테스트 사이트 - 개발 중인 베타 버전입니다

자동으로 글 퍼오는 것은 어떤 방식으로 구동되는 건가요?

가끔 어떤 사이트들을 보면 자동으로 글이 올라오더라구요. 
예를 들면 관련 뉴스라던가, 자동으로 꾸준히 생성되더라구요. 

어떻게 구현하는 건지 궁금하네요. 원리가 어떤건지..


댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

snoopy 나 curl 를 이용한 파싱 입니다.
원리는 대충 이렇습니다.
우선 먼저 file_get_contents() , curl 등 통해서 페이지를 불러 옵니다. 그다음 정규식 통해서 정리하여 디비에 올립니다.
한번 간단한거 만들어보면 재미있습니다.
하지만 우선 알아두셔야할것은 다른사람의 사이트에 정보을 동의 없이 수집하는 것은 도독에 어긋나는 일입니다.^^
xml 또는 json 같은 형태로 해당 서비스 업체에서 제공하기도 합니다.

게시글 목록

번호 제목
27182
27176
18634
5442
18632
18629
5435
18627
18626
18623
5409
18621
18617
18615
18614
18608
27162
18607
5405
18606
18605
5401
27152
5397
18603
27144
20667
20666
24485
20651
20632
20620
20607
18602
30749
5396
18601
18599
18596
20590
18589
18587
18586
18585
18584
5387
27106
18583
18580
18579
27120
18574
18570
18566
18562
18558
26490
30733
18554
20572
20541
5377
18553
5373
20534
20531
20527
20525
20519
20513
20507
20503
20496
20490
20483
20471
20464
20447
20419
20405
30729
18549
18544
32084
32083
32082
32081
30728
27097
18537
27092
32080
32079
32078
32077
32076
32075
32074
32073
32072