테스트 사이트 - 개발 중인 베타 버전입니다

자동으로 글 퍼오는 것은 어떤 방식으로 구동되는 건가요?

가끔 어떤 사이트들을 보면 자동으로 글이 올라오더라구요. 
예를 들면 관련 뉴스라던가, 자동으로 꾸준히 생성되더라구요. 

어떻게 구현하는 건지 궁금하네요. 원리가 어떤건지..


댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

snoopy 나 curl 를 이용한 파싱 입니다.
원리는 대충 이렇습니다.
우선 먼저 file_get_contents() , curl 등 통해서 페이지를 불러 옵니다. 그다음 정규식 통해서 정리하여 디비에 올립니다.
한번 간단한거 만들어보면 재미있습니다.
하지만 우선 알아두셔야할것은 다른사람의 사이트에 정보을 동의 없이 수집하는 것은 도독에 어긋나는 일입니다.^^
xml 또는 json 같은 형태로 해당 서비스 업체에서 제공하기도 합니다.

게시글 목록

번호 제목
26573
7309
19780
7306
28025
28020
28010
7304
7302
7295
7292
7287
19779
7284
7279
7278
28009
31753
31752
7274
31751
31750
31749
31748
30979
31747
28004
31745
7267
7261
31742
7256
19776
24650
7252
7248
28002
19772
7245
19770
19769
30975
7243
7236
28001
27994
7233
7232
19768
19765
19763
30974
7224
19761
24645
19760
19758
19757
19754
19753
19752
19751
7223
7216
7213
31741
19750
19749
19748
31740
31739
31738
7208
31737
30967
31736
7205
30965
30963
19747
19746
19745
19744
19742
7193
7191
31735
19741
19740
19739
7188
27986
31734
31733
31732
7186
19738
19736
7180
7165