테스트 사이트 - 개발 중인 베타 버전입니다

php 파싱! 간편하면서 강력한 - PHP Simple HTML DOM Parser

· 12년 전 · 20700 · 14
http://simplehtmldom.sourceforge.net/

다운로드 링크  : http://sourceforge.net/projects/simplehtmldom/files/latest/download?source=files


해당 홈에 나와있는 예제입니다.
간단한 주석을 붙입니다.

//html 을 가져오고
$html = file_get_html('http://www.google.com/');            

// 모든 이미지태그를 찾아냅니다.
foreach($html->find('img') as $element) 
       echo $element->src . '<br>';                                  

// 모든 a태그를 찾아내어 href속성을 뿌려줍니다.
foreach($html->find('a') as $element)                             
       echo $element->href . '<br>';

// 컨텐츠내에 텍스트들만 가져옵니다.
echo file_get_html('http://www.google.com/')->plaintext

// css jquery 많이 만져보셨다면 선택자는 거의 동일합니다.
//몇번째 a태그 같은 경우도 가져올수 있구요
foreach($html->find('div.article') as $article) {
    $item['title']     = $article->find('div.title'0)->plaintext;
    $item['intro']    = $article->find('div.intro'0)->plaintext;
    $item['details'] = $article->find('div.details'0)->plaintext;
    $articles[] = $item;
}

//가져오기전 해당 태그내의 텍스트도 이렇게 간단히 변경가능합니다.
$html->find('div[id=hello]', 0)->innertext = 'foo';



현재 홈에는 예제가 별로 안나와있는데 파일받아보시면
풍부한 예제가 많습니다.
강력추천드립니다 ㅋㅎ



댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 14개

12년 전
서버 접속후에
grep allow_url_fopen /etc/php.ini
입력해보세요.

allow_url_fopen 설정이 on인지 off인지 보일꺼에요.
on이 되어있어야 합니다.

php.ini 파일 직접한번 봐보셔두 됩니다 ㅎㅎ
.htaccess 에
php_flag register_globals on 설정되어있습니다.
ㅠㅠ
감사드려요
좋긴 한데..메모리누수 버그가 있었는데..지금은 패치가 되엇나요??
clear, destruct, unset...등 조치해야 되었던거 같은데..
무지...편리하긴 한데..

게시글 목록

번호 제목
26447
26436
5279
5276
30674
18417
18414
5261
27054
5259
5239
18413
31486
18410
18400
30670
5231
18395
18387
18381
30661
5222
18380
27043
18366
24478
18359
30660
18355
18351
18343
18333
31439
18329
18323
27040
30655
5211
31427
5205
5193
5184
18317
27032
18313
30647
31408
30644
18306
18303
18288
27028
18285
31383
27024
5174
18276
27017
27130
18274
26427
5170
5160
5157
31371
27010
18267
27003
30636
18265
31350
18262
26998
18260
26992
26988
18259
31328
26986
18257
26983
5154
26975
24474
31309
26966
31251
18253
31218
31201
26957
26954
5147
5139
18248
5132
26947
31189
30631
26939