테스트 사이트 - 개발 중인 베타 버전입니다

php 파싱! 간편하면서 강력한 - PHP Simple HTML DOM Parser

· 12년 전 · 20701 · 14
http://simplehtmldom.sourceforge.net/

다운로드 링크  : http://sourceforge.net/projects/simplehtmldom/files/latest/download?source=files


해당 홈에 나와있는 예제입니다.
간단한 주석을 붙입니다.

//html 을 가져오고
$html = file_get_html('http://www.google.com/');            

// 모든 이미지태그를 찾아냅니다.
foreach($html->find('img') as $element) 
       echo $element->src . '<br>';                                  

// 모든 a태그를 찾아내어 href속성을 뿌려줍니다.
foreach($html->find('a') as $element)                             
       echo $element->href . '<br>';

// 컨텐츠내에 텍스트들만 가져옵니다.
echo file_get_html('http://www.google.com/')->plaintext

// css jquery 많이 만져보셨다면 선택자는 거의 동일합니다.
//몇번째 a태그 같은 경우도 가져올수 있구요
foreach($html->find('div.article') as $article) {
    $item['title']     = $article->find('div.title'0)->plaintext;
    $item['intro']    = $article->find('div.intro'0)->plaintext;
    $item['details'] = $article->find('div.details'0)->plaintext;
    $articles[] = $item;
}

//가져오기전 해당 태그내의 텍스트도 이렇게 간단히 변경가능합니다.
$html->find('div[id=hello]', 0)->innertext = 'foo';



현재 홈에는 예제가 별로 안나와있는데 파일받아보시면
풍부한 예제가 많습니다.
강력추천드립니다 ㅋㅎ



댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 14개

12년 전
서버 접속후에
grep allow_url_fopen /etc/php.ini
입력해보세요.

allow_url_fopen 설정이 on인지 off인지 보일꺼에요.
on이 되어있어야 합니다.

php.ini 파일 직접한번 봐보셔두 됩니다 ㅎㅎ
.htaccess 에
php_flag register_globals on 설정되어있습니다.
ㅠㅠ
감사드려요
좋긴 한데..메모리누수 버그가 있었는데..지금은 패치가 되엇나요??
clear, destruct, unset...등 조치해야 되었던거 같은데..
무지...편리하긴 한데..

게시글 목록

번호 제목
4851
30604
4842
26788
4847
4839
4838
24428
30600
28442
4835
4831
4825
26775
26768
4821
4818
4815
4804
4800
4796
26757
4792
18160
26754
4786
18157
4782
4777
18152
4775
4768
4763
4758
4756
4751
4740
26746
26736
4737
4731
4726
26726
4719
26403
4713
26398
4711
4706
28437
26709
18151
4705
4699
24421
4696
18150
18149
18148
18146
26397
26694
26679
4693
개발자 리자님? 2
4684
18145
JavaScript getHtmlInfo
26664
26656
28434
4681
28432
4673
4665
4660
26648
4656
4648
4649
4652
26642
4632
26630
4627
4622
18142
4606
4592
4583
4575
26616
4565
4550
4545
4524
28422
26611
4520
26600
28408
4516