php 파싱! 간편하면서 강력한 - PHP Simple HTML DOM Parser
링크
http://simplehtmldom.sourceforge.net/ (1225) http://sourceforge.net/projects/simplehtmldom/files/latest/download?source=files (2590)
http://simplehtmldom.sourceforge.net/
다운로드 링크 : http://sourceforge.net/projects/simplehtmldom/files/latest/download?source=files
해당 홈에 나와있는 예제입니다.
간단한 주석을 붙입니다.
//html 을 가져오고
$html = file_get_html('http://www.google.com/');
// 모든 이미지태그를 찾아냅니다.
foreach($html->find('img') as $element)
echo $element->src . '<br>';
// 모든 a태그를 찾아내어 href속성을 뿌려줍니다.
foreach($html->find('a') as $element)
echo $element->href . '<br>';
$html = file_get_html('http://www.google.com/');
// 모든 이미지태그를 찾아냅니다.
foreach($html->find('img') as $element)
echo $element->src . '<br>';
// 모든 a태그를 찾아내어 href속성을 뿌려줍니다.
foreach($html->find('a') as $element)
echo $element->href . '<br>';
// 컨텐츠내에 텍스트들만 가져옵니다.
echo file_get_html('http://www.google.com/')->plaintext;
echo file_get_html('http://www.google.com/')->plaintext;
// css jquery 많이 만져보셨다면 선택자는 거의 동일합니다.
//몇번째 a태그 같은 경우도 가져올수 있구요
foreach($html->find('div.article') as $article) {
$item['title'] = $article->find('div.title', 0)->plaintext;
$item['intro'] = $article->find('div.intro', 0)->plaintext;
$item['details'] = $article->find('div.details', 0)->plaintext;
$articles[] = $item;
}
foreach($html->find('div.article') as $article) {
$item['title'] = $article->find('div.title', 0)->plaintext;
$item['intro'] = $article->find('div.intro', 0)->plaintext;
$item['details'] = $article->find('div.details', 0)->plaintext;
$articles[] = $item;
}
//가져오기전 해당 태그내의 텍스트도 이렇게 간단히 변경가능합니다.
$html->find('div[id=hello]', 0)->innertext = 'foo';
현재 홈에는 예제가 별로 안나와있는데 파일받아보시면
풍부한 예제가 많습니다.
강력추천드립니다 ㅋㅎ
댓글 14개
12년 전
사용하기 쉽지만 성능면에서는 어떨지 궁금하네요.
12년 전
괜춘하네요!!
12년 전
크롤러 소스네요 ㅋㅋ 좋네요 ㅋㅋ
프로프리랜서
12년 전
감사합니다.
넓은마인드
12년 전
좋네요.~~
감사합니다.
감사합니다.
hithat
12년 전
snoopy.class 얼마전에 처음 알고 신기해했는데. 이것도 좋아보이네요^^
12년 전
오호............
kimunan
12년 전
그누보드랑 접목 시킨 예제는 없을까요? 삽질 연속중..ㅠㅠ
12년 전
해보시면서 궁금하신 부분 여쭤보세요 도움닫는한 답변드릴께요 ㅎㅎ
kimunan
12년 전
감사합니다.
샘플 형태로 다 진행을 해봤는데요. URL 구글로 샘플된거 해보면 계속
Warning: file_get_contents() [function.file-get-contents]: URL file-access is disabled in the server configuration in /home1/**********/parser/simple_html_dom.php on line 75
이렇게 오류가 생기네요.
ㅠㅠ
구현하고 싶은것은 그누보드에 url 입력창에 입력하면 특정 게시물의 일부 또는 전체를 가져올까합니다. 블로그 같은경우 최신 RSS 50개만 적용되어서요. 50개이전글을 가져와서 DB저장시킬 방법을 찾고있습니다.
샘플 형태로 다 진행을 해봤는데요. URL 구글로 샘플된거 해보면 계속
Warning: file_get_contents() [function.file-get-contents]: URL file-access is disabled in the server configuration in /home1/**********/parser/simple_html_dom.php on line 75
이렇게 오류가 생기네요.
ㅠㅠ
구현하고 싶은것은 그누보드에 url 입력창에 입력하면 특정 게시물의 일부 또는 전체를 가져올까합니다. 블로그 같은경우 최신 RSS 50개만 적용되어서요. 50개이전글을 가져와서 DB저장시킬 방법을 찾고있습니다.
12년 전
서버 접속후에
grep allow_url_fopen /etc/php.ini
입력해보세요.
allow_url_fopen 설정이 on인지 off인지 보일꺼에요.
on이 되어있어야 합니다.
php.ini 파일 직접한번 봐보셔두 됩니다 ㅎㅎ
grep allow_url_fopen /etc/php.ini
입력해보세요.
allow_url_fopen 설정이 on인지 off인지 보일꺼에요.
on이 되어있어야 합니다.
php.ini 파일 직접한번 봐보셔두 됩니다 ㅎㅎ
kimunan
12년 전
.htaccess 에
php_flag register_globals on 설정되어있습니다.
ㅠㅠ
php_flag register_globals on 설정되어있습니다.
ㅠㅠ
takumi22
12년 전
감사드려요
11년 전
좋긴 한데..메모리누수 버그가 있었는데..지금은 패치가 되엇나요??
clear, destruct, unset...등 조치해야 되었던거 같은데..
무지...편리하긴 한데..
clear, destruct, unset...등 조치해야 되었던거 같은데..
무지...편리하긴 한데..
게시글 목록
| 번호 | 제목 |
|---|---|
| 17764 | |
| 17761 | |
| 17753 | |
| 17750 |
JavaScript
자바스크립트 메소드 관련..
2
|
| 26370 | |
| 4334 | |
| 4332 | |
| 17749 | |
| 17747 |
JavaScript
클릭하면 레이어로 메뉴영역 올라오는거요~~
1
|
| 26369 | |
| 17746 | |
| 17743 |
기타
쇼핑몰을 구축하려면
2
|
| 17742 | |
| 17740 |
PHP
라이브러리를 만들어서
1
|
| 17738 |
Flash
플래시 작업소스가 없는데
1
|
| 17736 |
MySQL
mysql 커뮤니티 버젼을 사용해서
1
|
| 17734 | |
| 17732 |
JavaScript
flash의 많은 기능들을
1
|
| 30517 |
HTML
php로 사이트 개발시
3
|
| 17729 |
Linux
그누4 에서 메일발송을 사용하려면
2
|
| 17728 |
jQuery
상용 그리드에 버금가는
|
| 17725 |
정규표현식
운전면허번호도
2
|
| 24409 | |
| 17722 |
node.js
node.js 활용사례 좀..
2
|
| 30513 | |
| 17720 |
Mobile
jquery mobile 커스터마이징...
1
|
| 17719 |
PHP
프레임웍 보다는...
|
| 4331 | |
| 17716 | |
| 26368 | |
| 17715 |
node.js
nodeJS 의 scraping
|
| 17713 |
JavaScript
바탕 화면에 생성될 아이콘(파비콘)의 자비스크립트에 대해 에러..ㅠㅠ
1
|
| 17712 |
Mobile
모바일 사이트 링크 걸기..(기본)
|
| 17709 |
JavaScript
ajax호출실패는 어떤 경우에 생기나요?
2
|
| 30511 | |
| 30507 | |
| 30503 | |
| 30500 | |
| 17706 |
JavaScript
스크립트 고수들님.... 초보인데요,,
2
|
| 17704 | |
| 17701 | |
| 17697 |
Mobile
Jindo 모바일 사용해보신분 있으신가요?
3
|
| 17691 | |
| 17685 | |
| 30474 |
HTML
제일 이해안되는 문제..
25
|
| 17674 | |
| 30467 |
HTML
태그 문의드립니다...
6
|
| 17670 |
MySQL
그누보드 innoDB?
3
|
| 17667 |
PHP
무슨뜻일까요>
2
|
| 17664 | |
| 17660 |
MySQL
MYSQL 필드 전체 암호화?
3
|
| 17658 | |
| 17656 | |
| 4325 | |
| 30459 | |
| 4318 | |
| 17653 |
MySQL
SQL Export 하는 중입니다.
2
|
| 30452 | |
| 17649 | |
| 30450 | |
| 30437 | |
| 17647 |
Flash
에러좀 봐주세요...
1
|
| 4315 | |
| 4310 | |
| 30435 |
HTML
스크롤에 따라 변하는 메뉴...
1
|
| 30413 |
HTML
로고 크기에 제한이 있나요?
21
|
| 17646 |
Flash
xml가 로드가 안됩니다ㅠㅠ
|
| 30411 | |
| 17642 |
Linux
윈도우 xp에 리눅스 설치 하면..
3
|
| 17638 | |
| 17636 |
Linux
리눅스 서버 관련 책좀 추천 해주세요..
1
|
| 30407 | |
| 17634 |
node.js
node.js가 간단하게 어떤건가요??
1
|
| 17632 |
MySQL
mysql 튜닝 책 추천 부탁 드립니다.
1
|
| 17627 | |
| 17624 | |
| 17620 | |
| 17619 | |
| 17616 |
Mobile
요즘 하이브리드에 관심이 많아서요..
2
|
| 17614 |
정규표현식
정규식을 공부 하는 방법이 있을까요??
1
|
| 17613 |
MySQL
인덱스 관련해서..
|
| 17609 |
JavaScript
고수님들, jQuery Mobile 은 희망이 없는건가요?
3
|
| 17606 |
MySQL
테이블에 인덱스 걸고 테스트..
2
|
| 17605 |
PHP
사이트 캡쳐 관련해서..
|
| 17601 | |
| 24408 | |
| 17597 |
JavaScript
1차셀렉트값 변경시 2차셀렉트값 변경 질문입니다
3
|
| 4299 | |
| 17594 |
JavaScript
퀵메뉴때매 고생하시는분들을 위한 자작 퀵메뉴 제공 ㅋ
2
|
| 17587 |
JavaScript
주소창에 url직접 입력시에..
6
|
| 17586 |
Flash
플래시 + GD 로 캡쳐하는 방법...
|
| 4295 | |
| 17582 | |
| 17577 |
Linux
리눅스에서 백업 하는 소스입니다.
4
|
| 17569 |
Linux
쉘에서 웹프로그램 실행하기
7
|
| 17568 | |
| 17565 | |
| 30399 | |
| 30394 |
HTML
웹 표준화 관련 사이트들
4
|
| 24400 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기