웹 소스 긁어오기
<?
function open_url($url)
{
if (preg_match('/^(https?)\:\/\/([^\/]+)(.*)/', $url, $pregs))
{
$host = $pregs[2];
$port = ($pregs[1] == 'http' ? 80 : 443);
$suburl = $pregs[3];
if (!$suburl) $suburl = '/';
if ($fp = fsockopen($host, $port, $errno, $errstr, 10))
{
fputs($fp, "GET {$suburl} HTTP/1.0\r\n");
fputs($fp, "Host: {$host}\r\n");
fputs($fp, "User-Agnet: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1)\r\n");
fputs($fp, "\r\n");
while (!feof($fp))
{
// $temp .= iconv('UTF-8', 'CP949', fgets($fp, 512)); // UTF-8
$temp .= fgets($fp, 512);
}
fclose($fp);
$arr = explode("\r\n\r\n", $temp, 2);
if (count($arr) < 2) return;
return array(
'header'=>$arr[0],
'body'=>$arr[1]
);
}
}
}
print_r(open_url('http://sir.co.kr/'));
?>
댓글 14개
13년 전
크롤러인가요?
13년 전
사람을 지칭하시는건가요 아니면 기능의 역할을 지칭하시는건가요? ㅎㅎ
13년 전
올려두고 물어보신다면 ;;
구글에서 크롤러를 검색해보세요 :)
기능이 비슷한지 해서 물어본 내용입니다.
구글에서 크롤러를 검색해보세요 :)
기능이 비슷한지 해서 물어본 내용입니다.
13년 전
기능은 웹사이트 코드를 긁어오는 것이니 당연히 비슷하죠.
이 코드를 수정해서 크롤러로 사용이 가능할수도 있겠지만, 저는 그런 의도로 올린건 아닙니다.
그리고 '크롤러'라고 하셔서 '크롤링 하는 사람'을 지칭하셨던 것인지
'크롤러 기능'을 지칭한 것인지를 여쭌것이지요 :D
이 코드를 수정해서 크롤러로 사용이 가능할수도 있겠지만, 저는 그런 의도로 올린건 아닙니다.
그리고 '크롤러'라고 하셔서 '크롤링 하는 사람'을 지칭하셨던 것인지
'크롤러 기능'을 지칭한 것인지를 여쭌것이지요 :D
13년 전
어떻게 사용하는건가요~?
13년 전
제가 만든 open_url 함수를 추가하시고 호출하시면 됩니다.
반환값은 긁어오기에 성공하면 header와 body를 인덱스로 갖는 배열이 반환되고, 실패시엔 아무것도 반환되지 않습니다.
header 에는 http 헤더가, body에는 http 내용이 들어갑니다
반환값은 긁어오기에 성공하면 header와 body를 인덱스로 갖는 배열이 반환되고, 실패시엔 아무것도 반환되지 않습니다.
header 에는 http 헤더가, body에는 http 내용이 들어갑니다
13년 전
때론 유용하게 사용되겠네요 ^^
13년 전
감사합니다~ ^^
프로프리랜서
13년 전
소스만 가지고오는
13년 전
네 웹소스 긁어오는 프로그램입니다 ^^
13년 전
파싱이..스누피도 있고..^^;;
중요한건 소스를 어떻게 컨트롤하느냐겠지요ㅎㅎㅎ
태그 날리는것도 한몫할것이고..
한마디로 정규식을 배워야 요것을 매우 유용하게 사용할수있을것이다..이런거지요
중요한건 소스를 어떻게 컨트롤하느냐겠지요ㅎㅎㅎ
태그 날리는것도 한몫할것이고..
한마디로 정규식을 배워야 요것을 매우 유용하게 사용할수있을것이다..이런거지요
13년 전
맞는 말씀이지요 ㅎㅎ
12년 전
좋은 소스네요 ㅋㅋ
takumi22
12년 전
유용한 정보 감사합니다
게시글 목록
| 번호 | 제목 |
|---|---|
| 4851 | |
| 30604 |
반응형
반응형웹 패턴/리소스/뉴스
4
|
| 4842 | |
| 26788 |
퍼블리셔
디자이너 지만 질문요
6
|
| 4847 | |
| 4839 |
개발자
디게 나른한 날이네요.
2
|
| 4838 |
개발자
오늘은 개발자
|
| 24428 | |
| 30600 | |
| 28442 | |
| 4835 | |
| 4831 |
개발자
미챠!!!! ㅠㅠ
3
|
| 4825 | |
| 26775 | |
| 26768 | |
| 4821 |
개발자
혹시 css에
3
|
| 4818 | |
| 4815 | |
| 4804 | |
| 4800 | |
| 4796 | |
| 26757 |
퍼블리셔
그누보드 vs 나의 퍼블리싱
10
|
| 4792 | |
| 18160 |
JavaScript
자바스크립트 함수모음!!!
8
|
| 26754 | |
| 4786 | |
| 18157 | |
| 4782 | |
| 4777 | |
| 18152 |
JavaScript
실시간 금액 계산기 ver.2 (php에 적용 가능)
4
|
| 4775 | |
| 4768 | |
| 4763 | |
| 4758 | |
| 4756 |
개발자
버벅거릴 수 있나요?
1
|
| 4751 | |
| 4740 | |
| 26746 | |
| 26736 | |
| 4737 | |
| 4731 | |
| 4726 | |
| 26726 | |
| 4719 | |
| 26403 | |
| 4713 | |
| 26398 | |
| 4711 | |
| 4706 | |
| 28437 | |
| 26709 | |
| 18151 | |
| 4705 | |
| 4699 |
개발자
제작의뢰 게시판은..
5
|
| 24421 | |
| 4696 | |
| 18150 |
Mobile
미래웹기술연구소 “HTML5 써야할 이유는…“
|
| 18149 | |
| 18148 |
Mobile
KT-한국MS, HTML5 웹앱 개발 활성화 맞손
|
| 18146 |
Mobile
KT, 앱개발 전문과정 ‘스마트스쿨’ 운영
1
|
| 26397 | |
| 26694 | |
| 26679 |
퍼블리셔
j-query 사용은 올바른가?
14
|
| 4693 |
개발자
리자님?
2
|
| 4684 | |
| 18145 |
JavaScript
getHtmlInfo
|
| 26664 | |
| 26656 | |
| 28434 | |
| 4681 |
개발자
왜 다운이 안되는 거죠?
2
|
| 28432 | |
| 4673 | |
| 4665 |
개발자
오, 사이트 바뀌었네요!
7
|
| 4660 |
개발자
이거 유저불량인가요??
4
|
| 26648 | |
| 4656 | |
| 4648 | |
| 4649 | |
| 4652 |
개발자
로그인페이지로 안가요
3
|
| 26642 |
퍼블리셔
퍼블리셔가 다뤄야 할 영역은?
5
|
| 4632 | |
| 26630 |
퍼블리셔
신입 퍼블리셔 연봉은 얼마?
11
|
| 4627 | |
| 4622 |
개발자
node.js 문의..
4
|
| 18142 |
JavaScript
자바스크립트 코딩할때 실수하기 쉬운 한가지(배열)
2
|
| 4606 | |
| 4592 |
개발자
아이폰앱 만들려면
13
|
| 4583 | |
| 4575 | |
| 26616 |
퍼블리셔
사이트를 제작하려고 합니다
13
|
| 4565 |
개발자
도메인주소가 바껴요~
9
|
| 4550 | |
| 4545 | |
| 4524 | |
| 28422 | |
| 26611 |
퍼블리셔
사이트 제작해볼려구요
4
|
| 4520 |
개발자
포인트 ㅠㅠ
3
|
| 26600 | |
| 28408 | |
| 4516 |
개발자
디비이전때문에요....ㅠㅠ
3
|
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기