테스트 사이트 - 개발 중인 베타 버전입니다

웹 소스 긁어오기

· 13년 전 · 4909 · 14
<?
function open_url($url)
{
if (preg_match('/^(https?)\:\/\/([^\/]+)(.*)/', $url, $pregs))
{
$host = $pregs[2];
$port = ($pregs[1] == 'http' ? 80 : 443);
$suburl = $pregs[3];
if (!$suburl) $suburl = '/';
if ($fp = fsockopen($host, $port, $errno, $errstr, 10))
{
fputs($fp, "GET {$suburl} HTTP/1.0\r\n");
fputs($fp, "Host: {$host}\r\n");
fputs($fp, "User-Agnet: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1)\r\n");
fputs($fp, "\r\n");
while (!feof($fp))
{
// $temp .= iconv('UTF-8', 'CP949', fgets($fp, 512)); // UTF-8
$temp .= fgets($fp, 512);
}
fclose($fp);
$arr = explode("\r\n\r\n", $temp, 2);
if (count($arr) < 2) return;
return array(
'header'=>$arr[0],
'body'=>$arr[1]
);
}
}
}

print_r(open_url('http://sir.co.kr/'));
?>

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 14개

파싱이..스누피도 있고..^^;;
중요한건 소스를 어떻게 컨트롤하느냐겠지요ㅎㅎㅎ
태그 날리는것도 한몫할것이고..
한마디로 정규식을 배워야 요것을 매우 유용하게 사용할수있을것이다..이런거지요
맞는 말씀이지요 ㅎㅎ
12년 전
좋은 소스네요 ㅋㅋ
유용한 정보 감사합니다

게시글 목록

번호 제목
4405
17973
17969
30568
17965
17962
17959
17955
17953
17950
17947
4403
17944
17943
17941
17939
17935
17928
4391
17926
17923
17920
17917
26380
17916
30565
17910
17907
17905
30555
17904
30552
17901
17900
17898
30549
17895
26379
26378
26377
17893
17891
17888
17885
17883
17882
17861
17859
17857
4388
24413
4383
17849
17847
17845
17844
17839
17838
30548
17836
17833
17831
17827
17826
17823
17820
17818
24412
30547
17814
4377
30544
17813
17810
26373
17804
30543
17803
4370
17801
17796
26372
17794
30536
17791
4364
17789
30535
17788
30527
30525
30524
4358
30521
17781
26371
17776
4343
17772
17768