html 코드내에서,
링크를 세부분으로 나누어 추출하려고 합니다.
다음과 같은 html 내용이 있을때,
**************************************************************
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
**************************************************************
1. <a 혹은 <area 태그 내용
(예: <a target=_blank href='http://www.naver.com'> )
2. 1내용중 href의 내용
(href내용은 큰따옴표 혹은 작은따옴표로 감싸지거나 그냥 링크만 있을수도..)
3. <a 혹은 <area 의 텍스트내용
(위 html의 첫째줄에서는 네이버, 둘째줄에서는 공백이 되겠네요.)
이 세 내용을 preg_match_all 함수와 정규식을 이용해 추출하고자 하는데,
정규식 작성이 잘 되지 않네요..
고수님들의 조언 부탁드립니다.
링크를 세부분으로 나누어 추출하려고 합니다.
다음과 같은 html 내용이 있을때,
**************************************************************
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
**************************************************************
1. <a 혹은 <area 태그 내용
(예: <a target=_blank href='http://www.naver.com'> )
2. 1내용중 href의 내용
(href내용은 큰따옴표 혹은 작은따옴표로 감싸지거나 그냥 링크만 있을수도..)
3. <a 혹은 <area 의 텍스트내용
(위 html의 첫째줄에서는 네이버, 둘째줄에서는 공백이 되겠네요.)
이 세 내용을 preg_match_all 함수와 정규식을 이용해 추출하고자 하는데,
정규식 작성이 잘 되지 않네요..
고수님들의 조언 부탁드립니다.
[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]
댓글 3개
17년 전
내공이 부족해서 preg_match_all 은 못하겠네요.
<?
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;
preg_match("/(\<a[^\>]*\>)/i", $s, $match1);
preg_match("/href\=[\"\']?([^\"\'\s\>]+)/i", $match1[1], $match2);
preg_match("/\<a[^\>]*\>(.*)\<\/a/i", $s, $match3);
?>
<textarea rows=10 cols=100><?print_r($match1)?></textarea>
<textarea rows=10 cols=100><?print_r($match2)?></textarea>
<textarea rows=10 cols=100><?print_r($match3)?></textarea>
<?
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;
preg_match("/(\<a[^\>]*\>)/i", $s, $match1);
preg_match("/href\=[\"\']?([^\"\'\s\>]+)/i", $match1[1], $match2);
preg_match("/\<a[^\>]*\>(.*)\<\/a/i", $s, $match3);
?>
<textarea rows=10 cols=100><?print_r($match1)?></textarea>
<textarea rows=10 cols=100><?print_r($match2)?></textarea>
<textarea rows=10 cols=100><?print_r($match3)?></textarea>
17년 전
http://phpschool.com/gnuboard4/bbs/board.php?bo_table=qna_function&wr_id=241200&sca=&sfl=mb_id&stx=kagla&sop=and
17년 전
<?
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;
preg_match_all("`<\s*(a[^>\s]*)[^>]* href\s*=\s*([^\s>]+)[^>]*(>(.+)</\s*\\1\s*>|/>)`is", $s, $match);
//print_r($match);
if (is_array($match[1])){
foreach($match[1] as $k => $v){
$text1 .= "$v , ";//태그들
$text2 .= str_replace(array("'", '"'), '', $match[2][$k]) . " , ";//링크들
$text3 .= trim($match[4][$k]) . " , ";//링크에 걸린 텍스트
}
}
echo "본문내의 태그들은? ==> $text1 <br>";
echo "본문내의 링크들은? ==> $text2 <br>";
echo "본문내의 링크에 걸린 텍스트는? ==> $text3 <br>";
?>
결과값
본문내의 태그들은? ==> a , area ,
본문내의 링크들은? ==> http://www.naver.com , http://www.daum.net ,
본문내의 링크에 걸린 텍스트는? ==> 네이버 , ,
요런 정도 하면 되지 않을 까요
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;
preg_match_all("`<\s*(a[^>\s]*)[^>]* href\s*=\s*([^\s>]+)[^>]*(>(.+)</\s*\\1\s*>|/>)`is", $s, $match);
//print_r($match);
if (is_array($match[1])){
foreach($match[1] as $k => $v){
$text1 .= "$v , ";//태그들
$text2 .= str_replace(array("'", '"'), '', $match[2][$k]) . " , ";//링크들
$text3 .= trim($match[4][$k]) . " , ";//링크에 걸린 텍스트
}
}
echo "본문내의 태그들은? ==> $text1 <br>";
echo "본문내의 링크들은? ==> $text2 <br>";
echo "본문내의 링크에 걸린 텍스트는? ==> $text3 <br>";
?>
결과값
본문내의 태그들은? ==> a , area ,
본문내의 링크들은? ==> http://www.naver.com , http://www.daum.net ,
본문내의 링크에 걸린 텍스트는? ==> 네이버 , ,
요런 정도 하면 되지 않을 까요
게시판 목록
프로그램
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 8130 | 9년 전 | 574 | ||
| 8129 |
|
9년 전 | 688 | |
| 8128 | 9년 전 | 543 | ||
| 8127 |
|
9년 전 | 591 | |
| 8126 | 9년 전 | 524 | ||
| 8125 | 9년 전 | 778 | ||
| 8124 |
|
9년 전 | 537 | |
| 8123 | 9년 전 | 522 | ||
| 8122 | 9년 전 | 455 | ||
| 8121 | 9년 전 | 562 | ||
| 8120 | 9년 전 | 482 | ||
| 8119 | 9년 전 | 570 | ||
| 8118 |
|
9년 전 | 648 | |
| 8117 |
|
9년 전 | 415 | |
| 8116 |
PASKRAN
|
9년 전 | 474 | |
| 8115 | 9년 전 | 469 | ||
| 8114 |
kiplayer
|
9년 전 | 607 | |
| 8113 | 9년 전 | 467 | ||
| 8112 |
|
9년 전 | 575 | |
| 8111 | 9년 전 | 414 | ||
| 8110 | 9년 전 | 456 | ||
| 8109 | 9년 전 | 388 | ||
| 8108 |
|
9년 전 | 564 | |
| 8107 |
|
9년 전 | 453 | |
| 8106 |
|
9년 전 | 455 | |
| 8105 | 9년 전 | 485 | ||
| 8104 |
|
9년 전 | 450 | |
| 8103 |
|
9년 전 | 450 | |
| 8102 |
|
9년 전 | 422 | |
| 8101 |
snshero
|
9년 전 | 808 | |
| 8100 | 9년 전 | 854 | ||
| 8099 | 9년 전 | 831 | ||
| 8098 | 9년 전 | 732 | ||
| 8097 | 9년 전 | 540 | ||
| 8096 | 9년 전 | 736 | ||
| 8095 | 9년 전 | 871 | ||
| 8094 | 9년 전 | 541 | ||
| 8093 | 9년 전 | 822 | ||
| 8092 | 9년 전 | 774 | ||
| 8091 | 9년 전 | 1158 | ||
| 8090 | 9년 전 | 784 | ||
| 8089 | 9년 전 | 998 | ||
| 8088 | 9년 전 | 660 | ||
| 8087 | 9년 전 | 787 | ||
| 8086 | 9년 전 | 535 | ||
| 8085 | 9년 전 | 501 | ||
| 8084 | 9년 전 | 618 | ||
| 8083 | 9년 전 | 592 | ||
| 8082 | 9년 전 | 780 | ||
| 8081 | 9년 전 | 489 | ||
| 8080 | 9년 전 | 586 | ||
| 8079 | 9년 전 | 545 | ||
| 8078 | 9년 전 | 465 | ||
| 8077 | 9년 전 | 554 | ||
| 8076 | 9년 전 | 424 | ||
| 8075 | 9년 전 | 457 | ||
| 8074 | 9년 전 | 419 | ||
| 8073 | 9년 전 | 477 | ||
| 8072 | 9년 전 | 468 | ||
| 8071 |
o1o111
|
9년 전 | 916 | |
| 8070 | 9년 전 | 425 | ||
| 8069 | 9년 전 | 362 | ||
| 8068 | 9년 전 | 615 | ||
| 8067 | 9년 전 | 415 | ||
| 8066 | 9년 전 | 441 | ||
| 8065 | 9년 전 | 400 | ||
| 8064 | 9년 전 | 394 | ||
| 8063 | 9년 전 | 362 | ||
| 8062 | 9년 전 | 332 | ||
| 8061 | 9년 전 | 368 | ||
| 8060 | 9년 전 | 407 | ||
| 8059 | 9년 전 | 342 | ||
| 8058 | 9년 전 | 281 | ||
| 8057 | 9년 전 | 410 | ||
| 8056 | 9년 전 | 327 | ||
| 8055 | 9년 전 | 373 | ||
| 8054 | 9년 전 | 383 | ||
| 8053 | 9년 전 | 434 | ||
| 8052 | 9년 전 | 306 | ||
| 8051 | 9년 전 | 356 | ||
| 8050 | 9년 전 | 413 | ||
| 8049 | 9년 전 | 345 | ||
| 8048 | 9년 전 | 449 | ||
| 8047 | 9년 전 | 388 | ||
| 8046 | 9년 전 | 330 | ||
| 8045 | 9년 전 | 277 | ||
| 8044 | 9년 전 | 364 | ||
| 8043 | 9년 전 | 321 | ||
| 8042 | 9년 전 | 311 | ||
| 8041 | 9년 전 | 372 | ||
| 8040 | 9년 전 | 296 | ||
| 8039 | 9년 전 | 338 | ||
| 8038 | 9년 전 | 281 | ||
| 8037 | 9년 전 | 427 | ||
| 8036 | 9년 전 | 515 | ||
| 8035 | 9년 전 | 446 | ||
| 8034 | 9년 전 | 407 | ||
| 8033 | 9년 전 | 367 | ||
| 8032 | 9년 전 | 471 | ||
| 8031 | 9년 전 | 364 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기