정규식 질문드립니다.
html 코드내에서,
링크를 세부분으로 나누어 추출하려고 합니다.
다음과 같은 html 내용이 있을때,
**************************************************************
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
**************************************************************
1. <a 혹은 <area 태그 내용
(예: <a target=_blank href='http://www.naver.com'> )
2. 1내용중 href의 내용
(href내용은 큰따옴표 혹은 작은따옴표로 감싸지거나 그냥 링크만 있을수도..)
3. <a 혹은 <area 의 텍스트내용
(위 html의 첫째줄에서는 네이버, 둘째줄에서는 공백이 되겠네요.)
이 세 내용을 preg_match_all 함수와 정규식을 이용해 추출하고자 하는데,
정규식 작성이 잘 되지 않네요..
고수님들의 조언 부탁드립니다.
링크를 세부분으로 나누어 추출하려고 합니다.
다음과 같은 html 내용이 있을때,
**************************************************************
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
**************************************************************
1. <a 혹은 <area 태그 내용
(예: <a target=_blank href='http://www.naver.com'> )
2. 1내용중 href의 내용
(href내용은 큰따옴표 혹은 작은따옴표로 감싸지거나 그냥 링크만 있을수도..)
3. <a 혹은 <area 의 텍스트내용
(위 html의 첫째줄에서는 네이버, 둘째줄에서는 공백이 되겠네요.)
이 세 내용을 preg_match_all 함수와 정규식을 이용해 추출하고자 하는데,
정규식 작성이 잘 되지 않네요..
고수님들의 조언 부탁드립니다.
[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]
댓글 3개
17년 전
내공이 부족해서 preg_match_all 은 못하겠네요.
<?
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;
preg_match("/(\<a[^\>]*\>)/i", $s, $match1);
preg_match("/href\=[\"\']?([^\"\'\s\>]+)/i", $match1[1], $match2);
preg_match("/\<a[^\>]*\>(.*)\<\/a/i", $s, $match3);
?>
<textarea rows=10 cols=100><?print_r($match1)?></textarea>
<textarea rows=10 cols=100><?print_r($match2)?></textarea>
<textarea rows=10 cols=100><?print_r($match3)?></textarea>
<?
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;
preg_match("/(\<a[^\>]*\>)/i", $s, $match1);
preg_match("/href\=[\"\']?([^\"\'\s\>]+)/i", $match1[1], $match2);
preg_match("/\<a[^\>]*\>(.*)\<\/a/i", $s, $match3);
?>
<textarea rows=10 cols=100><?print_r($match1)?></textarea>
<textarea rows=10 cols=100><?print_r($match2)?></textarea>
<textarea rows=10 cols=100><?print_r($match3)?></textarea>
17년 전
http://phpschool.com/gnuboard4/bbs/board.php?bo_table=qna_function&wr_id=241200&sca=&sfl=mb_id&stx=kagla&sop=and
17년 전
<?
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;
preg_match_all("`<\s*(a[^>\s]*)[^>]* href\s*=\s*([^\s>]+)[^>]*(>(.+)</\s*\\1\s*>|/>)`is", $s, $match);
//print_r($match);
if (is_array($match[1])){
foreach($match[1] as $k => $v){
$text1 .= "$v , ";//태그들
$text2 .= str_replace(array("'", '"'), '', $match[2][$k]) . " , ";//링크들
$text3 .= trim($match[4][$k]) . " , ";//링크에 걸린 텍스트
}
}
echo "본문내의 태그들은? ==> $text1 <br>";
echo "본문내의 링크들은? ==> $text2 <br>";
echo "본문내의 링크에 걸린 텍스트는? ==> $text3 <br>";
?>
결과값
본문내의 태그들은? ==> a , area ,
본문내의 링크들은? ==> http://www.naver.com , http://www.daum.net ,
본문내의 링크에 걸린 텍스트는? ==> 네이버 , ,
요런 정도 하면 되지 않을 까요
$s =<<<HTMLCODE
<a target=_blank href='http://www.naver.com'>네이버</a>
<area shape="RECT" target="_blank" coords="10,10,135,60" href="http://www.daum.net" />
HTMLCODE;
preg_match_all("`<\s*(a[^>\s]*)[^>]* href\s*=\s*([^\s>]+)[^>]*(>(.+)</\s*\\1\s*>|/>)`is", $s, $match);
//print_r($match);
if (is_array($match[1])){
foreach($match[1] as $k => $v){
$text1 .= "$v , ";//태그들
$text2 .= str_replace(array("'", '"'), '', $match[2][$k]) . " , ";//링크들
$text3 .= trim($match[4][$k]) . " , ";//링크에 걸린 텍스트
}
}
echo "본문내의 태그들은? ==> $text1 <br>";
echo "본문내의 링크들은? ==> $text2 <br>";
echo "본문내의 링크에 걸린 텍스트는? ==> $text3 <br>";
?>
결과값
본문내의 태그들은? ==> a , area ,
본문내의 링크들은? ==> http://www.naver.com , http://www.daum.net ,
본문내의 링크에 걸린 텍스트는? ==> 네이버 , ,
요런 정도 하면 되지 않을 까요
게시글 목록
| 번호 | 제목 |
|---|---|
| 12995 | |
| 12994 | |
| 12993 |
JavaScript
[SQL]Delete문
|
| 29390 |
HTML
[SQL]Update문
1
|
| 29389 |
HTML
[SQL]Insert 문
|
| 12992 |
JavaScript
[SQL]등록/수정/삭제 전에 알아둘 사항
|
| 12991 | |
| 29388 |
HTML
[SQL]Table 만들기
|
| 29387 |
HTML
[SQL]SQL의 기초 (3)
|
| 29386 |
HTML
[SQL]SQL의 기초 (2)
|
| 29384 |
HTML
[SQL]SQL의 기초 (I)
1
|
| 29383 |
HTML
[SQL]DATABASE의 구조
|
| 29382 | |
| 25079 |
마케팅
마케팅 전략 ppt자료
3
|
| 12989 |
MySQL
php 에서 자바스크립트로 배열 보내기
1
|
| 12988 |
기타
이벤트 객체
|
| 25070 | |
| 12987 | |
| 29381 | |
| 12986 |
JavaScript
에디터로 작성한 게시물에서 특정태그없애기
|
| 12985 |
PHP
롤링배너객체 Rolling
|
| 12984 |
JavaScript
간단하게 만들어본 메일전송 클래스
|
| 12979 |
JavaScript
24시간 이내에 수정된 php 파일만 찾기
4
|
| 12978 |
Flash
무툴즈를 이용한 플래시 비슷한 탑메뉴~~~
|
| 12977 | |
| 12973 | |
| 12972 | |
| 12971 | |
| 29380 |
HTML
클릭해서 이미지 팝업 뛰우기.
|
| 12969 | |
| 12968 |
Flash
플래시에 가려진 레이어 올려봅시다.
|
| 12967 | |
| 29379 |
HTML
부끄럽네요. 로그인아웃 표시
|
| 12965 |
기타
PHP 전역변수
1
|
| 12963 |
기타
PHP 배열변수
1
|
| 29378 |
HTML
PHP 변수사용법
|
| 12962 |
기타
PHP 기본구조
|
| 12960 |
Linux
리눅스 자바설치
1
|
| 29377 |
HTML
TAR명령. TAR압축묶기 압축풀기
|
| 12958 | |
| 12955 |
MySQL
ncftp 를 이용한 백업 스크립트
2
|
| 12954 |
기타
ftp 업로드 자동
|
| 12951 |
JavaScript
리눅스 시스템 시간 확인 및 시간 맞추기
2
|
| 12950 |
Linux
리눅스 한글 설정
|
| 12949 |
MySQL
리눅스 한글설정관련_locale
|
| 12946 |
MySQL
웹호스팅 사용자를 위한 계정관리 스크립트
2
|
| 12945 | |
| 12941 | |
| 12939 |
기타
리눅스 시간맞추기
1
|
| 12938 |
기타
리눅스 기본명령어들
|
| 12936 | |
| 12931 | |
| 29376 |
HTML
윈도우2003서버 관리
|
| 12928 | |
| 29375 | |
| 12927 |
JavaScript
간단한 텍스트 스크롤
|
| 12926 | |
| 12923 |
MySQL
mysql 5.0.x 공백문자인식
2
|
| 12921 | |
| 12918 | |
| 12917 | |
| 12914 | |
| 12909 |
정규표현식
정규표현식 튜토리얼
4
|
| 12906 | |
| 12903 | |
| 12902 |
JavaScript
확장자 bak 파일 지우기
|
| 298 | |
| 12901 |
JavaScript
프로젝트의 구축 방법에 관한 내용입니다.
|
| 12891 | |
| 12888 |
Flash
[질문] 플래시 메뉴를 통한 링크...
2
|
| 12886 | |
| 295 | |
| 12885 |
Flash
flv 플레이어 자막연동 보드 완성 하였음
|
| 12883 |
JavaScript
flv 동영상 자막 싱크만드는 중입니다. txt 연동
1
|
| 12881 |
Flash
풀 플래시 소스
1
|
| 292 | |
| 12880 | |
| 290 | |
| 287 | |
| 12879 | |
| 285 | |
| 12875 | |
| 12872 | |
| 280 | |
| 12857 | |
| 276 | |
| 275 | |
| 25063 |
계약서
홈페이지 관리계약서
6
|
| 271 | |
| 29369 |
HTML
제가 그린 일러스트입니다.
5
|
| 268 | |
| 267 | |
| 12852 |
JavaScript
원격이미지 조건에 따른 썸네일 생성
4
|
| 12851 |
JavaScript
윈도우 APM 에서 리눅스의 심볼릭 링크 사용하기
|
| 265 | |
| 263 | |
| 12844 |
Flash
도와주세요~
6
|
| 260 | |
| 12841 |
JavaScript
사진 뽀샤시 ~~
2
|
| 12834 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기