제 강좌를 출처를 밝히고 외부로 퍼가는 것은 허용하지만,
다른 강좌의 자료나 책의 자료로 사용되거나 부분적인 인용은 허용하지 않습니다.
PCRE 는 preg_ 로 시작되는 내장함수와 함께 사용되어지는 정규표현식을 말합니다.
PCRE > 정규표현식 의 핵심. 패턴변경자 1
이전 내용에서는 정규표현식의 메타문자에 대해서 알아보았습니다.
이번 내용에서도 역시 정규표현식의 핵심이라고 볼수 있는 패턴변경자에 대해서 이어서 알아보도록 하겠습니다.
패턴변경자란?
쉽게 설명하자면, 복잡해질수 있는 패턴을 쉽게 표현 가능하도록 해주는 것입니다.
1. i
이것은 주어진 패턴으로 문자열을 검사하되 대소문자는 구별하지 않겠다 는 것입니다.
즉, /^[a-z]+$/ 이렇게 사용한다면, 알파벳 소문자로만 이루어진 문자열을 찾는것이고
/^[a-z]+$/i 와 같이 사용한다면, /^[a-zA-Z]+$/ 와 같은 방법인 대소문자 구분없이 알파벳으로 이루어진 문자열을 찾는것입니다.
예제18> test18.php
$string = "zOOzoOZOozooZooZOO";
$patterns = Array();
$patterns[] = "/[a-z]{3}/" ; // 연속된 알파벳 소문자 세자를 찾는 패턴
$patterns[] = "/[A-Z]{3}/" ; // 연속된 알파벳 대문자 세자를 찾는 패턴
$patterns[] = "/[a-zA-Z]{3}/" ; //대소문자 구분없이 연속된 알파벳 대문자 세자를 찾는 패턴
$patterns[] = "/[a-z]{3}/i" ; // i 패턴 변경자를 사용하여 대소문자 구분없이 연속된 알파벳 세자를 찾는 패턴
$patterns[] = "/[A-Z]{3}/i" ; // i 패턴 변경자를 사용하여 대소문자 구분없이 연속된 알파벳 세자를 찾는 패턴
$patterns[] = "/zoo/" ; // zoo 를 찾는 패턴
$patterns[] = "/ZOO/" ; // ZOO 를 찾는 패턴
$patterns[] = "/[zZ][oO][oO]/" ; //대소문자 구분없이 zoo 를 찾는 패턴
$patterns[] = "/zoo/i" ; // i 패턴 변경자를 사용하여 대소문자 구분없이 zoo 를 찾는 패턴
$patterns[] = "/ZOO/i" ; // i 패턴 변경자를 사용하여 대소문자 구분없이 zoo 를 찾는 패턴
foreach($patterns as $pattern){
if (preg_match($pattern, $string, $m)) {
echo '<font color="blue">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함한 문자열 입니다. <br>" . $m[0] . "</font><br /><br />" . PHP_EOL;
}
else {
echo '<font color="red">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.</font><br /><br />" . PHP_EOL;
}
}
?>
결과 :
ozo
/[A-Z]{3}/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
OZO
/[a-zA-Z]{3}/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/[a-z]{3}/i ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/[A-Z]{3}/i ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/zoo/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zoo
/ZOO/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
ZOO
/[zZ][oO][oO]/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/zoo/i ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/ZOO/i ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
2. s
이것은 패턴 내의 . 메타 문자에 대하여 \n(개행문자) 를 포함하겠다 는 뜻입니다.
이전 내용에서 . 메타 문자 는 아무 문자나 하나 를 가리킨다고 하였습니다.
그러나, 이것을 좀 더 정확히 표현하자면 \n(개행문자) 를 제외한 모든 문자중 하나 입니다.
즉, . 메타문자에 \n 도 포함하여 사용할려면 s 패턴변경자와 같이 쓰여져야 합니다.
예제19> test19.php
$string = "I am a boy.
You are a girl?";
$patterns = Array();
$patterns[] = "/^.+/" ; // \n 을 제외한 모든 문자를 찾는다.
$patterns[] = "/^.+/s" ; // s 패턴 변경자를 사용하여 \n 을 포함한 모든 문자를 찾는다.
$patterns[] = "/^[^!]+/" ; // !를 제회한 모든 문자를 찾는다.
$patterns[] = "/^.+$/" ; // \n 을 제외한 모든 문자를 찾는다.
$patterns[] = "/^.+$/s" ; // s 패턴 변경자를 사용하여 \n 을 포함한 모든 문자를 찾는다.
$patterns[] = "/^[^!]+$/" ; // !를 제회한 모든 문자를 찾는다.
foreach($patterns as $pattern){
if (preg_match($pattern, $string, $m)) {
echo '<font color="blue">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함한 문자열 입니다. <br> " . nl2br($m[0]) . "</font><br /><br />" . PHP_EOL;
}
else {
echo '<font color="red">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.</font><br /><br />" . PHP_EOL;
}
}
?>
결과 :
I am a boy.
/^.+/s ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
/^[^!]+/ ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
/^.+$/ ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^.+$/s ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
/^[^!]+$/ ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
그런데, 첫번째는 결과가 있고, 두번째는 결과가 없습니다.
패턴의 차이는 $ 가 붙었나 안 붙었나의 차이입니다.
즉, 이것은 s 패턴변경자가 없기 때문에 . 메타문자는 \n 을 포함하지 않습니다.
따라서 원래의 문자열에 \n 이 포함되어있기 때문에 $ 가 붙으면 끝까지 일치 하는 것이므로 네번째는 결과가 없는 것입니다.
/^[^!]+/ 이 패턴을 예제에 넣은 이유는 . 메타문자와 ^ 과 함께 사용되는 문자클래스를 비교 하기 위함입니다.
. 은 s 패턴변경자에 따라 \n 문자를 포함하지만, ^ 과 함께 사용된 문자클래스는 지정된 문자를 제외한 모든 문자이므로
문자클래스에 \n을 포함하지 않았다면 당연히 \n 을 포함하여 검사합니다.
3. m
이것은 주어진 문자열을 여러줄로 취급 하여 검사 하겠다 는 것입니다.
문자열의 시작을 나타내는 ^ 나 문자열의 끝을 나타내는 $ 와 같이 사용될때만 의미 가 있습니다.
즉, ^ 과 $의 의미가 변하게 됩니다.
^ 은 전체 문자열의 시작을 의미하지 않고 줄(line)의 시작 을 의미합니다.
반대로 $ 은 전체 문자열의 끝을 의미하지 않고 줄(line)의 끝 을 의미합니다.
m 패턴변경자를 사용하지 않았다면 주어진 문자열이 여러줄이라도 한줄로 취급합니다.
즉, \n (개행문자) 를 하나의 문자로 취급한다는 것이지 줄바꿈을 해주는 개행문자로 취급하지 않는다는 뜻 이기도 합니다.
예제20> test20.php
$string = "I am a boy.
You are a girl?
I am a student.
You are a student too?";
$patterns = Array();
$patterns[] = "/^I.+$/" ; // 첫글자가 I 인것을 찾는다.
$patterns[] = "/^Y.+$/" ; // 첫글자가 Y 인것을 찾는다.
$patterns[] = "/^I.+$/s" ; // s 패턴 변경자를 사용하여 첫글자가 I 인것을 찾는다.
$patterns[] = "/^Y.+$/s" ; // s 패턴 변경자를 사용하여 첫글자가 Y 인것을 찾는다.
$patterns[] = "/^I.+$/m" ; // m 패턴 변경자를 사용 하여 첫글자가 I인것을 찾는다.
$patterns[] = "/^Y.+$/m" ; // m 패턴 변경자를 사용 하여 첫글자가 Y인것을 찾는다.
$patterns[] = "/^I.+$/ms" ; // m 과 s 패턴 변경자를 사용 하여 첫글자가 I인것을 찾는다.
$patterns[] = "/^Y.+$/ms" ; // m 과 s 패턴 변경자를 사용 하여 첫글자가 Y인것을 찾는다.
$patterns[] = "/^I.+/" ; // 첫글자가 I 인것을 찾는다.
$patterns[] = "/^Y.+/" ; // 첫글자가 Y 인것을 찾는다.
$patterns[] = "/^I.+/s" ; // s 패턴 변경자를 사용하여 첫글자가 I 인것을 찾는다.
$patterns[] = "/^Y.+/s" ; // s 패턴 변경자를 사용하여 첫글자가 Y 인것을 찾는다.
$patterns[] = "/^I.+/m" ; // m 패턴 변경자를 사용 하여 첫글자가 I인것을 찾는다.
$patterns[] = "/^Y.+/m" ; // m 패턴 변경자를 사용 하여 첫글자가 Y인것을 찾는다.
$patterns[] = "/^I.+/ms" ; // m 과 s 패턴 변경자를 사용 하여 첫글자가 I인것을 찾는다.
$patterns[] = "/^Y.+/ms" ; // m 과 s 패턴 변경자를 사용 하여 첫글자가 Y인것을 찾는다.
foreach($patterns as $pattern){
if (preg_match($pattern, $string, $m)) {
echo '<font color="blue">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.<br>" . nl2br($m[0]) . "</font><br /><br />" . PHP_EOL;
}
else {
echo '<font color="red">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.</font><br /><br />" . PHP_EOL;
}
}
?>
결과 :
/^Y.+$/ ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^I.+$/s ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
I am a student.
You are a student too?
/^Y.+$/s ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^I.+$/m ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
/^Y.+$/m ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
You are a girl?
/^I.+$/ms ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
I am a student.
You are a student too?
/^Y.+$/ms ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
You are a girl?
I am a student.
You are a student too?
/^I.+/ ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
/^Y.+/ ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^I.+/s ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
I am a student.
You are a student too?
/^Y.+/s ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^I.+/m ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
/^Y.+/m ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
You are a girl?
/^I.+/ms ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
I am a student.
You are a student too?
/^Y.+/ms ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
You are a girl?
I am a student.
You are a student too?
따라서 주어진 문자열에는 \n 이 포함되어 있으므로 매치된 결과가 없는 것입니다.
두번째 /^Y.+$/ 패턴은 대문자 Y 로 시작하는 것을 찾는것을 제외하면 첫번째 패턴과 동일합니다.
다섯번째 /^I.+$/m 패턴은 m 패턴변경자를 사용함 으로써 ^ 과 $ 이 줄의 시작과 끝 을 가리키게 되므로 I am a boy. 가 매치되었습니다.
일곱번째 /^I.+$/ms 패턴은 m 과 s 패턴변경자 두개를 동시에 사용 하였습니다.
의미가 다른 패턴 변경자는 여러개를 동시에 사용할수 있습니다.
그런데, 여기서 보면 m 패턴변경자를 사용하였으므로 $ 은 줄의 끝을 가리키는 것인데, 결과값은 4줄 모두 나왔습니다.
그 이유는 정규표현식은 매치되는 문자열을, 최대로 매치되는 범위 모두를 잡기 때문에 그렇습니다.
s 패턴 변경자를 사용하였기 때문에 \n 도 . 메타문자에 포함되고 맨끝도 라인의 끝이 되므로 모두 매치되는 것입니다.
아홉번째 이하는 $ 의 있고 없고의 차이를 보여주기 위한 예제입니다.
댓글 20개
음~ 크롬에서는 추천이 안되는군요... 다시 익스로 들어와서 추천!!
예전에 깊게는 못보고 언뜻 나린위키 파서를 훓어 본거 같은데.
아주 잘 만들었던 것 같습니다.
2라인 이상일 때 시작(^), 종료($) 메타 문자의 범위를
현재 라인에서 전체 라인으로 범위를 확대해주는 역활이군요.
잘 봤습니다.
말씀 하신 것과 반대의 의미 입니다.
m 을 사용하게 되면
^ 은 라인의 시작
$ 은 라인의 끝을 의미 합니다.
좋게 봐주셔서 감사합니다.
감사합니다.
제가 시간 날때 한번씩 올립니다.
감사합니다.
좋은강좌 감사합니다 ^^
나중에 패턴변경자 2가 있습니다.
게시판 목록
프로그램
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 8130 | 9년 전 | 542 | ||
| 8129 |
|
9년 전 | 668 | |
| 8128 | 9년 전 | 528 | ||
| 8127 |
|
9년 전 | 581 | |
| 8126 | 9년 전 | 514 | ||
| 8125 | 9년 전 | 776 | ||
| 8124 |
|
9년 전 | 533 | |
| 8123 | 9년 전 | 519 | ||
| 8122 | 9년 전 | 450 | ||
| 8121 | 9년 전 | 559 | ||
| 8120 | 9년 전 | 479 | ||
| 8119 | 9년 전 | 569 | ||
| 8118 |
|
9년 전 | 642 | |
| 8117 |
|
9년 전 | 414 | |
| 8116 |
PASKRAN
|
9년 전 | 472 | |
| 8115 | 9년 전 | 465 | ||
| 8114 |
kiplayer
|
9년 전 | 604 | |
| 8113 | 9년 전 | 464 | ||
| 8112 |
|
9년 전 | 572 | |
| 8111 | 9년 전 | 413 | ||
| 8110 | 9년 전 | 452 | ||
| 8109 | 9년 전 | 384 | ||
| 8108 |
|
9년 전 | 560 | |
| 8107 |
|
9년 전 | 449 | |
| 8106 |
|
9년 전 | 453 | |
| 8105 | 9년 전 | 483 | ||
| 8104 |
|
9년 전 | 447 | |
| 8103 |
|
9년 전 | 445 | |
| 8102 |
|
9년 전 | 418 | |
| 8101 |
snshero
|
9년 전 | 806 | |
| 8100 | 9년 전 | 852 | ||
| 8099 | 9년 전 | 828 | ||
| 8098 | 9년 전 | 724 | ||
| 8097 | 9년 전 | 535 | ||
| 8096 | 9년 전 | 731 | ||
| 8095 | 9년 전 | 859 | ||
| 8094 | 9년 전 | 534 | ||
| 8093 | 9년 전 | 817 | ||
| 8092 | 9년 전 | 770 | ||
| 8091 | 9년 전 | 1152 | ||
| 8090 | 9년 전 | 781 | ||
| 8089 | 9년 전 | 993 | ||
| 8088 | 9년 전 | 658 | ||
| 8087 | 9년 전 | 784 | ||
| 8086 | 9년 전 | 533 | ||
| 8085 | 9년 전 | 497 | ||
| 8084 | 9년 전 | 617 | ||
| 8083 | 9년 전 | 589 | ||
| 8082 | 9년 전 | 775 | ||
| 8081 | 9년 전 | 484 | ||
| 8080 | 9년 전 | 585 | ||
| 8079 | 9년 전 | 543 | ||
| 8078 | 9년 전 | 461 | ||
| 8077 | 9년 전 | 552 | ||
| 8076 | 9년 전 | 420 | ||
| 8075 | 9년 전 | 456 | ||
| 8074 | 9년 전 | 414 | ||
| 8073 | 9년 전 | 471 | ||
| 8072 | 9년 전 | 464 | ||
| 8071 |
o1o111
|
9년 전 | 911 | |
| 8070 | 9년 전 | 418 | ||
| 8069 | 9년 전 | 358 | ||
| 8068 | 9년 전 | 610 | ||
| 8067 | 9년 전 | 410 | ||
| 8066 | 9년 전 | 435 | ||
| 8065 | 9년 전 | 398 | ||
| 8064 | 9년 전 | 388 | ||
| 8063 | 9년 전 | 357 | ||
| 8062 | 9년 전 | 322 | ||
| 8061 | 9년 전 | 362 | ||
| 8060 | 9년 전 | 403 | ||
| 8059 | 9년 전 | 339 | ||
| 8058 | 9년 전 | 276 | ||
| 8057 | 9년 전 | 404 | ||
| 8056 | 9년 전 | 321 | ||
| 8055 | 9년 전 | 370 | ||
| 8054 | 9년 전 | 378 | ||
| 8053 | 9년 전 | 430 | ||
| 8052 | 9년 전 | 304 | ||
| 8051 | 9년 전 | 351 | ||
| 8050 | 9년 전 | 407 | ||
| 8049 | 9년 전 | 337 | ||
| 8048 | 9년 전 | 443 | ||
| 8047 | 9년 전 | 381 | ||
| 8046 | 9년 전 | 328 | ||
| 8045 | 9년 전 | 273 | ||
| 8044 | 9년 전 | 359 | ||
| 8043 | 9년 전 | 313 | ||
| 8042 | 9년 전 | 307 | ||
| 8041 | 9년 전 | 367 | ||
| 8040 | 9년 전 | 292 | ||
| 8039 | 9년 전 | 333 | ||
| 8038 | 9년 전 | 280 | ||
| 8037 | 9년 전 | 421 | ||
| 8036 | 9년 전 | 511 | ||
| 8035 | 9년 전 | 444 | ||
| 8034 | 9년 전 | 402 | ||
| 8033 | 9년 전 | 364 | ||
| 8032 | 9년 전 | 465 | ||
| 8031 | 9년 전 | 363 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기