제 강좌를 출처를 밝히고 외부로 퍼가는 것은 허용하지만,
다른 강좌의 자료나 책의 자료로 사용되거나 부분적인 인용은 허용하지 않습니다.
PCRE 는 preg_ 로 시작되는 내장함수와 함께 사용되어지는 정규표현식을 말합니다.
PCRE > 정규표현식 의 핵심. 패턴변경자 1
이전 내용에서는 정규표현식의 메타문자에 대해서 알아보았습니다.
이번 내용에서도 역시 정규표현식의 핵심이라고 볼수 있는 패턴변경자에 대해서 이어서 알아보도록 하겠습니다.
패턴변경자란?
쉽게 설명하자면, 복잡해질수 있는 패턴을 쉽게 표현 가능하도록 해주는 것입니다.
1. i
이것은 주어진 패턴으로 문자열을 검사하되 대소문자는 구별하지 않겠다 는 것입니다.
즉, /^[a-z]+$/ 이렇게 사용한다면, 알파벳 소문자로만 이루어진 문자열을 찾는것이고
/^[a-z]+$/i 와 같이 사용한다면, /^[a-zA-Z]+$/ 와 같은 방법인 대소문자 구분없이 알파벳으로 이루어진 문자열을 찾는것입니다.
예제18> test18.php
$string = "zOOzoOZOozooZooZOO";
$patterns = Array();
$patterns[] = "/[a-z]{3}/" ; // 연속된 알파벳 소문자 세자를 찾는 패턴
$patterns[] = "/[A-Z]{3}/" ; // 연속된 알파벳 대문자 세자를 찾는 패턴
$patterns[] = "/[a-zA-Z]{3}/" ; //대소문자 구분없이 연속된 알파벳 대문자 세자를 찾는 패턴
$patterns[] = "/[a-z]{3}/i" ; // i 패턴 변경자를 사용하여 대소문자 구분없이 연속된 알파벳 세자를 찾는 패턴
$patterns[] = "/[A-Z]{3}/i" ; // i 패턴 변경자를 사용하여 대소문자 구분없이 연속된 알파벳 세자를 찾는 패턴
$patterns[] = "/zoo/" ; // zoo 를 찾는 패턴
$patterns[] = "/ZOO/" ; // ZOO 를 찾는 패턴
$patterns[] = "/[zZ][oO][oO]/" ; //대소문자 구분없이 zoo 를 찾는 패턴
$patterns[] = "/zoo/i" ; // i 패턴 변경자를 사용하여 대소문자 구분없이 zoo 를 찾는 패턴
$patterns[] = "/ZOO/i" ; // i 패턴 변경자를 사용하여 대소문자 구분없이 zoo 를 찾는 패턴
foreach($patterns as $pattern){
if (preg_match($pattern, $string, $m)) {
echo '<font color="blue">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함한 문자열 입니다. <br>" . $m[0] . "</font><br /><br />" . PHP_EOL;
}
else {
echo '<font color="red">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.</font><br /><br />" . PHP_EOL;
}
}
?>
결과 :
ozo
/[A-Z]{3}/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
OZO
/[a-zA-Z]{3}/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/[a-z]{3}/i ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/[A-Z]{3}/i ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/zoo/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zoo
/ZOO/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
ZOO
/[zZ][oO][oO]/ ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/zoo/i ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
/ZOO/i ==> zOOzoOZOozooZooZOO 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
zOO
2. s
이것은 패턴 내의 . 메타 문자에 대하여 \n(개행문자) 를 포함하겠다 는 뜻입니다.
이전 내용에서 . 메타 문자 는 아무 문자나 하나 를 가리킨다고 하였습니다.
그러나, 이것을 좀 더 정확히 표현하자면 \n(개행문자) 를 제외한 모든 문자중 하나 입니다.
즉, . 메타문자에 \n 도 포함하여 사용할려면 s 패턴변경자와 같이 쓰여져야 합니다.
예제19> test19.php
$string = "I am a boy.
You are a girl?";
$patterns = Array();
$patterns[] = "/^.+/" ; // \n 을 제외한 모든 문자를 찾는다.
$patterns[] = "/^.+/s" ; // s 패턴 변경자를 사용하여 \n 을 포함한 모든 문자를 찾는다.
$patterns[] = "/^[^!]+/" ; // !를 제회한 모든 문자를 찾는다.
$patterns[] = "/^.+$/" ; // \n 을 제외한 모든 문자를 찾는다.
$patterns[] = "/^.+$/s" ; // s 패턴 변경자를 사용하여 \n 을 포함한 모든 문자를 찾는다.
$patterns[] = "/^[^!]+$/" ; // !를 제회한 모든 문자를 찾는다.
foreach($patterns as $pattern){
if (preg_match($pattern, $string, $m)) {
echo '<font color="blue">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함한 문자열 입니다. <br> " . nl2br($m[0]) . "</font><br /><br />" . PHP_EOL;
}
else {
echo '<font color="red">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.</font><br /><br />" . PHP_EOL;
}
}
?>
결과 :
I am a boy.
/^.+/s ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
/^[^!]+/ ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
/^.+$/ ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^.+$/s ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
/^[^!]+$/ ==> I am a boy.You are a girl? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
그런데, 첫번째는 결과가 있고, 두번째는 결과가 없습니다.
패턴의 차이는 $ 가 붙었나 안 붙었나의 차이입니다.
즉, 이것은 s 패턴변경자가 없기 때문에 . 메타문자는 \n 을 포함하지 않습니다.
따라서 원래의 문자열에 \n 이 포함되어있기 때문에 $ 가 붙으면 끝까지 일치 하는 것이므로 네번째는 결과가 없는 것입니다.
/^[^!]+/ 이 패턴을 예제에 넣은 이유는 . 메타문자와 ^ 과 함께 사용되는 문자클래스를 비교 하기 위함입니다.
. 은 s 패턴변경자에 따라 \n 문자를 포함하지만, ^ 과 함께 사용된 문자클래스는 지정된 문자를 제외한 모든 문자이므로
문자클래스에 \n을 포함하지 않았다면 당연히 \n 을 포함하여 검사합니다.
3. m
이것은 주어진 문자열을 여러줄로 취급 하여 검사 하겠다 는 것입니다.
문자열의 시작을 나타내는 ^ 나 문자열의 끝을 나타내는 $ 와 같이 사용될때만 의미 가 있습니다.
즉, ^ 과 $의 의미가 변하게 됩니다.
^ 은 전체 문자열의 시작을 의미하지 않고 줄(line)의 시작 을 의미합니다.
반대로 $ 은 전체 문자열의 끝을 의미하지 않고 줄(line)의 끝 을 의미합니다.
m 패턴변경자를 사용하지 않았다면 주어진 문자열이 여러줄이라도 한줄로 취급합니다.
즉, \n (개행문자) 를 하나의 문자로 취급한다는 것이지 줄바꿈을 해주는 개행문자로 취급하지 않는다는 뜻 이기도 합니다.
예제20> test20.php
$string = "I am a boy.
You are a girl?
I am a student.
You are a student too?";
$patterns = Array();
$patterns[] = "/^I.+$/" ; // 첫글자가 I 인것을 찾는다.
$patterns[] = "/^Y.+$/" ; // 첫글자가 Y 인것을 찾는다.
$patterns[] = "/^I.+$/s" ; // s 패턴 변경자를 사용하여 첫글자가 I 인것을 찾는다.
$patterns[] = "/^Y.+$/s" ; // s 패턴 변경자를 사용하여 첫글자가 Y 인것을 찾는다.
$patterns[] = "/^I.+$/m" ; // m 패턴 변경자를 사용 하여 첫글자가 I인것을 찾는다.
$patterns[] = "/^Y.+$/m" ; // m 패턴 변경자를 사용 하여 첫글자가 Y인것을 찾는다.
$patterns[] = "/^I.+$/ms" ; // m 과 s 패턴 변경자를 사용 하여 첫글자가 I인것을 찾는다.
$patterns[] = "/^Y.+$/ms" ; // m 과 s 패턴 변경자를 사용 하여 첫글자가 Y인것을 찾는다.
$patterns[] = "/^I.+/" ; // 첫글자가 I 인것을 찾는다.
$patterns[] = "/^Y.+/" ; // 첫글자가 Y 인것을 찾는다.
$patterns[] = "/^I.+/s" ; // s 패턴 변경자를 사용하여 첫글자가 I 인것을 찾는다.
$patterns[] = "/^Y.+/s" ; // s 패턴 변경자를 사용하여 첫글자가 Y 인것을 찾는다.
$patterns[] = "/^I.+/m" ; // m 패턴 변경자를 사용 하여 첫글자가 I인것을 찾는다.
$patterns[] = "/^Y.+/m" ; // m 패턴 변경자를 사용 하여 첫글자가 Y인것을 찾는다.
$patterns[] = "/^I.+/ms" ; // m 과 s 패턴 변경자를 사용 하여 첫글자가 I인것을 찾는다.
$patterns[] = "/^Y.+/ms" ; // m 과 s 패턴 변경자를 사용 하여 첫글자가 Y인것을 찾는다.
foreach($patterns as $pattern){
if (preg_match($pattern, $string, $m)) {
echo '<font color="blue">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.<br>" . nl2br($m[0]) . "</font><br /><br />" . PHP_EOL;
}
else {
echo '<font color="red">' . htmlspecialchars($pattern) . ' ==> ' . $string . " 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.</font><br /><br />" . PHP_EOL;
}
}
?>
결과 :
/^Y.+$/ ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^I.+$/s ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
I am a student.
You are a student too?
/^Y.+$/s ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^I.+$/m ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
/^Y.+$/m ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
You are a girl?
/^I.+$/ms ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
I am a student.
You are a student too?
/^Y.+$/ms ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
You are a girl?
I am a student.
You are a student too?
/^I.+/ ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
/^Y.+/ ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^I.+/s ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
I am a student.
You are a student too?
/^Y.+/s ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함하지 않은 문자열 입니다.
/^I.+/m ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
/^Y.+/m ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
You are a girl?
/^I.+/ms ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
I am a boy.
You are a girl?
I am a student.
You are a student too?
/^Y.+/ms ==> I am a boy.You are a girl?I am a student.You are a student too? 은 패턴에 매치되는 문자열을 포함한 문자열 입니다.
You are a girl?
I am a student.
You are a student too?
따라서 주어진 문자열에는 \n 이 포함되어 있으므로 매치된 결과가 없는 것입니다.
두번째 /^Y.+$/ 패턴은 대문자 Y 로 시작하는 것을 찾는것을 제외하면 첫번째 패턴과 동일합니다.
다섯번째 /^I.+$/m 패턴은 m 패턴변경자를 사용함 으로써 ^ 과 $ 이 줄의 시작과 끝 을 가리키게 되므로 I am a boy. 가 매치되었습니다.
일곱번째 /^I.+$/ms 패턴은 m 과 s 패턴변경자 두개를 동시에 사용 하였습니다.
의미가 다른 패턴 변경자는 여러개를 동시에 사용할수 있습니다.
그런데, 여기서 보면 m 패턴변경자를 사용하였으므로 $ 은 줄의 끝을 가리키는 것인데, 결과값은 4줄 모두 나왔습니다.
그 이유는 정규표현식은 매치되는 문자열을, 최대로 매치되는 범위 모두를 잡기 때문에 그렇습니다.
s 패턴 변경자를 사용하였기 때문에 \n 도 . 메타문자에 포함되고 맨끝도 라인의 끝이 되므로 모두 매치되는 것입니다.
아홉번째 이하는 $ 의 있고 없고의 차이를 보여주기 위한 예제입니다.
댓글 20개
음~ 크롬에서는 추천이 안되는군요... 다시 익스로 들어와서 추천!!
예전에 깊게는 못보고 언뜻 나린위키 파서를 훓어 본거 같은데.
아주 잘 만들었던 것 같습니다.
2라인 이상일 때 시작(^), 종료($) 메타 문자의 범위를
현재 라인에서 전체 라인으로 범위를 확대해주는 역활이군요.
잘 봤습니다.
말씀 하신 것과 반대의 의미 입니다.
m 을 사용하게 되면
^ 은 라인의 시작
$ 은 라인의 끝을 의미 합니다.
좋게 봐주셔서 감사합니다.
감사합니다.
제가 시간 날때 한번씩 올립니다.
감사합니다.
좋은강좌 감사합니다 ^^
나중에 패턴변경자 2가 있습니다.
게시판 목록
프로그램
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 6130 |
gender
|
12년 전 | 1075 | |
| 6129 | 12년 전 | 1315 | ||
| 6128 |
|
12년 전 | 3458 | |
| 6127 | 12년 전 | 692 | ||
| 6126 |
|
12년 전 | 2199 | |
| 6125 |
|
12년 전 | 4878 | |
| 6124 | 12년 전 | 652 | ||
| 6123 | 12년 전 | 3836 | ||
| 6122 | 12년 전 | 1016 | ||
| 6121 | 12년 전 | 3747 | ||
| 6120 | 12년 전 | 904 | ||
| 6119 | 12년 전 | 1767 | ||
| 6118 | 12년 전 | 922 | ||
| 6117 | 12년 전 | 2146 | ||
| 6116 | 12년 전 | 7931 | ||
| 6115 | 12년 전 | 1914 | ||
| 6114 |
|
12년 전 | 1702 | |
| 6113 | 12년 전 | 1520 | ||
| 6112 | 12년 전 | 588 | ||
| 6111 | 12년 전 | 2102 | ||
| 6110 | 12년 전 | 1842 | ||
| 6109 | 12년 전 | 631 | ||
| 6108 | 12년 전 | 1196 | ||
| 6107 | 12년 전 | 614 | ||
| 6106 | 12년 전 | 899 | ||
| 6105 | 12년 전 | 1184 | ||
| 6104 | 12년 전 | 3575 | ||
| 6103 | 12년 전 | 2111 | ||
| 6102 | 12년 전 | 2300 | ||
| 6101 | 12년 전 | 3667 | ||
| 6100 | 12년 전 | 3475 | ||
| 6099 | 12년 전 | 3140 | ||
| 6098 | 12년 전 | 4015 | ||
| 6097 | 12년 전 | 1009 | ||
| 6096 | 12년 전 | 5974 | ||
| 6095 | 12년 전 | 1360 | ||
| 6094 | 12년 전 | 1215 | ||
| 6093 | 12년 전 | 3398 | ||
| 6092 | 12년 전 | 3032 | ||
| 6091 | 12년 전 | 5184 | ||
| 6090 | 12년 전 | 2697 | ||
| 6089 | 12년 전 | 3324 | ||
| 6088 | 12년 전 | 1011 | ||
| 6087 | 12년 전 | 840 | ||
| 6086 | 12년 전 | 2015 | ||
| 6085 |
|
12년 전 | 805 | |
| 6084 |
웹디자인되고파
|
12년 전 | 2213 | |
| 6083 | 12년 전 | 1502 | ||
| 6082 | 12년 전 | 1100 | ||
| 6081 | 12년 전 | 2095 | ||
| 6080 |
Stiven
|
12년 전 | 2308 | |
| 6079 |
프로프리랜서
|
12년 전 | 1310 | |
| 6078 |
프로프리랜서
|
12년 전 | 785 | |
| 6077 |
프로프리랜서
|
12년 전 | 1333 | |
| 6076 |
프로프리랜서
|
12년 전 | 823 | |
| 6075 |
프로프리랜서
|
12년 전 | 1210 | |
| 6074 | 12년 전 | 3851 | ||
| 6073 | 12년 전 | 3944 | ||
| 6072 | 12년 전 | 1367 | ||
| 6071 | 12년 전 | 6978 | ||
| 6070 | 12년 전 | 7559 | ||
| 6069 | 12년 전 | 2310 | ||
| 6068 | 12년 전 | 3864 | ||
| 6067 |
smwkd
|
12년 전 | 628 | |
| 6066 | 12년 전 | 3650 | ||
| 6065 | 12년 전 | 3477 | ||
| 6064 | 12년 전 | 2712 | ||
| 6063 | 12년 전 | 2818 | ||
| 6062 | 12년 전 | 2356 | ||
| 6061 | 12년 전 | 2267 | ||
| 6060 | 12년 전 | 5169 | ||
| 6059 | 12년 전 | 2798 | ||
| 6058 | 12년 전 | 3126 | ||
| 6057 | 12년 전 | 2253 | ||
| 6056 | 12년 전 | 6835 | ||
| 6055 | 12년 전 | 2574 | ||
| 6054 | 12년 전 | 3424 | ||
| 6053 | 12년 전 | 2317 | ||
| 6052 | 12년 전 | 4813 | ||
| 6051 | 12년 전 | 3692 | ||
| 6050 | 12년 전 | 2549 | ||
| 6049 | 12년 전 | 2229 | ||
| 6048 |
|
12년 전 | 1284 | |
| 6047 | 12년 전 | 3426 | ||
| 6046 | 12년 전 | 4085 | ||
| 6045 | 12년 전 | 3450 | ||
| 6044 | 12년 전 | 5325 | ||
| 6043 | 12년 전 | 1646 | ||
| 6042 | 12년 전 | 1267 | ||
| 6041 | 12년 전 | 5161 | ||
| 6040 | 12년 전 | 935 | ||
| 6039 | 12년 전 | 3401 | ||
| 6038 | 12년 전 | 3403 | ||
| 6037 | 12년 전 | 2988 | ||
| 6036 | 12년 전 | 3340 | ||
| 6035 | 12년 전 | 2862 | ||
| 6034 | 12년 전 | 2842 | ||
| 6033 | 12년 전 | 2863 | ||
| 6032 | 12년 전 | 2854 | ||
| 6031 | 12년 전 | 2874 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기