테스트 사이트 - 개발 중인 베타 버전입니다

정규표현식의 기본구조

· 12년 전 · 6963 · 17
대단할것은 없는 강좌이지만,
제 강좌를 출처를 밝히고 외부로 퍼가는 것은 허용하지만,
다른 강좌의 자료나 책의 자료로 사용되거나 부분적인 인용은 허용하지 않습니다.

강좌는 php 5. 대를 기준으로 하며, PCRE (펄과 호환 되는 정규표현식)을 다룹니다.
PCRE 는 preg_ 로 시작되는 내장함수와 함께 사용되어지는 정규표현식을 말합니다.

PCRE > 정규표현식의 기본구조

정규표현식의 기본 구조는
[패턴구분자] [정규표현식] [패턴구분자] [패턴변경자]
입니다.

패턴구분자는 영어 알파벳, 숫자, \ (역슬래쉬) 를 제외한 1byte 문자 를 사용합니다.
` ~ ! @ # / ......

다음과 같은, 정규표현식 내에서 사용되는 의미 있는 메타 문자 는 패턴구분자로서 사용할수 있지만,
패턴구분자로 사용을 권장하지 않습니다.

나중에 다시 설명하겠지만 정규표현식에서 의미 있는 메타 문자는
$ ^ * ( ) + | \ { } ? ......
등이 있습니다.

`[정규표현식]`[패턴변경자]
@[정규표현식]@[패턴변경자]
......


그런데 여기서 평소에 정규표현식을 접해 보던 분들든

"`[정규표현식]`[패턴변경자]"

'`[정규표현식]`[패턴변경자]'
형태로 쓰이는 것을 보셨을 겁니다.

이것은 뭐지? (' 나 " 로 항상 싸여 있는데 왜 기본구조에 포함되지 않지?)
라고 생각하시는 분이 있을지도 모릅니다.

PCRE 는 preg_ 계열의 함수와 쓰이는데
정규표현식이 들어 가는 부분이 함수의 하나의 인자입니다.

즉, 해당 인자가 문자열로 값을 받기 때문에 문자열로 만들기 위한 것입니다.
$a = 'abcde';
또는
$a = "abcde";

$a라는 변수에 abcde 라는 문자열을 할당하는 것과 같은 이치입니다.

많이 쓰는 다른 함수로 예를 들면,
$a = str_replace('abc', 'ABC', $a);
와 같은 것입니다.


아래의 예제는 이메일주소에서 아이디 부분만 뽑는 것입니다.

예제1> test1.php

<?php

$email = 'dbckdghk1@nate.com';
preg_match("`^([^@]+)@`", $email, $match);
echo $match[1];

?>


결과 :

dbckdghk1




아래의 예제는 회원가입 등에서 올바른 아이디 인지를 체크하는 것입니다.
이해를 돕기위해 여러가지 경우의 아이디를 동시에 체크하도록 만들어 보았습니다.

예제2> test2.php

<?php

$ids = Array();
$ids[] = 'dbckdghk';
$ids[] = 'dbckdghk1';
$ids[] = 'dbckdghk1_';
$ids[] = 'DBCKDGHK';
$ids[] = 'DbCKdGHk1_';
$ids[] = 'dbc';//3자
$ids[] = 'dbckdghkdbckdghk';//16자
$ids[] = 'dbckdghk&';//_ 이외의 특수 문자
$ids[] = '유창화';//한글

foreach($ids as $id){

    echo $id . ' ==> ';

    //영어 알파벳(대소문자 구분없음), 숫자, _ 만 사용 가능하며, 4자이상 10자 이하
    if (preg_match("`^[0-9a-z_]{4,10}$`i", $id)) {

        echo "<font color='blue'>사용 가능한 아이디 입니다.</font> <br />" . PHP_EOL;
    }
    else {

        echo "<font color='red'>사용 할수 없는 아이디 입니다.</font> <br />" . PHP_EOL;
    }
}

?>


결과 :

dbckdghk ==> 사용 가능한 아이디 입니다.
dbckdghk1 ==> 사용 가능한 아이디 입니다.
dbckdghk1_ ==> 사용 가능한 아이디 입니다.
DBCKDGHK ==> 사용 가능한 아이디 입니다.
DbCKdGHk1_ ==> 사용 가능한 아이디 입니다.
dbc ==> 사용 할수 없는 아이디 입니다.
dbckdghkdbckdghk ==> 사용 할수 없는 아이디 입니다.
dbckdghk& ==> 사용 할수 없는 아이디 입니다.
유창화 ==> 사용 할수 없는 아이디 입니다.


나중에 설명하겠지만,
위의 예제에서는
` 를 패턴구분자로 하며
^, $, {, }, [, ] 메타 문자 와
대소문자를 구분하지 않는 i 패턴변경자
가 사용 된 정규표현식 패턴 입니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 17개

감사합니다. 앞으로 강좌가 기대됩니다.
네에 감사합니다.
기대하고 열심히 읽어보고 익혀봐야겠네요.. 감사합니다 :)
넵!!
고맙습니다.
11년 전
강의 잘봤습니다
11년 전
감사합니다 .잘보고 갑니다.

게시글 목록

번호 제목
20318
20317
20316
20315
20314
20313
20312
20311
20310
20309
20308
20307
20306
20303
20302
20301
20300
20299
20298
20297
20296
20295
20294
20293
20292
8222
20291
20290
20289
20288
20287
20286
20285
20284
20283
20282
20281
20280
20276
20275
20274
20273
8216
20272
20271
20270
20269
20268
20267
20265
20264
20263
20262
20261
20259
20258
20257
20256
20255
20254
20253
20252
20251
20250
20249
31028
20248
20247
20246
8215
20245
20244
20243
20242
20241
20240
20239
20238
20237
20236
20235
20234
20233
8197
20232
20231
20230
20229
20228
20227
20225
20224
20223
20222
20221
20220
20219
20218
20217
20216