테스트 사이트 - 개발 중인 베타 버전입니다

정규표현식의 기본구조

대단할것은 없는 강좌이지만,
제 강좌를 출처를 밝히고 외부로 퍼가는 것은 허용하지만,
다른 강좌의 자료나 책의 자료로 사용되거나 부분적인 인용은 허용하지 않습니다.

강좌는 php 5. 대를 기준으로 하며, PCRE (펄과 호환 되는 정규표현식)을 다룹니다.
PCRE 는 preg_ 로 시작되는 내장함수와 함께 사용되어지는 정규표현식을 말합니다.

PCRE > 정규표현식의 기본구조

정규표현식의 기본 구조는
[패턴구분자] [정규표현식] [패턴구분자] [패턴변경자]
입니다.

패턴구분자는 영어 알파벳, 숫자, \ (역슬래쉬) 를 제외한 1byte 문자 를 사용합니다.
` ~ ! @ # / ......

다음과 같은, 정규표현식 내에서 사용되는 의미 있는 메타 문자 는 패턴구분자로서 사용할수 있지만,
패턴구분자로 사용을 권장하지 않습니다.

나중에 다시 설명하겠지만 정규표현식에서 의미 있는 메타 문자는
$ ^ * ( ) + | \ { } ? ......
등이 있습니다.

`[정규표현식]`[패턴변경자]
@[정규표현식]@[패턴변경자]
......


그런데 여기서 평소에 정규표현식을 접해 보던 분들든

"`[정규표현식]`[패턴변경자]"

'`[정규표현식]`[패턴변경자]'
형태로 쓰이는 것을 보셨을 겁니다.

이것은 뭐지? (' 나 " 로 항상 싸여 있는데 왜 기본구조에 포함되지 않지?)
라고 생각하시는 분이 있을지도 모릅니다.

PCRE 는 preg_ 계열의 함수와 쓰이는데
정규표현식이 들어 가는 부분이 함수의 하나의 인자입니다.

즉, 해당 인자가 문자열로 값을 받기 때문에 문자열로 만들기 위한 것입니다.
$a = 'abcde';
또는
$a = "abcde";

$a라는 변수에 abcde 라는 문자열을 할당하는 것과 같은 이치입니다.

많이 쓰는 다른 함수로 예를 들면,
$a = str_replace('abc', 'ABC', $a);
와 같은 것입니다.


아래의 예제는 이메일주소에서 아이디 부분만 뽑는 것입니다.

예제1> test1.php

<?php

$email = 'dbckdghk1@nate.com';
preg_match("`^([^@]+)@`", $email, $match);
echo $match[1];

?>


결과 :

dbckdghk1




아래의 예제는 회원가입 등에서 올바른 아이디 인지를 체크하는 것입니다.
이해를 돕기위해 여러가지 경우의 아이디를 동시에 체크하도록 만들어 보았습니다.

예제2> test2.php

<?php

$ids = Array();
$ids[] = 'dbckdghk';
$ids[] = 'dbckdghk1';
$ids[] = 'dbckdghk1_';
$ids[] = 'DBCKDGHK';
$ids[] = 'DbCKdGHk1_';
$ids[] = 'dbc';//3자
$ids[] = 'dbckdghkdbckdghk';//16자
$ids[] = 'dbckdghk&';//_ 이외의 특수 문자
$ids[] = '유창화';//한글

foreach($ids as $id){

    echo $id . ' ==> ';

    //영어 알파벳(대소문자 구분없음), 숫자, _ 만 사용 가능하며, 4자이상 10자 이하
    if (preg_match("`^[0-9a-z_]{4,10}$`i", $id)) {

        echo "<font color='blue'>사용 가능한 아이디 입니다.</font> <br />" . PHP_EOL;
    }
    else {

        echo "<font color='red'>사용 할수 없는 아이디 입니다.</font> <br />" . PHP_EOL;
    }
}

?>


결과 :

dbckdghk ==> 사용 가능한 아이디 입니다.
dbckdghk1 ==> 사용 가능한 아이디 입니다.
dbckdghk1_ ==> 사용 가능한 아이디 입니다.
DBCKDGHK ==> 사용 가능한 아이디 입니다.
DbCKdGHk1_ ==> 사용 가능한 아이디 입니다.
dbc ==> 사용 할수 없는 아이디 입니다.
dbckdghkdbckdghk ==> 사용 할수 없는 아이디 입니다.
dbckdghk& ==> 사용 할수 없는 아이디 입니다.
유창화 ==> 사용 할수 없는 아이디 입니다.


나중에 설명하겠지만,
위의 예제에서는
` 를 패턴구분자로 하며
^, $, {, }, [, ] 메타 문자 와
대소문자를 구분하지 않는 i 패턴변경자
가 사용 된 정규표현식 패턴 입니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 17개

첫강 감사드립니다.
첫댓글 감사드립니다.
아하 저런 구조구나! 정규식 기본구조에 대해 처음 알았네요 :) !
네에 감사합니다.
감사합니다.
열심히 구독해서 제것으로 만들겠습니다....^^
감사합니다 잘 봤습니다~~
네에 고맙습니다.~~
감사합니다. 앞으로 강좌가 기대됩니다.
네에 감사합니다.
기대하고 열심히 읽어보고 익혀봐야겠네요.. 감사합니다 :)
강의 잘봤습니다
감사합니다 .잘보고 갑니다.

게시글 목록

번호 제목
20097
20095
20093
20092
20091
20089
20086
20085
20084
20083
20082
28358
20081
20079
20078
20077
20076
20075
20074
20073
20072
20071
20070
20069
8148
20057
8141
24669
20056
8138
28353
20055
20054
20053
20052
20051
20050
20047
20046
20045
20044
8111
20043
20042
20040
20039
20037
20036
20035
20027
8107
31022
20026
20025
20024
20023
28350
20022
20018
20017
8099
20016
20013
8090
20012
20010
20009
19998
28348
28347
19997
19996
19995
19993
8087
8065
19990
8063
8056
19989
19988
19987
19986
19985
19984
19983
19982
8054
19981
19980
19979
19978
19977
19976
19975
19974
19973
19972
19971
19970