테스트 사이트 - 개발 중인 베타 버전입니다

정규표현식의 기본구조

· 12년 전 · 11700 · 17
대단할것은 없는 강좌이지만,
제 강좌를 출처를 밝히고 외부로 퍼가는 것은 허용하지만,
다른 강좌의 자료나 책의 자료로 사용되거나 부분적인 인용은 허용하지 않습니다.

강좌는 php 5. 대를 기준으로 하며, PCRE (펄과 호환 되는 정규표현식)을 다룹니다.
PCRE 는 preg_ 로 시작되는 내장함수와 함께 사용되어지는 정규표현식을 말합니다.

PCRE > 정규표현식의 기본구조

정규표현식의 기본 구조는
[패턴구분자] [정규표현식] [패턴구분자] [패턴변경자]
입니다.

패턴구분자는 영어 알파벳, 숫자, \ (역슬래쉬) 를 제외한 1byte 문자 를 사용합니다.
` ~ ! @ # / ......

다음과 같은, 정규표현식 내에서 사용되는 의미 있는 메타 문자 는 패턴구분자로서 사용할수 있지만,
패턴구분자로 사용을 권장하지 않습니다.

나중에 다시 설명하겠지만 정규표현식에서 의미 있는 메타 문자는
$ ^ * ( ) + | \ { } ? ......
등이 있습니다.

`[정규표현식]`[패턴변경자]
@[정규표현식]@[패턴변경자]
......


그런데 여기서 평소에 정규표현식을 접해 보던 분들든

"`[정규표현식]`[패턴변경자]"

'`[정규표현식]`[패턴변경자]'
형태로 쓰이는 것을 보셨을 겁니다.

이것은 뭐지? (' 나 " 로 항상 싸여 있는데 왜 기본구조에 포함되지 않지?)
라고 생각하시는 분이 있을지도 모릅니다.

PCRE 는 preg_ 계열의 함수와 쓰이는데
정규표현식이 들어 가는 부분이 함수의 하나의 인자입니다.

즉, 해당 인자가 문자열로 값을 받기 때문에 문자열로 만들기 위한 것입니다.
$a = 'abcde';
또는
$a = "abcde";

$a라는 변수에 abcde 라는 문자열을 할당하는 것과 같은 이치입니다.

많이 쓰는 다른 함수로 예를 들면,
$a = str_replace('abc', 'ABC', $a);
와 같은 것입니다.


아래의 예제는 이메일주소에서 아이디 부분만 뽑는 것입니다.

예제1> test1.php

<?php

$email = 'dbckdghk1@nate.com';
preg_match("`^([^@]+)@`", $email, $match);
echo $match[1];

?>


결과 :

dbckdghk1




아래의 예제는 회원가입 등에서 올바른 아이디 인지를 체크하는 것입니다.
이해를 돕기위해 여러가지 경우의 아이디를 동시에 체크하도록 만들어 보았습니다.

예제2> test2.php

<?php

$ids = Array();
$ids[] = 'dbckdghk';
$ids[] = 'dbckdghk1';
$ids[] = 'dbckdghk1_';
$ids[] = 'DBCKDGHK';
$ids[] = 'DbCKdGHk1_';
$ids[] = 'dbc';//3자
$ids[] = 'dbckdghkdbckdghk';//16자
$ids[] = 'dbckdghk&';//_ 이외의 특수 문자
$ids[] = '유창화';//한글

foreach($ids as $id){

    echo $id . ' ==> ';

    //영어 알파벳(대소문자 구분없음), 숫자, _ 만 사용 가능하며, 4자이상 10자 이하
    if (preg_match("`^[0-9a-z_]{4,10}$`i", $id)) {

        echo "<font color='blue'>사용 가능한 아이디 입니다.</font> <br />" . PHP_EOL;
    }
    else {

        echo "<font color='red'>사용 할수 없는 아이디 입니다.</font> <br />" . PHP_EOL;
    }
}

?>


결과 :

dbckdghk ==> 사용 가능한 아이디 입니다.
dbckdghk1 ==> 사용 가능한 아이디 입니다.
dbckdghk1_ ==> 사용 가능한 아이디 입니다.
DBCKDGHK ==> 사용 가능한 아이디 입니다.
DbCKdGHk1_ ==> 사용 가능한 아이디 입니다.
dbc ==> 사용 할수 없는 아이디 입니다.
dbckdghkdbckdghk ==> 사용 할수 없는 아이디 입니다.
dbckdghk& ==> 사용 할수 없는 아이디 입니다.
유창화 ==> 사용 할수 없는 아이디 입니다.


나중에 설명하겠지만,
위의 예제에서는
` 를 패턴구분자로 하며
^, $, {, }, [, ] 메타 문자 와
대소문자를 구분하지 않는 i 패턴변경자
가 사용 된 정규표현식 패턴 입니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 17개

감사합니다. 앞으로 강좌가 기대됩니다.
네에 감사합니다.
기대하고 열심히 읽어보고 익혀봐야겠네요.. 감사합니다 :)
넵!!
고맙습니다.
11년 전
강의 잘봤습니다
11년 전
감사합니다 .잘보고 갑니다.

게시글 목록

번호 제목
1050
그누보드5 toto slot gacor
1047
1045
1044
1019
1017
1016
1007
1005
1004
967
964
917
889
879
851
848
762
741
740
727
726
725
724
723
722
721
720
719
717