테스트 사이트 - 개발 중인 베타 버전입니다

정규표현식의 기본구조

· 12년 전 · 11701 · 17
대단할것은 없는 강좌이지만,
제 강좌를 출처를 밝히고 외부로 퍼가는 것은 허용하지만,
다른 강좌의 자료나 책의 자료로 사용되거나 부분적인 인용은 허용하지 않습니다.

강좌는 php 5. 대를 기준으로 하며, PCRE (펄과 호환 되는 정규표현식)을 다룹니다.
PCRE 는 preg_ 로 시작되는 내장함수와 함께 사용되어지는 정규표현식을 말합니다.

PCRE > 정규표현식의 기본구조

정규표현식의 기본 구조는
[패턴구분자] [정규표현식] [패턴구분자] [패턴변경자]
입니다.

패턴구분자는 영어 알파벳, 숫자, \ (역슬래쉬) 를 제외한 1byte 문자 를 사용합니다.
` ~ ! @ # / ......

다음과 같은, 정규표현식 내에서 사용되는 의미 있는 메타 문자 는 패턴구분자로서 사용할수 있지만,
패턴구분자로 사용을 권장하지 않습니다.

나중에 다시 설명하겠지만 정규표현식에서 의미 있는 메타 문자는
$ ^ * ( ) + | \ { } ? ......
등이 있습니다.

`[정규표현식]`[패턴변경자]
@[정규표현식]@[패턴변경자]
......


그런데 여기서 평소에 정규표현식을 접해 보던 분들든

"`[정규표현식]`[패턴변경자]"

'`[정규표현식]`[패턴변경자]'
형태로 쓰이는 것을 보셨을 겁니다.

이것은 뭐지? (' 나 " 로 항상 싸여 있는데 왜 기본구조에 포함되지 않지?)
라고 생각하시는 분이 있을지도 모릅니다.

PCRE 는 preg_ 계열의 함수와 쓰이는데
정규표현식이 들어 가는 부분이 함수의 하나의 인자입니다.

즉, 해당 인자가 문자열로 값을 받기 때문에 문자열로 만들기 위한 것입니다.
$a = 'abcde';
또는
$a = "abcde";

$a라는 변수에 abcde 라는 문자열을 할당하는 것과 같은 이치입니다.

많이 쓰는 다른 함수로 예를 들면,
$a = str_replace('abc', 'ABC', $a);
와 같은 것입니다.


아래의 예제는 이메일주소에서 아이디 부분만 뽑는 것입니다.

예제1> test1.php

<?php

$email = 'dbckdghk1@nate.com';
preg_match("`^([^@]+)@`", $email, $match);
echo $match[1];

?>


결과 :

dbckdghk1




아래의 예제는 회원가입 등에서 올바른 아이디 인지를 체크하는 것입니다.
이해를 돕기위해 여러가지 경우의 아이디를 동시에 체크하도록 만들어 보았습니다.

예제2> test2.php

<?php

$ids = Array();
$ids[] = 'dbckdghk';
$ids[] = 'dbckdghk1';
$ids[] = 'dbckdghk1_';
$ids[] = 'DBCKDGHK';
$ids[] = 'DbCKdGHk1_';
$ids[] = 'dbc';//3자
$ids[] = 'dbckdghkdbckdghk';//16자
$ids[] = 'dbckdghk&';//_ 이외의 특수 문자
$ids[] = '유창화';//한글

foreach($ids as $id){

    echo $id . ' ==> ';

    //영어 알파벳(대소문자 구분없음), 숫자, _ 만 사용 가능하며, 4자이상 10자 이하
    if (preg_match("`^[0-9a-z_]{4,10}$`i", $id)) {

        echo "<font color='blue'>사용 가능한 아이디 입니다.</font> <br />" . PHP_EOL;
    }
    else {

        echo "<font color='red'>사용 할수 없는 아이디 입니다.</font> <br />" . PHP_EOL;
    }
}

?>


결과 :

dbckdghk ==> 사용 가능한 아이디 입니다.
dbckdghk1 ==> 사용 가능한 아이디 입니다.
dbckdghk1_ ==> 사용 가능한 아이디 입니다.
DBCKDGHK ==> 사용 가능한 아이디 입니다.
DbCKdGHk1_ ==> 사용 가능한 아이디 입니다.
dbc ==> 사용 할수 없는 아이디 입니다.
dbckdghkdbckdghk ==> 사용 할수 없는 아이디 입니다.
dbckdghk& ==> 사용 할수 없는 아이디 입니다.
유창화 ==> 사용 할수 없는 아이디 입니다.


나중에 설명하겠지만,
위의 예제에서는
` 를 패턴구분자로 하며
^, $, {, }, [, ] 메타 문자 와
대소문자를 구분하지 않는 i 패턴변경자
가 사용 된 정규표현식 패턴 입니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 17개

감사합니다. 앞으로 강좌가 기대됩니다.
네에 감사합니다.
기대하고 열심히 읽어보고 익혀봐야겠네요.. 감사합니다 :)
넵!!
고맙습니다.
11년 전
강의 잘봤습니다
11년 전
감사합니다 .잘보고 갑니다.

게시글 목록

번호 제목
716
715
714
713
712
711
710
정규표현식 PHP 정규식 정리 3
709
708
707
706
정규표현식 정규식 기초
695
689
688
687
656
651
643
638
633
606
593
584
576
562
556
539
538
537
536