테스트 사이트 - 개발 중인 베타 버전입니다

쉬어가는 페이지 > 정규표현식은 왜 알아야 하고 필요한가?

· 12년 전 · 3659 · 14
정규표현식을 모르거나 사용안한다고 하여도 프로그램을 하는 데는 전혀 지장이 없습니다.
클래스를 모른다고 프로그램이 안되지 않는 것처럼, 정규표현식도 그렇습니다.
프로그램은 문법 과 제어구조만 알아도 다 만들수 있습니다.

단, 생산성과 효율성의 문제에서 다른 것들을 익히고 알아야 할 필요가 있습니다.

많이 쓰는 부분을 정리해서 함수로 만들고,
그런 함수들을 모아서 새로운 기능 정의와 함께 클래스를 만들고,
또 그런 클래스를 모아서 또 새로운 여러가지 추가와 함께 패키지 형태로 만들고........

이렇게 하는 이유는 매번 반복하는 부분들에 대해서 빠르고 쉽게 재사용하여 생산성과 효율성을 높이기 위해서라고 저는 개인 적으로 생각합니다.
물론, 부가적으로 성능 개선과 같은 잇점도 발생 할수도 있습니다.

각설하고. 

아래와 같은 정규표현식을 사용하는 문제가 있습니다.
문제 > 입력받은 문자열에서 알파벳 소문자 중 하나가 포함되어 있다면 그것을 출력하라.

풀이>
<?php

$string = '12345j6789';

if (preg_match("/[a-z]/", $string, $matches)) {

    echo $matches[0];
}
else {

    echo $string . ' 에서 알파벳 소문자가 발견되지 않았습니다.';
}

?>

이것을 정규 표현식을 사용하지 않고 구현하라 라고 한다면........
아주 간단한 정규 표현식임에도 불구하고, 이런 문제를 평소에 접해보지 않은 사람이라면 잠시 헤멜 수도 있습니다.
방법이야 여러가지가 있겠지만 저는 다음 두가지 방식으로 한번 풀어봤습니다.

1. php 의 문자열 특성을 이용한 풀이
<?php

$string = '12345j6789';

$string_length = strlen($string);
$range = range('a', 'z');

$find = '';
$k = 0;
while($k < $string_length){

    if (in_array($string[$k], $range)) {

        $find = $string[$k];
        break;
    }

    $k++;
}

if (!empty($find)) {

    echo $find;
}
else {

    echo $string . ' 에서 알파벳 소문자가 발견되지 않았습니다.';
}

?>

2. php 의 substr 을 이용한 풀이
<?php

$string = '12345j6789';

$string_length = strlen($string);
$range = range('a', 'z');

$find = '';
$k = 0;
while($k < $string_length){

    if (in_array(substr($string, $k, 1), $range)) {

        $find = substr($string, $k, 1);
        break;
    }

    $k++;
}

if (!empty($find)) {

    echo $find;
}
else {

    echo $string . ' 에서 알파벳 소문자가 발견되지 않았습니다.';
}

?>

보시는 바와 같이 프로그램이 다소 복잡해졌습니다.
알파벳 소문자 하나를 찾기 위해서, 정규표현식으로는 간단하게 패턴만 만들어줌으로서 그과정을 모두 대신했지만,
정규표현식을 사용하지 않으면, 알파벳 소문자를 찾기 위한 과정이 처리과정에 포함되어야 합니다.


이렇게 간단한 것도 이정도 차이가 나는데
이전 내용에서 예제로 들었던 

<?php

$strings = Array();
$strings[] = 'dbckdghk1@nate.com';
$strings[] = "DBCKDGHK2@yahoo.co.kr";
$strings[] = "dbckdghk1@dbckdghk2@naver.com";
$strings[] = 'dbckdghk1.dbckdghk2@naver.com';
$strings[] = "DBCKDGHK@i-boss.co.kr";

foreach($strings as $string){

    //이메일은 @ 를 기준으로 아이디와 서버로 구분된다. 아이디에는 @ 와 . 은 올수 없으며 4자이상이다. 서버에는 알파벳 소문자와 숫자 - .으로 3 자 이상으로 구성 되어있다.
    if (preg_match('/^[^@.]{4,}@[0-9a-z-.]{3,}$/', $string, $matches)) {

        echo '<font color="blue">' . $string . ' 은 정상적인 이메일입니다.</font><br />' . PHP_EOL;
    }
    else {

        echo '<font color="red">' . $string . ' 은 정상적인 이메일이 아닙니다.</font><br />' . PHP_EOL;
    }
}

?>

이런 것을 정규표현식을 사용하지 않고 직접 구현하려면, 음......
이것만으로도 적지 않은 양의 라인수를 가진 프로그램이 된다는 것은 직감적으로도 알수 있습니다.



아무튼.......
제 말의 요지는 프로그램 이란 자체도 일일이 손으로 계산하고 처리하던 것을 생산성 과 효율성을 위해 만들어진 것처럼
프로그램 내에서도 생산성과 효율성은 배제 할수 없는 부분 이라는 것입니다.

그중에 이 정규표현식은 특히나 더 큰 생산성과 효율성을 제시하기 때문에, 반드시 알고 있어야 할 프로그램적인 소양 같은 것이라고 저는 생각합니다.



이상, 정규표현식을 왜 알아야 하고 필요한지 저의 생각이었습니다.
감사합니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 14개

그누보드 소스 분석하다가 정규표현식나오면 일단 뒤로 미뤄두곤 했었는데, 이제야 들여다 보내요.
좋은 강의 감사합니다.
좋은 강의 감사합니다.
좋은 내용 감사합니다.
11년 전
좋은 강좌를 게시해 주셔서 감사드립니다. ^^

게시글 목록

번호 제목
32341
32339
32326
32325
32322
32319
32318
32316
32315
32313
32312
32311
32310
32304
32303
32300
32293
32292
32291
32285
32284
32275
32271
32268
32265
32261
32258
32257
32255
32254
32253
32251
32250
32249
32247
32246
32245
32244
32243
32242
32241
32240
32239
32238
32237
32236
32232
32229
32228
32227
32217
32215
32214
32213
32211
32207
32196
32193
32192
32190
32188
32186
32184
32173
32172
32171
32167
32165
32163
32162
32158
32157
32155
32151
32149
32135
32132
32127
32125
32122
32120
32119
32117
32116
32115
32114
32112
32111
32109
32107
32104
32103
32102
32101
32094
32089
20404
31036
8279
8268