테스트 사이트 - 개발 중인 베타 버전입니다

따옴표 안의 여러 개행문자만 삭제하고 싶을 때..

· 15년 전 · 2854 · 3
구글 주소록을 내려받았습니다.
헤더 값이 다음과 같더군요.

Name,Given Name,Additional Name,Family Name,Yomi Name,Given Name Yomi,Additional Name Yomi,Family Name Yomi,Name Prefix,Name Suffix,Initials,Nickname,Short Name,Maiden Name,Birthday,Gender,Location,Billing Information,Directory Server,Mileage,Occupation,Hobby,Sensitivity,Priority,Subject,Notes,Group Membership,E-mail 1 - Type,E-mail 1 - Value,E-mail 2 - Type,E-mail 2 - Value,E-mail 3 - Type,E-mail 3 - Value,IM 1 - Type,IM 1 - Service,IM 1 - Value,Phone 1 - Type,Phone 1 - Value,Phone 2 - Type,Phone 2 - Value,Organization 1 - Type,Organization 1 - Name,Organization 1 - Yomi Name,Organization 1 - Title,Organization 1 - Department,Organization 1 - Symbol,Organization 1 - Location,Organization 1 - Job Description,Website 1 - Type,Website 1 - Value,Custom Field 1 - Type,Custom Field 1 - Value

메일 클라이언트(썬더버드)랑 자주 주소록 싱크를 하다보니 이런 정보들이 많이 생기더군요..
저 중에 필요한 컬럼은 몇 개 없습니다.
구글의 주소록병합기능은 화면에서 볼 때만 병합되어 보이고 실제로 비슷한 이름으로 성-이름이 찢어진채 여러 개의 주소가 생겨버리기도 합니다.

문제는 저 항목중에 NOTE 컬럼은 개행문자가 들어가 있습니다(제가 메모로 뭔가 적어놓은것들이 많은데, 개행문자가 들어있더군요..
한 명만 예를 들면..

권XX,XX,,권,,,,,,,,,,,,,,,,,,,,,,"이메일: cXXXXX@nate.com
회사/소속: 머시기
차장
",* My Contacts,* Home,cXXXXX@nate.com,,,,,,,,Mobile,01012345678,,,,머시기,,차장,,,,,,,,

요로코롬 한 명에 대해 한 줄이 아니라 메모때문에 여러 줄이 들어가있습니다.

요걸

권XX,XX,,권,,,,,,,,,,,,,,,,,,,,,,"이메일: cXXXXX@nate.com - 회사/소속: 머시기 - 차장 ",* My Contacts,* Home,cXXXXX@nate.com,,,,,,,,Mobile,01012345678,,,,머시기,,차장,,,,,,,,

요렇게 개행문자 표현이 없이 "-" 로 바꿔 저장해서 이걸 엑셀로 불러들이면 따옴표 부분도 셀분리가 잘 되서 데이터화 할 수 있을 것 같습니다.
주소록 정리하고 싶어서요..

에디트플러스나 vi에서 정규식으로 저 작업을 일괄처리하고 싶은데,
머리가 나쁘네요..
우찌하면 좋죠?

".*(\n)+.*"
요 구문으로 에디트플러스에서 따옴표로 둘러쌓인 부분을 찾아보니 개행문자가 여러 행 들어가버린 줄은 안찾아지네요..

"쏼라쏼라\n
쏼라"

요런건 찾아지는데,

"솰라솰라\n
솰라\n
또솰라\n
"
요렇게 개행문자가 중간중간 몇개든지 들어가버리면 못찾는다는겁니다.
저 찾아진걸 다 "-" (대쉬) 로 바꿔버리는 간단한 방법을 좀 찾고있습니다.
도와주실 분 계신가요?<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 18:00:23 Regular Expression (정규표현식)에서 이동 됨]</div>

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

csv형식이네요 정규식보다는 fgetcsv 함수를 이용하면 한번에 배열로 변환해줍니다
php 함수를 사용할건 아니구요.. 다른 프로그램에서도 동일하게 결과를 얻을 수 있으려면 일반적인 정규식으로 만들어야겠죠..
서버용 프로그램이 아니라...
이까짓거, 생각해볼 가치도 없다고 여기시는 분께선 부디 댓글로 훈수를..
오랜만에 들렸네요.

$t = "
우리나라
대한민국
입니다.

개행이에요

";

echo preg_replace("/(.*)\n(.*)/", "$1-$2", $t);

게시글 목록

번호 제목
755
21562
21559
754
750
749
13899
745
741
739
728
21546
21536
25342
21500
725
722
713
21483
21464
709
706
25340
25338
25335
698
681
679
676
25333
673
13894
13891
664
655
21451
642
25332
21447
29541
21430
21423
13889
638
627
29540
623
621
617
612
607
25331
600
13886
21405
592
13879
591
583
13868
25317
581
21402
576
13866
21365
21362
21359
21354
25313
21346
13865
570
567
21317
13860
25309
13859
21297
25307
559
13855
21291
13853
21288
13852
13851
21279
550
25306
545
13846
534
21274
25297
21265
25295
21262
21257
21250