테스트 사이트 - 개발 중인 베타 버전입니다

따옴표 안의 여러 개행문자만 삭제하고 싶을 때..

· 15년 전 · 2855 · 3
구글 주소록을 내려받았습니다.
헤더 값이 다음과 같더군요.

Name,Given Name,Additional Name,Family Name,Yomi Name,Given Name Yomi,Additional Name Yomi,Family Name Yomi,Name Prefix,Name Suffix,Initials,Nickname,Short Name,Maiden Name,Birthday,Gender,Location,Billing Information,Directory Server,Mileage,Occupation,Hobby,Sensitivity,Priority,Subject,Notes,Group Membership,E-mail 1 - Type,E-mail 1 - Value,E-mail 2 - Type,E-mail 2 - Value,E-mail 3 - Type,E-mail 3 - Value,IM 1 - Type,IM 1 - Service,IM 1 - Value,Phone 1 - Type,Phone 1 - Value,Phone 2 - Type,Phone 2 - Value,Organization 1 - Type,Organization 1 - Name,Organization 1 - Yomi Name,Organization 1 - Title,Organization 1 - Department,Organization 1 - Symbol,Organization 1 - Location,Organization 1 - Job Description,Website 1 - Type,Website 1 - Value,Custom Field 1 - Type,Custom Field 1 - Value

메일 클라이언트(썬더버드)랑 자주 주소록 싱크를 하다보니 이런 정보들이 많이 생기더군요..
저 중에 필요한 컬럼은 몇 개 없습니다.
구글의 주소록병합기능은 화면에서 볼 때만 병합되어 보이고 실제로 비슷한 이름으로 성-이름이 찢어진채 여러 개의 주소가 생겨버리기도 합니다.

문제는 저 항목중에 NOTE 컬럼은 개행문자가 들어가 있습니다(제가 메모로 뭔가 적어놓은것들이 많은데, 개행문자가 들어있더군요..
한 명만 예를 들면..

권XX,XX,,권,,,,,,,,,,,,,,,,,,,,,,"이메일: cXXXXX@nate.com
회사/소속: 머시기
차장
",* My Contacts,* Home,cXXXXX@nate.com,,,,,,,,Mobile,01012345678,,,,머시기,,차장,,,,,,,,

요로코롬 한 명에 대해 한 줄이 아니라 메모때문에 여러 줄이 들어가있습니다.

요걸

권XX,XX,,권,,,,,,,,,,,,,,,,,,,,,,"이메일: cXXXXX@nate.com - 회사/소속: 머시기 - 차장 ",* My Contacts,* Home,cXXXXX@nate.com,,,,,,,,Mobile,01012345678,,,,머시기,,차장,,,,,,,,

요렇게 개행문자 표현이 없이 "-" 로 바꿔 저장해서 이걸 엑셀로 불러들이면 따옴표 부분도 셀분리가 잘 되서 데이터화 할 수 있을 것 같습니다.
주소록 정리하고 싶어서요..

에디트플러스나 vi에서 정규식으로 저 작업을 일괄처리하고 싶은데,
머리가 나쁘네요..
우찌하면 좋죠?

".*(\n)+.*"
요 구문으로 에디트플러스에서 따옴표로 둘러쌓인 부분을 찾아보니 개행문자가 여러 행 들어가버린 줄은 안찾아지네요..

"쏼라쏼라\n
쏼라"

요런건 찾아지는데,

"솰라솰라\n
솰라\n
또솰라\n
"
요렇게 개행문자가 중간중간 몇개든지 들어가버리면 못찾는다는겁니다.
저 찾아진걸 다 "-" (대쉬) 로 바꿔버리는 간단한 방법을 좀 찾고있습니다.
도와주실 분 계신가요?<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 18:00:23 Regular Expression (정규표현식)에서 이동 됨]</div>

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

csv형식이네요 정규식보다는 fgetcsv 함수를 이용하면 한번에 배열로 변환해줍니다
php 함수를 사용할건 아니구요.. 다른 프로그램에서도 동일하게 결과를 얻을 수 있으려면 일반적인 정규식으로 만들어야겠죠..
서버용 프로그램이 아니라...
이까짓거, 생각해볼 가치도 없다고 여기시는 분께선 부디 댓글로 훈수를..
오랜만에 들렸네요.

$t = "
우리나라
대한민국
입니다.

개행이에요

";

echo preg_replace("/(.*)\n(.*)/", "$1-$2", $t);

게시글 목록

번호 제목
21248
13844
529
13842
526
29537
518
502
13840
25293
21244
29532
25288
29531
500
13836
21241
495
13832
25283
21236
13830
490
21220
21217
25277
25276
25275
484
13827
13825
13819
29529
13813
479
21211
25273
478
21201
25272
21189
477
476
21185
474
21181
21175
472
470
469
467
465
21168
25267
463
21164
21161
458
21146
457
13807
454
29528
451
447
21127
21122
25262
25254
21119
25251
25243
25239
21112
442
21103
25233
25222
25230
441
21100
25215
21097
21091
25212
25210
25209
21083
21080
439
438
436
25200
21066
25195
21055
21051
25192
21040
13803