테스트 사이트 - 개발 중인 베타 버전입니다

따옴표 안의 여러 개행문자만 삭제하고 싶을 때..

· 15년 전 · 2857 · 3
구글 주소록을 내려받았습니다.
헤더 값이 다음과 같더군요.

Name,Given Name,Additional Name,Family Name,Yomi Name,Given Name Yomi,Additional Name Yomi,Family Name Yomi,Name Prefix,Name Suffix,Initials,Nickname,Short Name,Maiden Name,Birthday,Gender,Location,Billing Information,Directory Server,Mileage,Occupation,Hobby,Sensitivity,Priority,Subject,Notes,Group Membership,E-mail 1 - Type,E-mail 1 - Value,E-mail 2 - Type,E-mail 2 - Value,E-mail 3 - Type,E-mail 3 - Value,IM 1 - Type,IM 1 - Service,IM 1 - Value,Phone 1 - Type,Phone 1 - Value,Phone 2 - Type,Phone 2 - Value,Organization 1 - Type,Organization 1 - Name,Organization 1 - Yomi Name,Organization 1 - Title,Organization 1 - Department,Organization 1 - Symbol,Organization 1 - Location,Organization 1 - Job Description,Website 1 - Type,Website 1 - Value,Custom Field 1 - Type,Custom Field 1 - Value

메일 클라이언트(썬더버드)랑 자주 주소록 싱크를 하다보니 이런 정보들이 많이 생기더군요..
저 중에 필요한 컬럼은 몇 개 없습니다.
구글의 주소록병합기능은 화면에서 볼 때만 병합되어 보이고 실제로 비슷한 이름으로 성-이름이 찢어진채 여러 개의 주소가 생겨버리기도 합니다.

문제는 저 항목중에 NOTE 컬럼은 개행문자가 들어가 있습니다(제가 메모로 뭔가 적어놓은것들이 많은데, 개행문자가 들어있더군요..
한 명만 예를 들면..

권XX,XX,,권,,,,,,,,,,,,,,,,,,,,,,"이메일: cXXXXX@nate.com
회사/소속: 머시기
차장
",* My Contacts,* Home,cXXXXX@nate.com,,,,,,,,Mobile,01012345678,,,,머시기,,차장,,,,,,,,

요로코롬 한 명에 대해 한 줄이 아니라 메모때문에 여러 줄이 들어가있습니다.

요걸

권XX,XX,,권,,,,,,,,,,,,,,,,,,,,,,"이메일: cXXXXX@nate.com - 회사/소속: 머시기 - 차장 ",* My Contacts,* Home,cXXXXX@nate.com,,,,,,,,Mobile,01012345678,,,,머시기,,차장,,,,,,,,

요렇게 개행문자 표현이 없이 "-" 로 바꿔 저장해서 이걸 엑셀로 불러들이면 따옴표 부분도 셀분리가 잘 되서 데이터화 할 수 있을 것 같습니다.
주소록 정리하고 싶어서요..

에디트플러스나 vi에서 정규식으로 저 작업을 일괄처리하고 싶은데,
머리가 나쁘네요..
우찌하면 좋죠?

".*(\n)+.*"
요 구문으로 에디트플러스에서 따옴표로 둘러쌓인 부분을 찾아보니 개행문자가 여러 행 들어가버린 줄은 안찾아지네요..

"쏼라쏼라\n
쏼라"

요런건 찾아지는데,

"솰라솰라\n
솰라\n
또솰라\n
"
요렇게 개행문자가 중간중간 몇개든지 들어가버리면 못찾는다는겁니다.
저 찾아진걸 다 "-" (대쉬) 로 바꿔버리는 간단한 방법을 좀 찾고있습니다.
도와주실 분 계신가요?<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 18:00:23 Regular Expression (정규표현식)에서 이동 됨]</div>

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

csv형식이네요 정규식보다는 fgetcsv 함수를 이용하면 한번에 배열로 변환해줍니다
php 함수를 사용할건 아니구요.. 다른 프로그램에서도 동일하게 결과를 얻을 수 있으려면 일반적인 정규식으로 만들어야겠죠..
서버용 프로그램이 아니라...
이까짓거, 생각해볼 가치도 없다고 여기시는 분께선 부디 댓글로 훈수를..
오랜만에 들렸네요.

$t = "
우리나라
대한민국
입니다.

개행이에요

";

echo preg_replace("/(.*)\n(.*)/", "$1-$2", $t);

게시판 목록

프로그램

글쓰기
🐛 버그신고