테스트 사이트 - 개발 중인 베타 버전입니다

euc-kr 문서를 utf-8 로 변환

· 19년 전 · 4059 · 3
euc-kr 문서를 utf-8 로 변환

태터툴즈 영역 안에 있는 문서들은 1.0 클래스로 업그래이드할 적에
변환시켜 주고 있으나, 그 이외의 문서들은 자신이 변환시켜 주어야 한다.
많은 문서들을 하나 하나 수동으로 변환시키는 것은 고역이므로 스크립트를 구하던 중 kldp 에서 도움을 받게 되었다. 그 분에게 감사를 드린다.

블로그에 있는 해당 문서를 리눅스의 적당한 폴더에 다운하고 그 폴더에서 다음과 같은 변환명령으로 처리하고 다시 업로드한다.

-------------
iconv && mv 이런식으로 하시는 편이 안전하지 않을까 생각합니다.

코드:
#!/bin/bash
iconv -c -f euc-kr -t utf-8 $1 > $1.tmp && mv $1.tmp $1


위 내용을 ~/bin/euc2utf8.sh로 저장하시고 실행권한을 주신 후,

cd /path/to/targets/
for I in ./*.htm ; do ~/bin/euc2utf8.sh $I ; done

아니면 그냥

cd /path/to/targets/
for I in ./*.htm ; do iconv -c -f euc-kr -t utf-8 $I > $I.tmp && mv $I.tmp $I ; done<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:32:05 Linux에서 이동 됨]</div>

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

음, 좋은 자료네요
UTF8 아직 넘지 못 했네여 ㅠ
find를 이용한 것도 연구해 봐야겠네요.

게시글 목록

번호 제목
10331
28724
10329
10328
10326
10324
10323
28723
10322
10321
10320
28722
10318
28719
10317
10314
10312
28716
10308
10307
10306
10305
28715
10304
10303
28714
10302
28713
10301
10300
10299
10296
10294
10293
10292
10291
10289
10285
28711
10281
10279
28710
10278
10277
10276
28709
10273
10270
10269
10267
28708
10266
10264
10263
10261
28707
10260
10256
10255
28706
10253
28704
10250
28703
28702
10249
10247
10245
10243
10240
10239
10238
10237
10235
10225
28700
10213
10210
10207
10205
10204
28693
10198
10195
10191
24785
28674
24784
10189
10187
10182
28669
10181
10175
24779
24772
10173
10168
10163
10160