테스트 사이트 - 개발 중인 베타 버전입니다

euc-kr 문서를 utf-8 로 변환

euc-kr 문서를 utf-8 로 변환

태터툴즈 영역 안에 있는 문서들은 1.0 클래스로 업그래이드할 적에
변환시켜 주고 있으나, 그 이외의 문서들은 자신이 변환시켜 주어야 한다.
많은 문서들을 하나 하나 수동으로 변환시키는 것은 고역이므로 스크립트를 구하던 중 kldp 에서 도움을 받게 되었다. 그 분에게 감사를 드린다.

블로그에 있는 해당 문서를 리눅스의 적당한 폴더에 다운하고 그 폴더에서 다음과 같은 변환명령으로 처리하고 다시 업로드한다.

-------------
iconv && mv 이런식으로 하시는 편이 안전하지 않을까 생각합니다.

코드:
#!/bin/bash
iconv -c -f euc-kr -t utf-8 $1 > $1.tmp && mv $1.tmp $1


위 내용을 ~/bin/euc2utf8.sh로 저장하시고 실행권한을 주신 후,

cd /path/to/targets/
for I in ./*.htm ; do ~/bin/euc2utf8.sh $I ; done

아니면 그냥

cd /path/to/targets/
for I in ./*.htm ; do iconv -c -f euc-kr -t utf-8 $I > $I.tmp && mv $I.tmp $I ; done<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:32:05 Linux에서 이동 됨]</div>

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

음, 좋은 자료네요
UTF8 아직 넘지 못 했네여 ㅠ
find를 이용한 것도 연구해 봐야겠네요.

게시글 목록

번호 제목
11470
11469
11468
11457
29100
11448
11444
24851
29091
11440
11434
11431
11420
11415
11412
29087
11408
11402
11397
11389
11387
11383
11375
11370
11362
11354
11349
11348
11347
11342
11338
29084
11335
11327
11325
11318
11312
11308
11303
11300
29077
24849
29075
29070
11291
11290
11288
11285
29068
11282
11279
11271
11267
11264
11263
29064
11256
11250
11244
11238
11237
11234
29061
11231
11228
11226
29056
11223
11216
11214
24846
11210
11206
11199
11194
11190
29052
11188
11182
11178
29048
11171
11163
11159
11154
29047
29037
11149
29036
11135
29032
11134
11129
29031
11127
29026
11119
11115
29020
11113