테스트 사이트 - 개발 중인 베타 버전입니다

euc-kr 문서를 utf-8 로 변환

euc-kr 문서를 utf-8 로 변환

태터툴즈 영역 안에 있는 문서들은 1.0 클래스로 업그래이드할 적에
변환시켜 주고 있으나, 그 이외의 문서들은 자신이 변환시켜 주어야 한다.
많은 문서들을 하나 하나 수동으로 변환시키는 것은 고역이므로 스크립트를 구하던 중 kldp 에서 도움을 받게 되었다. 그 분에게 감사를 드린다.

블로그에 있는 해당 문서를 리눅스의 적당한 폴더에 다운하고 그 폴더에서 다음과 같은 변환명령으로 처리하고 다시 업로드한다.

-------------
iconv && mv 이런식으로 하시는 편이 안전하지 않을까 생각합니다.

코드:
#!/bin/bash
iconv -c -f euc-kr -t utf-8 $1 > $1.tmp && mv $1.tmp $1


위 내용을 ~/bin/euc2utf8.sh로 저장하시고 실행권한을 주신 후,

cd /path/to/targets/
for I in ./*.htm ; do ~/bin/euc2utf8.sh $I ; done

아니면 그냥

cd /path/to/targets/
for I in ./*.htm ; do iconv -c -f euc-kr -t utf-8 $I > $I.tmp && mv $I.tmp $I ; done<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:32:05 Linux에서 이동 됨]</div>

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

음, 좋은 자료네요
UTF8 아직 넘지 못 했네여 ㅠ
find를 이용한 것도 연구해 봐야겠네요.

게시글 목록

번호 제목
11111
11108
11107
11105
11101
11099
11095
11093
24843
11065
11063
11059
29001
11054
28999
11050
28998
28956
11044
11023
11004
28946
10993
10990
28903
10984
24842
28900
10982
10978
28899
10974
10970
24831
24830
10967
10965
10963
10956
10954
10950
10946
24818
10943
28885
24813
10940
10927
10925
10920
10916
10914
10913
10908
10905
10904
10899
24803
28882
10898
28878
28877
24802
24801
24800
24799
10893
10892
24797
24794
10891
28871
28870
10881
10872
10870
28868
10868
10866
28862
10864
28861
10863
28860
10862
28859
28858
10861
10859
28856
10857
28854
10856
28853
28852
28851
10855
28850
10854
28849