테스트 사이트 - 개발 중인 베타 버전입니다

euc-kr 문서를 utf-8 로 변환

· 19년 전 · 4063 · 3
euc-kr 문서를 utf-8 로 변환

태터툴즈 영역 안에 있는 문서들은 1.0 클래스로 업그래이드할 적에
변환시켜 주고 있으나, 그 이외의 문서들은 자신이 변환시켜 주어야 한다.
많은 문서들을 하나 하나 수동으로 변환시키는 것은 고역이므로 스크립트를 구하던 중 kldp 에서 도움을 받게 되었다. 그 분에게 감사를 드린다.

블로그에 있는 해당 문서를 리눅스의 적당한 폴더에 다운하고 그 폴더에서 다음과 같은 변환명령으로 처리하고 다시 업로드한다.

-------------
iconv && mv 이런식으로 하시는 편이 안전하지 않을까 생각합니다.

코드:
#!/bin/bash
iconv -c -f euc-kr -t utf-8 $1 > $1.tmp && mv $1.tmp $1


위 내용을 ~/bin/euc2utf8.sh로 저장하시고 실행권한을 주신 후,

cd /path/to/targets/
for I in ./*.htm ; do ~/bin/euc2utf8.sh $I ; done

아니면 그냥

cd /path/to/targets/
for I in ./*.htm ; do iconv -c -f euc-kr -t utf-8 $I > $I.tmp && mv $I.tmp $I ; done<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:32:05 Linux에서 이동 됨]</div>

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

음, 좋은 자료네요
UTF8 아직 넘지 못 했네여 ㅠ
find를 이용한 것도 연구해 봐야겠네요.

게시글 목록

번호 제목
28772
10555
10554
10553
28770
28769
10552
10551
28768
10550
10549
10548
10547
28767
10546
10545
10544
28766
10541
10540
10538
10537
10535
10534
10533
10532
28760
10531
10530
28759
10527
10525
10523
10520
28758
28757
10519
10518
10517
10515
28756
10514
10512
10511
10510
10509
10508
10507
28755
28751
10506
10505
10504
10503
10499
10487
28748
10486
28747
10484
10483
10482
28746
10480
10476
10473
10472
28745
10460
10456
28739
10455
28738
10451
10448
10446
10445
10444
10442
10439
10408
10403
10400
10398
10397
10396
10391
10390
28733
10389
10383
10378
28732
10342
28731
10335
28730
28729
28727
10332