문자열 자르기 질문드립니다.
안녕하세요
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
댓글 2개
14년 전
mbstring 에 관해서 찾아보심이 어떠실까요.
14년 전
곰곰히 생각해 보았습니다..
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
게시판 목록
프로그램
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 7830 | 10년 전 | 458 | ||
| 7829 |
|
10년 전 | 641 | |
| 7828 | 10년 전 | 568 | ||
| 7827 | 10년 전 | 467 | ||
| 7826 | 10년 전 | 494 | ||
| 7825 | 10년 전 | 518 | ||
| 7824 | 10년 전 | 484 | ||
| 7823 | 10년 전 | 426 | ||
| 7822 | 10년 전 | 400 | ||
| 7821 | 10년 전 | 346 | ||
| 7820 | 10년 전 | 368 | ||
| 7819 |
|
10년 전 | 766 | |
| 7818 | 10년 전 | 423 | ||
| 7817 | 10년 전 | 602 | ||
| 7816 | 10년 전 | 439 | ||
| 7815 | 10년 전 | 635 | ||
| 7814 | 10년 전 | 476 | ||
| 7813 | 10년 전 | 433 | ||
| 7812 | 10년 전 | 440 | ||
| 7811 | 10년 전 | 418 | ||
| 7810 | 10년 전 | 615 | ||
| 7809 | 10년 전 | 550 | ||
| 7808 | 10년 전 | 429 | ||
| 7807 | 10년 전 | 441 | ||
| 7806 |
프로그래머7
|
10년 전 | 1363 | |
| 7805 | 10년 전 | 1304 | ||
| 7804 |
zahir1312
|
10년 전 | 802 | |
| 7803 |
|
10년 전 | 1403 | |
| 7802 | 10년 전 | 505 | ||
| 7801 | 10년 전 | 882 | ||
| 7800 | 10년 전 | 1109 | ||
| 7799 | 10년 전 | 591 | ||
| 7798 | 10년 전 | 540 | ||
| 7797 | 10년 전 | 560 | ||
| 7796 | 10년 전 | 394 | ||
| 7795 | 10년 전 | 547 | ||
| 7794 | 10년 전 | 587 | ||
| 7793 | 10년 전 | 1088 | ||
| 7792 | 10년 전 | 510 | ||
| 7791 | 10년 전 | 603 | ||
| 7790 | 10년 전 | 530 | ||
| 7789 |
fbastore
|
10년 전 | 1481 | |
| 7788 | 10년 전 | 585 | ||
| 7787 | 10년 전 | 444 | ||
| 7786 | 10년 전 | 653 | ||
| 7785 | 10년 전 | 624 | ||
| 7784 | 10년 전 | 685 | ||
| 7783 | 10년 전 | 506 | ||
| 7782 | 10년 전 | 530 | ||
| 7781 | 10년 전 | 936 | ||
| 7780 | 10년 전 | 846 | ||
| 7779 | 10년 전 | 799 | ||
| 7778 | 10년 전 | 389 | ||
| 7777 | 10년 전 | 501 | ||
| 7776 | 10년 전 | 496 | ||
| 7775 | 10년 전 | 435 | ||
| 7774 | 10년 전 | 647 | ||
| 7773 | 10년 전 | 401 | ||
| 7772 | 10년 전 | 773 | ||
| 7771 | 10년 전 | 430 | ||
| 7770 | 10년 전 | 672 | ||
| 7769 | 10년 전 | 434 | ||
| 7768 | 10년 전 | 652 | ||
| 7767 | 10년 전 | 1206 | ||
| 7766 | 10년 전 | 533 | ||
| 7765 | 10년 전 | 590 | ||
| 7764 |
잘살아보자
|
10년 전 | 450 | |
| 7763 |
|
10년 전 | 1500 | |
| 7762 |
Tosea
|
10년 전 | 1087 | |
| 7761 | 10년 전 | 688 | ||
| 7760 |
잘살아보자
|
10년 전 | 759 | |
| 7759 |
잘살아보자
|
10년 전 | 598 | |
| 7758 |
잘살아보자
|
10년 전 | 656 | |
| 7757 | 10년 전 | 1279 | ||
| 7756 |
ITBANK
|
10년 전 | 1289 | |
| 7755 | 10년 전 | 1944 | ||
| 7754 | 10년 전 | 1102 | ||
| 7753 | 10년 전 | 920 | ||
| 7752 | 10년 전 | 1420 | ||
| 7751 |
잘살아보자
|
10년 전 | 579 | |
| 7750 |
잘살아보자
|
10년 전 | 505 | |
| 7749 |
잘살아보자
|
10년 전 | 529 | |
| 7748 |
잘살아보자
|
10년 전 | 558 | |
| 7747 |
잘살아보자
|
10년 전 | 635 | |
| 7746 |
잘살아보자
|
10년 전 | 697 | |
| 7745 |
잘살아보자
|
10년 전 | 946 | |
| 7744 |
잘살아보자
|
10년 전 | 440 | |
| 7743 | 10년 전 | 967 | ||
| 7742 |
starbros
|
10년 전 | 864 | |
| 7741 |
잘살아보자
|
10년 전 | 705 | |
| 7740 |
잘살아보자
|
10년 전 | 592 | |
| 7739 |
잘살아보자
|
10년 전 | 487 | |
| 7738 |
잘살아보자
|
10년 전 | 561 | |
| 7737 |
잘살아보자
|
10년 전 | 541 | |
| 7736 |
잘살아보자
|
10년 전 | 561 | |
| 7735 |
잘살아보자
|
10년 전 | 895 | |
| 7734 |
잘살아보자
|
10년 전 | 454 | |
| 7733 |
잘살아보자
|
10년 전 | 564 | |
| 7732 |
잘살아보자
|
10년 전 | 730 | |
| 7731 |
잘살아보자
|
10년 전 | 653 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기