문자열 자르기 질문드립니다.
안녕하세요
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
댓글 2개
14년 전
mbstring 에 관해서 찾아보심이 어떠실까요.
14년 전
곰곰히 생각해 보았습니다..
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
게시판 목록
프로그램
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 4130 |
진정한승리v
|
14년 전 | 1067 | |
| 4129 | 14년 전 | 1429 | ||
| 4128 |
onlymilk74
|
14년 전 | 625 | |
| 4127 | 14년 전 | 540 | ||
| 4126 |
visualp
|
14년 전 | 1255 | |
| 4125 |
visualp
|
14년 전 | 1591 | |
| 4124 | 14년 전 | 1661 | ||
| 4123 | 14년 전 | 831 | ||
| 4122 |
visualp
|
14년 전 | 644 | |
| 4121 |
visualp
|
14년 전 | 1799 | |
| 4120 |
visualp
|
14년 전 | 868 | |
| 4119 |
visualp
|
14년 전 | 1240 | |
| 4118 |
그래픽노블
|
14년 전 | 694 | |
| 4117 |
visualp
|
14년 전 | 752 | |
| 4116 | 14년 전 | 741 | ||
| 4115 |
visualp
|
14년 전 | 826 | |
| 4114 |
onlymilk74
|
14년 전 | 4631 | |
| 4113 | 14년 전 | 742 | ||
| 4112 |
그래픽노블
|
14년 전 | 867 | |
| 4111 | 14년 전 | 1516 | ||
| 4110 | 14년 전 | 681 | ||
| 4109 | 14년 전 | 476 | ||
| 4108 | 14년 전 | 846 | ||
| 4107 | 14년 전 | 2116 | ||
| 4106 | 14년 전 | 1589 | ||
| 4105 |
onlymilk74
|
14년 전 | 1411 | |
| 4104 | 14년 전 | 2849 | ||
| 4103 | 14년 전 | 1956 | ||
| 4102 | 14년 전 | 928 | ||
| 4101 | 14년 전 | 988 | ||
| 4100 | 14년 전 | 945 | ||
| 4099 | 14년 전 | 1036 | ||
| 4098 |
Lonnie
|
14년 전 | 528 | |
| 4097 | 14년 전 | 829 | ||
| 4096 | 14년 전 | 977 | ||
| 4095 | 14년 전 | 2525 | ||
| 4094 | 14년 전 | 846 | ||
| 4093 | 14년 전 | 581 | ||
| 4092 |
|
14년 전 | 601 | |
| 4091 | 14년 전 | 2937 | ||
| 4090 | 14년 전 | 736 | ||
| 4089 |
|
14년 전 | 1447 | |
| 4088 | 14년 전 | 1446 | ||
| 4087 | 14년 전 | 644 | ||
| 4086 | 14년 전 | 1363 | ||
| 4085 | 14년 전 | 758 | ||
| 4084 | 14년 전 | 855 | ||
| 4083 | 14년 전 | 1817 | ||
| 4082 | 14년 전 | 1523 | ||
| 4081 | 14년 전 | 2126 | ||
| 4080 |
onlymilk74
|
14년 전 | 857 | |
| 4079 | 14년 전 | 754 | ||
| 4078 | 14년 전 | 2145 | ||
| 4077 |
DreamT
|
14년 전 | 774 | |
| 4076 | 14년 전 | 875 | ||
| 4075 | 14년 전 | 1982 | ||
| 4074 | 14년 전 | 1002 | ||
| 4073 | 14년 전 | 902 | ||
| 4072 |
onlymilk74
|
14년 전 | 659 | |
| 4071 | 14년 전 | 906 | ||
| 4070 | 14년 전 | 1919 | ||
| 4069 | 14년 전 | 484 | ||
| 4068 | 14년 전 | 2442 | ||
| 4067 | 14년 전 | 809 | ||
| 4066 | 14년 전 | 520 | ||
| 4065 | 14년 전 | 530 | ||
| 4064 | 14년 전 | 793 | ||
| 4063 | 14년 전 | 701 | ||
| 4062 | 14년 전 | 595 | ||
| 4061 | 14년 전 | 1093 | ||
| 4060 | 14년 전 | 523 | ||
| 4059 | 14년 전 | 1211 | ||
| 4058 | 14년 전 | 1580 | ||
| 4057 | 14년 전 | 536 | ||
| 4056 |
|
14년 전 | 668 | |
| 4055 |
SGFlash
|
14년 전 | 521 | |
| 4054 |
Priere
|
14년 전 | 665 | |
| 4053 | 14년 전 | 1090 | ||
| 4052 | 14년 전 | 789 | ||
| 4051 | 14년 전 | 917 | ||
| 4050 | 14년 전 | 738 | ||
| 4049 | 14년 전 | 881 | ||
| 4048 |
내꿈은대통령
|
14년 전 | 469 | |
| 4047 |
visualp
|
14년 전 | 1275 | |
| 4046 |
visualp
|
14년 전 | 616 | |
| 4045 |
visualp
|
14년 전 | 1380 | |
| 4044 | 14년 전 | 8135 | ||
| 4043 | 14년 전 | 764 | ||
| 4042 | 14년 전 | 1610 | ||
| 4041 | 14년 전 | 1328 | ||
| 4040 | 14년 전 | 1601 | ||
| 4039 | 14년 전 | 1943 | ||
| 4038 | 14년 전 | 536 | ||
| 4037 |
sider
|
14년 전 | 679 | |
| 4036 | 14년 전 | 6470 | ||
| 4035 | 14년 전 | 655 | ||
| 4034 | 14년 전 | 592 | ||
| 4033 |
techer
|
14년 전 | 1740 | |
| 4032 | 14년 전 | 646 | ||
| 4031 | 14년 전 | 640 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기