문자열 자르기 질문드립니다.
안녕하세요
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
댓글 2개
14년 전
mbstring 에 관해서 찾아보심이 어떠실까요.
14년 전
곰곰히 생각해 보았습니다..
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
게시판 목록
프로그램
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 7630 | 10년 전 | 679 | ||
| 7629 |
|
10년 전 | 2439 | |
| 7628 | 10년 전 | 817 | ||
| 7627 |
|
10년 전 | 1053 | |
| 7626 |
|
10년 전 | 1806 | |
| 7625 | 10년 전 | 742 | ||
| 7624 | 10년 전 | 751 | ||
| 7623 |
|
10년 전 | 3141 | |
| 7622 | 10년 전 | 755 | ||
| 7621 |
leeleeleelee
|
10년 전 | 609 | |
| 7620 | 10년 전 | 556 | ||
| 7619 | 10년 전 | 526 | ||
| 7618 | 10년 전 | 1060 | ||
| 7617 | 10년 전 | 742 | ||
| 7616 | 10년 전 | 680 | ||
| 7615 | 10년 전 | 745 | ||
| 7614 | 10년 전 | 1287 | ||
| 7613 |
|
10년 전 | 2102 | |
| 7612 | 10년 전 | 1184 | ||
| 7611 | 10년 전 | 1448 | ||
| 7610 |
|
10년 전 | 1925 | |
| 7609 |
|
10년 전 | 1381 | |
| 7608 |
mwdkim
|
10년 전 | 1154 | |
| 7607 |
|
10년 전 | 1084 | |
| 7606 |
mwdkim
|
10년 전 | 3961 | |
| 7605 | 10년 전 | 710 | ||
| 7604 | 10년 전 | 1045 | ||
| 7603 | 10년 전 | 1665 | ||
| 7602 |
|
10년 전 | 1097 | |
| 7601 |
AniNest
|
10년 전 | 2815 | |
| 7600 |
port443
|
10년 전 | 1057 | |
| 7599 | 10년 전 | 966 | ||
| 7598 | 10년 전 | 1042 | ||
| 7597 | 10년 전 | 4590 | ||
| 7596 |
SeungYeon
|
10년 전 | 912 | |
| 7595 |
untitled
|
10년 전 | 2460 | |
| 7594 |
프로그래머7
|
10년 전 | 1750 | |
| 7593 |
untitled
|
10년 전 | 2393 | |
| 7592 |
untitled
|
10년 전 | 1958 | |
| 7591 |
untitled
|
10년 전 | 2696 | |
| 7590 |
아리마2001
|
10년 전 | 874 | |
| 7589 | 10년 전 | 1125 | ||
| 7588 |
|
10년 전 | 2940 | |
| 7587 | 10년 전 | 1324 | ||
| 7586 | 10년 전 | 687 | ||
| 7585 | 10년 전 | 1724 | ||
| 7584 | 10년 전 | 1426 | ||
| 7583 |
leeleeleelee
|
10년 전 | 1194 | |
| 7582 |
|
10년 전 | 1154 | |
| 7581 | 10년 전 | 1383 | ||
| 7580 | 10년 전 | 1034 | ||
| 7579 |
|
10년 전 | 626 | |
| 7578 | 10년 전 | 1444 | ||
| 7577 |
|
10년 전 | 1892 | |
| 7576 | 10년 전 | 1402 | ||
| 7575 |
멋진남자임
|
10년 전 | 1483 | |
| 7574 | 10년 전 | 2149 | ||
| 7573 | 10년 전 | 3286 | ||
| 7572 | 10년 전 | 782 | ||
| 7571 |
|
10년 전 | 798 | |
| 7570 |
|
10년 전 | 1345 | |
| 7569 | 10년 전 | 1568 | ||
| 7568 |
this1mg
|
10년 전 | 1067 | |
| 7567 |
|
10년 전 | 785 | |
| 7566 | 10년 전 | 930 | ||
| 7565 |
Angel하늘
|
10년 전 | 1035 | |
| 7564 |
seoldi
|
10년 전 | 1279 | |
| 7563 |
|
10년 전 | 1418 | |
| 7562 |
멋진남자임
|
10년 전 | 2119 | |
| 7561 | 10년 전 | 741 | ||
| 7560 |
leeleeleelee
|
10년 전 | 934 | |
| 7559 | 10년 전 | 5073 | ||
| 7558 |
RinaP
|
10년 전 | 812 | |
| 7557 |
|
10년 전 | 1272 | |
| 7556 | 10년 전 | 1214 | ||
| 7555 |
hyohyojj1234
|
10년 전 | 1682 | |
| 7554 | 10년 전 | 1112 | ||
| 7553 |
senseme
|
10년 전 | 1363 | |
| 7552 |
ehdltdoit
|
10년 전 | 1458 | |
| 7551 |
|
10년 전 | 1846 | |
| 7550 |
leeleeleelee
|
10년 전 | 1618 | |
| 7549 | 10년 전 | 2448 | ||
| 7548 | 10년 전 | 1857 | ||
| 7547 |
멋진남자임
|
10년 전 | 1981 | |
| 7546 | 10년 전 | 1024 | ||
| 7545 |
ILMare1003
|
10년 전 | 1315 | |
| 7544 |
|
10년 전 | 1270 | |
| 7543 | 10년 전 | 904 | ||
| 7542 | 10년 전 | 683 | ||
| 7541 |
울라라라우
|
10년 전 | 886 | |
| 7540 | 10년 전 | 1611 | ||
| 7539 | 10년 전 | 958 | ||
| 7538 |
|
10년 전 | 1848 | |
| 7537 | 10년 전 | 3636 | ||
| 7536 |
Gaumi
|
10년 전 | 1446 | |
| 7535 |
프로그램은어려워
|
10년 전 | 1299 | |
| 7534 |
senseme
|
10년 전 | 1222 | |
| 7533 | 10년 전 | 1224 | ||
| 7532 | 10년 전 | 892 | ||
| 7531 | 10년 전 | 2083 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기