문자열 자르기 질문드립니다.
안녕하세요
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
댓글 2개
14년 전
mbstring 에 관해서 찾아보심이 어떠실까요.
14년 전
곰곰히 생각해 보았습니다..
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
게시판 목록
프로그램
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 8030 | 9년 전 | 415 | ||
| 8029 | 9년 전 | 339 | ||
| 8028 | 9년 전 | 296 | ||
| 8027 | 9년 전 | 308 | ||
| 8026 | 9년 전 | 380 | ||
| 8025 | 9년 전 | 410 | ||
| 8024 | 9년 전 | 399 | ||
| 8023 | 9년 전 | 424 | ||
| 8022 | 9년 전 | 339 | ||
| 8021 | 9년 전 | 362 | ||
| 8020 | 9년 전 | 364 | ||
| 8019 | 9년 전 | 376 | ||
| 8018 | 9년 전 | 479 | ||
| 8017 | 9년 전 | 559 | ||
| 8016 | 9년 전 | 385 | ||
| 8015 | 9년 전 | 419 | ||
| 8014 | 9년 전 | 347 | ||
| 8013 | 9년 전 | 269 | ||
| 8012 | 9년 전 | 270 | ||
| 8011 | 9년 전 | 478 | ||
| 8010 | 9년 전 | 333 | ||
| 8009 | 9년 전 | 349 | ||
| 8008 | 9년 전 | 318 | ||
| 8007 | 9년 전 | 466 | ||
| 8006 | 9년 전 | 502 | ||
| 8005 |
|
9년 전 | 995 | |
| 8004 | 9년 전 | 385 | ||
| 8003 | 9년 전 | 455 | ||
| 8002 | 9년 전 | 349 | ||
| 8001 |
|
9년 전 | 693 | |
| 8000 | 9년 전 | 457 | ||
| 7999 | 9년 전 | 408 | ||
| 7998 | 9년 전 | 467 | ||
| 7997 | 9년 전 | 337 | ||
| 7996 | 9년 전 | 565 | ||
| 7995 | 9년 전 | 513 | ||
| 7994 | 9년 전 | 401 | ||
| 7993 | 9년 전 | 473 | ||
| 7992 | 9년 전 | 542 | ||
| 7991 | 9년 전 | 291 | ||
| 7990 | 9년 전 | 325 | ||
| 7989 | 9년 전 | 331 | ||
| 7988 | 9년 전 | 759 | ||
| 7987 | 9년 전 | 463 | ||
| 7986 | 9년 전 | 465 | ||
| 7985 | 9년 전 | 543 | ||
| 7984 | 9년 전 | 462 | ||
| 7983 | 9년 전 | 699 | ||
| 7982 | 9년 전 | 558 | ||
| 7981 | 9년 전 | 517 | ||
| 7980 | 9년 전 | 538 | ||
| 7979 | 9년 전 | 528 | ||
| 7978 | 9년 전 | 491 | ||
| 7977 | 9년 전 | 433 | ||
| 7976 | 9년 전 | 892 | ||
| 7975 | 9년 전 | 406 | ||
| 7974 | 9년 전 | 450 | ||
| 7973 | 9년 전 | 632 | ||
| 7972 | 9년 전 | 424 | ||
| 7971 | 9년 전 | 499 | ||
| 7970 | 9년 전 | 341 | ||
| 7969 | 9년 전 | 582 | ||
| 7968 | 9년 전 | 428 | ||
| 7967 | 9년 전 | 413 | ||
| 7966 | 9년 전 | 416 | ||
| 7965 |
|
9년 전 | 1045 | |
| 7964 | 9년 전 | 435 | ||
| 7963 | 9년 전 | 444 | ||
| 7962 | 9년 전 | 444 | ||
| 7961 |
전갈자리남자
|
9년 전 | 538 | |
| 7960 | 9년 전 | 1005 | ||
| 7959 | 9년 전 | 586 | ||
| 7958 | 9년 전 | 436 | ||
| 7957 | 9년 전 | 393 | ||
| 7956 | 9년 전 | 390 | ||
| 7955 | 9년 전 | 494 | ||
| 7954 | 9년 전 | 431 | ||
| 7953 | 9년 전 | 479 | ||
| 7952 | 9년 전 | 399 | ||
| 7951 | 9년 전 | 531 | ||
| 7950 | 9년 전 | 428 | ||
| 7949 | 9년 전 | 421 | ||
| 7948 | 9년 전 | 356 | ||
| 7947 | 9년 전 | 974 | ||
| 7946 | 9년 전 | 490 | ||
| 7945 | 9년 전 | 434 | ||
| 7944 | 9년 전 | 494 | ||
| 7943 | 9년 전 | 424 | ||
| 7942 | 9년 전 | 439 | ||
| 7941 | 9년 전 | 429 | ||
| 7940 | 9년 전 | 928 | ||
| 7939 | 9년 전 | 421 | ||
| 7938 | 9년 전 | 436 | ||
| 7937 | 9년 전 | 325 | ||
| 7936 | 9년 전 | 909 | ||
| 7935 | 9년 전 | 512 | ||
| 7934 | 9년 전 | 494 | ||
| 7933 | 9년 전 | 617 | ||
| 7932 | 9년 전 | 560 | ||
| 7931 | 9년 전 | 618 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기