문자열 자르기 질문드립니다.
안녕하세요
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^
아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..
제가 찾은 UTF-8 한글 자르기 소스입니다.
function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);
if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}
이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
댓글 2개
14년 전
mbstring 에 관해서 찾아보심이 어떠실까요.
14년 전
곰곰히 생각해 보았습니다..
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.
function splitString($str,$size) {
$len = strlen($str);
if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}
일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
게시판 목록
프로그램
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 630 | 19년 전 | 2364 | ||
| 629 |
|
19년 전 | 2029 | |
| 628 |
|
19년 전 | 3142 | |
| 627 |
|
19년 전 | 2047 | |
| 626 |
|
19년 전 | 2074 | |
| 625 |
|
19년 전 | 1735 | |
| 624 |
|
19년 전 | 2244 | |
| 623 | 19년 전 | 2214 | ||
| 622 |
|
19년 전 | 2523 | |
| 621 |
|
19년 전 | 2929 | |
| 620 |
|
19년 전 | 2423 | |
| 619 | 19년 전 | 2493 | ||
| 618 | 19년 전 | 3523 | ||
| 617 |
|
19년 전 | 3243 | |
| 616 |
|
19년 전 | 3235 | |
| 615 |
|
19년 전 | 3060 | |
| 614 |
|
19년 전 | 2056 | |
| 613 |
|
19년 전 | 2406 | |
| 612 |
|
19년 전 | 2256 | |
| 611 |
|
19년 전 | 2098 | |
| 610 |
|
19년 전 | 2533 | |
| 609 |
|
19년 전 | 2440 | |
| 608 |
|
19년 전 | 2830 | |
| 607 | 19년 전 | 2204 | ||
| 606 | 19년 전 | 3547 | ||
| 605 | 19년 전 | 2008 | ||
| 604 | 19년 전 | 2630 | ||
| 603 | 19년 전 | 1630 | ||
| 602 |
|
19년 전 | 2851 | |
| 601 | 19년 전 | 3082 | ||
| 600 |
|
19년 전 | 2160 | |
| 599 | 19년 전 | 2013 | ||
| 598 | 19년 전 | 2499 | ||
| 597 | 19년 전 | 2409 | ||
| 596 |
|
19년 전 | 3087 | |
| 595 |
|
19년 전 | 6776 | |
| 594 | 19년 전 | 2720 | ||
| 593 | 19년 전 | 3196 | ||
| 592 |
|
19년 전 | 3099 | |
| 591 |
|
19년 전 | 1948 | |
| 590 | 19년 전 | 3373 | ||
| 589 | 19년 전 | 2226 | ||
| 588 |
|
19년 전 | 2713 | |
| 587 | 19년 전 | 2355 | ||
| 586 |
|
19년 전 | 4378 | |
| 585 | 19년 전 | 2511 | ||
| 584 | 19년 전 | 2773 | ||
| 583 |
|
19년 전 | 3539 | |
| 582 |
|
19년 전 | 3730 | |
| 581 |
|
19년 전 | 3268 | |
| 580 | 19년 전 | 2498 | ||
| 579 | 19년 전 | 3105 | ||
| 578 | 19년 전 | 4015 | ||
| 577 | 19년 전 | 3841 | ||
| 576 | 19년 전 | 1786 | ||
| 575 |
|
19년 전 | 2241 | |
| 574 |
|
19년 전 | 5418 | |
| 573 | 19년 전 | 6748 | ||
| 572 | 19년 전 | 2589 | ||
| 571 | 19년 전 | 2122 | ||
| 570 | 19년 전 | 2616 | ||
| 569 | 19년 전 | 3328 | ||
| 568 | 19년 전 | 3554 | ||
| 567 | 19년 전 | 2991 | ||
| 566 | 19년 전 | 2612 | ||
| 565 |
|
19년 전 | 4738 | |
| 564 |
|
19년 전 | 6748 | |
| 563 |
|
19년 전 | 5022 | |
| 562 |
|
19년 전 | 5966 | |
| 561 |
|
19년 전 | 2718 | |
| 560 |
|
19년 전 | 2578 | |
| 559 |
|
19년 전 | 2245 | |
| 558 |
|
19년 전 | 2316 | |
| 557 | 19년 전 | 4600 | ||
| 556 |
|
19년 전 | 4681 | |
| 555 | 19년 전 | 2520 | ||
| 554 | 19년 전 | 2189 | ||
| 553 | 19년 전 | 2534 | ||
| 552 |
|
19년 전 | 3184 | |
| 551 | 19년 전 | 2954 | ||
| 550 |
|
19년 전 | 1907 | |
| 549 |
|
19년 전 | 1979 | |
| 548 |
|
19년 전 | 3160 | |
| 547 |
|
19년 전 | 2362 | |
| 546 |
|
19년 전 | 3636 | |
| 545 |
|
19년 전 | 2572 | |
| 544 |
|
19년 전 | 1871 | |
| 543 |
|
19년 전 | 2469 | |
| 542 |
|
19년 전 | 1741 | |
| 541 |
|
19년 전 | 1422 | |
| 540 |
|
19년 전 | 1563 | |
| 539 |
|
19년 전 | 1816 | |
| 538 |
|
19년 전 | 1604 | |
| 537 |
|
19년 전 | 1807 | |
| 536 |
|
19년 전 | 1575 | |
| 535 |
|
19년 전 | 1965 | |
| 534 |
|
19년 전 | 1856 | |
| 533 |
|
19년 전 | 1469 | |
| 532 |
|
19년 전 | 1455 | |
| 531 |
|
19년 전 | 1377 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기