$str = "한글 abc 123 사랑합니다.";
$str = preg_replace("#\r|\n#", " ", trim($str));
$len = strlen($str);
$i = 0;
$k = 0;
while ($i < $len) {
if (preg_match('/^[\x20]/xs', $str)) {
echo $str[0];
$n = 1;
}
else if (preg_match('/^[\x30-\x39\x41-\x5a\x61-\x7a]/xs', $str)) {
echo $str[0];
$n = 1;
}
else if (preg_match('/^[\xc0-\\xdf][\x80-\xbf]/xs', $str)) {
echo $str[0].$str[1];
$n = 2;
}
else if (preg_match('/^[\xe0-\\xef][\x80-\xbf]{2}/xs', $str)) {
echo $str[0].$str[1].$str[2];
$n = 3;
}
else if (preg_match('/^[\xf0-\\xf7][\x80-\xbf]{3}/xs', $str)) {
echo $str[0].$str[1].$str[2].$str[3];
$n = 4;
}
else {
$n = 1;
}
$str = substr($str, $n);
$i += $n;
//echo $i; echo "<br>";
if ($k++ > 10000) break;
}
댓글 1개
bytes bits representation
1 7 0bbbbbbb
2 11 110bbbbb 10bbbbbb
3 16 1110bbbb 10bbbbbb 10bbbbbb
4 21 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb
예를 들어 3바이트(한글 포함) UTF-8 의 경우
E0-EF 에 포함되고 뒤 이은 2바이트가 80-BF 에 포함되면 UTF-8 한글임
게시판 목록
팁게시판
질문은 상단의 QA에서 해주시기 바랍니다.
| 번호 | 제목 | 글쓴이 | 날짜 | 조회 |
|---|---|---|---|---|
| 5977 | 9년 전 | 220 | ||
| 5976 | 9년 전 | 252 | ||
| 5975 | 9년 전 | 285 | ||
| 5974 | 9년 전 | 380 | ||
| 5973 | 9년 전 | 424 | ||
| 5972 | 9년 전 | 272 | ||
| 5971 | 9년 전 | 320 | ||
| 5970 | 9년 전 | 289 | ||
| 5969 | 9년 전 | 210 | ||
| 5968 | 9년 전 | 193 | ||
| 5967 | 9년 전 | 368 | ||
| 5966 | 9년 전 | 227 | ||
| 5965 | 9년 전 | 221 | ||
| 5964 | 9년 전 | 216 | ||
| 5963 | 9년 전 | 306 | ||
| 5962 | 9년 전 | 362 | ||
| 5961 | 9년 전 | 270 | ||
| 5960 | 9년 전 | 309 | ||
| 5959 | 9년 전 | 245 | ||
| 5958 |
|
9년 전 | 525 | |
| 5957 | 9년 전 | 354 | ||
| 5956 | 9년 전 | 326 | ||
| 5955 | 9년 전 | 324 | ||
| 5954 | 9년 전 | 251 | ||
| 5953 | 9년 전 | 385 |
댓글 작성
댓글을 작성하시려면 로그인이 필요합니다.
로그인하기