utf8mb4_unicode_ci와 utf8mb4_general_ci의 차이점

swallow

· 2년 전 · 조회 6165 6165 · 댓글 3 3

이번에는 디비에서 인코딩과 관련한 글로 utf8mb4_unicode_ci와 utf8mb4_general_ci의 차이점을 보시겠습니다.

utf8mb4_unicode_ci와 utf8mb4_general_ci는 MySQL 데이터베이스에서 문자열을 비교 및 정렬하기 위해 사용되는 문자열 인코딩 및 정렬 규칙입니다. 이 두 규칙 간에는 다음과 같은 차이점이 있습니다:

1. 언어 및 문자 처리: utf8mb4_unicode_ci는 유니코드 기반으로 모든 언어 및 문자를 지원하는 규칙이며, 문자의 일관성과 정확성을 보장합니다. 반면에 utf8mb4_general_ci는 일반적인 언어 및 문자만을 지원하며, 몇몇 특수한 언어나 문자의 정렬이 올바르게 이루어지지 않을 수 있습니다.

2. 정렬 순서: utf8mb4_unicode_ci는 문자열을 정렬할 때 유니코드 코드 포인트를 기준으로 하여 정렬합니다. 이는 각 문자의 고유한 식별자를 기반으로 정렬하므로, 다양한 언어와 문자를 정확하게 정렬할 수 있습니다. 반면 utf8mb4_general_ci는 문자의 바이트 시퀀스를 기준으로 정렬하며, 일부 언어나 문자의 정렬 순서가 제대로 반영되지 않을 수 있습니다.

3. 성능: utf8mb4_unicode_ci는 정확한 문자 정렬을 위해 추가적인 계산이 필요하므로, 일반적으로 utf8mb4_general_ci에 비해 더 많은 리소스를 요구합니다. 따라서 대량의 데이터가 있는 경우 utf8mb4_general_ci를 사용하는 것이 성능상 유리할 수 있습니다.

결론적으로, utf8mb4_unicode_ci는 다양한 언어와 문자를 정확하게 지원하는 대신 약간의 성능 저하가 발생할 수 있습니다. utf8mb4_general_ci는 보다 간단하고 빠른 정렬을 제공하지만, 일부 언어나 문자에서는 정확한 정렬 순서가 보장되지 않을 수 있습니다. 선택은 사용하는 데이터베이스의 요구 사항과 용도에 따라 달라질 수 있습니다.

실례로 독일어나 프랑스어는 utf8mb4_unicode_ci에서는 정확하게 인코딩하나 utf8mb4_general_ci 는 인코딩 및 정렬에서 정확치 않습니다.

ß = s // utf8mb4_general_ci은 두 문자가 동일한것으로 인코딩

ß = ss // utf8mb4_general_ci는 서로다른 문자로 인식, 그러나 utf8mb4_unicode_ci는 독일사전규칙을 반영하여 두 문자를 동일한것으로 인코딩

때문에 디비를 설계할때 저장하려는 문자열의 어종에 따라 적합한 인코딩을 지정해주어야 하며 대용량디비에서는 될수록 utf8mb4_general_ci 를 써야 성능부하를 줄입니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

리오닥터

프로필 보기 이 회원 글보기

2년 전

헐.. 여태까지 유니코드로 했는데.. 제너럴이 낫단군요..
그럼 이모지도 지원되나요?

마르산

프로필 보기 이 회원 글보기

2년 전

@리오닥터 다국어가 중요하면 utf8mb4_unicode_ci 가 낫죠 이모지는 둘다 같아요

리오닥터

프로필 보기 이 회원 글보기

2년 전

@마르산 아하!!

게시글 목록

번호	제목	글쓴이	조회	날짜
17316	PHP 제로보드의 메모왔어요의 기법을 다르게 구현하면?	piadream	955	2년 전
17315	JavaScript 시계 스크립트 그런데 페이지 뜨는건 느린게 문제네...	piadream	847	2년 전
17313	PHP php 업로드 소스 4	piadream	1,762	2년 전
17312	웹서버 리눅스 압축풀기 방법 lzip 제외. 일반적 쓰는	piadream	810	2년 전
17305	PHP fopen의 꼼수? 흉내내기. 1	piadream	987	2년 전
17304	PHP happyl 페이징 다시 뜯어 no bug [ 보강 ]	piadream	853	2년 전
17298	node.js 간단한 채팅	tmp	1,281	2년 전
17294	OS 서버호스팅[ubuntu] 에 php-fpm , php5.x를 깔아야할때	지구버스	1,515	2년 전
17291	웹서버 라라벨 설치시 404 오류가 나오는 경우	리자	912	2년 전
17285	PHP ChatGPT API 예제 30	리자	6,891	2년 전
17284	JavaScript 두가지 형태의 페이지 로딩 [ 로딩중, 로딩 프로그레스바 ] 2	예뜨락	1,694	2년 전
17279	PHP 영카트 쇼핑몰 구축과 관련해서 과외해 주실 분 있을까요? 2	아노라니	920	2년 전
17272	PHP 두 날짜 사이의 날 수 구하기 2	우러러	1,410	2년 전
17271	JavaScript 관계에 따른 메뉴 구성방안 1	개노미	801	2년 전
17270	PHP valcmp() 함수 - 지정 범위에 값이 있는지 여부 체크 사용자정의함수	sinbi	897	2년 전
17262	웹서버 소프트링크(심볼릭링크) 잘못 삭제했다가 영업중인 쇼핑몰 관리자 날린 이야기 11	본연	2,399	2년 전
17255	기타 웹방화벽 캐슬 아이피 차단 안먹힐때 1	경천76	1,539	2년 전
17248	JavaScript 엘레먼트 요소에서 data 를 이벤트 핸들러로 사용하기 4	비타주리	1,185	2년 전
17241	PHP foreach()에서 next() 사용하기 3	엑스엠엘	1,496	3년 전
17238	MySQL interval에 쓸 수 있는 값 3	엑스엠엘	1,681	3년 전
17236	PHP 탈퇴합니다. 6	메리7	1,986	3년 전
17220	PHP 영카트 주소검색부분 에러문제 해결법 10	카깡	1,930	3년 전
17217	JavaScript 회원가입 2	오토소프트	1,087	3년 전
17216	PHP 자주 쓰는 제어문 대체 문법 정리해서 올립니다!	코드오타쿠	1,121	3년 전
17214	웹서버 CentOS 7 에서 MariaDB 5.5에서 10.5 업그레이드시 레포지트리 에러발생시 1	하늘뚱	1,277	3년 전
17207	OS 리눅스 Linux Public Key 추가 명령어 5	HLAB	1,911	3년 전
17205	OS 리눅스 Linux df 사용법 1	HLAB	1,394	3년 전
17203	OS 리눅스 Linux du 사용법 1	HLAB	1,784	3년 전
17201	OS 리눅스 Linux md5, sha1 해시값 확인하기 1	HLAB	1,794	3년 전
17198	OS 리눅스 Linux tmux 주요 명령어	HLAB	906	3년 전

이전 다음

7 8 9 10 11

전체 목록

강좌