utf8mb4_unicode_ci와 utf8mb4_general_ci의 차이점

swallow

· 2년 전 · 조회 6169 6169 · 댓글 3 3

이번에는 디비에서 인코딩과 관련한 글로 utf8mb4_unicode_ci와 utf8mb4_general_ci의 차이점을 보시겠습니다.

utf8mb4_unicode_ci와 utf8mb4_general_ci는 MySQL 데이터베이스에서 문자열을 비교 및 정렬하기 위해 사용되는 문자열 인코딩 및 정렬 규칙입니다. 이 두 규칙 간에는 다음과 같은 차이점이 있습니다:

1. 언어 및 문자 처리: utf8mb4_unicode_ci는 유니코드 기반으로 모든 언어 및 문자를 지원하는 규칙이며, 문자의 일관성과 정확성을 보장합니다. 반면에 utf8mb4_general_ci는 일반적인 언어 및 문자만을 지원하며, 몇몇 특수한 언어나 문자의 정렬이 올바르게 이루어지지 않을 수 있습니다.

2. 정렬 순서: utf8mb4_unicode_ci는 문자열을 정렬할 때 유니코드 코드 포인트를 기준으로 하여 정렬합니다. 이는 각 문자의 고유한 식별자를 기반으로 정렬하므로, 다양한 언어와 문자를 정확하게 정렬할 수 있습니다. 반면 utf8mb4_general_ci는 문자의 바이트 시퀀스를 기준으로 정렬하며, 일부 언어나 문자의 정렬 순서가 제대로 반영되지 않을 수 있습니다.

3. 성능: utf8mb4_unicode_ci는 정확한 문자 정렬을 위해 추가적인 계산이 필요하므로, 일반적으로 utf8mb4_general_ci에 비해 더 많은 리소스를 요구합니다. 따라서 대량의 데이터가 있는 경우 utf8mb4_general_ci를 사용하는 것이 성능상 유리할 수 있습니다.

결론적으로, utf8mb4_unicode_ci는 다양한 언어와 문자를 정확하게 지원하는 대신 약간의 성능 저하가 발생할 수 있습니다. utf8mb4_general_ci는 보다 간단하고 빠른 정렬을 제공하지만, 일부 언어나 문자에서는 정확한 정렬 순서가 보장되지 않을 수 있습니다. 선택은 사용하는 데이터베이스의 요구 사항과 용도에 따라 달라질 수 있습니다.

실례로 독일어나 프랑스어는 utf8mb4_unicode_ci에서는 정확하게 인코딩하나 utf8mb4_general_ci 는 인코딩 및 정렬에서 정확치 않습니다.

ß = s // utf8mb4_general_ci은 두 문자가 동일한것으로 인코딩

ß = ss // utf8mb4_general_ci는 서로다른 문자로 인식, 그러나 utf8mb4_unicode_ci는 독일사전규칙을 반영하여 두 문자를 동일한것으로 인코딩

때문에 디비를 설계할때 저장하려는 문자열의 어종에 따라 적합한 인코딩을 지정해주어야 하며 대용량디비에서는 될수록 utf8mb4_general_ci 를 써야 성능부하를 줄입니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

리오닥터

프로필 보기 이 회원 글보기

2년 전

헐.. 여태까지 유니코드로 했는데.. 제너럴이 낫단군요..
그럼 이모지도 지원되나요?

마르산

프로필 보기 이 회원 글보기

2년 전

@리오닥터 다국어가 중요하면 utf8mb4_unicode_ci 가 낫죠 이모지는 둘다 같아요

리오닥터

프로필 보기 이 회원 글보기

2년 전

@마르산 아하!!

게시글 목록

번호	제목	글쓴이	조회	날짜
17043	PHP AWS Lightsail 의 PHP 8 버전에서 SSH2 서비스 사용하기 3	리자	1,492	3년 전
17042	JavaScript for 문으로 유사패턴 태그 만들기 4	비타주리	2,120	3년 전
17025	JavaScript with 블럭 사용하기 17	비타주리	2,037	3년 전
17015	기타 4 lines of CSS for a vertical responsive slideshow 3	엑스엠엘	1,413	3년 전
17001	JavaScript event listeners 찾기 3	엑스엠엘	1,959	3년 전
16998	기타 그누보드 첨부파일에서 중간에 파일을 지웠을 때, 재정렬 하기	레드불355	1,314	3년 전
16994	기타 [그누보드] 그누보드 게시판 전체와 해당글 리스트 불러오기 4	레드불355	2,247	3년 전
16988	웹서버 Amazon linux2 에 REMI 저장소를 사용하여 PHP 8.1 버전 설치하기 5	SIR개발팀	3,321	3년 전
16985	JavaScript 자바스크립트 for length / for in / for of 6	비타주리	2,049	3년 전
16983	기타 보드 설치후 메인이 정상이 아닌 원인이 뭔지요.	한길은	1,650	3년 전
16981	웹서버 AWS사용시 추가 계정 생성하여 PUTTY에 접속하는 방법	SIR개발팀	1,692	3년 전
16979	node.js 이지코드, ezcode.kr vue로 웹사이트 만들기 강좌 공유	붉은바람	1,641	3년 전
16978	JavaScript javascript 라이브러리 로다쉬 - 배열,객체, 문자열 관련 유용한 라이브러리	DogFoot개발	1,444	3년 전
16976	웹서버 그누보드 개발환경 설치 기초편 ( nginx + db + php + 그누보드 설치) 3	DogFoot개발	2,981	3년 전
16968	JavaScript javascript 자바스크립트 하루 전/후 날짜 구하기 다음달 이전달 구하기 내년 작년 날짜 구하기 3	DogFoot개발	4,020	3년 전
16967	JavaScript 상위요소 찾기 노드 3	DogFoot개발	2,092	3년 전
16957	JavaScript 자바스크립트 로컬스토리지 사용법 localStorage ( javascript localStorage ) 3	DogFoot개발	2,429	3년 전
16956	기타 윈도우11 익스플로러 11 모드 설정 ie11 ( Internet Explorer ) 4	DogFoot개발	2,482	3년 전
16955	OS 서버 이전시 scp(ssh) 가 허용되지 않은 경우 백업 처리 1	솔그루	1,643	3년 전
16951	웹서버 ubuntu에서 redis설치 와 php redis확장 모듈 설치 Redis Extension	DogFoot개발	1,720	3년 전
16950	기타 [개발환경] VirtualBox ubuntu 21 에서 windows 10, 11 공유폴더 설정	DogFoot개발	1,529	3년 전
16949	기타 GIT 클라이언트 소개 합니다.	DogFoot개발	1,665	3년 전
16932	기타 postman 4	퀀텀리프	2,275	3년 전
16930	기타 테마 및 전역변수 감추기 1	XIES	2,548	3년 전
16913	웹서버 API 제작시, Json Body 로 받는 데이타 배열로 변환해서 쓰기 2	솔루션모아	2,229	4년 전
16909	웹서버 클라우드플레어의 SSL/TLS 암호화 모드 가변을 "가변"으로 사용시 5	리자	3,230	4년 전
16906	PHP G5_SERVER_TIME 오늘, 내일 추가 5	울라프	3,192	4년 전
16905	웹서버 데스크탑에서 나스 쉽게 켜기 2	울라프	2,433	4년 전
16904	기타 2021년 CSS프레임워크 9가지 소개입니다 3	mind7	3,001	4년 전
16894	기타 [Mariadb] 10.7.0 버전에 새로 생긴 natural_sort_key() 6	DogFoot개발	2,674	4년 전

이전 다음

9 10 11 12 13

전체 목록

강좌