utf8mb4_unicode_ci와 utf8mb4_general_ci의 차이점

swallow

· 2년 전 · 조회 6170 6170 · 댓글 3 3

이번에는 디비에서 인코딩과 관련한 글로 utf8mb4_unicode_ci와 utf8mb4_general_ci의 차이점을 보시겠습니다.

utf8mb4_unicode_ci와 utf8mb4_general_ci는 MySQL 데이터베이스에서 문자열을 비교 및 정렬하기 위해 사용되는 문자열 인코딩 및 정렬 규칙입니다. 이 두 규칙 간에는 다음과 같은 차이점이 있습니다:

1. 언어 및 문자 처리: utf8mb4_unicode_ci는 유니코드 기반으로 모든 언어 및 문자를 지원하는 규칙이며, 문자의 일관성과 정확성을 보장합니다. 반면에 utf8mb4_general_ci는 일반적인 언어 및 문자만을 지원하며, 몇몇 특수한 언어나 문자의 정렬이 올바르게 이루어지지 않을 수 있습니다.

2. 정렬 순서: utf8mb4_unicode_ci는 문자열을 정렬할 때 유니코드 코드 포인트를 기준으로 하여 정렬합니다. 이는 각 문자의 고유한 식별자를 기반으로 정렬하므로, 다양한 언어와 문자를 정확하게 정렬할 수 있습니다. 반면 utf8mb4_general_ci는 문자의 바이트 시퀀스를 기준으로 정렬하며, 일부 언어나 문자의 정렬 순서가 제대로 반영되지 않을 수 있습니다.

3. 성능: utf8mb4_unicode_ci는 정확한 문자 정렬을 위해 추가적인 계산이 필요하므로, 일반적으로 utf8mb4_general_ci에 비해 더 많은 리소스를 요구합니다. 따라서 대량의 데이터가 있는 경우 utf8mb4_general_ci를 사용하는 것이 성능상 유리할 수 있습니다.

결론적으로, utf8mb4_unicode_ci는 다양한 언어와 문자를 정확하게 지원하는 대신 약간의 성능 저하가 발생할 수 있습니다. utf8mb4_general_ci는 보다 간단하고 빠른 정렬을 제공하지만, 일부 언어나 문자에서는 정확한 정렬 순서가 보장되지 않을 수 있습니다. 선택은 사용하는 데이터베이스의 요구 사항과 용도에 따라 달라질 수 있습니다.

실례로 독일어나 프랑스어는 utf8mb4_unicode_ci에서는 정확하게 인코딩하나 utf8mb4_general_ci 는 인코딩 및 정렬에서 정확치 않습니다.

ß = s // utf8mb4_general_ci은 두 문자가 동일한것으로 인코딩

ß = ss // utf8mb4_general_ci는 서로다른 문자로 인식, 그러나 utf8mb4_unicode_ci는 독일사전규칙을 반영하여 두 문자를 동일한것으로 인코딩

때문에 디비를 설계할때 저장하려는 문자열의 어종에 따라 적합한 인코딩을 지정해주어야 하며 대용량디비에서는 될수록 utf8mb4_general_ci 를 써야 성능부하를 줄입니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

리오닥터

프로필 보기 이 회원 글보기

2년 전

헐.. 여태까지 유니코드로 했는데.. 제너럴이 낫단군요..
그럼 이모지도 지원되나요?

마르산

프로필 보기 이 회원 글보기

2년 전

@리오닥터 다국어가 중요하면 utf8mb4_unicode_ci 가 낫죠 이모지는 둘다 같아요

리오닥터

프로필 보기 이 회원 글보기

2년 전

@마르산 아하!!

게시글 목록

번호	제목	글쓴이	조회	날짜
17927	오라클 무료 티어 또는 AWS 대한민국 리전에서 클라우드플레어 사용시 사이트 속도 느림	푸른악마	947	1년 전
17926	간단한 스크롤 진행률 표시기 구현하기 2 2	김서훈	962	1년 전
17922	간단한 스크롤 진행률 표시기 구현하기 4	김서훈	881	1년 전
17921	nprogress bar&Circle 수정본 입니다.	들레아빠	709	1년 전
17915	도커(docker) 웹관리 프로그램인 dockge 설치 및 사용방법 7	바다클라우드	3,634	1년 전
17910	aws라이트세일에 그x보드 설치 5	뽕엄능브라	1,664	1년 전
17907	2개 이상의 button 누르면 각 ifrme 으로 페이지 열기 3	해피정	1,323	1년 전
17892	불펌금지 자바스크립트 18	GREENnBLUE	2,642	1년 전
17888	러시아 이용자들을 효과적으로 차단하기 8	Tak2	2,451	1년 전
17879	그누보드 폰에서 돌리기 (Termux) 19	Tak2	3,637	1년 전
17878	F12 키를 쉽게 비활성화 시키기 2	시리즈8	1,536	1년 전
17874	JavaScript 글자수 제한 가장 쉬운판.중 하나	piadream	679	1년 전
17873	OS aws 아이피 모조리 차단하기 -웹호스팅 사용자는 불가- 1	길가던분	738	1년 전
17872	PHP 포럼 출력소스 [ 샘플본 ]	piadream	882	1년 전
17871	PHP 게시판별 카테고리 만들기.	piadream	781	1년 전
17870	PHP 댓글이나 답글은 로직이 같다.	piadream	641	1년 전
17869	PHP 카테고리 만드는 예제.	piadream	747	1년 전
17868	PHP 엑셀로 EXPORT 할때 사용하기 좋은 방법	techstar	792	1년 전
17866	JavaScript 문구 복사하기 자바스크립트	piadream	663	1년 전
17865	PHP 그룹의 그룹내 사용자가 전체 메시지 보내기.	piadream	611	1년 전
17864	PHP 사용자 그룹 통합 해제(해제는 삭제)	piadream	570	1년 전
17863	PHP 랜덤값 만들기 겹치기는	piadream	678	1년 전
17862	PHP 만들고 보니 카톡의 단톡방 톡방 패러디 .....	piadream	662	1년 전
17859	PHP 그누보드로 다중검색을 구현해보니..	techstar	756	1년 전
17856	정규표현식 정규표현식 쉽게 이해하는 방법 좀 가르켜주세요	linlinHuang	634	1년 전
17845	JavaScript 페이지 로딩 애니메이션	솔루션개발	696	1년 전
17835	PHP docker 활용한 php 환경 구성 10	Laraveler	2,108	1년 전
17834	PHP 데이타 1개 가져오기 5	techstar	1,601	1년 전
17826	PHP 제목(wr_subject)를 안짤리게 하려면..	techstar	665	1년 전
17823	node.js 사진에서 배경을 제거하고 다른 배경이미지와 합성하는 서비스 5	swallow	1,424	1년 전

이전 다음

1 2 3 4 5

전체 목록

강좌