utf8mb4_unicode_ci와 utf8mb4_general_ci의 차이점

swallow

· 2년 전 · 조회 6168 6168 · 댓글 3 3

이번에는 디비에서 인코딩과 관련한 글로 utf8mb4_unicode_ci와 utf8mb4_general_ci의 차이점을 보시겠습니다.

utf8mb4_unicode_ci와 utf8mb4_general_ci는 MySQL 데이터베이스에서 문자열을 비교 및 정렬하기 위해 사용되는 문자열 인코딩 및 정렬 규칙입니다. 이 두 규칙 간에는 다음과 같은 차이점이 있습니다:

1. 언어 및 문자 처리: utf8mb4_unicode_ci는 유니코드 기반으로 모든 언어 및 문자를 지원하는 규칙이며, 문자의 일관성과 정확성을 보장합니다. 반면에 utf8mb4_general_ci는 일반적인 언어 및 문자만을 지원하며, 몇몇 특수한 언어나 문자의 정렬이 올바르게 이루어지지 않을 수 있습니다.

2. 정렬 순서: utf8mb4_unicode_ci는 문자열을 정렬할 때 유니코드 코드 포인트를 기준으로 하여 정렬합니다. 이는 각 문자의 고유한 식별자를 기반으로 정렬하므로, 다양한 언어와 문자를 정확하게 정렬할 수 있습니다. 반면 utf8mb4_general_ci는 문자의 바이트 시퀀스를 기준으로 정렬하며, 일부 언어나 문자의 정렬 순서가 제대로 반영되지 않을 수 있습니다.

3. 성능: utf8mb4_unicode_ci는 정확한 문자 정렬을 위해 추가적인 계산이 필요하므로, 일반적으로 utf8mb4_general_ci에 비해 더 많은 리소스를 요구합니다. 따라서 대량의 데이터가 있는 경우 utf8mb4_general_ci를 사용하는 것이 성능상 유리할 수 있습니다.

결론적으로, utf8mb4_unicode_ci는 다양한 언어와 문자를 정확하게 지원하는 대신 약간의 성능 저하가 발생할 수 있습니다. utf8mb4_general_ci는 보다 간단하고 빠른 정렬을 제공하지만, 일부 언어나 문자에서는 정확한 정렬 순서가 보장되지 않을 수 있습니다. 선택은 사용하는 데이터베이스의 요구 사항과 용도에 따라 달라질 수 있습니다.

실례로 독일어나 프랑스어는 utf8mb4_unicode_ci에서는 정확하게 인코딩하나 utf8mb4_general_ci 는 인코딩 및 정렬에서 정확치 않습니다.

ß = s // utf8mb4_general_ci은 두 문자가 동일한것으로 인코딩

ß = ss // utf8mb4_general_ci는 서로다른 문자로 인식, 그러나 utf8mb4_unicode_ci는 독일사전규칙을 반영하여 두 문자를 동일한것으로 인코딩

때문에 디비를 설계할때 저장하려는 문자열의 어종에 따라 적합한 인코딩을 지정해주어야 하며 대용량디비에서는 될수록 utf8mb4_general_ci 를 써야 성능부하를 줄입니다.

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 3개

리오닥터

프로필 보기 이 회원 글보기

2년 전

헐.. 여태까지 유니코드로 했는데.. 제너럴이 낫단군요..
그럼 이모지도 지원되나요?

마르산

프로필 보기 이 회원 글보기

2년 전

@리오닥터 다국어가 중요하면 utf8mb4_unicode_ci 가 낫죠 이모지는 둘다 같아요

리오닥터

프로필 보기 이 회원 글보기

2년 전

@마르산 아하!!

게시글 목록

번호	제목	글쓴이	조회	날짜
17443	PHP PHP 로직 실행과정을 웹페이지에 런타임현시 2	swallow	927	2년 전
17442	PHP 세션타임아웃기능	swallow	947	2년 전
17441	PHP 유니큐 문자열 생성 함수를 공유해드립니다.	swallow	520	2년 전
17440	PHP 나만의 프레임워크를 만들어 본다	swallow	825	2년 전
17438	PHP 완벽한 UTF8 지원하기	swallow	755	2년 전
17436	기타 CSS3으로 3디텍스트애니 작성하기 2	swallow	1,007	2년 전
17435	Season2 // How To Force SSL On All Pages In .htaccess File	울라프	559	2년 전
17433	기타 CSS의 마우스커서 리스트 1	swallow	1,415	2년 전
17432	PHP PHP에서 HTML구문을 파싱하는 샘플코드	swallow	781	2년 전
17430	JavaScript 자바스크립트로 ctrl+F기능과 유사한 웹페이지내 문자검색기능 작성 1	swallow	1,477	2년 전
17426	PHP PHP로 숫자캡챠 이미지 생성하기 2	swallow	1,175	2년 전
17416	라이트세일 리소스 문제 알림	리오닥터	552	2년 전
17413	기타 selenium 네이버 카페 게시판 제일 첫번째 글 선택하기 3	라균	801	2년 전
17401	PHP $_SERVER 명려어중에서... 5	piadream	954	2년 전
17391	PHP 소스 코드가 이상하게 변질되어서 파일 기부[ No Bug 파일 완전판] 7	piadream	1,236	2년 전
17379	기타 팁 다운 팁좀 씁시다. 8	그누GPT	1,541	2년 전
17375	PHP 사이트 정보(파비콘, 제목, 설명) 가져오는 함수	친절한태엽씨	1,035	2년 전
17374	PHP xampp의 phpmyadmin 암호 처리 끝내기.	piadream	1,210	2년 전
17362	PHP 스크립트 해킹 방어 구문 간단 셀프 작성한 것인데... 웬지 쎈 소스 3	piadream	1,182	2년 전
17350	JavaScript 지정한 범위내에서 랜덤으로 숫자출력하는 스크립트 3	안드류KIM	988	2년 전
17348	MySQL 배너 노출 관련 쿼리 4	하얀감자	1,173	2년 전
17341	MySQL 이진 트리 순회... 무한 계층형 트리 2	스팸마요	1,243	2년 전
17339	PHP 1에서 45까지 랜덤이면서 연속 숫자도 가능한 소스 3	하늘뚱	1,485	2년 전
17335	OS 리눅스 퍼미션에 무조건. 7계열을 써야 패키지 실행된다?	piadream	826	2년 전
17334	웹서버 phpmyadmin config.inc.php 않건드리고 사용자 생성(구닥다리정보일수도?)	piadream	874	2년 전
17333	웹서버 REWRITE 설계도 해주는 사이트 3	piadream	960	2년 전
17332	PHP 멤버십 탈퇴할때 탈퇴문구 넣기 그러나 왜 단일?	piadream	833	2년 전
17331	PHP 글은 화면에 차고. 카테고리길어져 카테고리는 그냥 화면만큼쓰고 싶고	piadream	893	2년 전
17330	PHP 맨 앞글자만 크게 써먹게 하기.(네이트 뉴스 서비스 사용하다 보면 이해함)	piadream	894	2년 전
17329	PHP technote ipage를 다르게 구현 (소스가 같으려나....)	piadream	923	2년 전

이전 다음

6 7 8 9 10

전체 목록

강좌