MySQL 쓰면서 하지 말아야 할 것 17가지

켈리얀

· 14년 전 · 조회 1552 1552 · 댓글 6 6

출처->http://xeraph.com/4286421

mysql로 작업을 하면서도 퍼포먼스에 대한 이해부족으로 어떤식으로 디비를 구성하고 테이블을 작성해야 좋은 효율을 내게 될것인가에 대해 나름 고민 해 왔었습니다.
이글은 그런 고민에대해 어느정도는 방향을 제시해 주는 글이었던것 같습니다.

물론 이 내용에 대해 다 이해하고 또 다른 관점으로 보시는 고수님들이 스쿨에는 많이 계시겠지만 이제 시작하는 분들에겐 어느정도 방향을 제시 해줄 수 있을것 같아 옮깁니다.

================================================================================================
*MySQL 쓰면서 하지 말아야 할 것 17가지*

작게 생각하기
- 조만간 규모가 커질거라면 MySQL ecosystem을 봐야된다.
- 그리고 캐싱 빡시게 안 하는 메이저 웹사이트는 없다.
- develooper.com의 Hansen PT랑 Ilia 튜토리얼 볼 것
- 처음부터 확장 가능하게 아키텍처 잘 쪼개놔야된다.
- 복제랑 파티셔닝 어떻게 할지 미리 계획 세워놔라.
- 파일 기반 세션 좀 쓰지마 -_-
- 그렇다고 너무 쓸데없이 크게 생각하지도 말 것
- 특히 성능하고 확장성 구분 못 하면 난감함

EXPLAIN 안 써보기
- SELECT 앞에 EXPLAIN 이라고 붙이기만 하면 되는 것을 (..)
- 실행 계획 확인
- 타입 컬럼에 index 써있는거랑 Extra 컬럼에 index 써있는거랑 "매우 큰" 차이 있음
* 타입에 있으면 Full 인덱스 스캔 (안 좋다.)
* Extra 컬럼에 있으면 Covering 인덱스 찾았다는 의미임 (좋다!)
- 5.0 이후부터는 index_merge 최적화도 한다.

잘못된 데이터 타입 선택
- 한 메모리 블럭 단위에 인덱스 레코드가 많이 들어갈수록 쿼리가 빨리 실행될 것이다. (중요)
- 아.. 정규화 좀 해 -_-... (이거 정말 충격과 공포인 듯)
- 가장 작은 데이터 타입을 써.. (진짜 BIGINT가 필요하냐고..)
- 인덱스 걸리는 필드는 정말 최소한으로 데이터 크기를 써야된다고.
- IP는 INT UNSIGNED로 저장해!! (아주 공감)
* 이럴 때 쓰라고 INET_ATON 함수가 아예 내장되어 있음.

PHP에서 pconnect 쓰는 짓
- 아파치에서 좀비 프로세스라도 생기면 그 커넥션은 그냥 증발하는거야..
- 어차피 MySQL 접속 속도는 Oracle이나 PostgreSQL 보다 10~100배 빠르다고.

너무 과도한 DB 추상화 계층을 두는 것
- 어디 포팅 열심히 할 거 아니면 추상화 계층 쓰지마 (ADODB, MDB2, PearDB 등)
- scale out 가능한걸 쓰라고.

스토리지 엔진 이해 못 하는 것
- 단일 엔진만으로 전체 아키텍처를 결정했다면 대부분 최적이 아님
- 엔진 별 장단점을 공부할 것
- ARCHIVE : zlib으로 압축해주고 UPDATE 안 되고 로그 Bulk Insert에 유용함.
- MEMORY : 서버 재시작하면 증발. 인덱스가 HASH나 BTREE로 가능함. 임시, 요약 데이터에 사용.
* 주간 top X 테이블 같은 것.
* 하여튼 메모리에 박아넣고 싶은 데이터 있으면..

인덱스 레이아웃 이해 못 하는 것
- 제대로 인덱스랑 스토리지 엔진 선택하려면 공부 좀 해
- 엔진은 데이터와 인덱스 레코드를 메모리나 디스크에 레이아웃하는 걸 구현한 것
- clustered 구성은 데이터를 PK 순서에 따라 저장함.
- non-clustered 구성은 인덱스만 순서대로 저장하고 데이터는 순서 가정하지 않음.
- clustered에서는 인덱스만 타면 추가적인 조회 없이 바로 데이터 가져오는 것임.
- 그래서 clustered PK는 작은 놈으로 할 필요가 있다는거
* 다른 인덱스는 각 레코드마다 PK를 앞에 더 붙이게 되니까.
* PK 지정 안 하면 아무렇게나 해버림

쿼리 캐시 이해 못 하는 것
- 어플리케이션 read/write 비율은 알고 있어야지
- 쿼리 캐시 설계는 CPU 사용과 읽기 성능 간의 타협
- 쿼리 캐시 크기를 늘린다고 읽기 성능이 좋아지는게 아님. heavy read라도 마찬가지.
- 과도한 CPU 사용을 막기 위해 무효화 할 때는 캐시 항목들을 뭉텅이로 날려버림
- 한마디로 SELECT가 참조하는 테이블 데이터 하나라도 변경되면 그 테이블 캐시는 다 날라간다는 얘기임
- 수직 테이블 파티셔닝으로 처방
* Product와 ProductCount를 쪼갠다든지..
* 자주 변하는 것과 변하지 않는 것을 쪼개는게 중요하다 이 말임.

Stored Procedure를 쓰는 것
- 무조건 쓰면 안 된다는게 아니고..
- 컴파일 할 때 무슨 일이 일어나는지 이해 못 하고 쓰면 재앙이 된다 이 말.
- 다른 RDBMS랑 다르게 connection thread에서 실행 계획이 세워짐.
- 이게 뭔 얘기냐 하면 데이터 한 번 가져오고 연결 끊으면 그냥 CPU 낭비 (7~8% 정도)하는 꼴이라는 것.
- 웬만하면 Prepared 구문과 Dynamic SQL을 써라.. 아래 경우를 제외하고
* ETL 타입 프로시저
* 아주아주 복잡하지만 자주 실행되지는 않는 것
* 한 번 요청할 때마다 여러번 실행되는 간단한 것 (연결한 상태로 여러번 써야 된다니까)

인덱스 컬럼에 함수 쓰는 것
- 함수에 인덱스 컬럼 넣어 호출하면 당연히 인덱스 못 탄다
- 함수를 먼저 계산해서 상수로 만든 다음에 = 로 연결해야 인덱스 탈 수 있다.
* 여기 실행 계획 보면 LIKE도 range type 인덱스 타는 것 보임

인덱스 빼먹거나 쓸모없는 인덱스 만들어 놓는 것
- 인덱스 분포도(selectivity)가 허접하면 안 쓴다.
- S = d/n
* d = 서로 다른 값의 수 (# of distinct values)
* n = 테이블의 전체 레코드 수
- 쓸모없는 인덱스는 INSERT/UPDATE/DELETE를 느리게 할 뿐..
- FK는 무조건 인덱스 걸어라. (물론 FK 제약 걸면 인덱스 자동으로 생긴다.)
- WHERE나 GROUP BY 표현식에서 쓰이는 컬럼은 인덱스 추가를 고려할 것
- covering index 사용을 고려할 것
- 인덱스 컬럼 순서에 유의할 것!

join 안 쓰는 짓
- 서브쿼리는 join으로 재작성해라
- 커서 제거해라
- 좋은 Mysql 성능을 내려면 기본
- 집합 기반으로 생각해야지 루프 돌리는거 생각하면 안 된다.

Deep Scan 고려하지 않는 것
- 검색엔진 크러울러가 쓸고 지나갈 수 있다.
- 이 경우 계속해서 전체 집합을 정렬한 다음 LIMIT로 가져와야 하니 무진장 느려진다.
- 어떻게든 집합을 작게 줄인 다음 거기서 LIMIT 걸어 가져올 것

InnoDB 테이블에서 WHERE 조건절 없이 SELECT COUNT(*) 하는 짓
- InnoDB 테이블에서는 조건절 없이 COUNT(*) 하는게 느리다.
- 각 레코드의 transaction isolation을 유지하는 MVCC 구현이 복잡해서 그렇다는..
- 트리거 걸어서 메모리 스토리지 엔진 쓰는 테이블에 통계를 별도로 유지하면 된다.

프로파일링이나 벤치마킹 안 하는 것
- 프로파일링 : 병목 찾아내기
- 벤치마킹 : 시간에 따른 성능 변화 추이 평가, 부하 견딜 수 있는지 테스트
- 프로파일링 할 때는 실제 데이터를 옮겨와서 할 것
- 어디가 병목이냐~ Memory? Disk I/O? CPU? Network I/O? OS?
- 느린 쿼리 로그로 남기기
* log_slow_queries=/path/to/log
* log_queries_not_using_indexes
- 벤치마킹 시에는 다 고정시키고 변수 하나만 바꿔가면서 해야 함. (쿼리 캐시는 끌 것.)
- 도구를 써라~~
* EXPLAIN
* SHOW PROFILE
* MyTop/innotop
* mysqlslap
* MyBench
* ApacheBench (ab)
* super-smack
* SysBench
* JMeter/Ant
* Slow Query Log

AUTO_INCREMENT 안 쓰는 것
- PK를 AUTO_INCREMENT로 쓰는건 무진장 최적화 되어 있음
* 고속 병행 INSERT 가능
* 잠금 안 걸리고 읽으면서 계속 할 수 있다는!
- 새 레코드를 근처에 놓음으로써 디스크와 페이지 단편화를 줄임
- 메모리와 디스크에 핫 스팟을 생성하고 스와핑을 줄임

ON DUPLICATE KEY UPDATE를 안 쓰는 것
- 레코드가 있으면 업데이트하고 없으면 인서트하고 이런 코드 필요없다!! 다 날려버려라!!
- 서버에 불필요하게 왔다갔다 할 필요가 없어짐
- 5-6% 정도 빠름
- 데이터 입력이 많다면 더 커질 수 있음

하지 말아야 할 것 총정리
Thinking too small
Not using EXPLAIN
Choosing the wrong data types
Using persistent connections in PHP
Using a heavy DB abstraction layer
Not understanding storage engines
Not understanding index layouts
Not understanding how the query cache works
Using stored procedures improperly
Operating on an indexed column with a function
Having missing or useless indexes
Not being a join-fu master
Not accounting for deep scans
Doing SELECT COUNT(*) without WHERE on an InnoDB table
Not profiling or benchmarking
Not using AUTO_INCREMENT
Not using ON DUPLICATE KEY UPDATEK

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 6개

K찰스

프로필 보기 이 회원 글보기

14년 전

게시글 목록

번호	제목	글쓴이	조회	날짜
3182	Git 배우기.. 5	진정한승리v	1,047	13년 전
3171	개발자 장점? 단점? 10	톰소여	1,417	13년 전
3165	업무스타일로 보는 우리 사장님 과거 출신 부서.. 5	onlymilk74	610	13년 전
3163	일 하나 끝네고 시계를 보니~ 1	하하하송	521	13년 전
14999	Flash [ActionScript 3.0] , MovieClipWithPlaying , 현제 무비클립이 재생 중인지 체크하기 위해서 1	visualp	1,239	13년 전
14998	PHP mp3 tag 정보 구하기	visualp	1,575	13년 전
14991	PHP 유용한 함수 substr 과 array_slice 6	유창화	1,650	13년 전
14984	jQuery javascript the difinitive guide 5/E 17-6 Keymap.js 예제 6	관리자	819	13년 전
14982	기타 [windows 2003]에서 flv가 재생 되지 않는 다면? 1	visualp	632	13년 전
14979	PHP [ActionScript 3] 배열의 특정 원소 삭제하기 2	visualp	1,784	13년 전
14978	기타 [ActionScript 3] TextArea embedFonts	visualp	854	13년 전
14977	Flash [ActionScript 3.0] 폰트 임베디드 , Embed font	visualp	1,229	13년 전
3155	정말 좋은 아이디어가 없네요... 7	그래픽노블	680	13년 전
14976	JavaScript [ActionScript 3.0] Singleton , 싱글톤 페턴	visualp	737	13년 전
14963	PHP 유용한 함수 strpos 12	유창화	729	13년 전
14960	JavaScript [er-win 7 발표자료] 도움이 될지 모르겠내요. 2	visualp	820	13년 전
14957	jQuery jquery를 이용한 오른쪽 퀵메뉴 2	onlymilk74	4,622	13년 전
3151	인사 겸 질문: 그누 API? oauth? 3	전진	729	13년 전
3143	개발활동 10년 그리고 창업... 7	그래픽노블	849	13년 전
14951	PHP getimagesize 속도가 느려지는 또는 느린 경우 5	관리자	1,505	13년 전
3135	경찰청 업무 홈페이지 구축을 위한 전문 웹개발자를 찾습니다 7	박형근	671	13년 전
3132	월요일입니다. 개발자 게시판에 글이 없군요 2	명랑폐인	466	13년 전
14948	PHP php 함수검색 넣기 2	선택이란	841	13년 전
14941	MySQL php 에 유용한툴 15가지 6	K찰스	2,112	13년 전
29815	HTML 메타데이타를 제거하여 이미지 최적화하기 5	port	1,582	13년 전
14939	기타 오라클 디비 사용시 서브쿼리시 주의할점! 1	onlymilk74	1,404	13년 전
14936	jQuery jQuery closest().find() 2	관리자	2,836	13년 전
14935	PHP php로 동영상파일 영상정보(포맷,해상도,플레이타임등등) 가져오기	선택이란	1,945	13년 전
3119	저희같은 회사가 있을까여? 12	톰소여	898	13년 전
3113	HTML5 혹시 잘아시는분도움좀부탁드려요. 5	초딩님	969	13년 전
14933	PHP fwrite() 함수 관련 1	켈리얀	923	13년 전
14929	PHP 모바일 벤치마킹 하기 좋은 사이트이네요 3	K찰스	1,023	13년 전
3110	flex개발자자겸 디자이너로 활동하려면 2	Lonnie	514	13년 전
14928	JavaScript ssh 기본명령어 (왕초보 -_-)	남이	818	13년 전
14923	PHP phpExcelReader 엑셀 업로드 다운로드 매우 편리합니다. 4	담장이	969	13년 전
14921	PHP php 로 ssh2 원격접속 명령실행하기 1	선택이란	2,521	13년 전
3091	산속에 들어가서 개발하고 싶어요 18	배추벌레	833	13년 전
3087	커스터마이징, 생각만 해도 초긴장입니다. 3	바보천사	565	13년 전
3078	요즘에는 개발할때 8	TopSchooL	583	13년 전
26068	계약서 프로그램 용역 계약서 6	담운	2,933	14년 전
3067	프로젝트 미완성시 계약금 환불에 대해 10	담운	716	14년 전
24252	디자인,기획 그리고 웹기획 과 솔루션의 이해 21	신현종실장	1,435	14년 전
14918	jQuery [jQuery] 입력한 내용에 맞는 체크박스만 보여주기 2	아샬	1,436	14년 전
3061	프리랜서 하시는분? 5	톰소여	632	14년 전
3059	내적 동기유발 1	명랑폐인	1,352	14년 전
3053	https://github.com/kagla/gnuboard 5	관리자	743	14년 전
14915	기타 open API & Mashup 정보제공사이트 2	행님	851	14년 전
3049	Editplus + XAMPP + TortoiseSVN + 네이버 개발자센터 3	관리자	1,815	14년 전
14912	jQuery 문서의 총 높이값 알아내는 자바스크립트 2	켈리얀	1,520	14년 전
14911	MySQL mysql utf-8 설정하기	명랑폐인	2,120	14년 전
14909	MySQL 사이트 제작시 데이터 베이스에서 한번은 꼬옥~ 확인해야 될것 1	onlymilk74	853	14년 전
3040	node.js 를 사용한 1차 프로젝트 8	명랑폐인	738	14년 전
3033	node.js 개발하기 STEP 0. 준비 6	명랑폐인	2,123	14년 전
3027	첫취업 하려는데요.. 웹퍼블리셔와 개발자.. 5	DreamT	753	14년 전
3022	페이스북에서 뉴스피드 ..? 4	아르에나	861	14년 전
14908	jQuery jQuery 의 attr 과 prop 에 대하여	관리자	1,974	14년 전
24246	기획력에 대해서~ 5	여행지기	990	14년 전
14905	PHP 모바일로 접속하는지 웹으로 접속하는지 체크 2	K찰스	899	14년 전
3015	개발자 구인하는 글에 이런 애기 좀 없었으면 ~~ 6	onlymilk74	644	14년 전
14904	PHP 모바일 OS에서 자바스크립트 select() 구현	켈리얀	891	14년 전
14899	PHP php에서 ssh2로 서버간 파일 복사하기 4	선택이란	1,906	14년 전
3007	건의] 개발게시판내 소모임 게시판 요청 7	명랑폐인	474	14년 전
14884	PHP 유용한 함수 - json_decode 14	유창화	2,435	14년 전
24241	기획자에 대해서 궁금합니다. 4	톰소여	801	14년 전
3001	한가지 로그인방식에 대해서 질문합니다. 5	톰소여	509	14년 전
2997	j-query에 대해서 또 글올립니다. 3	톰소여	513	14년 전
14880	JavaScript 유용한 함수 - serialize 3	유창화	773	14년 전
2991	node.js 가 대세라고 해서.. 5	명랑폐인	680	14년 전
2984	유용한 함수 - serialize 6	유창화	579	14년 전
14879	MySQL 프로그래밍 보안 가이드 2006	K찰스	1,068	14년 전
2975	여기서 막혔어요 도와주세요~ 8	손사	506	14년 전
24232	약관의 나이에 대박 낸 스타트업 CEO들 8	스티브닷	1,184	14년 전
14872	MySQL MySQL 쓰면서 하지 말아야 할 것 17가지 6 현재글	켈리얀	1,553	14년 전
2970	j-query고수분들 도와줍쇼 4	톰소여	518	14년 전
24231	외국 사이트 관련 기획경험 있으신 분 찾습니다.	wooriteam	649	14년 전
2967	요즘 액션스크립 일거리가 없네요.. 2	SGFlash	506	14년 전
2958	개발자로 살기가 8	Priere	657	14년 전
14864	Flash Modify HTTP Headers (Examples) 7	명랑폐인	1,084	14년 전
2952	MMORPG 동접개선을 위한 개발 이야기 5	명랑폐인	779	14년 전
14858	JavaScript 자기 컴퓨터에서 자신만에 홈피 주소 사용하기. 5	카이루	900	14년 전
24230	기획자들은 어떻게 자기 계발하시나요?	정기33	721	14년 전
14850	PHP form 의 action 필드를 전환하는 방법 7	관리자	863	14년 전
2950	개발자분들께 질문이 있습니다. 1	내꿈은대통령	454	14년 전
14848	JavaScript 아이폰 개발시 sbjson을 이용시 파싱 하다 보면 , \n \r때문에 파싱이 안되는 경우에는? 1	visualp	1,262	14년 전
14846	JavaScript 도메인 "_" 문자열? 1	visualp	607	14년 전
14845	jQuery jquery, mouseover/out	visualp	1,368	14년 전
14839	jQuery [jQuery] textarea 글자수 카운트 5	아샬	8,122	14년 전
2944	혹시 대구에 사시는 프로그래머 계신가요? 5	여행지기	745	14년 전
2932	facebook 게시판 연동해서 사용하시는분 정보 공유하시면 복받으실껍니다. 11	해피정	1,589	14년 전
14833	PHP [전자결제] [다날] [핸드폰/ARS] 한글 인코딩 utf-8 사용시 해결법 5	해피정	1,314	14년 전
14832	PHP [전자결제] [다날] [계좌이체] 한글 인코딩 utf-8 사용시 해결법	해피정	1,589	14년 전
14830	jQuery 가변 폼 액션 접근성 확보하기 1	웃는하루	1,925	14년 전
2927	메뉴얼이 필요한 프로그램은 좋은 프로그램이 아니다. 4	바보천사	522	14년 전
14826	기타 퍼미션 명령 3	sider	663	14년 전
26056	기획서 기획 및 시연회 PPT 템플릿 자료 입니다. 11	복스리	6,461	14년 전
2921	제작의뢰 후 그분? 에게서 연락이 왔습니다.. 5	o하하o	652	14년 전
2911	프리랜서에 대해서 궁금합니다. 9	톰소여	584	14년 전
14824	JavaScript ajax 서버측 현재시간 출력 1	techer	1,731	14년 전
2906	j-query사용? 4	톰소여	636	14년 전
2889	프로젝트 시작과끝 16	명랑폐인	634	14년 전

이전 다음

40 41 42 43 44

전체 목록