MySQL의 UUID 성능?

ProgramingTip

MySQL의 UUID 성능?

bestdevel 2020. 10. 14. 08:07

MySQL의 UUID 성능?

MySQL 데이터베이스의 기본 키로 UUID 값을 사용하는 것을 고려하고 있습니다. 삽입되는 데이터는 수백 또는 수천 대의 원격 컴퓨터에서 생성되며 100 ~ 40,000 개의 삽입 속도로 전면 업데이트를 수행하지 않습니다.

약 5 개의 데이터베이스는 일반적으로 데이터를 추출하기 전에 약 5 개의 데이터베이스는 데이터베이스는 파일 작지도를 가져옵니다. 우리는 또한 InnoDB에서 사용할 계획이지만, 우리가하고있는 것이 더 나은 엔진이있는 기법 수 있습니다.

우리는 Java의 Type 4 UUID를 사용할 준비가 곧 테스트에서 이상한 동작을 보았습니다. 첫째로, 우리는 varchar (36)로 저장하고 이제 바이너리 (16)를 사용하는 것이 더 나을 의미 깨달았습니다.

더 큰 질문은 5 천만 개의 레코드가있을 때 무작위 데이터가 심각하게 심하게 망가 뜨리는가입니다. 예를 들어 가장 중요한 비트에 타임 스탬프가 찍힌 유형 1 UUID를 사용하는 것이 더 나을까요? 아니면 UUID를 완전히 버리고 auto_increment 기본 키를 때할까요?

여러 유형의 UUID가 MySQL에서 정책 / 기본 키로 저장 될 때 성능에 대한 일반적인 생각 / 팁을 찾고 있습니다. 감사합니다!

UUID는 범용 고유 ID입니다. 여기서 보편적 인 부분입니다.

당신이 할 보편적으로 고유하게 ID를해야합니까? 유일한 선택은 UUID가 있습니다.

난 강력하게 당신이 경우에 제안 할 사용 UUID를, 당신은 숫자로 아닌 경우에 저장합니다. 5,000 만 개 이상의 레코드가있는 경우 저장 공간을 절약하면 성능이 향상됩니다 (얼마나 많이 말할 수는 없지만).

ID가 보편적으로 고유 할 필요가없는 경우 auto_increment를 사용하는 것보다 훨씬 더 잘할 수 있습니다. 이는 즉 ID가 테이블 내에서 고유 한 것을 보장합니다 (값이 매번 증가하기 때문에).

제 직장에서는 UUID를 PK로 사용합니다. 경험을 통해 알 수있는 것은 PK (SQL Server)로 사용하지 않습니다.

레코드가 1000 개곡이면 괜찮지 만 수백만 개가 있으면 할 수있는 최악의 일입니다. 왜? UUID는 삽입 될 때마다 새 레코드가 삽입 될 때마다 MSSQL은 레코드를 삽입 할 올바른 페이지보고 레코드를 삽입해야합니다. 이로 인한 정말 추악한 결과는 페이지가 모두 다른 크기로 끝나고 결국 조각화가 주기적으로 조각 모음을 수행해야합니다.

자동 증가를 사용할 때 MSSQL은 항상 마지막 페이지로 이동하고 동일한 크기의 페이지 (이론상)로 끝나는 해당 레코드를 선택하는 성능이 훨씬 좋습니다 (또한 INSERT가 테이블 / 페이지를 차단하지 않습니다. 안녕).

그러나 UUID를 PK로 사용하는 가장 큰 장점은 DB 클러스터가 있으면 병합 할 때 충돌이 발생하지 않습니다.

다음 모델을 권장합니다. 1. PK INT Identity 2. UUID로 자동 생성되는 추가 열.

기존 방식으로 병합 프로세스가 가능합니다 (UUID는 REAL 키가되고 PK는 좋은 성능을 제공하는 일시적인 것입니다).

참고 : 가장 좋은 해결책은 NEWSEQUENTIALID (댓글에서 말한 것처럼)를 사용하는 것이지만 리팩터링 할 시간이 많지 않은 레거시 앱의 (심지어 모든 삽입을 제어하지 않는 경우) 불가능합니다. 그러나 실제로 2017 년 현재 최고의 솔루션은 NEWSEQUENTIALID 또는 NHibernate와 함께 Guid.Comb을 수행하는 것입니다.

도움이 되셨기를 바랍니다.

할 일 사항은 자동 증가가 한 번에 하나씩 생성 할 수있는 솔루션을 사용하여 수 있습니다. UUID 사용을위한 싸움은 대전하고자하는 것과 일치합니다.

성능에 대해 간단히 :

위와 같은 UUID는 대시를 포함하여 36 자입니다. 이 VARCHAR (36)을 저장하면 성능이 크게 향상됩니다. 이것이 기본 기본이며 느리기를 사용합니다.

비트 수준에서 UUID는 128 비트입니다. 즉, 16 바이트에 맞습니다. 사람이 읽을 수는 없지만 저장소를 낮게 유지하고 32 비트 int보다 4 배 더 먹을 것을 준비합니다. 64 비트 정수보다 배 섭섭니다. 이론적으로는 VARBINARY (16)를 사용합니다. 이 많은 오버 헤드없이 작동 할 수 있습니다.

다음 두 게시물을 읽는 것이 좋습니다.

나는 둘 사이에서 생각하고 당신의 질문에 대답합니다.

나는 저장하는 것이 고통스럽고 기본 키로 사용하는 것이 고통이기 때문에 UUID를 피하는 것이 좋습니다. 주요한 것은 고유 한 것입니다.

나는 일반적으로 문제를 해결하고 이중 키 필드를 사용하여 UUID를 피합니다.

수집기 = 기계에 할당 된 고유

ID = 수집자가 수집 한 레코드 (auto_inc 필드)

이것은 나에게 두 가지를 제공합니다. 자동 통합 필드의 속도와 데이터가 수집 및 그룹화 된 후 중앙 위치에 저장되는 데이터의 고유성. 나는 또한 데이터가 수집 된 위치를 탐색하는 동안 알고 중요합니다.

나는 UUID를 사용하기로 결정한 클라이언트를위한 다른 데이터 세트를 처리하는 동안 많은 경우를 보았습니다.하지만 여전히 데이터가 수집 된 필드가있어 실제로 노력할 수 있습니다. 두 개 (또는 필요한 경우 더 많은) 필드를 키로 사용하면 정말 도움이됩니다.

UUID를 사용하여 너무 많은 성능을 발휘했습니다. 그들은 속임수처럼 느낍니다 ...

각 삽입에 대해 고유 키를 생성하는 대신 식별 중앙 서버에 키 블록을 할당하는 것은 무엇입니까? 키가 부족하면 새 블록을 수 있습니다. 그런 다음 각을 연결하여 오버 헤드 문제를 해결합니다.

키 서버는 사용 가능한 다음 ID를 유지합니다.

서버 1은 ID 블록을 요청합니다.
키 서버 는 (1,1000)을 반환합니다.
서버 1은 새 블록을 삽입 할 때까지 1000 개의 레코드를 삽입 할 수 있습니다.
서버 2는 블록을 요청합니다.
키 서버 반환 (1001,2000)
기타 ...

서버가 필요한 키의 수를 요청하거나 사용하지 않은 블록을 키에 반환 할 수있는 것보다 정교한 버전을 만들 수 있습니다. 그러면 사용 / 미사용 블록의 맵을 유지해야합니다.

트랜잭션 방식으로 각 서버에 숫자 ID를 할당합니다. 그런 다음 삽입 된 각 레코드는 자체 카운터를 자동으로 증가시킵니다. ServerID와 RecordID의 조합은 고유합니다. ServerID 필드는 인덱싱 될 수 있으며 ServerID (필요한 경우)를 기반으로 향후 선택 성능이 훨씬 더 좋을 수 있습니다.

손으로 만든 UID는 어떻습니까? 수천 개의 서버 각각에 ID를 부여하고 기본 키를 autoincrement, MachineID의 콤보 키로 만듭니다. ???

기본 키는 분산되어 생성되므로 어쨌든 auto_increment를 사용할 수있는 옵션이 없습니다.

원격 컴퓨터의 ID를 숨길 필요가없는 경우 UUID 대신 유형 1 UUID를 사용합니다. 생성하기가 더 쉽고 최소한 데이터베이스의 성능을 손상시키지 않습니다.

varchar (사실상)와 바이너리의 경우도 마찬가지입니다. 정말 중요합니까? 성능이 얼마나 향상됩니까?

짧은 대답은 많은 데이터베이스가 인덱싱 방법과 고차 비트에서 UUID의 의도적 인 엔트로피 간의 충돌로 인해 성능 문제 (특히 높은 INSERT 볼륨)가 있다는 것입니다. 몇 가지 일반적인 해킹이 있습니다.

신경 쓰지 않는 다른 인덱스 유형 (예 : MSSQL에서 클러스터되지 않음)을 선택하십시오.
데이터를 뭉쳐서 엔트로피를 하위 비트로 이동 (예 : MySQL에서 V1 UUID의 바이트 재정렬)
자동 증가 int 기본 키를 사용하여 UUID를 보조 키로 만듭니다.

...하지만 이것들은 모두 해킹이며 아마도 깨지기 쉬운 것입니다.

가장 좋은 대답은 안타깝게도 가장 느린 방법은 다른 유형과 마찬가지로 UUID를 기본 키로 처리 할 수 있도록 공급 업체에 제품 개선을 요구하는 것입니다. 그들은 일반적인 사용 사례가 된 것을 해결하지 못하고 계속 성장할 것임을 보완하기 위해 자신의 반쯤 구운 해킹을 강요해서는 안됩니다.

참고 URL : https://stackoverflow.com/questions/2365132/uuid-performance-in-mysql

'ProgramingTip' 카테고리의 다른 글

csv import pandas 중 행 건너 뛰기 (0)	2020.10.14
카르마 단위 테스트 중 이미지에 대한 404 경고를 수정하는 방법 (0)	2020.10.14
이메일에 이미지를 삽입하는 방법 (0)	2020.10.14
SQL EXISTS 문은 어떻게 작동 작동합니까? (0)	2020.10.14
DB의 특정 스키마에 대한 모든 권한을 PostgreSQL의 그룹 역할에 부여합니다. (0)	2020.10.14

현재글MySQL의 UUID 성능?

bestdevel

MySQL의 UUID 성능?

MySQL의 UUID 성능?

'ProgramingTip' 카테고리의 다른 글

'ProgramingTip'의 다른글

티스토리툴바

MySQL의 UUID 성능?

MySQL의 UUID 성능?

'ProgramingTip' 카테고리의 다른 글

'ProgramingTip'의 다른글

관련글

티스토리툴바