PostgreSQL: 텍스트와 바차르의 차이점(문자 가변)

CREATE FUNCTION string_generator(int DEFAULT 20,int DEFAULT 10) RETURNS text AS $f$
  SELECT array_to_string( array_agg(
    substring(md5(random()::text),1,$1)||chr( 9824 + (random()*10)::int )
  ), ' ' ) as s
  FROM generate_series(1, $2) i(x);
$f$ LANGUAGE SQL IMMUTABLE;

예습이요 특정 테스트 (예)

DROP TABLE IF EXISTS test;
-- CREATE TABLE test ( f varchar(500));
-- CREATE TABLE test ( f text); 
CREATE TABLE test ( f text  CHECK(char_length(f)<=500) );

수행되는지 기본적인 테스트:

INSERT INTO test  
   SELECT string_generator(20+(random()*(i%11))::int)
   FROM generate_series(1, 99000) t(i);

테스트 및 기타

CREATE INDEX q on test (f);

SELECT count(*) FROM (
  SELECT substring(f,1,1) || f FROM test WHERE f<'a0' ORDER BY 1 LIMIT 80000
) t;

. 이해 및 활용 '분석'.

재업데이트 2018년 (pg10) *

2018년 & # 39 의 결과와 강화하십시오 권장안을 리틀이에요 편집할지 추가할 수 있습니다.

결과 (2016-2018년)

이후 내 결과, 평균, 대부분의 시스템 및 많은 테스트: , 모든 same*&l br/&gt. (통계적으로 덜 탐 표준 편차).

권장안을

텍스트, 데이터 형식, &lt br/&gt 사용하여 '구형' varchar (x) ',' 피할 수 있는 경우가 있으므로 사용하지 않는 것이 varchar (x) '' 절 '작성 기능을 표준, 예를 들어' 'varchar (y)'.
익스플레스 제한값 (varchar 같은 '' 성능!) '확인', '테이블 만들기' 를 사용하여 절에 &lt br/&gt. (예: '검사 (char_length &lt, (x) = 10)'. 삽입 / 업데이트, br&gt &lt, 미미한 성능 저하를 제어할 수 있는 범위 및 구조, br/&gt &lt 문자열이어야 수도 있습니다. (예: '검사 (char_length (x) &gt, 5 와 char_length (x), # 39, & # 39 와 같은 Hello%& &lt 및 x = 20;)'

Peter Krauss

편집된 답변14일 6월 2018 в 10:58

49

0

bpd

11일 1월 2018 в 3:56

텍스트 및 varchar 서로 다른 암시적입니다 유형 변환. # 39 는 처리할 수 있는 가장 큰 영향을 미치는 것을, ve I& 후행 독창적이다. 예를 들어.

select ' '::char = ' '::varchar, ' '::char = ' '::text, ' '::varchar = ' '::text

'진정한' true, true, true, true, false 되돌려줍니다 아닌 '예상대로'.

15

0

ofir_aghai

14일 3월 2018 в 9:47

다양한 (n) ',' varchar (n) - '문자' (모두 동일). 값 n 자 로 잘립니다 없이 오류가 있다. &lt br&gt &lt br>;;; '문자 (n)', '챨 (n)' - (모두 동일). 패드 비워집니다 길이 끝날 때까지 함께 고정 길이 될 것입니다. &lt br&gt &lt br>;;; 무제한 'text' 이다. &lt br&gt &lt br>;;;

Example:*&lt br>;

Table test:
   a character(7)
   b varchar(7)

insert "ok    " to a
insert "ok    " to b

우리 결과:

a        | (a)char_length | b     | (b)char_length
----------+----------------+-------+----------------
"ok     "| 7              | "ok"  | 2

0

질문 추가

카테고리

모두

기술

문화/레크리에이션

생활/예술

과학

직업

비즈니스

사용자

すべて

새로운

인기

1

2

3

4

5

질문이 있으신가요? 사이트에 추가하고 즉시 답변을 받으세요.

ko.kzen.dev

Frank Heikens · Accepted Answer · 2011-01-31T08:55:19+00:00

내부적으로는 모두 varlena(가변 길이 배열)이므로 차이가 없습니다.

Depesz의 이 기사를 확인하세요: http://www.depesz.com/index.php/2010/03/02/charx-vs-varcharx-vs-varchar-vs-text/

몇 가지 주요 내용입니다:

요약하자면:

char(n) - n보다 짧은 값을 처리할 때 너무 많은 공간을 차지하며(n으로 패딩), 후행 추가 때문에 미묘한 오류가 발생할 수 있습니다. 공백을 추가하기 때문에 미묘한 오류가 발생할 수 있으며, 제한을 변경하는 것도 문제가 됩니다.

varchar(n) - 라이브 환경에서 제한을 변경하는 것은 문제가 있습니다(테이블을 변경하는 동안 독점 잠금이 필요함).

varchar - 텍스트와 마찬가지로 텍스트 - 문제가 없기 때문에 (n) 데이터 유형보다, varchar - 고유 한 이름이 있기 때문에 승자입니다.

이 문서에서는 4가지 데이터 유형 모두에 대한 삽입 및 선택의 성능이 유사하다는 것을 보여주기 위해 자세한 테스트를 수행합니다. 또한 필요한 경우 길이를 제한하는 다른 방법도 자세히 살펴봅니다. 함수 기반 제약 조건 또는 도메인은 길이 제약 조건을 즉시 증가시킬 수 있는 이점을 제공하며, 문자열 길이 제약 조건을 줄이는 경우는 드물다는 점을 근거로 Depesz는 일반적으로 이 중 하나가 길이 제한에 가장 적합한 선택이라고 결론을 내립니다.