Forskjellen mellom partisjonsnøkkel, komposittnøkkel og klyngenøkkel i Cassandra?

Question

Mer

Spørsmål

Forskjellen mellom partisjonsnøkkel, komposittnøkkel og klyngenøkkel i Cassandra?

Jeg har lest artikler rundt om på nettet for å forstå forskjellene mellom følgende key-typer. Men det virker bare vanskelig for meg å forstå. Eksempler vil definitivt bidra til å gjøre forståelsen bedre.

primary key,
partition key, 
composite key 
clustering key

Rodrigo

Redigerte spørsmål 13. september 2017 в 4:06

Programmering

database

cassandra

cql

Løsning / svar

Big Data Guy

5. mai 2016 в 7:10

Mer

I cassandra gjør forskjellen mellom primærnøkkel, partisjonsnøkkel, komposittnøkkel, klyngenøkkel alltid litt forvirring .... Så jeg skal forklare nedenfor og relatere til hverandre. Vi bruker CQL (Cassandra Query Language) for tilgang til Cassandra-databasen. Merk:- Svaret er i henhold til oppdatert versjon av Cassandra. Primærnøkkel :- I Cassandra er det to forskjellige måter å bruke primærnøkkel på.

CREATE TABLE Cass (
    id int PRIMARY KEY,
    name text 
);

Create Table Cass (
   id int,
   name text,
   PRIMARY KEY(id) 
);

I CQL er rekkefølgen kolonnene defineres i for PRIMARY KEY av betydning. Den første kolonnen i nøkkelen kalles partisjonsnøkkelen og har den egenskapen at alle rader som deler samme partisjonsnøkkel (også på tvers av tabellen) lagres på samme fysiske node. Dessuten utføres innsetting/oppdatering/sletting av rader som deler samme partisjonsnøkkel for en gitt tabell, atomisk og isolert. Merk at det er mulig å ha en sammensatt partisjonsnøkkel, dvs. en partisjonsnøkkel som består av flere kolonner, ved hjelp av et ekstra sett med parenteser for å definere hvilke kolonner som utgjør partisjonsnøkkelen.

**Partisjonering og klyngedannelse PRIMARY KEY-definisjonen består av to deler: partisjonsnøkkelen og grupperingskolonnene. Den første delen mappes til lagringsmotorens radnøkkel, mens den andre brukes til å gruppere kolonner i en rad.

CREATE TABLE device_check (
  device_id   int,
  checked_at  timestamp,
  is_power    boolean,
  is_locked   boolean,
  PRIMARY KEY (device_id, checked_at)
);

Her er device_id partisjonsnøkkelen og checked_at klyngenøkkelen.

Vi kan også ha flere klyngenøkler og partisjonsnøkler, noe som avhenger av erklæringen.

Carlo Bertuccini

Redigert svar 15. mai 2016 в 8:51

14

0

Legg til spørsmål

Kategorier

Alle

Teknologi

Kultur / Fritid

Liv / Kunst

Vitenskap

Profesjonell

Virksomhet

Brukere

Alle

New

Popular

1

Ксения Комарова

Registered 1 måned siden

2

Артур «Апер»

Registered 2 måneder siden

3

Viktor Malyutin

Registered 2 måneder siden

4

Viktor Malyutin

Registered 2 måneder siden

5

Syahputra Zhedenk

Registered 2 måneder siden

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Carlo Bertuccini · Accepted Answer · 2014-07-25T10:12:44+00:00

Det er mye forvirring rundt dette, så jeg skal prøve å gjøre det så enkelt som mulig.

Primærnøkkel er et generelt begrep som angir en eller flere kolonner som brukes til å hente data fra en tabell.

Primærnøkkelen kan være SIMPLE og til og med deklareres inline:

 create table stackoverflow_simple (
      key text PRIMARY KEY,
      data text      
  );

Det betyr at den består av én enkelt kolonne.

Men primærnøkkelen kan også være COMPOSITE (også kalt COMPOUND), generert av flere kolonner.

 create table stackoverflow_composite (
      key_part_one text,
      key_part_two int,
      data text,
      PRIMARY KEY(key_part_one, key_part_two)      
  );

I en situasjon med COMPOSITE primærnøkkel kalles den første delen av nøkkelen PARTITION KEY (i dette eksemplet er key_part_one partisjonsnøkkelen) og den andre delen av nøkkelen er CLUSTERING KEY (i dette eksemplet key_part_two).

Vær oppmerksom på at både partisjons- og klyngenøkkelen kan lages av flere kolonner, slik gjør du:

 create table stackoverflow_multiple (
      k_part_one text,
      k_part_two int,
      k_clust_one text,
      k_clust_two int,
      k_clust_three uuid,
      data text,
      PRIMARY KEY((k_part_one, k_part_two), k_clust_one, k_clust_two, k_clust_three)      
  );

Bak disse navnene ...

Partisjonsnøkkelen** er ansvarlig for datadistribusjon på tvers av nodene.
Klyngenøkkelen er ansvarlig for datasortering innenfor partisjonen.
Primary Key tilsvarer Partition Key i en tabell med én feltnøkkel (dvs. Simple).
Den sammensatte/sammensatte nøkkelen er en hvilken som helst flerkolonnenøkkel.

Mer informasjon om bruk: DATASTAX-DOKUMENTASJON

Små eksempler på bruk og innhold
***SIMPLE*** NØKKEL:

insert into stackoverflow_simple (key, data) VALUES ('han', 'solo');
select * from stackoverflow_simple where key='han';

tabellinnhold

key | data
----+------
han | solo

COMPOSITE/COMPOUND KEY kan hente "wide rows" (dvs. at du kan spørre etter bare partisjonsnøkkelen, selv om du har definert klyngenøkler).

insert into stackoverflow_composite (key_part_one, key_part_two, data) VALUES ('ronaldo', 9, 'football player');
insert into stackoverflow_composite (key_part_one, key_part_two, data) VALUES ('ronaldo', 10, 'ex-football player');
select * from stackoverflow_composite where key_part_one = 'ronaldo';

tabellinnhold

 key_part_one | key_part_two | data
--------------+--------------+--------------------
      ronaldo |            9 |    football player
      ronaldo |           10 | ex-football player

Men du kan spørre med alle nøkler (både partisjon og klynge) ...

select * from stackoverflow_composite 
   where key_part_one = 'ronaldo' and key_part_two  = 10;

utdata fra spørringen

 key_part_one | key_part_two | data
--------------+--------------+--------------------
      ronaldo |           10 | ex-football player

Viktig merknad: partisjonsnøkkelen er den minste spesifikasjonen som trengs for å utføre en spørring ved hjelp av en where-klausul. Hvis du har en sammensatt partisjonsnøkkel, slik som følgende

f.eks: PRIMARY KEY((col1, col2), col10, col4)).

Du kan bare utføre spørringen ved å oppgi minst både col1 og col2, som er de to kolonnene som definerer partisjonsnøkkelen. Den "generelle" regelen for å lage spørring er at du må sende minst alle partisjonsnøkkelkolonnene, så kan du eventuelt legge til hver klyngenøkkel i den rekkefølgen de er angitt.

så de gyldige spørsmålene er ( unntatt sekundære indekser )

col1 og col2
col1 og col2 og col10
col1 og col2 og col10 og col 4

Ugyldig:

col1 og col2 og col4
alt som ikke inneholder både col1 og col2

Håper dette er til hjelp.