Cassandra中的分区键、复合键和集群键的区别？

Question

更多

问题

Cassandra中的分区键、复合键和集群键的区别？

我一直在阅读网上的文章，以了解以下 "钥匙 "类型之间的区别。但对我来说，这似乎很难掌握。例子肯定会有助于更好地理解。

primary key,
partition key, 
composite key 
clustering key

Rodrigo

已编辑的问题 13日九月 2017 в 4:06

编程

database

cassandra

cql

解决方案/答案

Carlo Bertuccini

编辑本段答案22日五月 2018 в 8:01

1098

0

Big Data Guy

5日五月 2016 в 7:10

更多

在cassandra中，主键、分区键、复合键、集群键之间的区别总是让人有些困惑。所以我打算在下面解释一下，并把它们相互联系起来。我们使用CQL（Cassandra查询语言）来访问Cassandra数据库。注：-答案是根据Cassandra的最新版本。主键：- 在Cassandra中，有两种不同的方式来使用主键。

CREATE TABLE Cass (
    id int PRIMARY KEY,
    name text 
);

Create Table Cass (
   id int,
   name text,
   PRIMARY KEY(id) 
);

在CQL中，为PRIMARY KEY定义列的顺序很重要。键的第一列被称为分区键，其属性是所有共享相同分区键的行（事实上甚至是跨表）都存储在同一个物理节点上。另外，对于一个给定的表，在共享相同分区键的行上的插入/更新/删除都是原子地和隔离地进行的。请注意，可以有一个复合分区键，即一个由多个列组成的分区键，使用一组额外的括号来定义哪些列构成分区键。

分区和聚类 PRIMARY KEY定义由两部分组成：分区键和聚类列。第一部分映射到存储引擎的行键，而第二部分是用来对行中的列进行分组。

CREATE TABLE device_check (
  device_id   int,
  checked_at  timestamp,
  is_power    boolean,
  is_locked   boolean,
  PRIMARY KEY (device_id, checked_at)
);

这里device_id是分区键，checked_at是集群键。

我们也可以有多个集群密钥和分区密钥，这取决于声明。

Carlo Bertuccini

编辑本段答案15日五月 2016 в 8:51

14

0

添加问题

岚，巗峃，。

全部

技术

文化/娱乐

生活/艺术

科学

专业的

业务

用户

全部

新的

热门

1

2

3

4

5

您有问题吗？将问题添加到网站上并立即得到答复

zh.kzen.dev

Carlo Bertuccini · Accepted Answer · 2014-07-25T10:12:44+00:00

这方面有很多困惑，我将尽量使之简单化。

主键是一个一般的概念，表示一个或多个用于从表中检索数据的列。

主键可以是简单的，甚至可以是内联声明。

 create table stackoverflow_simple (
      key text PRIMARY KEY,
      data text      
  );

这意味着它是由一个单列构成的。

但主键也可以是COMPOSITE（又称COMPOUND），由更多的列生成。

 create table stackoverflow_composite (
      key_part_one text,
      key_part_two int,
      data text,
      PRIMARY KEY(key_part_one, key_part_two)      
  );

在COMPOSITE主键的情况下，键的"第一部分"被称为PARTITION KEY（在本例中key_part_one是分区键），键的第二部分是CLUSTERING KEY（本例中key_part_two）。

请注意，分区键和聚类键都可以由更多的列组成，这里有一个方法。

 create table stackoverflow_multiple (
      k_part_one text,
      k_part_two int,
      k_clust_one text,
      k_clust_two int,
      k_clust_three uuid,
      data text,
      PRIMARY KEY((k_part_one, k_part_two), k_clust_one, k_clust_two, k_clust_three)      
  );

在这些名字背后...

分区键负责在你的节点上的数据分配。
聚类键负责分区内的数据排序。
主键等同于单字段键表（即简单）中的分区键**。
复合/复合键只是任何多列键

进一步的使用信息：DATASTAX DOCUMENTATION</a&gt。

小的用法和内容示例

insert into stackoverflow_simple (key, data) VALUES ('han', 'solo');
select * from stackoverflow_simple where key='han';