在阅读了有关墓碑和收藏在Cassandra我明白,正确的方法是使用加法(+)和加法减法(-)运算符。
我读过的所有地方都给我这样的印象:使用这个操作符而不是覆盖集合不应该创建任何墓碑。
在做了一些测试并阅读了sstables之后,似乎在做加法时,没有创建任何墓碑
但是在做减法运算时,我注意到sstable得到了一条删除信息记录。这个记录不同于删除整个单元格(而不仅仅是一个集合中的一个条目)的记录,所以我不确定它是否是墓碑?
6545d91# sstabledump mc-23-big-Data.dbata/cs/customers-49e96fc0011f11e985316d2c86
WARN 11:17:05,402 Only 52.363GiB free across all data volumes. Consider adding more capacity to your cluster or removing obsolete snapshots
[
{
"partition" : {
"key" : [ "da8b9f4e-b063-4254-aee6-acba55b35d83" ],
"position" : 0
},
"rows" : [
{
"type" : "row",
"position" : 143,
"clustering" : [ "da8b9f4e-b063-4254-aee6-acba55b35d83", "da8b9f4e-b063-4254-aee6-acba55b35d83" ],
"liveness_info" : { "tstamp" : "2018-12-16T10:47:19.434990Z" },
"cells" : [
{ "name" : "payments", "deletion_info" : { "marked_deleted" : "2018-12-16T11:00:27.524999Z", "local_delete_time" : "2018-12-16T11:00:27Z" } },
{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d81" ], "value" : "", "tstamp" : "2018-12-16T11:15:17.989Z" },
{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ], "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
"tstamp" : "2018-12-16T11:16:34.929999Z"
}
]
}
]
}
底线,我的问题是牢房里的记录是不是墓碑?如果是,有可能避免吗?
{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ], "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
"tstamp" : "2018-12-16T11:16:34.929999Z"
}
1条答案
按热度按时间b4qexyjb1#
关于:
减法确实会创建一个墓碑,向存储引擎指示集合中该元素(已删除)的状态。因此,删除优先于该路径上该特定元素的任何先前添加(较旧的时间戳数据)。
此外,当您将整个集合作为cql语句的一部分提供时,这也会创建一个墓碑,这很可能就是这个墓碑所代表的:
因为cassandra不采用先读后写,所以它只是为该列中的所有元素创建一个墓碑,以使所有可能的现有写入无效。
如果您想完全避免使用墓碑,可以考虑使用冻结的集合。对于冻结的集合,每次都需要提供完整的集合值,并且集合的所有元素都存储在单个单元格中。因此,更新集合时不需要创建墓碑。
使用冻结集合的明显缺点是,如果没有第一个元素,就无法从集合中追加/删除元素
SELECT
在您的INSERT
/UPDATE
. 这样做的一个缺点是,您可能需要担心管理并发写操作。或者,如果要避免使用非冻结集合创建墓碑,请不要
INSERT
完整的收藏(即。INSERT INTO ks.tbl (k, c) VALUES (0, [1,2,3])
. 而是使用附加语,即UPDATE ks.tbl SET c = c + [1,2,3] WHERE k = 0
.