我想在Milvus中使用gptcache。我参考了示例创建了以下代码:
cache.init(
embedding_func=onnx.to_embeddings,
data_manager=data_manager,
similarity_evaluation=SearchDistanceEvaluation(),
config=Config(similarity_threshold=0.9,
auto_flush=5
)
)
我添加了num_entities来检查大小,发现它管理的实体数量超过了缓存大小。你能告诉我为什么会这样吗?另外,有没有办法让它根据缓存大小工作?
1条答案
按热度按时间eqzww0vc1#
这主要是因为Milvus的num entity只能获得近似的数据行数,不够准确。如果需要确切的行数,需要调用查询接口。你可以参考Milvus文档:https://milvus.io/docs/get-and-scalar-query.md#Use-Advanced-Operators
对于驱逐,也许对另一个问题的解释可以加深对此方面的理解