在Pyspark中记录链接

5n0oy7gb  于 2023-03-01  发布在  Spark
关注(0)|答案(1)|浏览(78)

如何在Pyspark中实现记录链接功能???我想在数据集1名称和数据集2名称之间进行相似性检查。
请帮助建议我,如果任何图书馆可用于pyspark。
我尝试使用pyhton的recordlinkage库,但它只能使用panda的dataframe。

相关问题