BERTopic 在可视化文档中添加额外的标签

jjjwad0x  于 5个月前  发布在  其他
关注(0)|答案(4)|浏览(70)

我正在对一个语料库进行一些EDA(探索性数据分析),想知道是否可以为每个文档添加另一层标签。当你调用visualize_documents时,点会根据各自的主题绘制并着色,我想知道是否有办法根据某个因素改变点状物的形状,比如说,我有一个作者列表。我主要想使用BERTopic绘图,因为我很懒😅,但如果现在不可能的话,我可以自己创建图表。

bmvo0sr5

bmvo0sr51#

你好,Eric,
我也有同样的问题,就是懒惰 ;)
无论如何,如果视图不是你想要的,就获取数据并使用plotly.express。这对懒人来说要快得多。
Andreas

lnlaulya

lnlaulya2#

遗憾的是,目前尚未实现该功能,并且不在路线图上。尽管如此,您确实可以自己实现它,这应该相对简单,因为您只需要更改点的形状,同时保持其他所有内容不变。

qhhrdooz

qhhrdooz3#

同意;一个解决NLP问题,另一个解决图形问题。
我选择具有明确主题(由概率矩阵确定)的句子,确定句子嵌入,使用umap进行5DMap,然后就完成了。(5D是因为3DMap对投影的限制太多)。
稍后我会添加代码,并附上一个示例(我需要做一些图像/代码黑客工作)。

uoifb46i

uoifb46i4#

按照承诺,额外的代码将为您提供漂亮的图表来帮助分析BERTopic结果。至少市场营销部门喜欢这些图片。请随意更改代码/重新编码,只要您觉得合适即可。祝您好运,Andreas https://drive.google.com/drive/folders/1pnHIJGfq2bY4li8ilQS49kuG_p3EKwEA?usp=sharing

PS:我的个人GitHub没有得到很好的维护,所以这是分享(在周末之前)最快的方式。如果您愿意,我可以为它设置一个GitHub,但这可能需要一段时间...

2023年10月19日星期四下午3点18分,Maarten Grootendorst < ***@***.***>写道:不幸的是,这确实目前还没有实现,也没有在路线图上。尽管如此,您确实可以自己实现它,这应该相对简单,因为您只需要改变点的形式,同时保持其他所有内容不变。—直接回复此电子邮件,查看GitHub上的评论<#1579>或取消订阅< https://github.com/notifications/unsubscribe-auth/AFO2PW3CFQGUU26RIFOK7JDYAELCPAVCNFSM6AAAAAA6CUKERGVHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMYTONZQHA2DIMRZGA >。您收到此邮件是因为您发表了评论。消息ID:***@***.***>

相关问题