社交媒体俚语标识符

kupeojn6  于 2021-07-09  发布在  Java
关注(0)|答案(2)|浏览(380)

关闭。这个问题需要更加突出重点。它目前不接受答案。
**想改进这个问题吗?**通过编辑这篇文章更新这个问题,使它只关注一个问题。

6年前关门了。
改进这个问题
我正在做一个关于社交媒体俚语识别器的项目。我必须从不同的评论中识别缩写词。但问题是,假设在一个特定的评论中它写的是gm(意思是早上好),同时在其他一些评论中它又写了gm(意思是总经理)。
所以我需要区分这两种情况,尽管这两种情况下显示相同(即gm)。
我对这个问题真的很困惑,对此我一无所知。
有谁能帮我克服这一点吗?

pgky5nke

pgky5nke1#

这听起来是一个非常复杂的问题。据我所知,你需要一本包含这些缩写词的大字典,还有 lexical field (又称语义场)它们的用法。
为了检测 lexical field 你也可以把演讲者分为“工作相关的”或“大学同事”或“酒友”,也许对这些组有一个标准,这样其他用户的数据也可以使用。为了理解这一点,也许你可以理解俚语的一种同义词,即暗语。
例如,如果有人说“总经理的反馈实际上相当好”,你不仅明白这是一个常用名词,而且还明白反馈来自“业务” lexical field .
一个实际的时间框架和数据,你的工作将是有用的,我会编辑这个答案相应。

368yc8dk

368yc8dk2#

这是个难题。你需要一些语义算法来区分。
你不能仅仅从语法或者仅仅从文本表达中推断出意思。
谷歌“消歧自然语言处理”。你会看到很多资源。
这只是给你一个提示。如前所述,这个问题是广泛而复杂的。

相关问题