这个问题已经在这里问Python : How to remove all emojis没有解决方案,我已经作为解决方案的一步。但需要帮助完成它。
我去了,并得到了所有的表情符号十六进制代码点从emoji网站:https://www.unicode.org/emoji/charts/emoji-ordering.txt
然后我在文件中读到这样的内容:
file = open('emoji-ordering.txt')
temp = file.readline()
final_list = []
while temp != '':
#print(temp)
if not temp[0] == '#' :
utf_8_values = ((temp.split(';')[0]).rstrip()).split(' ')
values = ["u\\"+(word[0]+((8 - len(word[2:]))*'0' + word[2:]).rstrip()) for word in utf_8_values]
#print(values[0])
final_list = final_list + values
temp = file.readline()
print(final_list)
我希望这会给予我unicode文字。它没有,我的目标是得到unicode文字,这样我就可以使用部分的解决方案,从最后一个问题,并能够排除所有的表情符号。任何想法,我们需要得到一个解决方案?
4条答案
按热度按时间7y4bm7vi1#
或
这对我有用!
版本emoji == 1.7.0是包含UNICODE_EMOJI的最新版本。
你也可以尝试用EMOJI_DATA来代替UNICODE_EMOJI。如果你解释你是如何使用UNICODE_EMOJI的或者展示你的代码,我可以给出更具体的帮助。
或者您可以尝试以上两种解决方案之一:
kx7yvsdv2#
下面是一个Python脚本,它使用了emoji库的
get_emoji_regexp()
。它从一个文件中读取文本,并将无表情符号的文本写入另一个文件。
u3r8eeie3#
安装表情符号
然后简单地运行
ar7v8xwq4#
在表情包的最新版本(v2.2.0)中,可以简单地使用
replace_emoji
方法。但是,必须通过
replace
属性指定表情符号应该替换为 * 什么 *。否则,例如,参见@Shaked Lokits答案,表情符号将被替换为其字符串等效项: