我有以下 Dataframe :
df = pd.DataFrame({'id':[1,2,3],'text':['a foox juumped ovr the gate','teh car wsa bllue','why so srious']})
我想使用pyspellchecker库生成一个新的列,并修复拼写错误。
我尝试了以下方法,但没有纠正任何拼写错误:
import pandas as pd
from spellchecker import SpellChecker
spell = SpellChecker()
def correct_spelling(word):
corrected_word = spell.correction(word)
if corrected_word is not None:
return corrected_word
else:
return word
df['corrected_text'] = df['text'].apply(correct_spelling)
以下是预期输出的 Dataframe '
pd.DataFrame({'id':[1,2,3],'text':['a foox juumped ovr the gate','teh car wsa bllue','why so srious'],
'corrected_text':['a fox jumped over the gate','the car was blue','why so serious']})
`
1条答案
按热度按时间webghufk1#
我对这个包一无所知(如何修正精度),但是你可以把每一行的字符串拆分成一个列表,然后遍历列表的列表。
输出(如您所见,您需要提高精度):