Python - 拼写检查
拼写检查是任何文本处理或分析的基本要求。 python 包 pyspellchecker 为我们提供了这个功能来查找可能拼写错误的单词并建议可能的更正。
首先,需要在我们的 python 环境中使用以下命令安装所需的包。
pip install pyspellchecker
现在我们在下面看到这个包是如何用来指出拼写错误的单词以及对可能的正确单词提出一些建议的。
from spellchecker import SpellChecker spell = SpellChecker() # find those words that may be misspelled misspelled = spell.unknown(['let', 'us', 'wlak','on','the','groun']) for word in misspelled: # Get the one `most likely` answer print(spell.correction(word)) # Get a list of `likely` options print(spell.candidates(word))
当我们运行上面的程序时,得到以下输出 −
group {'group', 'ground', 'groan', 'grout', 'grown', 'groin'} walk {'flak', 'weak', 'walk'}
区分大小写
如果我们使用 Let 代替 let 那么这将变成区分大小写的单词与字典中最匹配的单词的比较,结果现在看起来不同了。
from spellchecker import SpellChecker spell = SpellChecker() # find those words that may be misspelled misspelled = spell.unknown(['Let', 'us', 'wlak','on','the','groun']) for word in misspelled: # Get the one `most likely` answer print(spell.correction(word)) # Get a list of `likely` options print(spell.candidates(word))
当我们运行上面的程序时,得到以下输出 −
group {'groin', 'ground', 'groan', 'group', 'grown', 'grout'} walk {'walk', 'flak', 'weak'} get {'aet', 'ret', 'get', 'cet', 'bet', 'vet', 'pet', 'wet', 'let', 'yet', 'det', 'het', 'set', 'et', 'jet', 'tet', 'met', 'fet', 'net'}