Paddle docstrings太多单词拼写错误

nwo49xxi  于 2022-10-20  发布在  其他
关注(0)|答案(6)|浏览(191)

编写小代码检查paddle docstring太多拼写错误,至少超过200个,估计大佬比较忙。

7bsow1i6

7bsow1i61#

感谢您的指出,请问您的代码能贡献出来么?

a2mppw5e

a2mppw5e2#

您好,感谢您的反馈,我们最近会集中解决,请问您的代码能贡献吗?

bjp0bcyl

bjp0bcyl3#

半手工python docstrings单词拼写工具——吴登刚, wudenggang@outlook.com
1、获取某个目录下所有以.py结尾的文件,通过ast解析语法树,获取docstrings。保存在records里(格式:文件名,docstrings开始行号,结尾行号,docstrings),保存为records.pkl。并将docstrings里的标点去除拆分成字典保存,保存为word_freq.pkl。
2、针对字典每个词,确认是否拼写正常(有大量算法可用)。我采用最简单的,将字典里的单词复制到word文档中自动检查,获取可能拼写错误的单词,保存在(单词.txt)里。
3、反查相关单词在docstrings里的位置,这部分代码不在此电脑上,后续补上(代码也比较简单),保存到rst.pkl中(格式:单词,在docstrings里的位置,docstrings开始行号,结尾行号,docstrings)
首先阅读文件.txt
paddle-吴登刚.docx

单词.txt

python代码在getdoc.txt里面
getdoc.txt

tgabmvqs

tgabmvqs4#

感谢您的反馈,我们近期统一修改!

l3zydbqr

l3zydbqr5#

我们使用了您的脚本,在执行后的word文件里发现了一些并不属于Paddle代码里的单词,像是多个单词组合起来的。
例如:distributedoptimizer、mkldnnposttrainingquantstrategy、distributedoptimizer
看起来像是在拆分单词时候发生了问题。

pzfprimi

pzfprimi6#

大佬,之前拆分单词比较粗糙。代码主要功能是获取所有的docstrings,单词差错功能其实还需要更好的方法。

相关问题