编写小代码检查paddle docstring太多拼写错误,至少超过200个,估计大佬比较忙。
7bsow1i61#
感谢您的指出,请问您的代码能贡献出来么?
a2mppw5e2#
您好,感谢您的反馈,我们最近会集中解决,请问您的代码能贡献吗?
bjp0bcyl3#
半手工python docstrings单词拼写工具——吴登刚, wudenggang@outlook.com1、获取某个目录下所有以.py结尾的文件,通过ast解析语法树,获取docstrings。保存在records里(格式:文件名,docstrings开始行号,结尾行号,docstrings),保存为records.pkl。并将docstrings里的标点去除拆分成字典保存,保存为word_freq.pkl。2、针对字典每个词,确认是否拼写正常(有大量算法可用)。我采用最简单的,将字典里的单词复制到word文档中自动检查,获取可能拼写错误的单词,保存在(单词.txt)里。3、反查相关单词在docstrings里的位置,这部分代码不在此电脑上,后续补上(代码也比较简单),保存到rst.pkl中(格式:单词,在docstrings里的位置,docstrings开始行号,结尾行号,docstrings)首先阅读文件.txtpaddle-吴登刚.docx
单词.txt
python代码在getdoc.txt里面getdoc.txt
tgabmvqs4#
感谢您的反馈,我们近期统一修改!
l3zydbqr5#
我们使用了您的脚本,在执行后的word文件里发现了一些并不属于Paddle代码里的单词,像是多个单词组合起来的。例如:distributedoptimizer、mkldnnposttrainingquantstrategy、distributedoptimizer看起来像是在拆分单词时候发生了问题。
pzfprimi6#
大佬,之前拆分单词比较粗糙。代码主要功能是获取所有的docstrings,单词差错功能其实还需要更好的方法。
6条答案
按热度按时间7bsow1i61#
感谢您的指出,请问您的代码能贡献出来么?
a2mppw5e2#
您好,感谢您的反馈,我们最近会集中解决,请问您的代码能贡献吗?
bjp0bcyl3#
半手工python docstrings单词拼写工具——吴登刚, wudenggang@outlook.com
1、获取某个目录下所有以.py结尾的文件,通过ast解析语法树,获取docstrings。保存在records里(格式:文件名,docstrings开始行号,结尾行号,docstrings),保存为records.pkl。并将docstrings里的标点去除拆分成字典保存,保存为word_freq.pkl。
2、针对字典每个词,确认是否拼写正常(有大量算法可用)。我采用最简单的,将字典里的单词复制到word文档中自动检查,获取可能拼写错误的单词,保存在(单词.txt)里。
3、反查相关单词在docstrings里的位置,这部分代码不在此电脑上,后续补上(代码也比较简单),保存到rst.pkl中(格式:单词,在docstrings里的位置,docstrings开始行号,结尾行号,docstrings)
首先阅读文件.txt
paddle-吴登刚.docx
单词.txt
python代码在getdoc.txt里面
getdoc.txt
tgabmvqs4#
感谢您的反馈,我们近期统一修改!
l3zydbqr5#
我们使用了您的脚本,在执行后的word文件里发现了一些并不属于Paddle代码里的单词,像是多个单词组合起来的。
例如:distributedoptimizer、mkldnnposttrainingquantstrategy、distributedoptimizer
看起来像是在拆分单词时候发生了问题。
pzfprimi6#
大佬,之前拆分单词比较粗糙。代码主要功能是获取所有的docstrings,单词差错功能其实还需要更好的方法。