如何计算markdown文件中引号中的单词数(使用regex或其他方法)?

fnatzsnv  于 2022-12-27  发布在  其他
关注(0)|答案(1)|浏览(161)

我正在用markdown写一篇论文,我需要确保我没有引用太多(有些地方说文章不应该包括超过10%的直接引用),所以我想找一种方法来计算引用的单词。
这怎么可能呢?
我试过用正则表达式,例如\“(.*?)\”,但这只会让我知道在某些文件中有引号中的单词,我需要找出单词的数量。
我也试过([“”])(?:(?=(\\?))\2.)*?\1,同样的事情发生了。我也试过在终端中使用grep和这些regex搜索中的任何一个(我在Linux Mint上),但都没有任何输出。
任何建议都很感激。

vlju58qv

vlju58qv1#

下载并安装Visual Studio Code(如果您还没有)。

  • 插入您的全文
  • ctrl + F并单击.*(使用正则表达式)
  • 插入正则表达式“(.*?)”。VSCode将查找所有用引号括起来的短语/单词
  • ctrl + shift + L选择所有匹配项
  • 通过ctrl + C复制它们
  • 打开新文件
  • ctrl + V

这会给予你一个单独的文件,里面的单词只在引号里。你可以计算里面的单词数和原始文件里的单词数,然后得到结果。
对于单词计数(有点近似,但应该适合您的需要),您可以搜索regex (\s|\n|\t)+并在搜索对话框的右侧查看找到的条目数,或者您可以使用https://marketplace.visualstudio.com/items?itemName=ms-vscode.wordcount等插件来获得文件中的准确单词计数。

相关问题