为什么Eclipse > File Search
在DOCX和PDF文件中找不到给定的字符串?
障碍物
当在我的工作区中的所有文件中搜索特定的字符串时,Eclipse没有找到包含该字符串的DOCX和PDF文件。
问题
Eclipse > File Search
是否能够在DOCX和PDF文件中搜索特定字符串?如果可以,前提条件是什么?
现状
- 在Eclipse工作区中,我有不同的文件类型,例如.DOCX、.PDF(带文本)、.XLS、.XLS和.XLM以及其他更奇特的文件类型。
- 通常,我的目标是查找包含特定字符串/标识符的所有文件,例如
abc-dd-123.variable name
- 为了实现这个目标,我使用
Eclipse > File Search
(STRG + H),并进行以下设置: - 包含文字:“abc-dd-123.变量名”
- 文件名模式:“*”
- 区分大小写:没有
- 一般表示式:没有
- 全字匹配:否
- 搜索〉派生资源:没有
- 搜索〉二进制文件:是的
- 范围:工作区
结果
除了在DOCX和PDF(带文本)中,搜索可以在许多文件类型中找到该字符串。例如,文件搜索可以在XLSX、XML、Java文件和各种其他外来文件类型中找到该字符串。我知道工作区中的DOCX和PDF文件包含该特定字符串。我正是使用该字符串进行搜索。我期望Eclipse将这些文件显示为搜索结果,但它没有。
"我所做的一切"
我搜索了多个论坛,似乎是唯一一个面临这个问题的。我看到的唯一其他线程有一个不同的问题设置-用户有Excel文件嵌入在他的DOCX文件,请参阅Eclipse search file not working for .docx files。这是不是我的DOCX文件的情况。当我使用Eclipse > Quick Search
函数,我发现字符串在PDF文件。但不是在DOCX文件。注意:在Quick Search
首选项中,我从Ignored Extensions
-list中删除了我想查找的所有文件类型,包括DOCX。我使用了Notepad++的Find in Files
函数,得到了与Eclipse > Quick Search
函数相同的结果:我在除DOCX之外的所有文件类型中都找到了该字符串。
1条答案
按热度按时间wpx232ag1#
Eclipse > File Search
,或者任何基于字符串的搜索,都是寻找给定的字符串以不间断的字符序列出现。PDF和DOCX都没有这样的保证。例如,在DOCX中,通常将一个字符串分成两个独立的运行DOCX应用程序中的搜索知道如何处理这种分离,磁盘上的DOCX文件已根据开放打包约定压缩了上述XML内容。基于文本的字符串搜索无法正确匹配。对于PDF文件,问题是类似的,但不同的结构负责分离。
由于这两种文件格式的目标都是保留视觉外观,而不是字符级别的内容排序,因此这两种格式都不能保证包含在搜索字符串中找到的连续字符。