elasticsearch 桑巴舞服务器上的文件搜索-有哪些选项?

mhd8tkvw  于 2022-11-28  发布在  ElasticSearch
关注(0)|答案(1)|浏览(195)

我们的办公室有一个桑巴舞文件服务器来存放我们所有的办公文件。许多用户访问这个服务器,我们把所有相关的公司文件都存储在上面。
令人恼火的是,我们没有一个好的搜索系统。当然,我可以通过文件名进行搜索,但如果我要查找所有提到Yoyodyne的文件(比如2021年),这就没有什么帮助了,除非文件名中有这个词。我希望能够进行类似“Yoyodyne年份:2021”的搜索。那就太棒了。
我已经查看了相关的选项。Windows用户应该使用一个名为Windows Search Protocol(MS-WSP)的协议来实现这一点。在www.example.com上有一个samba.org关于这一点的旧线程,但没有工作代码的更新。
与此同时,有各种各样的开源搜索引擎,比如Elastic Search、Apache Lucene和Slr,它们似乎已经能够解析各种类型的文档(PDF、ODF等),为它们建立索引,并回答有关它们的查询。但没有明确的方法将其与桑巴舞挂钩。
对于Linux桌面客户端,我知道我可以运行Recoll、Baloo(仅KDE)和Beagle(不再活动)。但这将需要在每一个桌面上运行索引,而实际上它应该是服务器上的一个索引。希望Windows和Linux用户都得到类似的结果是合理的。(我意识到用户权限也是关联的,因此某些用户将无法获得其他用户可以获得的某些搜索结果。)
对此有什么解决方案或指导,或者这只是其中一个“这就是它,直到它改变”的情况?

uurv41yg

uurv41yg1#

我设置了Xapian Omega,这样你就可以通过一个内联网页面进行搜索,它会创建特殊的链接,触发一个小的PowerShell脚本,打开文档(它也可以打开包含的文件夹并突出显示结果)。
与Windows资源管理器集成将是很好的,但这超出了我的技能。桑巴舞中的WSP东西看起来很有趣,但似乎Windows搜索和其他一切之间的阻抗不匹配很难弥合。
我写了一篇关于它的维基文章:https://trac.xapian.org/wiki/XapianOmegaSmallBiz

相关问题