虚心肖白
(xqw)
1
希望搜索插件或功能在保持较快搜索的基础上又能检索出准确的中文内容,不占用太多内存,不影响obsidian软件的流畅使用,能给出相关搜索内容列表,点击选择后能高亮显示
环境背景
win11系统24h2版本,obsidian系统版本为V1.8.1,Omnisearch版本为1.25.2
遇到的问题
1、Omnisearch和系统自带搜索在中文搜索时哪个更好
2、还有没有更好的中文检索方案,不后台占用太多内存的
3、安装中文分词插件是否能对Omnisearch的中文检索功能有较大的提升
已尝试的解决方案
全局搜索使用obsidian自带搜索(可以高亮查找内容),笔记文件内用Omnisearch(可以列出相关搜索内容列表)
obsidian自带搜索:点击后可以定位到搜索内容,并且可以高亮标黄,更加显眼
Omnisearch:默认无高亮标黄
笔记文件内搜集
obsidian自带搜索:一个个查找
Omnisearch:可以将相关内容给出列表,从中选择更合适的点击跳转。
相关话题链接
很好奇各位大佬的中文搜索方案? - 每日闲聊 - Obsidian 中文论坛
我做了个搜索框,就是整这个中文的,用的就是obsidian的 接口,搜索,可以搜索内容;另外常规的筛选,也全部都有,你看看是否符合需求 ?
1 个赞
这论坛咱发附件的哈,我得研究一下哈;稍后发给您代码
1 个赞
熊猫别熬夜
(噗~)
5
1 个赞
熊猫别熬夜
(噗~)
9
虚心肖白
(xqw)
10
感谢大佬,不过使用之后长时间显示空白,过了十几分钟后程序自动闪退。不知道是不是我从来不怎么添加笔记属性标签,还是笔记内容太多了(目前大概180多万字)
虚心肖白
(xqw)
11
谢谢推荐,有一群热心大佬在obsidian,才让这个软件变得越来越好。
我没有这么多笔记 哈,我就2000条测试的哈,没办法复现你的问题,非常抱歉; ,你看看我的那个ReadMe,文件,你可能要进行一下设定;就是那个表头,可以最开始只用系统的; 比如link , tag,ctime, 不要写自定义的,比如你写了个"分类 ",可能你的系统压根儿都没有这个key;,可能扫描 起来就慢了;另外就是我觉得你得思考一下自己的真实需求哈,如何把这百万字处理好,是打单个标签?,还是分级标签?分级不分级?… ; 对于纯文本,你如果只是想查找东西,想不卡,用EmEditor,最快;
1 个赞
虚心肖白
(xqw)
13
也辛苦您了,对我很有启发,是我这边程序编程及dataview基础较弱。之前没用过dataview,现在也算是用过dataview的人了
我的笔记内容基础都是纯文字,采用无序列表框架(类似下面图片),也考虑建立标签系统辅助,但是建立和整理标签也都要时间。
就想着通过搭建文件目录框架大致将不同分类内容存放在在不同地方,万一找不到的时候通过好的检索功能来进行检索。就像我的文件夹和文件也进行了分类,但很多时候直接用Everything检索全部文件和文件夹。
再次感谢您的慷慨无私分享
Probe
(Probe)
14
楼上方案都挺好的, 补充几个楼主提到的其他问题
对于上百万甚至上千万字数的中文笔记
1、Omnisearch和系统自带搜索在中文搜索时哪个更好
我自己实测是: 区别不大, 或者说, 在千万字数笔记库这个量级上, Omnisearch 没能体现出比原生搜索更有性能优势
Omnisearch 好处在于: 能索引 pdf, 图片, docx 以及任意用户指定后缀纯文本; 容忍误拼写; 带个 http server; 能按照各级标题权重排序搜索结果; 等等… 这些是挺好的, 但一般场景也用不到
3、安装中文分词插件是否能对Omnisearch的中文检索功能有较大的提升
有很大提升, 比如 (在 Ob 自带搜索里, 和不分词的 Omnisearch 里) 搜 "安装分词插件是否对Omnisearch"
是搜不到上一行引用这句话的, 因为搜索词里漏字了
解决办法要么手动分词, 要么 Omnisearch + 中文分词插件
这是因为 Omnisearch 是基于 BM25 的, 该算法核心就是看词频, 而中文不以空格划分单词, 于是得额外有个办法让它知道啥算一个单词
2、还有没有更好的中文检索方案,不后台占用太多内存的
这个目前不清楚, 还需要研究
1 个赞
虚心肖白
(xqw)
15
感谢大佬再次解惑,这下清晰知道了系统和om的差异。就个人而言,我只想保持高度的文字编辑流畅性,因此会倾向减少使用插件数量。但如果一个插件能带来较好效果,我也回去尝试使用
Probe
(Probe)
16
楼主别客气~ 我也是跟大家一块学习, 每次看大家讨论问题都是赶紧抄回自己笔记库里…
保持高度的文字编辑流畅性,因此会倾向减少使用插件数量
同意, 就具体这个场景, Omnisearch 不是必须的 (尤其是主要为搜自己写的笔记时, 此时笔记内容, 习惯用语等等都符合直觉)
1 个赞
虚心肖白
(xqw)
17
我看到还有人推荐Clever Search这个插件( 插件网址),不知道和现在版本系统自带和Omnisearch比较如何,还有这个插件为什么会显示出偏黑色的悬浮框