使用Obsidian进行剪藏的优势在于哪里?

嗨,朋友们好。最近关于使用Obsidian进行剪藏我有些疑问。

我看到很多人已经在用一款很成熟的剪藏软件了,还是要联动使用Obsidian进行剪藏。之前我因为想要使用Obsidian All In One,所以也试图这样做过。可是现在我已经放弃All In One了,于是才开始思考,使用Obsidian进行剪藏的优势在于哪里?

请大家指教。

1 个赞

用了几个月。感觉剪藏没有任何优势。

  1. 剪藏后会觉得格式不对,会浪费时间去整理格式。
  2. 剪藏的内容基本不会去回顾,不回顾的信息是无用的。
  3. 剪藏的内容会有大量对自己无用的文字信息,不如在看普查剪藏的内容的时候,直接把对自己有用的信息提取出来……
  4. 除了无用的信息,还无用的图片、视频、音频等会包含在网页中,这些到底要不要也一同保留下来?剪下来占空间还要在这些上面花时间进行整理。很伤脑筋呢。

综上,我选择了另外的信息整理方式。并且,计划随后花点时间把以前剪藏的东西都清理一下。
我认为你的“可是现在我已经放弃All In One了”的想法是好的,建议你也做个彻底的决断。

1 个赞

obsidian是markdown格式的,网页信息一般是html的,用markdown几乎不可能把格式保留下来,觉得还是看原文的好。

楼上说的不必要信息的问题,可以通过浏览器扩展来做注释的方式解决。但这个需要浏览器api的支持,ob桌面版的能提供一部分api,可能某些扩展用不了。

我也想all in one,但发现markdown的限制有点大。

1 个赞

你这里谈到了markdown格式的限制,我还想冒昧地多问一句:

那么是否有哪个笔记软件值得在专门的剪藏软件之外,额外地使用其进行剪藏,以得到额外的好处呢?也就是说,抛开Obsidian本身不谈,在笔记软件中进行剪藏的优势在于哪里呢?

笔记软件受限于markdown,剪裁插件也受限于浏览器,应该将两者整合起来才行。

比如说可以用canvas把剪裁的多个片段放在一起。

1 个赞

在笔记软件里实现剪藏是有技术难度的,应该是只能联动了吧。

优势在于可以做笔记啊…对于一个网页, 你可以做各种高亮, 调整原文顺序, 修改原文内容, 把关联项通过块链接放到一起, 把关联网页内容聚合起来等等…这些信息二次加工功能往往是剪藏软件所提供不了的, 即便能提供, 比如简悦, 用起来也很繁琐, 反倒浪费时间, 还不如直接进ob处理.

2 个赞

抱歉,我不太理解在什么场景下需要修改原文内容。你能够举一些例子吗?

歪个楼,我以前用过一段时间其他软件的剪藏,但是我很容易把这个功能用成收藏夹(剪完不转化成自己的想法),后来我发现我需要的是一个网页批注插件:

  1. 可以及时的对某个部分写下当时的思考。
  2. 回顾的时候可以自动跳转到网页批注的位置。
  3. 看到原文和批注,我就不用再费心回忆当时的想法,就可以比较轻松的写入笔记。

可能是我的学习过程中不太需要阅读很大一段、偏学术的知识,所以我很少需要摘录部分原文。目前我使用Hypothesis网页插件+ob-hypothesis就可以轻松满足上面的三点。

1 个赞

比如有些博客, 尤其是技术博客, 作者行文逻辑往往较差, 需要自己小修小补, 把一些废话给删了, 调整逻辑链条使之通顺. 再比如看代码, 往往需要自己追加注释. 再比如视频的语音转文字稿, AI识别不够准, 经常需要修改关键词. 类似的场景太多了.

我的情况是,写东西的时候需要参考一些文章。比如我之前收藏了一些 dataview 的教程,然后哪个词忘了可以直接在 ob 搜索,也不用换 app。
最近了解了一下”渐进式阅读“,或许也可以通过像上面说的二次加工,把剪藏转换为自己的笔记?这样搜索阅读起来也会更舒服。
但我也不是很喜欢把文章扔 ob 里,一不小心就会积很多 :face_exhaling:

我之前也就是觉得可以方便搜索。不过如果是没有收藏的内容,也无法直接到互联网上搜索。而我使用的剪藏软件cubox可以在使用搜索引擎搜索的时候进行全文搜索,把相关结果显示在一旁,感觉超过了使用obsidian收藏的体验。

而且感觉和知识的内部和外部分开了,也挺好的。

2 个赞

具体的工作流如何?

没有什么优势,我目前都是自己编写油猴脚本,针对常用的需要剪藏的网页进行格式整理,然后再用Web Clipper进行剪藏。目前主要担心的是网页可能会频繁进行格式、布局调整,脚本可能过段时间就没法使用了。

看了一些大家的评论。我这里有一个问题,你剪藏的是哪些方面的网页?

先总的回答一下,对我自己而言,使用Obsidian剪藏的优势:

  • 免费的本地信息库,节约了金钱成本
  • PC端笔记软件我只用Ob,不用再去折腾其它工具
  • 网页剪藏到Ob之后,就是纯文本,方便我编辑&提取,也免去了各种广告
  • 有效防止网页404,不要更我说你没有遇到过

再来简单谈谈评论区中的一些问题

  • 剪藏后格式不对。需要什么格式,都纯文本了,需要的是内容
  • 剪藏后的信息回顾问题。也许剪藏后前两个月你没有回顾,你怎么知道第三个月会不会回顾?这其实就牵扯到你剪藏的内容是哪方面的内容。

举个简单例子,我用Origin进行数据分析和科研绘图,可是这种数据分析和绘图方法我不知道,然后就去网上检索,看了几个帖子之后,终于会了,但是这种处理方法我又不是经常用到,请问此刻,你要剪藏一下这几个帖子吗?然后你要在Ob里把这几个帖子汇总一下吗(什么?让我单独写感想,抱歉那是不可能的,我会把帖子中无关的信息剔除,然后把步骤写得更详细一些)?当你几个月后,做另一个项目的数据处理时,需要同样的方法,这时你应该有很深的印象,我之前处理过类似的问题,然后就在Ob里检索出之前的剪藏笔记。对于这样的剪藏, 我有必要进行回顾吗,显然是不需要的,但是它没用吗,显然是有用的。我觉得不要一概而论剪藏的内容不去回顾就没有用。

  • 剪藏的内容会有大量对自己无用的文字信息,不如在看普查剪藏的内容的时候,直接把对自己有用的信息提取出来。同上,这个要具体剪藏的是哪方面的内容?

  • 无用的图片、视频、音频等会包含在网页中,你都说了是无用的,为啥还要保存下来呢

  • 什么场景下需要修改原文内容。你能够举一些例子吗?上面Origin的例子就是一个典型的例子。

  • 把剪藏变成收藏夹(剪完不转化成自己的想法)。根本问题还在于剪藏的是哪方面的内容。不是所有剪藏的内容都需要写想法的。

  • 不是很喜欢把文章扔 ob 里。这个可以理解,可以全文扔到其它地方。当然如果全文也不扔到其它地方,我觉得就会有下面这个问题--------网页404。

举个例子,之前我写过一篇Ob选手必知24条的推文,然后没过两天我删了,然后好多群友找我要…

知识的内部和外部,这个我粗浅的理解一下哈。知识的外部,我觉得就是没有加工过的信息,也就是直接收藏的东西;知识的内部,我觉得就是经过你自己思考过加工过的信息,称之为知识。即知识外部=信息,知识内部=知识。至于两个东西是不是需要分别存在于两个软件中,个人觉得没啥太大的必要,分开了,反而增加了金钱、管理(可以部管理)和信息提取成本,还有说不定哪天你那个XXBox和之前的剪藏软件一样挂了(这里我只是想说一下这种情况存在的可能性,无其它意思,毕竟有太多先例)

  • 自己会编程挺好的。可是大部分人都不会,只能用市面上的现成的剪藏软件。但貌似这和题主的问题无关,并没有讨论剪藏的优势。
1 个赞

你好!很高兴看到你打了这么多字来和大家探讨这个内容。关于分开知识的内部和外部,是因为有一次我发现,我所剪藏的内容,实际上通过一些元信息很容易就能够在互联网上搜索到链接。这使得我开始思考,所谓的剪藏,本质上究竟是我对这个内容做了什么。即使没做任何加工,剪藏了一些东西还是让我觉得自己好像吸收了一些东西,这种虚无的获得感让我感到很可怕。
但我不想说这是一种普遍的问题,应该算是我自己性格上的问题。不过,总归我还是想要更加了解大家的想法,于是发了这个帖子。
关于404,我不想否认任何人所曾经被它刁难的经历,不过我个人的收藏确实都是不会被404的那种内容。反倒是视频经常消失,可是把视频都本地化需要太多存储,根本做不到。


自己开发一个类似的剪藏软件大概要怎么做?如此多的网站的解析规则…都要手动去适配吗?我也有点想要试试开发一个类似的东西了。目前有一些想法。

剪藏 vs 不剪藏的优缺点对比:



“Obsidian All in One 剪藏” vs “搭配 cubox 等专门剪藏” 对比:

我个人支持 All in One 这一派, 理由:

1
从 纯剪藏网页一字不改 到 纯原创笔记一字不抄 之间没明显界限, 都搁一起有助于逐步完善你的笔记, 楼上也有朋友提到了 “渐进阅读”

Obsidian 可以读到哪, 就顺手链接到另一篇笔记的佐证/反驳章节, 这是个比批注更轻量级的操作, 但对于理解知识同样有意义

更不必说, 全放 Obsidian 就可以随便 拆分/合并/片段嵌入 你的剪藏

固然, 剪藏软件也可以加类似功能, 比如把多个剪藏对象连成网络, 但既然都这么费心思理解页面间联系了, 这些链接/批注应该按照 “笔记” 对待

2
都搁一个库, 有助于灵活利用 Obsidian 的统计过滤

比如拿 dv 搜出所有没被链接过的笔记, 这种笔记就是剪藏了没看的呗, 有空时可以复盘, 不看也没事, 以后搜的到就行

局部MOC/搜索块 之类也算这种

3
如果使用单独的剪藏器:

  • 如果它是 web 优先的: 则跟 Obsidian 本地优先原则不太相符, 迟早有一天得担心全丢
  • 如果它是本地优先的: 那还是得要个资料管理软件, 显然, 这就有个现成的软件…

4
操作一堆本地文字的难度, 要远小于操作多个软件里的不同类型条目的难度

最常用是批量查找替换

另举例, 假设今后出现个人 AI 知识库助手, 比如 Text Embedding 后喂 GPT 这种的, 则 “准备全在 Obsidian 里的纯文本语料” 的难度, 会小于 “准备多款软件里的多种页面数据” 的难度, 这在 LangChain 里有现成示例

2 个赞

你好,请问您对网页的剪藏是直接复制文字吗,还是使用到什么插件呢

我之前用简悦, 现在干脆啥都不用了, 直接用浏览器自带的指向高亮超链接, 比如

摘录内容1 ([ref1](https://czottmann.github.io/obsidian-actions-uri/parameters/#:~:text=啊啊啊...啊啊啊))

  • 笔记1

摘录内容2 ([ref1](https://czottmann.github.io/obsidian-actions-uri/parameters/#:~:text=不不不...不不不))

  • 笔记2

自己写个ahk脚本, 划选好内容后, 一键往ob里添加就行了, 反倒最为省事.

2 个赞

说点其它的,我觉得用ob一定要摒弃一种倒推需求的习惯。
想要实现什么样的效果再找工具,如果都想不到功能用在哪里,就不要去折腾,不需要的。