用 MaoXian 网摘把网络文章以 Markdown 格式保存到 Obsidian

网摘扩展解决了什么问题?

当前网络环境恶劣,网络文章可能由于种种原因而变得无法访问。如果你平常阅读到喜欢的文章时,只是将其保存在浏览器的书签里,那么当文章消失之时,你的书签就变得毫无用处。或者是文章还在,而文章引用的图片无法访问了(有的文章会引用第三方网站的图片,或者把那些大网站作为图床等等,都会有这个风险)。所以在收藏文章时,需要备份。网摘扩展就是方便你对文章进行备份的工具。

为什么要优先本地备份?

同样是因为当前网络环境恶劣的原因,你把信息存储在云端(别人的电脑上),这些信息就不是完全由你自己掌控。假如突然某个人玻璃心了,看某个词不开心,于是决定把其设为敏感词,而你备份的信息里恰好有这个敏感词,然后你备份的信息就消失了,这肯定是你不想看到的吧,所以要优先本地备份。当然你是可以在已经完成本地备份的情况下,再加密信息备份到云端,来方便你跨设备访问。

MaoXian 网摘扩展的特点

  • 可以把网络文章 以 Markdown 的格式保存到本地
  • 在保存文章时,会同时把文章内容引用到的图片下载到本地,并自动引用本地图片
  • 对文章代码片段有很好的识别效果。
  • 支持将数学公式保存为 LaTex 的格式。
  • 提供了模板和丰富的变量,这允许其支持 YAML Front Matter(一种将元信息放到 Markdown 内容头部的格式)。
  • 存储结构是以文件夹来组织 Markdown 文本文件的,这一点和 Obsidan 的设计不谋而合
  • 支持灵活地配置不同类型文件的存储路径。
  • 它不会盲目地去猜网页的主内容区(Web 太复杂,程序很难 100% 猜对),而是允许你框选要裁剪的区域。

当然,还有以下特点:

  • 开源软件,项目在Github
  • 不侵犯用户隐私,它不会收集用户任何信息,你可查看它的隐私说明
  • 不需要注册就可使用

你可以在 这里 预览它的界面。

如何对接?

MaoXian 网摘的作者,最近写了一个教程,叫做《用 MaoXian 网摘保存网络文章到 Obsidian》。以图文的形式描述了整个对接流程,也简述了存储路径的配置。我是跟着这个教程走的。读者可按该文的教程走,我就不再赘述了。 值得一提的是,该文的对接环境可能和读者的不同,不过其作者也说了:“不同的操作系统的对接略有差异,但整个对接思路和流程是一致的,请参照各个对接步骤灵活变通“。

强烈推荐各位读者按照其中的〖方法A〗的方式进行对接,我原本还以为创建软链接(文中把其比作传送门)有多复杂,静下心来跟着教程走下来,才发现其实很简单,而且我还学会了创建传送门,这个超有用的技能。而且你根本就不需要安装〖本地程序〗和它依赖的 ruby。该教程由于讲得太细,篇幅有点显长,可能会吓退读者,其实步骤并不复杂。耐心点,其实很容易就对接上。

使用过程中,需要注意的点

网摘扩展只能帮助你保存当前时刻网页展示的信息,MaoXian 也不例外。所以对于一些动态网页,需要从头到尾浏览一下内容,以确保所有的图片都加载完成,再进行裁剪,以避免有的图片没有下载,或者是下载到占位图片(空白图)的情况。

一些链接

  • 为什么 MaoXian 不在「谷歌商店」上线 : 作者遭遇了谷歌商店的误伤后,受不了其的一刀切行为,决定了不在谷歌商店上架扩展。
  • MaoXian 助手 ,该功能支持你在裁剪网页之前,对当前的网页状态进行修改,以达到更好的保存网页,如:移除掉一些与内容无关的按钮和推荐,下载高质量图而非默认显示的,等等…… (这个可能需要有点 JSON 和 CSS 基础,才能很好地利用)
  • MaoXian 主页 请在此找到它的更多信息。

写在最后

我是看到本论坛里的那篇教程《obsidian使用Maoxian插件完美剪藏网页文章》 已经有点陈旧了,而且有点绕弯路了。才作此文,希望能帮助到你。

当然,如果你遇到了问题,也可回复此帖,我也会尽力帮忙的

感觉不如markdownload

感觉不如markdownload

额,没有要和其他软件比较的意思,不过你说的 :“感觉“ 也太主观了,你可以说下哪些方面吗?

我在用原批体,不用太当真…
我想说的是剪藏网页为md已经有轮子了,markdownload可以直接保存md到ob库的指定文件夹,对各种文字格式都能够较好地保留(相比另一个扩展「copy as markdown」而言)。你提到的几点优点markdownload都符合,除了自动下载图片到本地,但这个可以配合ob插件「local image plus」来实现,而且用户拥有下载或不下载的决定权。所以看你的描述,没有感觉到MaoXian的差异化优势。
除了markdownload以外,另一个工作流是omnivore保存文章然后配合官方插件「obsidian-omnivore」导入到ob里,可以保留omnivore中的高亮批注等。

1 个赞

什么是 “原批体”?搜了下没搜到……

我引用的那篇教程就是配置 MaoXian 保存 Markdown 文件到 Obsidian 库里面的某个文件夹。多一个选择是好事,没所谓重复造轮子的问题(如果真要论,这两谁先谁后还不一定呢)。我看了下 Markdownload,它其实也可以配置自动下载图片到本地,只不过目前不能很灵活地配置路径。

关于是使用网摘来下载图片还是使用 ob 插件来下载图片。我个人的看法是:优先使用网摘来下载图片。因为网摘的运行环境是正在使用的浏览器,可以利用浏览器的缓存(下载速度更快)。有些图片有防盗链机制,在浏览器这边下载可以天然利用当前的环境(比如:需要登录的环境,cookie等)。而用 ob 插件,很难完全模拟浏览器那边的环境,在极端的情况下(较少出现),可能会出现无法下载图片的情况。当然网摘扩展也不是百分百能下载图片,不过会比 ob 插件有优势。

用户拥有下载或不下载的决定权

这个看个人需求吧,我自己是没有链接在线图片的需求的。

除了markdownload以外,另一个工作流是omnivore保存文章然后配合官方插件「obsidian-omnivore」导入到ob里,可以保留omnivore中的高亮批注等。

我没用过 omnivore ,不做评价

omnivore收藏某一篇知乎回答,会获取到该问题下另一篇回答的内容。这个问题有解决的办法吗?