怎么用calibre将电子书简单粗暴转换为md格式导入obsidian

需要准备的calibre插件

步骤

纯文本电子书处理方式

  • 打开calibre选择要转换的图书
  • 选择批量转换

  • 输出格式设置为MD,中文书籍需要修改XPath表达式。
//*[re:test(., "^\s*[第卷][0123456789一二三四五六七八九十零〇百千两]*[章回部节集卷].*", "i")]

  • 选择图书导出单一格式,选择md格式
  • 直接进文件夹拖动转换后的文件进obsidian库

针对对有大量图片的电子书处理方式

这里视频的方法有误,会造成图片混乱,感谢评论指出。(我太天真了,想懒到只用一个软件一动不动没那么容易QUQ)

  1. 查找正则表达式:<img.*src=".*(?=/.*.jpeg)/ 替换文本:![[
  2. 查找正则表达式:.jpeg".*(?=.*/>)/> 替换文本:.jpeg]]
因为每本图书的html文档不同,这个表达式可能会出bug,我靠我的菜鸟正则水平已经尽量试了好几本了QUQ。
如果出错可以在编辑书籍里搜索 img 来确认一下要修改哪里。

我基本上只用obsidian,所以这里直接用了wiki链来修改,方便接下来的懒人步骤。

如果有大佬提供更好的正则表达式我再换上。

  • 到这里虽然已经完成,但我开始觉得用calibre操作图片书籍一点都不懒人了。。。继续找下一个懒惰的办法

感谢收看?

5 个赞

结构检测那学到了,谢谢分享。
另外Calibre可以直接转换为md么?有额外安装插件吗?我的Calibre,txt输出那就算选择了markdown,转出来的也是txt,需要手动改后缀名

更新一下?新版的我啥都没做,有一天就看到md选项出现了,都不知道啥时候出现的。

到calibre的设置里找插件的选项,里面有个“markdown output”(大致意思)的插件,装上去就行了

谢谢。确实是需要安装md output的插件来实现

噢噢这样呀。。。QUQ可能我以前乱点上的没注意到。。我补充一下原文