【解答合集】各种格式批量转 Markdown/Markdown 批量转 PDF

非常感谢,我去学习一下。

我把以前的笔记转成PDF放进仓库里了,我想把它们批量转换为可编辑的markdown笔记,已经安装了pandoc插件,但是我只找到了导出为pdf,没看到把pdf转换为markdown。。。求助各位大佬们,我该怎么操作才能把这些PDF文件批量转换为markdown啊 :sob:

你的 PDF 都是可复制文字的那种吗,扫描件估计不行,最好先 PDF 转下 Word。

Word 批量转 MD,我的经验是 Windows Powershell。前提是下载了 Pandoc,而不是只下载了 Ob Pandoc Plugin。

先做好备份。

具体步骤
  1. 右键 - 在终端打开

  2. 输入代码,回车(# 那行是注释)

    # pandoc 本文件夹 .docx 转 .md,media 在 ./media 文件夹
    Get-ChildItem -File -Recurse -Filter *.docx | ForEach-Object {
      pandoc --extract-media ./ -o ($_.BaseName + '.md') $_.FullName
    }
    

    image

  3. 效果(Pandoc 不能转 .doc,我把文件格式转换了一下,尴尬)

    image

2 个赞

可以试试先用ABBYY转换成docx或者是RTF,然后用pandoc转换成MD

俺写了一篇迁移方案,可以看看

Obsidian格式转换神器,一键转换epub电子书为Markdown笔记,转换极快,效果极佳! (qq.com)

你这个就是有多余空行,应该是幕布的格式和obsidian有差异,你试试粘贴的时候ctrl+shift+V看看,粘贴纯文本,感觉应该好一些

如题,有一些文章有epub版本,但如果人工排版为md格式,要花费很多时间,请问有什么插件或者方法可以快速转换

还是直接打开吧,转换不太容易,特别是有css的时候

有在线网站可以转,不过转出来的格式还需要手工处理一下。比如: Online EPUB to MD Converter - Vertopal

用 calibre 把 epub 转成 htmlz 格式,然后用解压软件解压htmlz文件,里面就有html文件和图片文件夹。

用浏览器打开 html 文件,复制内容,到ob里面,然后把图片文件夹托进ob里。

1 个赞

calibre下一个插件,可以直接把很多电子书格式转化成md,网上搜一下

谢谢各位,通过各位的方法,我解决了问题

孩子太菜了,不会自己写 :persevere:
求一个脚本

1 个赞

英文论坛好像很久以前就有了:

2 个赞

好的,我去看看
感谢

网上没有搜到将幕布笔记迁移至ob的文章,有清楚的大神可以解答下?

可以参考这个问题: 从幕布中导出Markdown格式的大纲? - 知乎 (zhihu.com)

2 个赞

我的诉求是有大量md文件,像导出pdf,
多个文件转成多个pdf,自带导出可以用,但是效率太低,各位大佬帮帮忙

安装旧版本印象笔记能导出enex的6.x版本,然后导出enex后,在obsidian里面第三方插件安装impoter插件 导入笔记即可。