【解答合集】各种格式批量转 Markdown/Markdown 批量转 PDF

好吧,谢谢了。。。

批量word转成md文件,有没这样的工具

工作需要,在微信公众号提取了一些有养分的文章,都是html格式的文件,希望能批量转换md格式文件便于导入OB的知识体系

你这个是有多余的空行,下载增强编辑插件批量去除空行就可以了,很多软件导出的时候都会这样包含多余空行,你可以下载旧版的增强编辑来用,因为我一直没去使用看看新版的长什么样子GitHub - obsidian-canzi/Enhanced-Editing-legacy-version: A plugin for Obsidian.md (ZH增强编辑插件)

2 个赞

有没有什么插件可以导入Word文档到obsidian中啊,有批量的更好。每次想把Word中的文档导入到obsidian,只能先复制到TXT中,然后再复制到obsidian,再调整格式,有没有好的方法简化操作?

搜索pandoc试试

这个插件看介绍是obsidian导出为doc的,可以把doc导入obsidian吗?

你可以直接用pandoc,不必在obsidian里。

好的,非常谢谢!

我今天发现最方便的办法是在chrome/edge浏览器里下载幕布导出器这个插件,用幕布网页端直接批量导出md,格式非常干净不用在ob里调整

1 个赞

遇到的问题

试图把logseq的笔记迁移到Obsidian中,但是因为logseq中的笔记是out-line格式的,导入后在Obisidian中会变成无须列表,同时会有缩进。希望能够变成普通纯markdown样式。

预期的效果

希望从logseq导出到obsidian中,变成普通的纯文本的markdown格式。

已尝试的解决方案

  1. 直接导出图谱为markdown格式,之后会有上述问题。
  2. 导出到roamresearch中后,再导入到Obsidian中问题同样存在。

这种转换, 其实跟每人笔记内容的关系挺大,
比如大纲式的写法, 前几层缩进要转为小标题? 还是忽视所有缩进, 统一平铺正文就完事?

希望从logseq导出到obsidian中,变成普通的纯文本的markdown格式

如果没啥复杂样式, 可能找个全局替换工具, 直接把所有开头为 - , \t- 之类字符, 转成 \n, 就完了

更细节些的转换方案, 可以参考下面这个

非常感谢,我去学习一下。

我把以前的笔记转成PDF放进仓库里了,我想把它们批量转换为可编辑的markdown笔记,已经安装了pandoc插件,但是我只找到了导出为pdf,没看到把pdf转换为markdown。。。求助各位大佬们,我该怎么操作才能把这些PDF文件批量转换为markdown啊 :sob:

你的 PDF 都是可复制文字的那种吗,扫描件估计不行,最好先 PDF 转下 Word。

Word 批量转 MD,我的经验是 Windows Powershell。前提是下载了 Pandoc,而不是只下载了 Ob Pandoc Plugin。

先做好备份。

具体步骤,点击展开
  1. 右键 - 在终端打开

  2. 输入代码,回车(# 那行是注释)

    # pandoc 本文件夹 .docx 转 .md,media 在 ./media 文件夹
    Get-ChildItem -File -Recurse -Filter *.docx | ForEach-Object {
      pandoc --extract-media ./ -o ($_.BaseName + '.md') $_.FullName
    }
    

    image

  3. 效果(Pandoc 不能转 .doc,我把文件格式转换了一下,尴尬)

    image

2 个赞

可以试试先用ABBYY转换成docx或者是RTF,然后用pandoc转换成MD

俺写了一篇迁移方案,可以看看

Obsidian格式转换神器,一键转换epub电子书为Markdown笔记,转换极快,效果极佳! (qq.com)

你这个就是有多余空行,应该是幕布的格式和obsidian有差异,你试试粘贴的时候ctrl+shift+V看看,粘贴纯文本,感觉应该好一些

如题,有一些文章有epub版本,但如果人工排版为md格式,要花费很多时间,请问有什么插件或者方法可以快速转换