- 中文图书的原信息如何抓取?
- 缘起:目前知识管理存在的一些难点(持续更新中) - 每日闲聊 - Obsidian 中文论坛 time: 2022/5/13 22:47:10
目前,Zotero Connector的Translators主要由 Zotero translators 中文维护小组 (以下简称CN库)进行维护,Zotero 中文社区中大火的 Jasminum - 茉莉花 插件调用的就是这个仓库,并同样由 l0o0 (Linxzh) · GitHub 维护。
其他的贡献仓库有:
- GitHub - gezhongran/DougSociety: 道格学社官方仓库 time: 2022/5/13 22:53:34
- GitHub - TanGuangZhi/MyTranslator: Zotero translator 优化,开智translator time: 2022/5/13 22:55:04
欢迎进行补充!
可以抓取中文图书的 Translators 有:
-
全国图书馆参考咨询联盟 → Superlib.js:推荐,详情见下。
-
百度学术 → Baidu Scholar.js:不推荐,条目类型混乱、收录图书信息少。
-
当当网图书 → Dangdang.js:不推荐,只适合检索在售图书。
举例:[英]雷蒙·威廉斯. 现代悲剧[M/OL]. 丁尔苏, 译. 译林出版社, 2017[2022-05-13]. https://book.douban.com/subject/26058980/.
省流:尽管豆瓣存在信息源错误的可能性(如页数比文津、全国图书馆参考咨询联盟多),但选择道格学社版 Douban.js 需要调整的地方比较少,推荐使用DougSociety/Douban.js at master · gezhongran/DougSociety · GitHub 。
豆瓣
省流:推荐使用道格学社版。
CN库:Douban.js
- translators_CN/Douban.js at master · l0o0/translators_CN · GitHub time: 2022/5/13 23:30:20
效果如下:
- 优点
- 其他:有评价人数、豆瓣评分、价格
- 可批量抓取豆列
- 可茉莉花插件更新
- 同时抓取书籍目录
- 缺点
- 姓、名分开
- 出版社有问题
DoubanSample.js
- MyTranslator/DoubanSimple.js at main · TanGuangZhi/MyTranslator · GitHub time: 2022/5/13 23:34:41
注,与Douban.js同时存在时会执行Douban.js(好像)。可能存在测试错误,我跑出来的效果和作者描述完全不一样。
参见:
- 豆瓣最新 zotero translator time: 2022/5/13 23:38:08
- 豆瓣条目出现BGU · Issue #2 · TanGuangZhi/MyTranslator · GitHub time: 2022/5/13 23:38:20
效果如下:
- 优点
- 其他:有评价人数、豆瓣评分、价格
- 可批量抓取豆列
- 缺点
- 姓、名分开
- 出版社有问题
- 系列有问题
- 不可茉莉花插件更新
- 不抓取书籍目录
道格学社:Douban.js
- DougSociety/Douban.js at master · gezhongran/DougSociety · GitHub time: 2022/5/13 23:39:35
效果如下:
- 优点
- 其他:豆瓣评分
- 可批量抓取豆列
- 姓名合并,基本不用调整元数据
- 缺点
- 不可茉莉花插件更新
- 不抓取书籍目录
文津
- translators_CN/Wenjin.js at master · l0o0/translators_CN · GitHub time: 2022/5/13 23:50:14
省流:不推荐,长时间未维护。
效果如下:
- 优点
- 有语言,但并不是标准格式
- 缺点
- Creators 混乱
- 不可茉莉花插件更新
- 不抓取书籍目录
- 无法抓取系列
全国图书馆参考咨询联盟
- DougSociety/Superlib.js at master · gezhongran/DougSociety · GitHub time: 2022/5/13 23:53:20
省流:文津的上位替代,需要批量抓取检索结果的可用。
效果如下:
- 优点:
- 可批量抓取检索结果
- 存档位置→中图法分类
- 大部分条目会保留编辑信息
- 缺点:
- 编辑识别为作者
- 作者中英文名混杂
- 需要登录
- 无法抓取系列
- 不可茉莉花插件更新
- 不抓取书籍目录
3 个赞