KG笔记法评析(二):知识关联与融合

昨天的文章从信息组织学的视角分析了 KG 笔记法简单组织和快速查找的优点,今天这篇文章将从教育心理学的角度谈谈 KG 笔记法的第二个优点——关联已有知识。

正所谓“温故而知新,可以为师矣”,将新知识与已有知识关联起来是增强学习效果的一个重要技巧 (Dunlosky等, 2013)。我们在进行知识管理的时候也是如此——我们希望自己的知识有序化、系统化,相似的知识应该相互关联、融合,而非零散各处。那么,是否所有的笔记方法都能把知识关联起来呢?

散落各处的知识

假设我们现在在读一本粤菜菜谱,菜谱上讲解了正宗白切鸡好吃的原因——酱汁非常影响白切鸡的味道。我们觉得菜谱说得很好,想把这个观点记录下来,该怎么做呢?考虑到大多数人同时会使用分类法(文件夹)、叙词法(标签)、元信息法,再配合 MOC 来组织自己的笔记,因此这里也使用这四种方法:

  1. 首先,我们会创建一篇新的笔记,起名为《正宗白切鸡好吃的原因》。

  2. 随后,我们在这篇笔记里记录下相应内容“正宗白切鸡好吃的原因在于酱汁,酱汁非常影响白切鸡的味道……”。

  3. 记录完成后,我们会给这篇笔记打上“粤菜”、“白切鸡”两个标签,赋予“create time:2022/6/20”等元信息,然后将其放到“饮食”这个文件夹中,同时登记到《白切鸡 MOC》这篇笔记里。

这样做乍一看是没有问题的,非常符合知识管理的理念。但是,当未来我们遇到相似知识的时候,问题就来了。

假设一年过去了,我们读了另一本粤菜菜谱。菜谱里说正宗白切鸡好吃的原因不仅在于酱汁,鸡的种类也很重要。我们觉得这本菜谱说得也有道理,也想把这个观点记下来。但是,因为过去了一年,我们并不记得之前记录了相似的笔记。于是,我们创建了一篇名为《鸡的品种影响白切鸡的味道》的笔记,并在其中记录了具体内容,然后给其打上“粤菜”、“白切鸡”两个标签,赋予“create time:2023/8/10”等元信息,最后将其放到“饮食”这个文件夹中,同时登记到《白切鸡 MOC》这篇笔记里。

过了两天,一个朋友突然给我们发了条微信消息,问我们有哪些因素会影响白切鸡的味道。为了解答朋友的疑问,我们开始在笔记库里查找相关的笔记:打开“饮食”文件夹,发现里面有百余篇与做菜相关的笔记,得一篇篇翻查;搜索“白切鸡”标签,也返回了几十篇笔记,也得一篇篇翻查;搜索元字段,这似乎并帮不上什么忙;检查《白切鸡 MOC》,发现里面也登记了几十篇笔记……最终我们还是只能寄希望于全文搜索,让软件以“白切鸡”、“味道”这个两关键词进行搜索。但结果还是给我们返回了几十篇笔记。迫不得已,我们只能把两天前记的《鸡的品种影响白切鸡的味道》发过去……

上面这个例子就是我在使用 KG 笔记法之前的真实写照,我相信很多人也遇到过类似的情景。目前主流的笔记方法,并不能很好的将相似的知识关联、融合起来,甚至可能会产生知识知识冗余——同样的内容一年前放到《正宗白切鸡好吃的原因》里,一年后遗忘了可能就会以《白切鸡好吃的关键》为题再记一次。导致这种问题的根本原因在于我们使用的检索标识专指度过低,简单来说就是所用的分类和标签包含范围太大,检索时会返回大量的信息。

说到这里,肯定有人会说使用范围更窄的标签或 MOC 不就行了。确实如此,但问题在于我们给笔记安排标签或 MOC 并不是一蹴而就的,而是不断迭代的:一开始对粤菜不了解的时候,我们对白切鸡的笔记可能只会打上“粤菜”的标签,或是把它放到《粤菜 MOC》中;只有我们对粤菜了解了,对白切鸡熟知了,我们才会选用“白切鸡”标签或《白切鸡 MOC》。所以这里还涉及一个重新打标签或重新登记 MOC 的过程。而这个过程往往又是非常麻烦的:我们需要先逐一翻阅包含“粤菜”标签或是登记在《粤菜 MOC》中的成百上千篇笔记,然后选出与白切鸡有关的几十篇笔记,再为它们重新赋予“白切鸡”标签或登记到《白切鸡 MOC》中。这般高昂的整理成本使得大多数人都不会重新整理标签或 MOC。

受控标题,自然而然的知识融合

那么 KG 笔记法是怎么规避这个问题的呢?方法很简单,借助受控制的标题,我们可以自然地将同一主题的内容汇集到一篇笔记里。并且,当这篇笔记里关于某细分主题的内容足够多时,我们可以方便快速地将这部分内容独立成为一篇新的笔记。

还是刚刚的例子。当我们第一次看到“酱汁非常影响白切鸡的味道”这个观点的时候,由于这个观点的主题是“白切鸡”,因此我们会在《白切鸡》这篇笔记中记录这个观点。同时,因为观点讲述的是“影响味道的因素”这一细分主题,我们会在《白切鸡》这篇笔记中创建“# 影响味道的因素”章节,将观点记录在该章节下。而当我们后来看到“鸡的品种影响白切鸡的味道”这一观点时,记录过程也是类似的:由于这个观点的主题是“白切鸡”,因此我们还是在《白切鸡》这篇笔记中记录这个观点;同时,因为观点讲述的是“影响口味的因素”这一细分主题,我们只需在《白切鸡》这篇笔记中创建“# 建立影响味道的因素”章节,将观点记录在该章节下——而这个步骤我们之前就已经完成了,两个相同主题的观点就会汇集到同篇笔记的同个章节中。综上所述,KG 笔记法可以自然而然的把新知识与已有知识融合起来。

这时肯定有人又会说,这样做的话笔记不就会很长了吗?确实会很长。但因为我们已经通过小标题划分出了细分内容,所以当我们觉得笔记篇幅过大时,可以轻松地将各章节独立成为新的笔记。比如,我们可以将“# 影响味道的因素”这一章节单独出来,形成一篇名为《影响白切鸡味道的因素》的笔记。(当然,由于这个题目并不是一个固定主题短语,因此我不推荐这么做。)

举一个实际的例子。以我最近在学的国际结算相关知识为例。当我想记下书中关于支票的内容时,由于内容是关于“支票”这一主题的,我只要创建一篇名为《支票》的笔记,将内容记录于其中即可。而当我在 Obsidian 的快速切换输入“支票”二字并回车之后,Obsidian 给我打开了《支票》这篇笔记——原来我在一年前看货币金融学教材的时候,就已经记录了与“支票”这一主题相关的内容。接下来需要我要做的就是比较不同书籍中这些内容的异和同。

gfasa-12jwh

不再沉默的潜在链接

受控标题的另一大好处在于可以充分利用双链笔记软件的潜在链接功能,让软件自动嗅探知识间的关联。

举个例子,比如我在学 html 的时候,我在《标签》这篇笔记中记录了该标签的作用:“标签用来为 Web 页面指定字符编码”。而就在我输入最后一个字后,Obsidian 的出链面板马上就提示了“字符编码”是一条潜在链接。我当时非常奇怪,并不记得“字符编码”是什么。但顺着链接点开笔记一看,原来这是我大一计算机基础课程里的计算机字符编码的内容。这样,时隔多年的知识就被 Obsidian 联系起来了,我既复习了原先学过的字符编码的知识,又将标签这个新知识与旧知识关联了起来,更好的理解了标签的作用。

098op-i8a52

为什么只有受控标题才有如此效果呢?原因很简单,因为受控标题去除了自然语言的歧义性,这使得标题可以在日常记录中大量复现。比如,如果我们以《标签的用法》作为标题,那么软件自然无法嗅探,因为我们可能在笔记中会用“标签的作用”来表达相同的内容。但如果我们仅使用《标签》,那么无论是“标签的用法”,还是“标签的作用”,都能匹配到这个标题。

结尾

在使用 KG 笔记法的这段时间中,我真正在 Obsidian 中感受到了一种融会贯通的感觉。不同学科的知识都能在 Obsidian 的帮助下产生关联,这让我能很好地将当前所学的新知识与已有的旧知识来联系起来,让我温故而知新。同时,相同主题的内容也能汇集在一篇笔记中,让我在学术研究时能更方便地比较不同学者对于同一问题的观点,提升科研效率。


Dunlosky, J., Rawson, K. A., Marsh, E. J., Nathan, M. J., & Willingham, D. T. (2013). Improving Students’ Learning With Effective Learning Techniques: Promising Directions From Cognitive and Educational Psychology. Psychological Science in the Public Interest, 14(1), 4–58. https://doi.org/10.1177/1529100612453266

4 个赞

俺用的法子就像大佬说的,一个主题一个page,相关topic用大标题盖楼,看大纲就能全览一路的轨迹 :wink:
看大佬总结才晓得原来是有这么科学的讲究,和大佬同道儿,算歪打正着了 :yum: 没从笔记理论上考究过,懒人只图扔进去多快好省不费脑子 :crazy_face:当然更主要是想聚类话题,不使在各处零落,首先在视觉上达到融汇集合。主题的子项之间要是有交叉关联,就用标签系统补上处理 :slightly_smiling_face:

题外话,为啥你们这些大佬都爱拿做鸡说事儿 :joy:,bonbon大佬举栗子也鸡不离口 :laughing:
这篇看着特别顺畅,∵比之前写的更具象,接地气儿 :smiling_face_with_three_hearts:

因为白切鸡已经成了 ob 案例的一个梗 :rofl:

这边必须强调的一点是,请使用dataview建立好一篇关于全部文件的链接数量的统计,这相当于logseq里面的all page的功能,让我们能够直观的看见究竟有多少篇笔记链接到了这篇笔记。

let files = dv.pages(`"未命名"`)
dv.table(
	['文件名','双链'],
	files.map(p=>[p.file.link,fun(p)])
		.sort(p=>p[1],'desc')
		)

function fun(file) {
	let s = new Set(file.file.inlinks.values.map(p=>p.path)
		.concat(file.file.outlinks.values.map(p=>p.path)))
	return s.size
}

語法來自 @lazyloong

当链接的数量太多的时候,就表示我们该重新梳理关于这方面的知识。这时我们就可以打开那篇笔记,查看提及以及反链,并将有用的知识汇总于一篇笔记,并且剃除掉重复的知识点,这边建议使用标题的# ## ### 来进行汇总而不是无序列表,这是为了后期可以快速的引用这方面的知识,例如我们使用[[白斩鸡#作法]]就能很快的链接到白斩鸡的作法而不是还需要切换到白斩鸡到页面后查找。

匆匆读了一遍kg介绍文,本菜鸡驽钝,理解可能偏差较大,kg法主要通过拆分主题,获取其中的实体、概念、关系,以此作节点,通过这些语义来连结,形成逻辑关系链,在图谱里展现层级结构。

虽然这套笔记法是大佬原创,但好像很多人在构建自己笔记体系的过程中,也会自然而然的关注几个点:

笔记如何建立、归放、连结,才更准确、自然呈现逻辑关系,∵逻辑的清晰合理与否,会影响对事物理解的差缪、记忆的难易和在脑中存储的时长;

设计的笔记架构要能更方便日后的检索,减少搜索遗漏,和能更轻松唤醒记忆锚点(节点)及关系全体(big picture);

以及kg里的“G” for graph表达的意象,把笔记间的关系连结视觉化, 直观的帮助笔记用户拓展知识网,发掘更多深层关系,整合优化关系网结构。

这是很多人对笔记结构的关注、需求点,很多方面是和kg法不谋而合的,所以也殊途同归,会用相似的方法去架构笔记体系。虽然一般人很少上升到理论层面研究撰写笔记法,但他们在做笔记的同时,是会不断筛选淘汰进化组合出合适自己的方法。当然你们这些scholar是负有带领提携后辈的使命,从方法中提纯出理论,指导使用,造福后学。

要是像日常笔记(肺话daily-log)关联性不强,或不看重逻辑关联的,kg就使不上劲,不太合适了。

“人其实并不需要这么多意义和模型,而且很有可能,学得越多越困惑,意义太多,就很难指导具体的生活。你要找到的,是现在最有感觉的那一个。” —《拆掉思维里的墙》
“少即是多”,用趁手的就好 :yum:

daily note 建议看这篇,在daily note流他算是讲得最好的了,这也是很多人赞同的方法,其实最终都是使用传递型双链来达到聚类的方法

1 个赞

信息组织方法是要为信息检索需求来服务,其实我一直都有在强调这点 :rofl:

从理论层面来说,大多数人搜寻信息时往往是从主题出发的,因此信息组织学里更强调分类法、主题法等基于信息组织的方法 (曹树金 & 罗春荣, 2000)。但如果常以时间、作者等角度进行检索,比如想看 xx 月 xx 日的工作报告、组里小王交的终稿,那肯定是要选用基于时间、作者等字段为检索标识的组织方法。

另外,双链笔记其实还有一个很重要的重点,就是自下而上自然生长,而不是你一开始就试图构建一个大框架把笔记丢进去,而是笔记多到一个数量使你感到混乱时才去整理分类,假设你今天只有十条笔记,那么一个文件夹就够了,假设今天你有一百条笔记,那么可能需要多几个资料夹或是开始打上标签了,不只是笔记是自然生长的,管理的结构其实也是自然生长的,这是一个不断更新迭代的过程。

不是设计笔记框架,而是开用一个新笔记app初始,构思一个组织笔记信息的大体(通用)方法 ,尽量避免克服随着时间推移出现信息混杂,以致需要大范围的重新整理。尽可能设计有效(高效)的组织管理,更好拓展信息网络,发掘潜在的新的关联,挖掘深层关系
当然也像你说的那样,组织法也得有弹性,能随变而变 :yum:

双向链接实际对应的是引文组织方法,但引文组织方法并不算一种典型的信息组织方法。这种方法的优点在于系统是动态的且自组织的,但缺点在于检索性能很差。

至于双链,我认同ryooo大佬的评判,也有劣势

  • 欢迎探讨。
  • 是的 :rofl:

跟随大佬的脚步去了解了一些知识图谱的知识,
您觉得随着obsidian本体和插件的更新,
KG笔记法的未来是向知识图谱看齐,使obsidian成为更自由的neo4j,超越了知识图谱
还是说是成为知识图谱的草稿,KG笔记法就相当于做了粗糙的人工的知识抽取与知识融合,把知识推理留给原生图数据库去解决,是知识图谱的前置、附庸的一个状态

基本上是后者。

因为不管 ob 怎么更新,其大概率没法内置知识抽取相关的算法及软硬件。这意味着 ob 终究仍是一个笔记软件,在 ob 里进行实体和关系抽取的仍是我们的大脑。在这种基础上,我们是没法构建真正意义上的知识图谱的。毕竟真正意义上的知识图谱需要的不是笔记而是三元组,并且需要严格的构建规则与海量的节点。只有这样,知识图谱才能发挥其相应的知识推理能力。

但是,作为普通人,我们需要的并不是知识图谱那种恐怖的知识推理能力(同时我们也没有那个条件搞出一个质量良好的知识图谱)。我们的根本目的是知识管理,这可以分解成两个子目标:1)良好的知识组织,方便我们日后查询;2)一定的知识推理能力,能辅助我们产生洞见。为了满足这两个子目标,KG 笔记法才借鉴了信息组织学的标题语言和知识图谱的构建原理。所以说,KG 笔记法并不是为了超越知识图谱存在的,而是借鉴其他领域已有的研究成果,更好地为个人知识工作服务。

1 个赞

学到了,多谢大佬

@Ryooo 今天在企鹅群里给大佬打了个小广告 :yum:


暑假葛优躺了好多天,还没践行大佬的大法,明儿起收起懈怠,好好的体会领略一番 :stuck_out_tongue_winking_eye:

期待体验报告 :rofl:

Emmm,很有道理:+1:~

今天又安利(huyou)了一个友友

你这不体验下就安利不怕给别人带沟里 :rofl:

接二连三的拉客上(hei)车,大佬的车车稳,无所畏惧 :crazy_face:

您好,最近在拜读您的一系列关于笔记的文章,如有打扰请您谅解。我想问,如果此处想将“# 影响味道的因素”这一章节单独出来,您觉得如何命名标题比较好呢?我的想法是命名为《白切鸡的味道》,然后再《白切鸡》这一笔记中登记即可,如果有需要可以再创建《味道》这一个页面,然后在《味道》中记录《菜肴味道的分类》并登记《白切鸡的味道》。您觉得如何?