【知识管理】笔记组织、《数据库技术》、《面向问题的信息模型设计》、Bases 插件和《图情档》学科体系
引言:数据库插件 Bases
最近,Obsidian 官方推出了【核心插件 Bases】。这个插件可以将一些笔记转换成数据库[1],从而以数据库的方式管理和组织笔记
据我观察,Obsidian 的数据库是一种单用户的文档型数据库。要使用这种数据库组织笔记,就需要学习和应用数据库设计的理论方法。
于是,为了学习相关的理论,我读了《数据库技术与应用》[2] 这本书,并且产生了一些【读书心得】、【感想】和【思考】
为什么要组织笔记?
我个人认为,面对大量笔记,适当的笔记组织是必要的
如果笔记没有恰当的组织,那么搜索和查询的性能会极大的下降或灭失,即可能会出现查全率和查准率双低的情况(在搜索和查询时,既找不到想要的信息,又会看到大量的无关信息)
即使去尝试使用 AI 搜索,也不一定会有很好的搜索体验,因为 ”垃圾进,垃圾出“[3]
当然,对笔记进行组织和管理是有成本的。这需要我们分析自己的需求,考虑投入产出比,即追求在低成本下追求高收益(运用计算思维:折中和冗余、关注点分离、约简与聚类、抽象与自动化)
笔记组织可以分成两钟:写索引 (Indexing)(编目(标引和著录))和写倒排索引 (Inverted Index)(综述笔记,内容地图(MOC))。
为什么要用数据库?
在使用数据库过程中,可以方便的辅助笔记组织的工作(写索引和写倒排索引)
《面向问题的信息模型设计》[2:1]
数据库设计的任务如下图所示
数据库设计有 6 个阶段
- 需求分析
- 概念设计
- 逻辑设计
- 物理设计
- 数据库实施
- 数据库运行和维护
面向问题的信息模型设计 有 2 个阶段
一、需求分析(自顶向下进行需求分析)
点击展开内容(多图)
- 需求收集:数据库设计人员调查、收集用户需求的过程
- 需求分析和表达
- 使用【数据流图】描述【数据处理】
- 数据流图:表示信息在系统中流动和处理过程的图形化工具
- 数据处理和功能划分:分拆数据处理功能模块成树状层次结构
- 分层数据流图:分拆相应的数据流动图成树状层次结构
- 数据流图:表示信息在系统中流动和处理过程的图形化工具
- 使用【数据字典】描述【数据】
- 数据项:数据项描述={数据项名,含义说明,数据类型,长度,取值范围,与其他数据项之间的逻辑关系}
- 数据结构:数据结构描述={数据结构名,含义说明,组成:{数据项或数据结构}}
- 数据流:数据存储描述={数据存储名,含义说明,编号,数据流来源,数据流去向,组成:{数据结构},平均流量,高峰期流量}
- 数据存储:数据存储描述={数据存储名,含义说明,输入数据流,输出数据流,组成:{数据结构},存储的数据量,存储频度,存储方式}
- 处理过程:处理过程描述={处理过程名,含义说明,输入:{数据流},输出:{数据流},处理描述:{简要说明}}
- 数据项:数据项描述={数据项名,含义说明,数据类型,长度,取值范围,与其他数据项之间的逻辑关系}
- 需求规格说明书
- 系统概括,包括系统的目的、背景、范围、现状
- 系统功能需求说明
- 系统性能的要求,如精度、响应时间等。
- 运行环境的要求,如硬件、软件、接口等。
- 系统方案的可行性分析、实施方案等
- 使用【数据流图】描述【数据处理】
二、概念设计(自底向上进行 “现实世界抽象—概念模型设计”)
点击展开内容(多图)
- 概念模型(具有丰富的语义表达能力,易于理解、更改和转换)
- 实体—联系模型(E-R模型:实体、属性、实体类型、码、联系)
- 设计局部视图
- 标识及定义实体类型
- 标识及定义联系类型
- 确定属性
- 确定实体类型的码
- 绘制局部 E-R 图
- 视图集成
- 合并局部 E-R 图,生成初步 E-R 图
- 消除冗余,生成基本 E-R 图
引例:《汉语主题词表》OB 示例库
DIKW 金字塔,《图情档》学科体系和《数据库技术》
DIKW 金字塔(Data-Information-Knowledge-Wisdom-Pyramid)[4][5]
- 数据(Data):数据是描述事物的符号记录。【我个人认为数据属于感性认识中的感觉】
- 信息(Information):信息是具有时效性的有一定含义的,有逻辑的、经过加工处理的、对决策有价值的数据流。 【我个人认为信息属于感性认识中的知觉和表象。信息回答了是什么、是谁、什么时间和地点(What, Who, When, Where)的问题。】
- 知识(Knowledge):知识是被证立的真信念。对知识的更现代的定义则认为知识就是对相关关系、因果关系和逻辑关系的理解。【我个人认为知识属于理性认识。知识回答了怎么做(How)的问题。】
- 智慧(Wisdom):智慧是指识别和应用相关知识的能力。【我个人认为知识属于理性认识。智慧回答了为什么(Why)的问题和正确的怎么做(Why-How)的问题。】
图情档学科体系
- 图书馆学:图书馆学,是以满足人的信息需求为目的,研究文献、信息和知识的收集、组织与传播利用,图书馆管理,以及图书馆与社会的关系的一门管理科学。[6]【我个人认为这个学科侧重于知识管理】
- 情报学(信息学):信息学是研究信息的表示,获取,处理,传递和利用的规律性的一门新兴学科。信息学又称信息科学,旧称情报学。[7]【我个人认为这个学科侧重于信息管理】
- 档案学:档案学是旨在对文件从其形成之初到最终被销毁或作为档案永久保存的全过程进行监督控制,对档案信息资源进行开发利用,以守护国家、社会和组织的记忆,满足人们的信息和知识需求的专业。[8]【我个人认为这个学科侧重于数据管理】
数据库技术
- 数据库技术是信息系统的一个核心技术。是一种计算机辅助管理数据的方法,它研究如何组织和存储数据,如何高效地获取和处理数据。[9]【我个人认为这个学科可以用于计算机辅助管理和建设个人数据库】
G35 情报学、情报工作 笔记[10]
G35-K1 理论情报学
- 经验规律 5 条
- 3+3(信息基础论 决策系统论 科学交流论 规范论 原理论 信息栈论)
- DIJKW 逻辑链 马 6 条
- 情报学架构
- 方法论 1 个程式 2s2r 4 对范畴(归纳演绎 分析综合 定性定量 通用专用)
- 通用方法
- 哲学(新三论 旧三轮(系统论 控制论 信息论)
- 逻辑(形式 数理 辩证) 数学(数分 统分))
- 专门方法(引文分析 问卷调查 广义二重证据)
- 一个中心(情报传递(J. C))
- 三层逻辑结构(IJK x SCR)(基础层 实用层 理想层)
- 三个原则(资源 传递 服务)
- 一个应用体系 应用(科技 社科 专利 企业 军事……)
G35-K2 应用情报学
- 情报组织(分类 主题 索引文摘 元数据 语义网)
- 情报检索(原理 模型 系统设计 策略设计 类型和评价 发展特定和趋势)
- 情报分析(原则 流程 专用方法)
- 情报技术(数据库 数据仓库 数据挖掘 文本挖掘 大数据 情报支持技术)
- 情报素养(意识 能力 伦理 )
- 可视化 知识管理 竞争情报 影子团队 补充计量学 知识图谱
Obsidian Help. Create a base [EB/OL]. ()[2025-09-01]. Create a base - Obsidian Help ↩︎
陈立潮. 数据库技术及应用(SQL Server):面向计算思维和问题求解(第2版)/陈立潮主编 [M]. 北京:高等教育出版社, 2018.9 ↩︎ ↩︎
Wikipedia. Garbage in, garbage out - Wikipedia. ()[2025-09-01]. Garbage in, garbage out - Wikipedia ↩︎
Wikipedia. DIKW pyramid - Wikipedia [EB/OL]. ()[2025-09-01]. DIKW pyramid - Wikipedia ↩︎
知识管理觉行者(知乎用户 sunxz). 什么是数据、信息、知识和智慧? 怎么将数据、信息、知识转化为智慧? - 知乎 [EB/OL]. ()[2025-09-01] . https://zhuanlan.zhihu.com/p/632906242 ↩︎
百度百科. 图书馆学(中国普通高等学校本科专业)_百度百科 [EB/OL]. ()[2025-09-01]. 图书馆学(中国普通高等学校本科专业)_百度百科 ↩︎
百度百科. 档案学(中国普通高等学校本科专业)_百度百科 [EB/OL]. ()[2025-09-01]. 档案学(中国普通高等学校本科专业)_百度百科 ↩︎
百度百科. 数据库技术(信息系统的一个核心技术)_百度百科 [EB/OL]. ()[2025-09-01]. 数据库技术(信息系统的一个核心技术)_百度百科) ↩︎
叶鹰. 情报学基础教程(第三版) [M]. 北京:科学出版社, 2024.10 ↩︎