各位大佬,就是我想对OB中的笔记进行个分类编码,根据不同的大类建立不同的编码,为了方便计算机检索,因为我不是计算机专业的,想先建立编码规则,以后再学一门语言,进行高阶操作。举个例子,我设置了这样一个编码(引号里的内容)
“TH122-62_a_同步带尺寸选择_20230422174954 ”
对于此编码,“_”是作为不同层级编码的分隔号。
“TH122-62”是一级编码,采用中图法,TH122是机械设计,-62是总论复分表中代表的手册、名录、指南、一览表,年表分类号的意思,分配一文件夹。
“a”是二级编码,代表机械设计此大类下的分类,即同步带相关内容,且是卢曼编码,会有b作为a的同济分类,以及a1作为a的分支分类。
“同步带尺寸选择”是三级编码,是此篇笔记的名称,采用汉字,介绍这篇笔记讲的是什么,每篇笔记的名称字数长短都会不同。
“20230422174954”是四级编码,是创建笔记的时间戳,作为此篇笔记的唯一编码,如果发生了主题名称改变,失去的相关的链接关系,或者时间戳统计不同时间内,所做的哪些事情,比如汇总2月份的学习情况,进行总结反思,以及根据创立时间、艾宾浩斯曲线,创建复习计划。
这个是我根据@Shao Sen写的这篇文章,确立的编码。https://c94n0azlfu.feishu.cn/docs/doccnjKu95LMGcjN7ikEsGgosDe#
对于以上,我有以下疑问
1.对于编码的分隔号使用。
我本来是用的-,中图法中用-作为复分表连接符,因此我不能使用“TH122-62-a-同步带尺寸选择-20230422174954 ”这样子全是-连接的编码,是不利于计算机进行检索等功能,且容易发生混淆。中图法使用的标点有这些,
再加上win中文件名不能使用的字符有“\ / : * ? " < > | ”。
所以我打算采用非中图法所用的符号如“_”、“~”。
对于此点,我的问题有两个。
(1)对于“_”、“~”这两个符号,是否有利于编程进行检索等功能,在一些编程语言中,是否有其他特殊的功能?采取哪个更优?
(2)考虑到键盘输入的问题,“”、“~”、“-”三者中,还是“-”输入最方便,因此我想在我的知识库里,交换“-”和“~”的功能?也就是“~”作为中图法中的代表复分表连接符号的功能、“-”取代“”作为不同层级编码的分隔号?但之后想我的知识库和一些图书馆的数据库进行一些数据交互操作,两者的编码含义不同,是否会影响一些数据交互?
2.关于每级编码的位数问题,是否要统一长度?
由于中图法中,每种分类的所占字符数不同,由于长度不同,对于后续编程,如进行MOC汇总,数据统计是否有影响?
因为我知道每级编码的位数相同,是有利于编程的,我是否要建立位数的统一对齐,比如两个一级编码,一个是“TH122-62”,代表“机械设计手册”大类内容,“S123”,代表“光在农学上的应用”,当然还有更长的分类号,为了利于检索,我将一级编码扩充为10位,“TH122-62”变为“TH122-62@@”,“S123”变为“S123@@@@@@”,@只是起补位作用,也可以用其他符号代替,是否有这个补位必要呢?
3.关于时间戳的位置
由第二点提及到的问题延伸,也就是每级编码位数要保持一致,那么时间戳的位置必须要放在主题名的前面。像这样子排序,“TH122-62_a_20230422174954_同步带尺寸选择”,但因为我不想主题名称太放后面,编码实在长,后续不利于文件夹中阅读查找。
还有你可能会问,为什么不这样子排序“同步带尺寸选择_TH122-62_a_20230422174954”,这样给更好阅读,当然因为依照卢曼编码发挥文件加中文件排序的功能的缘故,“TH122-62_a_主题名1-20230422174954”、“TH122-62_a1_主题名2-20230422174954”、“TH122-62_b_主题名3-20230422174954”,比如,这三个文件夹放在文件夹中,这样子的话会依次排序,同类相近的笔记会摆放在一起。