我要投稿 投诉建议

中医学学科交叉信息发现及可视化研究

时间:2022-07-29 00:32:29 毕业论文范文 我要投稿
  • 相关推荐

中医学学科交叉信息发现及可视化研究

  第一章绪论

中医学学科交叉信息发现及可视化研究

  中医药是中国民族优秀文化的精粹,是当今中国医药事业中独具特色和优势的重要组成部分,对于丰富世界医学宝库、保护人类健康,具备积极的作用。「5]新形势下,我国中医学领域的相关研宄在注重继承经典的同时,同样注重与西方医学、药学、预防医学、信息学、生物学等学科的交叉融合,进而形成新的学科增长点,在学术研宄领域的直接表现为:研究主题跨双学科或多学科的学术论文的发表。基于此背景,为探宄我国中医学学科发展现状及其与医药卫生类其他学科交叉的程度,进而了解我国中医学交叉学科研宄热点、发展趋势、知识源流及核心团队,为中医学研究者确定研宄方向提供决策支持,寻找我国中医学新的学科增长点,最终促进我国中医药事业的发展,本文拟借助海量文献题录信息及引文资料为基础数据源,通过数据采集、加工、清洗后建立中医学学科交叉文献题录及引文数据仓库,以知识发现为主要技术手段对中医学学科交叉知识进行关联、聚类分析,以统一解决上述问题,并将相关过程及结果以可视化的方式呈现。

  ......

  第二章数据来源及处理

  2.1 GMSCI数据库构建

  笔者所在研究团队以C#为编程语言,设计期刊论文元数据自动抽取系统,完成原始数据的采集工作。电子期刊为传统纸质期刊在网络时代的延伸,其采用与传统纸质期刊相类似的布局和格式,以符合读者的阅读习惯,提高用户满意度。主要表现有:标题居中显示、标题字体大于正文字体、作者名称位于其下一行,参考文献列表位于整篇论文靠后位置等。基于电子期刊网络数据库的高度相似的布局格式,设计统一的电子期刊论文网页元数据自动抽取系统对期刊论文的元数据自动釆集能够节省大量时间成本,提高信息采集的效率。2010年,笔者所在项目组完成了该系统的设计,测试等工作,其功能模块划分如图2-1所示:需要说明的是:系统功能结构模块中,特别设定了手工修正模块,以应对网页元数据抽取过程的对部分原始数据不能识别的问题,保证所有的处理格式和规范均按照统一的标准进行,最大限度保证数据的准确性和完整性,同时也为后期

  的数据校对工作提供便利。

  2.2中医学学科交叉文献数据仓库构建

  国内外学术期刊要求投稿论文应按指定分类法注明其分类号。我国国家标准GB7713-87要求学术期刊论文,应注明《中国图书资料分类法(第四版)》所提供的分类号,同时尽可能注明《国际十进分类法》的分类号。若论文涉及多学科,可同时标注多个分类号,第一个为主分类号。笔者从《中国图书资料分类法》(第四版)中所获得医药卫生类学科分类号如附录1所示,基于此发现,医药卫生类学科分类号均以英文字母“R”幵头具有良好的辨识性。需要说明的是:CMSCI数据库中文献基本信息来源于万方、维普及中国知网3大中文数据库,其所收录的部分期刊著录格式中未包含分类号字段,但3大数据库提供商基于文献的标题、摘要及关键词字段对中图分类号进行了机器标注,笔者在数据采集的过程中首先最大限度的采集发文作者自行标注的原始分类号,若作者未对中图分类号进行标注,则采集机标分类号。

  第三章中医学学科交叉领域文献计量学分析.......... 22

  3.1发文年度分析....... 22

  3.2刊载期刊分析....... 23

  3.3学科交叉发文网络分析 .........24

  3.4基金资助分析....... 27

  第四章中医学学科交叉领域知识发现分年度分析.......... 30

  第五章中医学学科交叉领域知识发现综合分析 .........58

  5.1 2004-2012年中医学学科交叉领域研宄热点分析 ......58

  5.2 2004-2012年中医学学科交叉领域知识源流分析....... 62

  第五章中医学学科交叉领域知识发现综合分析

  5.1 2004-2012年中医学学科交叉领域研究热点分析

  笔者将第4章中2004-2006年、2007-2009年及2010-2012年数据3个时间片区的关键词数据整合后得到2004-2012年9年度的中医学学科交叉领域关键词的基本集合,并将该集合导入CiteSpace软件中。经过相关初始设置,选择2004-2012年所有数据,以3年为时间切片,经过多次实验模拟最终确定闽值插值组合为(24,1,2),(26,1,3),(20,1,2)最终得到78个关键词节点及105条关键词连接线,模块化值为0.7996,经聚类后共得到9类关键词子网,所形成的包含聚类标签及节点标签的知识图谱如图5-1所示。在图5-1中,节点大小与其代表的关键词9年的总词频成正比,节点外圈圆环的颜色代表其出现的年度信息,最内层外圈颜色代表该节点首次出现的年度或年度区间,由于笔者选择3年为时间切片,因此节点外圈代表年度旳颜色光环最多具有3层,对应圆环的厚度与节点在该时间片段的词频成正比。

  5.2 2004-2012年中医学学科交叉领域知识源流分析

  图中通过文献被引次数控制节点大小,所有节点标签设置为统一大小,节点之间连线颜色代表两篇文献首次共被引的时间片段旳起始年度,连线的粗细代表共被引次数的多少。具有紫色光环的节点代表其在共被引网络中具有较高的中介中心度,紫色光环的厚度越厚代表其中介中心度越大。为对全年度共被引知识图谱进行进一步的解读,笔者统计了被引次数高于20次的被引参考文献的、中介中心度、出版或发行年度、聚类号等基本信息如表5-2所示,并将其与图5-2结合,综合分析出2004-2012年中医学学科交叉文献的重要知识源流及知识基础。

  ........

  第六章结语及展望

  6.1研究结论

  本文以中医学学科交叉文献为主要研宄对象,首先基于文献计量学中发文指标、基金资助、刊载期刊等角度对2004-2012年中医学交叉学科领域的基本信息展开分析,揭示中医学学科交叉领域文献的基本特征;基于此借助可视化中的知识图谱技术,基于CiteSpace及Pajek两款信息可视化软件,从研宄热点、研宄基础、作者共被引网络、作者科研协作网络等维度对中医学学科交叉领域相关知识进行揭示。考虑到研究热点、知识源流具有高度的时间稱合性,笔者首先将2004-2012年9年数据等分为3个时间片区,分别发现其研宄热点、知识源流,继而对整个时间片段进行了综合分析,直观展现中医学学科交叉研宄领域的主题演化、知识源流演进过程,并在此基础上对中医学学科交叉研宄领域内的作者科研协作网络及作

  者共被引网络进行揭示。

  6.2研究局限及展望

  本文对中医学学科交叉知识所进行的研究中存在着诸多不足之处,主要体现为:(1)本文以CMSCI数据库为数据源,该数据库以《北京大学中文核心要目总览(2011版)》为原始数据采集样本,尚未有效组织医药卫生领域内所有期刊论文元数据,该问题将会对数据分析的客观性产生一定的影响;(2) 2004-2012年《北京大学中文核心要目总览》存在2004版、2008版及2011版3个版本,版本多变对数据采集及组织过程提出了较高的要求,海量信息的采集、组织、人工内省、校对及清洗过程中,极易产生谬误;(3) CMSCI数据库主要针对于医药卫生类文献的题录及参考文献数据进行数据收集、组织,尚未囊括哲学、生物学类等与中医学发展联系较为紧密的期刊信息,齿此本文仅局限于中医学与医药卫生类学科之间的交叉知识发现,未对中医学与非医药卫生领域学科之间的知识交叉展开研究。

  .............

  参考文献(略)

【中医学学科交叉信息发现及可视化研究】相关文章:

小学数学学科研究心得02-09

中医学术论文摘要的写作与翻译研究论文08-20

信息技术学科工作总结04-14

信息技术与学科融合的教学设计05-19

信息技术与学科融合教学设计02-11

信息技术学科教学设计01-11

小学信息技术学科工作总结03-08

信息技术与学科融合教学设计集合05-19

信息技术与学科融合教学设计通用05-16

信息技术学科个人工作总结03-29