一、高校医学学报关键词标引质量分析与探讨(论文文献综述)
武华维[1](2020)在《基于主题模型与知识图谱的电子公文主题标引方法研究》文中研究指明世界已经从信息时代逐步进入到大数据时代,海量数据中很大一部分是用自然语言记录的文本数据。而电子公文作为文本数据类型的一种,它是政府机关、企事业单位等形成、具有法律效力和规范体式的数字形式的文件。历年累积的电子公文归档保存后一般按照内容进行人工主题标引、分类组织或者建立专题数据库以方便检索和开发利用。但人工标引主题方式存在劳动量大、速度慢、标引不一致等弊端,因此需要研究电子公文主题自动标引方法。针对非结构化公文的主题分析和标引问题,本文提出一种融合主题模型和知识图谱技术的电子公文主题自动标引方法,与当前存在的主题自动标引方法相比,它将电子公文文档集作为一个整体识别主题,基于主题词表构建外部知识库以实现对识别的主题用规范化的正式主题词和范畴进行统一标引。本文研究的内容包括以下三个方面:(1)基于主题模型的电子公文主题分析研究。从整体的视角进行电子公文的主题分析,应用多种自然语言处理技术将其转换成文档语料库,采用主题模型进行主题识别与分析,包括融合主题词表语义特征和通用主题模型进行主题识别,以及综合共词网络特征和层次主题模型进行主题层次结构分析。(2)基于知识图谱的主题词表语义自动转换研究。基于知识图谱建立机器可识别的主题知识库,弥补主题模型方法在非结构化文本的主题标引中存在的背景知识不足问题,以增强主题标引的语义性。在主题词表语义化表示及知识图谱技术的基础上,构建一种利用知识图谱技术对传统纸质载体的叙词表进行语义化自动转换的方法,为电子公文主题的标引奠定坚实的知识基础。(3)电子公文主题标引研究。提出综合应用主题模型和主题词表知识图谱进行电子公文主题标引的方法。在应用主题模型进行主题分析的基础上,运用知识图谱技术借助主题词表外部知识来进行主题的标引工作,使用正式主题词及范畴进行规范、控制和统一组织。具体包括基于LDA和知识图谱的电子公文主题标引、基于hLDA和知识图谱的电子公文主题标引。本文创新点和贡献主要有:(1)对电子公文主题标引这一传统实践问题,提出了综合应用主题模型和知识图谱技术进行自动化标引的方法。将应用主题模型进行文本主题分析的数据类型扩展到电子公文灰色文献类型,应用知识图谱技术建立主题词知识库,为正式主题词标引工作提供了现代化的标引工具和知识服务。(2)提出从纸质版主题词表到网络知识库的语义化转换的方法。设计了面向电子公文主题自动标引的主题词表SKOS数据模型描述方案及其自动转换算法,设计了RDF/N3主题词表关联数据自动转换成知识图谱算法,并用Python编程语言实现上述算法。(3)完成《中国档案主题词表》语义转换任务,将其主表和范畴表部分的所有内容从传统纸质媒介形式转换成为图数据库存储的知识图谱形式,为图书、情报和档案学术界和管理实务界贡献了重要的基础数据集。本论文包括图40幅,表17个,附录3个
屈李纯,霍振响[2](2019)在《科技论文关键词“不关键”原因探析》文中研究表明在中国学术期刊全文数据库中,对农业科技类目中农艺学、植物保护、农作物和园艺4个学科领域刊文的关键词进行调查分析,发现这4个学科论文中出现频次排名前40的关键词中有较多的泛化关键词出现,主要表现为从论文题名中抽取关键词但漏标主题内容、关键词标引顺序和逻辑关系混乱等问题。要杜绝泛化关键词,需要及时修订或制订操作性强的科技论文关键词选取标准和规范,作者和期刊编辑对科技论文关键词的重要性要有正确的认识,高度重视论文关键词的标引工作,科技期刊编辑部可结合自己期刊刊文的学科特点,在编校规范中对关键词的标引提出可操作性的规范和要求。
张红霞,冀伦文,贾丽红,王晶冰[3](2018)在《信息传播视角下学术论文关键词标引方法与策略》文中认为【目的】探寻实用有效的关键词标引方法,以期解决关键词标引不正确的问题。【方法】参考GB/T 3860—2009《文献主题标引规则》,结合中国知网的中国学术期刊全文数据库,从信息传播视角探讨关键词标引方法的科学性与合理性。【结果】提出关键词标引的步骤:通过主题分析,用研究对象、研究方法、结果结论、其他重要信息4个要素来确定主题概念;采用组配、上位词等方式把主题概念转换为关键词;借助学术期刊全文数据库对所选关键词进行辅助性审核和修改。【结论】科学、合理地标引关键词有助于提升文献利用率和期刊学术影响力。
王大伟[4](2016)在《基于共词分析的档案学关键词规范化研究》文中研究表明关键词是学术文献表达研究主题的检索标识,为规范档案学专业关键词标引。本文分析了2016年5月8日于CNKI检索到的档案学研究领域的相关文献25990篇,运用共词分析方法,对部分文献关键词的不规范使用进行了分析,阐述了规范关键词标引的原则、方法和相关建议。
戴旸[5](2015)在《学术论文关键词“泛义”现象观察与分析》文中研究说明关键词是学术论文的主要组成部分之一。关键词标引的规范,是影响学术论文检索效率的重要因素。但是,词义模糊宽泛,专指性差的泛义词被频繁用于关键词标引的"泛义"现象,却成为当前一个较为严重的问题。本文在调查这一现象存在状况的基础上,深入分析其主要表现形式和不良影响,进而探寻出切实可行的解决对策。
叶济蓉[6](2014)在《高校学报农科类学术论文关键词的标引》文中认为统计分析出高校学报农科类学术论文关键词标引常出现以下问题:关键词抽取较随意,未能全面、准确标引;关键词抽取出现的各种错误;关键词的数量和排序不符合要求等。结合实例,指出了更正这些问题的办法,并给出了提高论文关键词标引质量的建议。
李静,董良广,游苏宁[7](2012)在《《中国科技期刊研究》2006年至2011年载文关键词分析》文中研究表明通过对《中国科技期刊研究》2006年至2011年发表文献关键词进行统计分析,探讨近几年我国科技期刊研究领域的热点问题,并用语义网络全面的表达该领域的组成及特点,预测今后几年我国科技期刊的发展方向。
倪向阳,马永军[8](2011)在《科技期刊的关键词标引质量凾待提高——从《编辑学报》《中国科技期刊研究》的标引现状谈起》文中研究指明关键词是文献检索的主要入口之一,它能直观地反映主题,便于读者检索。其标引质量的高低直接影响到科技文献的有效传播和高效利用,影响着整个信息传播系统的优劣。对其传播效果进行分析,能更好地指导传播实践活动,促进科技期刊的编排质量和学术质量的不断提高。
倪向阳,马永军[9](2011)在《科技期刊关键词的标引及其信息传播生态效果》文中指出"在最宽泛的意义上,传播生态指的是信息技术、各种论坛、媒介以技信息渠道的结构、组织和可得性。"也就是说,所谓传播生态基实就是传播行为发生的具体环境,这种环境除了人自身的因素外,最重要的是信息技术媒介的特性,信息技术的开放性和易接近性使得人们能够非常容易地获取信息、交流信息,在人与信息技术的互动过程中,传播生态环境逐渐形成,而一旦这种环境成为另一种"实在",它就对现实环境产生影响。
赵智岗,王长青,袁庚申[10](2010)在《我国体育核心期刊关键词标引分析》文中研究指明运用文献资料法,以2008年13种体育核心期刊为样本,对所抽查各期的每篇论文的关键词标引进行统计分析。发现在关键词标引数量上基本符合国家标准要求,略显低平,存在着关键词标引主题不清、重复、泛意词多、漏标、概念专指性差等问题。应引起作者与编者的重视,加强关键词标引环节管理检查,提高期刊质量。
二、高校医学学报关键词标引质量分析与探讨(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、高校医学学报关键词标引质量分析与探讨(论文提纲范文)
(1)基于主题模型与知识图谱的电子公文主题标引方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究内容 |
1.2.1 研究问题 |
1.2.2 研究对象 |
1.2.3 研究内容 |
1.3 研究思路与方法 |
1.3.1 研究思路 |
1.3.2 研究方法和工具 |
1.4 论文结构与创新点 |
1.4.1 论文结构 |
1.4.2 论文创新点 |
第2章 相关研究现状 |
2.1 主题标引的相关研究 |
2.1.1 主题标引的基本概念 |
2.1.2 主题标引的演进历史 |
2.1.3 主题标引的技术方法 |
2.2 主题模型的相关研究 |
2.2.1 主题模型概述 |
2.2.2 主题模型应用研究 |
2.3 研究述评 |
第3章 研究框架 |
3.1 研究设计 |
3.2 研究整体框架 |
3.2.1 自由文本数据和词典数据的预处理 |
3.2.2 电子公文文档集主题识别和分析 |
3.2.3 主题词表语义转换 |
3.2.4 电子公文主题的自动标引 |
3.3 数据集的构建与清洗 |
3.3.1 实证数据 |
3.3.2 验证数据 |
第4章 基于主题模型的电子公文主题分析研究 |
4.1 融合主题词表语言特征和通用主题模型LDA的主题分析 |
4.1.1 研究方法及流程 |
4.1.2 实证研究 |
4.2 融合共词网络特征和层次主题模型hLDA的主题分析 |
4.2.1 层次主题模型及共词网络概述 |
4.2.2 研究方法及流程 |
4.2.3 实证研究 |
4.3 小结 |
第5章 基于知识图谱的主题词表语义自动转换研究 |
5.1 主题词表及语义转化的理论研究 |
5.2 研究方法及流程 |
5.2.1 分析主题词表构成及其语义关系类型 |
5.2.2 构建基于SKOS数据模型的语义转换映射方案 |
5.2.3 主题词表的SKOS语义自动转换 |
5.2.4 SKOS语义化主题词表自动转换知识图谱 |
5.3 实证研究 |
5.3.1 数据来源 |
5.3.2 分析结果 |
5.4 小结 |
第6章 综合应用主题模型与知识图谱的电子公文主题标引研究 |
6.1 基于LDA和知识图谱的电子公文主题标引研究 |
6.1.1 方案及流程 |
6.1.2 实证研究 |
6.1.3 有效性分析 |
6.2 基于hLDA和知识图谱的电子公文主题标引研究 |
6.2.1 方法及流程 |
6.2.2 实证研究 |
6.2.3 有效性分析 |
6.3 有效性验证 |
6.4 总结 |
第7章 总结与展望 |
7.1 总结 |
7.2 不足与展望 |
参考文献 |
附录1 实证数据 |
附录2 验证数据 |
附录3 主题词表数据 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
(2)科技论文关键词“不关键”原因探析(论文提纲范文)
1 农业科技类论文关键词标引现状 |
2 科技论文中关键词标引“不关键”的表现 |
2.1 泛化关键词不完全受到关键词数量要求的影响 |
2.2 因从论文题名中抽取而漏标主题内容 |
2.2.1 忽略了反映文章主题内容的重点词 |
2.2.2 对论文题名的切分太细,导致泛化词出现 |
2.2.3 从论文题名中选取具体名称而忽略了主题词 |
2.3 关键词标引顺序和逻辑关系混乱 |
3 科技论文关键词“不关键”的原因解析 |
3.1 论文关键词标引缺少指导规范 |
3.2 作者对论文关键词标引不熟悉 |
3.3 学术期刊编辑“忽视”关键词编校 |
4 研究论文关键词“不关键”的对策 |
4.1 修订规范,加强培训 |
4.2 加强沟通,规范选取 |
4.3 提高认识,重视编校 |
5 结束语 |
(3)信息传播视角下学术论文关键词标引方法与策略(论文提纲范文)
1 关键词标引方法与步骤 |
1.1 通过分析论文主题确定主题概念 |
1.2 将主题概念转换成关键词 |
1.2.1 主题概念转换成关键词的必要性及转换方式 |
1.2.2 主题概念转换成关键词的注意事项 |
1.3 借助数据库审核和修改关键词 |
2 实例说明 |
3 结语 |
(4)基于共词分析的档案学关键词规范化研究(论文提纲范文)
一、相关概念 |
(一)共词分析 |
(二)关键词 |
二、实证研究 |
(一)数据来源 |
(二)研究方法 |
(三)数据检验 |
1. 词义混用 |
2. 达意宽泛 |
3. 分类不当 |
(四)数据分析 |
三、规范关键词 |
(一)规范原则 |
(二)明确方法 |
(三)相关建议 |
四、结束语 |
(5)学术论文关键词“泛义”现象观察与分析(论文提纲范文)
一、学术论文关键词“泛义”现象调查 |
二、学术论文关键词“泛义”现象解析 |
三、学术论文关键词“泛义”现象透视 |
四、学术论文关键词“泛义”现象对策探析 |
(6)高校学报农科类学术论文关键词的标引(论文提纲范文)
1 关键词标引的主要问题 |
1.1 关键词抽取较随意, 未能全面、准确标引 |
1.2 抽取关键词出现的错误 |
1.2.1 抽取的关键词不规范 |
1.2.2 抽取的关键词为复合词 |
1.2.3 抽取的关键词为非公认公用的缩写词 |
1.2.4 抽取的关键词没有检索意义 |
1.3 关键词的数量和排序不符合要求 |
2 建议 |
(7)《中国科技期刊研究》2006年至2011年载文关键词分析(论文提纲范文)
1 引言 |
2 数据与方法 |
3 结果与分析 |
3.1 发表文献数量及关键词标引变化 |
3.2 文献标引深度分析 |
3.3 高频次关键词分析 |
3.4 关键词共现分析 |
4 结语 |
(8)科技期刊的关键词标引质量凾待提高——从《编辑学报》《中国科技期刊研究》的标引现状谈起(论文提纲范文)
1 关键词标引的现状 |
2 关键词的传播效果 |
3 关于关键词标引质量的思考 |
(9)科技期刊关键词的标引及其信息传播生态效果(论文提纲范文)
一关键词的传播信息生态链 |
二关键词的传播生态效果 |
1. 正确标引关键词的理想模式 |
2. 关键词的标引现状 |
三关键词的信息传播生态效果的启示 |
(10)我国体育核心期刊关键词标引分析(论文提纲范文)
1 研究对象与方法 |
1.1 研究对象 |
1.2 研究方法 |
2 研究结果与分析 |
2.1 关键词标引数量 |
2.2 关键词标引来源 |
2.3 关键词标引分析 |
2.3.1 关键词标引总体情况 |
2.3.2 关键词标引存在的主要问题 |
2.3.2.1 上位词运用宽泛, 首标关键词标引主题不清 |
2.3.2.2 关键词标引不全 |
2.3.2.3 泛意词为关键词 |
2.3.2.4 关键词重复标引 |
2.3.2.5 行业专用英语术语、缩略语、方法等关键词的标引问题 |
2.3.2.6 省市作为地名关键词标引时不统一 |
2.3.2.7 关键词的选定组配与标引专指性差 |
2.3.3 存在问题的主要原因 |
3 结论与建议 |
四、高校医学学报关键词标引质量分析与探讨(论文参考文献)
- [1]基于主题模型与知识图谱的电子公文主题标引方法研究[D]. 武华维. 中国科学院大学(中国科学院文献情报中心), 2020(01)
- [2]科技论文关键词“不关键”原因探析[J]. 屈李纯,霍振响. 编辑学报, 2019(05)
- [3]信息传播视角下学术论文关键词标引方法与策略[J]. 张红霞,冀伦文,贾丽红,王晶冰. 中国科技期刊研究, 2018(12)
- [4]基于共词分析的档案学关键词规范化研究[J]. 王大伟. 管理观察, 2016(23)
- [5]学术论文关键词“泛义”现象观察与分析[J]. 戴旸. 中州大学学报, 2015(04)
- [6]高校学报农科类学术论文关键词的标引[J]. 叶济蓉. 学报编辑论丛, 2014(00)
- [7]《中国科技期刊研究》2006年至2011年载文关键词分析[J]. 李静,董良广,游苏宁. 中国科技期刊研究, 2012(03)
- [8]科技期刊的关键词标引质量凾待提高——从《编辑学报》《中国科技期刊研究》的标引现状谈起[J]. 倪向阳,马永军. 编辑学报, 2011(04)
- [9]科技期刊关键词的标引及其信息传播生态效果[J]. 倪向阳,马永军. 编辑之友, 2011(07)
- [10]我国体育核心期刊关键词标引分析[J]. 赵智岗,王长青,袁庚申. 首都体育学院学报, 2010(02)
标签:中国科技期刊研究论文; 语义分析论文; 文献研究法论文; 主题模型论文; 论文论文;