科技信息分析从单一维度到多维复合的演进<sup(2)
【作者】网站采编
【关键词】
【摘要】在研究方法上,基于研究者和机构的科技信息分析,相比基于文献核心词的科技信息分析更适合于社会网络分析中关于行动者的设定。研究数据来源多为科
在研究方法上,基于研究者和机构的科技信息分析,相比基于文献核心词的科技信息分析更适合于社会网络分析中关于行动者的设定。研究数据来源多为科学文献的作者署名信息,这使得其中的网络分析通常以1-模网络为基础,研究工作的数据维度与分析维度相对单一。仅有少数的研究工作涉及文献署名与科研绩效指数两种不同的数据维度。
1.4 基于专利技术的科技信息分析
专利技术连接基础研究与实际应用,也是衡量科学技术发展水平的重要指标。基于专利技术的科技信息研究更倾向于科技创新的落地应用,由此也带来了技术保护与技术竞争等问题。因此,专利技术分析是科技信息分析中最常见的分析视角。早期基于专利技术的科技信息研究主要集中在新技术开发与传播等方面[13];近年来,随着科学技术商业环境中竞争态势的加剧,专利技术价值与保护[14]、专利审查与诉讼[15]等与技术竞争和知识产权相关的研究工作逐渐增加。
这部分研究工作的相关数据大多来自专利文献中的发明人、申请人、IPC分类号、专利授权机构等形式特征,但是由于专利的可转让性等原因,同一项专利可能会出现申请人、持有人等并非一致的现象。因此,许多研究工作将复杂网络分析与数据挖掘技术结合使用,其中一些研究涉及2种数据维度。此外,不同的专利授权机构往往对专利文献的标准格式要求存在差异,自然语言处理技术被较多地应用于基于专利技术的科技信息分析。
2 多维复合的科技信息分析
随着科学技术的发展以及研究工作的深入,研究者逐渐意识到仅凭单一维度的数据和单一维度的研究视角很难对科学活动背后潜在的模式与规律给予更全面的洞察。尽管网络科学(复杂网络、社会网络)理论与方法的引入在一定程度上丰富了研究工作的分析视角,但是数据维度的单一性仍然在一定程度上限制了在具体研究工作中展开多维复合分析的空间。大数据思维的兴起,为解决这一局限提供了新的思路。人们在关注数据体量、处理速度、价值密度的同时,也对4V(Volume、Velocity、Variety、Value)中的多样性(Variety)给予了高度重视。数据的多样性能够为研究工作注入多维度的信息,还能在多个维度之间实现交叉复现。学术界逐渐产生从多个视角对科技信息展开研究的相关成果。这些研究工作超越以往单一维度的科技信息分析,考虑多维度之间的相互关联与扰动。
2.1 简单的多维科技信息分析
多维复合的科技信息分析首先是研究数据的多维性。早期简单的多维科技信息分析主要包括基于多数据源同一维度的科技信息分析,以及基于同一数据源的科技信息多维分析。
学术界众多的科学文献数据库各有侧重,单纯以某一数据库作为数据源或多或少都会存在一定的疏漏。因此,学术界在科技信息研究的过程中已经开始重视多源数据对研究工作的有效支持,力图通过多个数据源整合后的信息资源对研究问题建立更全面的认识。较早的基于多数据源的科技信息分析常采用整合多个文献数据库(如Web of Science、Scopus)的方法,虽然涉及多库整合,但主要还是以科学论文为基础,数据具有明显的同质性。随着研究工作的开展,此类研究的数据源已经不再局限于科学论文数据,其中比较典型的多数据源整合包括科学论文与专利文献的整合[16],科学论文与商业报告的整合[17],以及科学论文与政府公报和行业新闻的整合[18]等多种形式。此类研究多以更全面地识别领域知识或技术前沿为目的。尽管不同数据源中的数据维度可能存在差异,但是通过特征词(如关键词)的提取与匹配,通常可以满足单一维度分析的任务需求。研究中通常需要面对文献归类与去重问题,涉及到不同语种数据源还要面对跨语言处理问题。由于不同数据源题录格式的差异会给文献归类与去重工作造成一定的困扰,而且跨语言处理目前仍然需要一定程度的人工介入。因此,其中跨语言文献间的内部关联识别成为研究工作的难点。
基于同一数据源的科技信息多维分析不需要多库或跨库检索。相对于多数据源同一维度的科技信息分析而言,基于同一数据源的科技信息多维分析关注的重点在于不同维度数据之间的关联与扰动。由于在数据获取方面具有一定的便捷性,此类研究目前积累了较多的研究成果,包括基于“作者-关键词”“合作关系-作者水平”“作者-机构-国家”“作者-时间-关键词”“机构-主题-地区”“作者-论文-关键词-期刊-基金”“学科-地区”“学科-时间-出版机构”“基金-学科-国家-合作-引文”“发明人-申请人-IPC分类号-授权机构”“博主-博文-评论-推荐-访问量”等诸多不同维度数据的科技信息分析[19-22]。这类研究中,分析工作往往涉及多个维度,包括2-模网络、3-模网络等网络分析的方法被大量应用。尽管其中不同维度之间关联关系的识别尚处于较浅的层面,但是跨维度的关联与扰动分析已经初见端倪。
文章来源:《江苏科技信息》 网址: http://www.jskjxx.cn/qikandaodu/2020/1005/490.html