引文分析法及其在图情学中的应用
2009/12/20 点击数:825
[作者] 柴苗岭
[单位] cc is here
[摘要] 文献计量分析法是以文献信息为研究对象,以文献计量学为理论基础的研究方法。用下图表示文献计量分析方法所包含的方法种类。
一、引文分析法相关概念
1.什么是文献计量分析法及方法体系
文献计量分析法是以文献信息为研究对象,以文献计量学为理论基础的研究方法。用下图表示文献计量分析方法所包含的方法种类。
插图
2.什么是引文分析法
citation analysis,即利用各种数学及统计的方法和比较、归纳、抽象、概括等逻辑方法,从引文入手,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。
3.引文分析法的历史背景
20世纪随书目学的出现,引文分析法也崭露头角。最早使用引文进行分析的是格罗斯,他于1927年对《化学教育》杂志刊登的文章首次进行引文分析。他通过选择期刊《化学教育》为来源,借助其中论文的引文文献,分析研究了某专业的现状。
4.为什么要引用文献
对开拓者的尊重;对有关著作给予荣誉;核对其所用的方法及仪器;提供材料背景;对自己的著作予以更正;对别人的著作予以更正;鉴定数据及物理常数等;核对原始资料中某个观点或概念是否被讨论过。对他人的优先权要求提出争议等。
5.引文分析的基本类型
1).出发点和内容来看:
引文数量分析:主要用于评价期刊和论文;研究文献情报流的规律等。
引文网状分析:主要用于揭示科学结构、学科相关程度和进行文献检索等.
引文链状分析:科技论文间存在着一种“引文链”,如文献A被文献B引,B被文献C引,C又被文献D引,等等。对这种引文的链状结构进行研究可以揭示科学的发展过程并展望未来的前景。
2).文献引证的相关程度来看:
自引分析:语种自引、著者自引、期刊自引、学科自引和时间自引。
自引率=主体引证自身的数量/该主体引证总数×100%
互引分析:语种的互引、期刊的互引、文献的互引等。
三引分析
6.引文的主要指标分析
1)引文年代分析。从时间的角度对引文分布规律进行分析,可以反映出被引文献的出版、传播和利用情况。特别在文献老化和科技史的研究中引文年代分布分析更是广泛应用。
2)引文语种分析。考察和分析引文语种的分布对于人们有计划地引进外文文献、译文选题、外语教育都有参考价值。
3)引文类型分析。通常的引文文献面很广,有期刊、图书、特种文献,近年来还有网络链接。
4)引文的国别分析。对国别及各国文献互引情况的统计分析,可以探明各国互引文献情况,弄清国际文献交流的数量和流向,研究各国的科学发展水平和技术实力,指定合理的技术引进政策有重要的意义。
7.引文测度常用的测度指标
1)引文率:期刊引文率等于该刊中参考文献的数量除以载文量。
2)期刊载文量:在抽样时间内,某刊登载论文的数量。
3)期刊被引量:在抽样时间内,某刊被别的期刊引用的数量。
4)期刊引用量:即某刊引用它刊的次数。
5)影响因子:是一种期刊中论文的平均被引率,等于期刊论文被引量与可引论文总数之比。
6)学科影响因子:测度某刊中论文被某一学科的核心期刊所引用的平均次数。
7)当年被引指数:用于测度期刊被利用速度的指标,一般为期刊某年发表的论文的当年被引用的平均次数。
8)引证系数和被引证系数:即各期刊或学科文献之间引用关系的测试度,可从引用或被引用的角度反映出科学文献相互引用的分类结构和关系。
8.引文分析的应用和评价
1)测定学科 的影响和重要性
2)研究科学结构
3)反映成果的学术价值以及期刊的学术地位,确定核心期刊
4)研究科学交流和情报传递规律,研究文献老化和情报利用规律,指导文献收藏
5)研究情报用户的需求特点
6)评估某一组织结构、国家和地区的科学能力和学术水平,评价人才
二、引文分析法在图情学中的实证分析
以CNKI数据库为检索工具,对1989年至2009年,标题为“引文分析法”的中文期刊全文数据库、中国优秀硕士学位论文、中国博士学位论文数据库进行了分析,共查到相关文献37篇,其中硕士级论文1篇,1989-1999年,论文总量23篇,2000至今共计14篇,如下图所示。其中,1989年-1999年,论文显示研究重点主要在期刊评价及馆藏建设方向,2000年以后则偏向利用引文分析法进行各方向的评价。按照两个时期的研究侧重点,本文选取了利用引文分析法进行馆藏及评价的两篇文章进行实例分析。
插图2
1.应用实例
1)馆藏工作的指导(90年代前后)
《用引文分析法确定地方专业图书馆工作重点的探索》选取年1987年至1996年年陕西林业科技共计40期, 统计各期有引文论文数、引文总量、各类型引文量、各语种引文量和引文年代, 将有引文的论文数作为基础进行分析的。
分别对:
插图3
2)学术影响力评价(2000年以后)
以中国引文数据库为基础,以《中州学刊》为例,对该刊5年间各栏目发表论文的分别统计发文量、被引量、被引频次,以被引率和篇均被引频次为评价指标, 比较各栏目的学术影响力。结果表明,用论文被引率作为各栏目学术影响力的评价指标,可以定量而客观地评价社科学术期刊各栏目的学术影响力,社科学术期刊栏目的学术影响力的大小与各栏目发文量的大小不存在一一对应关系。
插图4
2.引文分析工具
1)常用的国外数据库
ISI Web of Science
由三个独立的数据库组成(既可以分库检索,也可以多库联合检索) ,分别是Science Citation Index Expanded (简称SCI Expanded)、Social Sciences Citation Index(简称SSCI)和Arts & Humanities Citation Index(简称A&HCI)。内容涵盖自然科学、工程技术、社会科学、艺术与人文等诸多领域内的8,500多种学术期刊。
该数据库在引文分析功能上有以下特点:
1. 通过引文检索功能可查找相关研究课题各个时期的文献题录和摘要。
2. 可以看到论文引用参考文献的记录、论文被引用情况及相关文献记录。
JCR
数据来源于ISI建立的科学引文数据库(Science Citation Index,SCI)、社会科学引文数据库(Social Sciences Citation Index,SSCI),期刊范围涉及200多个专业研究领域,通过文献计量学的方法,对引文数据库的来源期刊进行引用频次和发表论文数量的统计,从被引频次、影响因子、立即影响指数、当年发文量、被引半衰期等方面提供评价期刊的定量依据,同时对7000余种期刊进行了出版信息的详细描述,内容涉及出版商、出版地、出版国、出版频率、期刊标准刊号(ISSN)、期刊使用语言和期刊分类。
2) 国内的引文分析工具
中国科学引文数据库( CSCD )
由中国科学院国家科学图书馆创建于1989年,是我国第一个引文数据库收录我国数学、物理、化学、天文学、地学、生物学、农林科学、医药卫生、工程技术、环境科学和管理科学等领域出版的中英文科技核心期刊和优秀期刊千余种,目前已积累从 1989 年到现在的论文记录300 万条,引文记录近 1700万条。实现了网络平台,并与Thomson-Reuters Scientific合作,目前以ISI Web of Knowledge为平台,实现与Web of Science的跨库检索
中文社会科学引文索引(CSSCI)
由南京大学中国社会科学研究评价中心开发研制的数据库,用来检索中文社会科学领域的论文收录和文献被引用情况。利用CSSCI的“来源文献检索”,读者可以检索到包括普通论文、综述、评论、传记资料、报告等类型的文章。利用CSSCI的“被引文献检索”,读者可以检索到论文(含学位论文)、专著、报纸等文献被他人引用的情况。
三、引文分析法的前沿研究
1.各类研究方法的引入
引文可视化研究
引文分析是文献计量学揭示学科规律的重要方法,科学文献或作者间的引用与被引用关系构成了引文网络.引文分析可视化研究旨在探讨如何利用计算机系统设计的方法和工具,把引文网络以一种直观网络图的形式显示出来,为学者提供引文分析的可视化查询和分析平台。
在这里需要对科学可视化图谱进行一个解释.科学知识图谱是显示科学知识的发展进程与结构关系的一种图形。它的悄然兴起,一方面是揭示科学知识及其活动规律的科学计量学从数学表达转向图形表达的产物,另一方面又是显示科学知识地理分布的知识地图转向以图象展现知识结构关系与演进规律的结果。
网络引文分析研究
网络引文分析的开创性研究始于1996年,Larson 采用同被引和多维向量描述了地球科学网页之间的关系。近年的网络引文分析研究主要就站点和网页之间的链接关系和进行研究。主要研究网络上的信息组织规律和传播方式,目前研究最多的是链接分析法。通过网页上的链接可以定量分析网站、学科、机构或者地区之间的相互引用关系——网络影响因子(WIF)。
目前的热重点之一是研究open access下资源的网络引用关系,进而起到评价和规范开放资源的作用。
四 引文分析方法的缺点及解决方法
1.引文分析法的缺点
文献被引用并不等于重要,引用动机复杂造成引文重要程度不均衡。如观点错误或有争议的论文,重要但过于专深的。
受到文献可获取性的影响。
引用关系存在假联系。
文献引用上存在马太效应。引文分析法是形式上的分析方法是定量的方法。存在着知识信息的表达和组织物理层次化。
2.解决方法
引文分析上从物理层次的文献单元向知识单元和情报单元转换;知识的计量上从语法层向语义和语用层转换。
引入其他的定量分析法,如:内容分析法。
引入定性分析法。
需要指出的是,本文对引文分析法的前沿研究的归纳是基于网络文献的调研,仅是一家之言;在引文分析法的实证研究部分,仅对CNKI中“引文分析法”为关键词,且题名符合的才予以统计,方法比较简略,可能在研究趋势的百分比例上存在一定偏差。