[论文关键词]引文分析网络信息计量网络链接分析
[论文摘要]引文分析是传统文献计量学和科学计量学的一种独特研究方法。主要从网络链接分析研究、基于网页链接分析的搜索引擎排序算法研制和新型网络引文索引工具的编制等方面,分析论述引文分析方法在网络环境下的发展和应用,以期形成对引文分析方法及其价值的合理认知和评价。
1、引 言
所谓“引文分析(Citation Analysis)”,是指利用各种数学和统计学的方法,以及比较、归纳、抽象、概括等逻辑方法,对学术期刊、论文、著者等各种对象的引用与被引用现象进行分析研究,以便揭示其数量分布特征和内在关联规律的一种文献计量研究方法。
追溯引文分析思想的渊源,最初的相关活动都出现在法学领域。特别是1873年美国出版的专供律师查阅法律判例的检索工具――“Shepard’s Citations”,对后来引文分析工具的研制产生了直接而重要的影响。1927年,美国的Gross夫妇对化学专业期刊论文的参考文献进行统计分析,得出了化学教育方面的核心期刊表,成为文献工作中的第一次引文分析实践。1961年,E,Garfield经过多年思考和苦心钻研,开始编制并出版“Science Citation Index(简称SCI)”,为期刊文献引文分析研究活动的广泛开展提供了强有力的工具保障和数据来源。随后,Social Science Citation Index(简称SSCI)(1973年)、Arts&Humanities Citation Index(简称A&HCI)(1978年)、Journal Citation Reports(简称JcR)(1975年)、Essential Science Indicators(简称ESI)(2001年)等系列工具的不断问世,更极大地促进了引文分析研究活动的大规模开展。
作为传统文献计量学和科学计量学中一种独具特色的研究方法,自20世纪60年代以后,引文分析方法逐渐发展成熟,并形成比较完备的研究体系,在指标设置、工具开发和应用实践等方面也都取得了丰硕成果。1997年,丹麦学者T.C.Almind和P.Ingwersen首次提出“网络信息计量学(Webometfics)”这一概念。随后各种面向网络信息的计量分析研究活动迅速展开,引文分析的思想和方法在新兴的网络信息计量学领域获得了进一步的发展,并取得了一系列新的理论和应用进展。本文尝试从3个不同方面对引文分析方法的网络化拓展及应用进行分析和论述。
2、新研究领域的开拓――网络链接分析
网络链接不仅是互联网的基本构成要素,也是其最显著的特征。由于网络链接关系普遍存在于网站与网站、网站与网页、网页与网页等之间,它们与传统学术期刊文献之间的引用关系具有一种天然的相似性,于是,研究人员便从这种天然的相似性出发,将引文分析方法广泛应用在网络信息计量研究中,并由此开创、形成了网络信息计量学的一个特色研究领域――网络链接分析(Web link analysis)。
10年来的研究实践证明,在成功借鉴引文分析方法的一系列基本思想、概念、指标等基础上,网络链接分析已成为促进网络信息计量学不断深入发展的重要动力。目前,国内外大量的网络链接分析研究活动,都带有鲜明的“引文分析”烙印。
首先从计量指标的设计和使用上来看。早在1996年,美国图书馆员G.Mckieman就根据引文分析中“citation”概念的含义,提出使用“sition”一词来描述网站(site)之间相互链接的行为,即sitation=citedsites。此后,“sitation”一词逐渐在研究同行中得到使用。1998年,P.Ingwemen受引文分析中“期刊影响因子”概念的启发,提出了“网络影响因子(Web ImpactFactor)”的概念,用它来分析一定时期内某特定网站或网页的平均链接强度,并以此来评价网站在网络中的影响力。随后,以“文献耦合”、“共引”、“自引”等引文分析的重要概念为基础,“Web coupling”、“Co-sitati-on”、“Co-link”、“Co-authorship”、“Co-usage”、“Self-linking”、“Self-linked”等网络计量概念和指标也陆续被提出。