统计学方法在情报学中的应用(信息管理方法论作业一)
2011/3/1 点击数:794
[作者] lanjianlong
[单位] lanjianlong的博客
[摘要] 统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。
统计学方法在情报学中的应用
情报学S104484 兰建龙
1.统计学介绍
统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。
统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。
统计学的主要方法有如下:统计调查与统计整理,抽样推断,总体参数检验,相关分析与回归分析,方差分析,因子分析和聚类分析。信息专业人员常用的方法有:基本统计学、描述统计学、t检验、X2检验、方差分析、相关、回归、基本非参数统计检验的理论及应用,也对中、高级统计方法——多重回归分析和线性关系模型。
2.情报学的定量化分析
布鲁克斯曾说到情报学如果不实现定量化,它将是一堆支离破碎的技艺,而不会成为科学。
因此情报数学是情报科学技术的基础工具,能够进行典型情报过程的量化分析,通过数学模型的建立来研究各种情报现象与规律,定量化分析方法主要有:集合与序、矩阵与线性理论、函数与方程、概率分布与随机过程、数理统计与多元分析、树与网络、规划与选优、计数与枚举、模糊理论与应用、分形理论等。其中统计学作为应用数学的一个分支,其方法论在情报学研究方向中的信息分析,数据挖掘,信息计量学都有着重要的应用。
3统计学方法在信息分析中的应用
信息分析就是根据特定问题的需要,对大量相关信息进行深层次的思维加工和分析研究,形成有助于问题解决的新信息的信息劳动过程。它是情报研究流程的一个重要环节。侧重于对信息进行精加工,既与研究对象有关,又与研究目标和任务相连。从信息分析的整个工作流程来看,信息分析具有整理、评价、预测和反馈四项基本功能。具体来说,整理功能体现在对信息进行收集、组织,使之由无序变为有序;评价功能体现在对信息价值进行评定,以达去粗(取精)、去伪(存真)、辨新、权重、评价、荐优之目的;预测功能体现在通过对已知信息内容的分析获取未知或未来信息;反馈功能体现在根据实际效果对评价和预测结论进行审议、修改和补充。信息分析的基本功能决定了其在社会发展中将发挥重要作用。查先进在信息分析与预测一书中总结的统计学方法有调查问卷法,回归分析法,时间序列分析法等
4.统计学方法在计量经济学中的应用
信息计量学的研究开始于19世纪末。目前分为4个大的分支——文献计量学、科学计量学、信息计量学、网络计量学。简称“四计学”。文献计量学里有三大经典定律:布拉德福定律、齐普夫定律、洛特卡定律。另外还有两个有关文献资源动态特征的定律——文献老化定律和文献增值定律.这些定律都是建立在统计学基础之上的。
5.统计学方法在数据挖掘中的应用
在人工智能领域,习惯上又称为数据库中知识发现(Knowledge Discovery in Database, KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程以下三个阶段组成:(1)数据准备,(2)数据挖掘,(3)结果表达和解释。数据挖掘可以与用户或知识库交互。
数据挖掘也三个研究方向,一是从数据库角度去研究,二是从人工智能角度去研究,三是从统计学角度研究。统计学和数据挖掘有着共同的目标:发现数据中的结构。一些人(尤其是统计学家)还认为数据挖掘是统计学的分支。
6.案例分析
为了揭示近年来我国情报学研究方法应用的变化趋势,选择了我国情报学领域CSSCI 影响因子最高的情报学报作为分析样本研究目标是通过准确揭示我国枟情报学报近十年的研究论文所采用的研究方法,来把握我国情报学研究方法应用的发展趋势。为此,首先确定了分析中所依据的研究方法的分类标准;然后依据此标准对每篇论文的研究方法进行分析判断和记录统计;最后对各类研究方法在十年间应用的情况进行统计分析,并找出其中蕴含的规律。对1999~2008十年间情报学全部学术论文共1174篇的研究方法进行了逐篇分析与统计。结果表明我国情报学研究方法的科学化与理论化趋势正在逐年增强。其中,一般理论研究总计占29.6%,并且在近年迅速下降;计算机信息技术相关方法占49% ,是情报学报采用最多的方法;文献与信息计量方法占15.5%,并且逐年上升;内容分析方法、统计调查方法则在一个较低的水平上轻微上升。
研究的数据分析结果表明,我国情报学研究的科学化趋势日趋明显;理论性仍然较低,有待进一步增强;信息技术类研究的创新性有所增强,但水平仍然较低;论文中对于研究方法的明确表述不够重视,但在逐渐增加。总体看来,我国情报学研究方法的应用与其他学科如经济学、管理学或计算机学科相比仍有一定的距离,与国外情报学的研究也有差距,需要尽快与国际接轨,提高研究方法应用的规范性.