NKOS听会记

2008/4/22   点击数:118

[作者] 娄影重现

[单位] 娄影重现

[摘要] 今天下午在上海图书馆听了曾蕾老师的报告大有收获。报告的主题是:从情报检索语言到网络环境下的知识组织系统(NKOS)和语义工具。KOS(knowledge organization system)知识组织系统,是我们用来定义并组织表述真实世界物体的术语和符号的系统。NKOS是指在网络环境下的知识组织系统。

[关键词]  KOS 国际图联 NKOS



今天下午在上海图书馆听了曾蕾老师的报告大有收获。报告的主题是:从情报检索语言到网络环境下的知识组织系统(NKOS)和语义工具。KOS(knowledge organization system)知识组织系统,是我们用来定义并组织表述真实世界物体的术语和符号的系统。NKOS是指在网络环境下的知识组织系统。会议开始由Keven老师介绍曾蕾老师,曾蕾老师,武汉大学图书情报学院学士(1982)、硕士(1984),美国匹兹堡大学信息科学学院博士(1992)。1985年至1988年在武汉大学图书情报学院任教,现为美国肯特州立大学(Kent State University)图书情报学院教授。研究与教学领域包括数字图书馆、知识组织系统(含分类法、叙词表、语义网络、本体等语义工具),文献标引与检索,元数据与置标语言,数据库质量分析与控制等。在国内及国际刊物、百科全书、各种国际学术会议上发表研究文章60余篇,编写专著三本,应邀在北美、南美、亚洲、欧洲各国讲学和做特邀主讲。曾获美国情报学会(ASIS) 最佳博士论文奖和其它奖励。近年来主持两项美国国家自然科学基金会国家科学数字图书馆项目,在此之前曾主持OCLC联机图书馆计算机中心、俄亥俄联机网络(OhioLINK)等资助的多项研究项目,目前任两项美国联邦博物馆和图书馆服务机构(Institute of Museum and Library Services,IMLS)项目的顾问。

曾任国际图联(IFLA) 标引与分类法委员会主席、美国国家信息标准组织(NISO) 国家标准Z39.19工作组成员、专业图书馆协会(Special Libraries Association, SLA) 编目委员会主席和技术标准委员会主席、 若干国际会议组织委员会成员等。目前任国际图联FRBR项目中关于主题规范数据的功能要求(FRSAR)研究工作组的主席,国际图联数字图书馆指南工作组成员,美国情报学会标准委员会主席, 美国国家信息标准组织NISO投票成员。1994年以来多次应邀回国参加学术会议、组织讲习班、举办不同形式的讲座,并参加了国内数字图书馆项目有关标准规范的制定。受聘为上海交通大学、华中理工大学、以及中科院文献情报中心客座教授、北京大学数字图书馆研究所顾问、《现代图书情报技术》编委、中国索引学会顾问、云南省图书馆顾问等。

会议主要分3大块:a) 重温 KOS 的特征;b) 网络环境下的词表与本体;c) KOS注册系统(registries)和术语网络服务(terminology services)近期发展。在a中讲到,KOS包括情报检索语言,但其涵盖面更大,在具体应用中被泛指语义工具:词汇控制用的列表、同义词环;在分面结构中采用可选词;从分众分类法中采集词汇;等。新一代语义工具的特点是吸取不同知识系统的特长,采取登记机构与元数据式的“特征”结合(为此举了柜子椅子的例子以说明,首先要把柜子归类,比如床头柜,大衣柜等,这涉及的是本体,本体(ontology)也叫实用分类系统,然后再床头柜,大衣柜的属性长宽高颜色用途等用元数据表示)。

在b中提到KNOS正在从机器可读走向机器可理解,KOS的编码已成为KOS的一个不可忽视的部分。再这一部分还提到thema—–>nomen,(thema ’s application is nomen? )为了避免重复歧义,这两个单词取自希腊文。thema也就是概念, nomen是概念的具体应用。为了说明这个问题曾老师举了圣诞老人(who,when,where who等属性)其本身只是一个概念,和意大利的地图(name,place , parent place等属性描述)为例。KOS应该重点针对的是概念,一个概念concept,还有terms/names,related concept,parent concept,scope node等,还有一个概念用一个URI表示,概念下出现的词也用URI加编码代号表示,这样就会带着语义性跟着走。然后又谈到用SKOS(simple knowledge organization systems)表达叙词表的内容,讲到同位类,上下位,同义,多义等情况下的描述,还举了大量的例子,具体内容到时可参见上海图书馆学会的PPT。其实上面提到的同义多义,上下位,相关关系都可以用叙词表表示,为什么还要用本体,关键是本体具有机器可处理,概念、属性、相关性都有明确界定,可以建立概念和概念的关系模型等优点(以人体解剖为例),本体用OWL(基于web的本体描述语言)语言描述其优于RDF的是可以限定一些特殊的关系类型。本体的主要是从不同的方面来描述同一个东西,这样可以实现共享和复用。这里有个本体软件altova sementicworks可以实用。本体与知识库相结合使用对目前的管理、利用等都很有好处。最后综合从语义的歧义、对同义近义控制、对概念关系表达、对属性特征等描述,对表达的处理,基本目的和作用等方面比较了分类法、叙词表、本体的优缺点。在b最后一个部分中提到了NKOS要解决的问题是在网络环境下,KOS的使用 (use)、再利用(re-use)、重新定位(re-purpose) 的可能性。

在c中谈到如何保证KOS的共享,共享的目的是便利数据、信息知识的交流,在不同的用户、服务系统、应用软件等中分享,为此编辑词表和寻找实现共享的工具是长期研究的重点。使用,重在词表的建立,词表的建立主要有一下几种方法:根源词汇产生新词汇,卫星词汇,词汇分支,网状结构,还有个伞状结构(这个对于我们的情况比较使用像一个伞的结构上层不管下层的,但下层要向上兼容),在再利用中主要涉及的是术语资源管理,术语注册系统,概念要用URI表示,术语要用URI加编码表示,让语义跟着走即使搬家。目前的缺点是术语是表面的匹配还没有达到概念的匹配。接着谈到本体的应用web service具体情况可以上OCLC看下www.oclc.org/terminologies/default.html.目前正在进行NKOS还有STAK,ENTAG,SKOS based service.术语网络服务目前技术有词汇概念查询,检索提问支持等。

会议结束时从新强调会议谈论的3个小主题,KOS的作用以及涉及其作用实现要依靠的方法手段。

原文连接:http://www.dlresearch.cn/lxm/?p=18