隐私暴露——2009年6月某天下午对数字图书馆感悟

2009/6/13   点击数:1199

[作者] 强巴曲丹

[单位] 强巴曲丹

[摘要] 隐私暴露——2009年6月某天下午对数字图书馆感悟。

[关键词]  隐私 数字图书馆



(源自博主与某mM的QQ记录)

简单 17:22:57

数字图书馆这么多年。

我终于在前段时间,发现了最难的,也是最核心的一件事情——别笑我啊

高MM 17:24:01

不笑,静听

简单 17:24:48

元数据整合!

简单 17:27:13

在我们的三层体系中,我分别将其特色做了总结。读者的个人门户,采用了SNS的方法论和相关技术。业务管理,争取实现全业务的信息化。这些其实都是比较简单的事情。

高MM 17:27:29

不愧是大侠

简单 17:28:39

但是在以前,也就是2002年以前,图书馆的检索系统可以检索到全部的资源,也就是opac,然后基于这个开展服务。可是2002后,数字图书馆的加入,没有办法实现了,于是很多服务和管理,都不好开展了。都是和日常运行脱节的。如比calis的文献传递,是独立的。

读者检索不到需要的资源,谈什么进一步申请获取全文。独立的系统,不便推广。

简单 17:33:15

但是所谓的异构跨库检索,不能实现全部资源的检索,效率也差。我已经判断是不合适的。

好的解决方案是类似google和百度,将相关元数据收割在一起,然后进行图书馆资源体系的整合检索。

有两个方法:

1、人肉。(正确性、完整性?)

2、系统自动收割。(全部的数据库商会提供接口么?)

高MM 17:33:48

超星的medalink和艾利贝斯的SFX呢?

简单 17:35:53

系统自动收割的方式是最合理的,进而又有两个问题:

1、元数据标准?数据库商就算同意,也要知道如何做?

2、图书馆作为强势的甲方,却无法给作为乙方的数据库商提出这个要求,尤其是在比较散乱的、不团结的中国。

简单 17:37:33

medalink采用人肉的方式进行元数据收割。

sfx仅仅是全文资源的链接服务,该公司metalib提供上一代的异构跨库检索方案。流程是先用异构检索出来,然后sfx全文链接到本馆购买的数据库中。

高MM 17:40:19

那使用medalink的人肉方式的准确性与全面性如何?

简单 17:41:48

如果我们有一个全部文献资源的检索系统,所有服务就好开展了。数据库提供的各种平台,就不需要了。

理想的状态是:

1、图书馆有一套标准体系。也有一个标准的类似原来marc的元数据接口插件,采用web service方式。

2、作为甲方的合同要求,乙方数据库商自动采用这个标准接口,实时将更新资源的索引、摘要等,抽取到图书馆的整合检索系统中。——全部数据库!

所以现在就发现,这个东西,好难好难啊!因为有很多非技术和非理念的因素。

简单 17:42:44

medalink的正确性现在我还没有时间去考察,全面性方面,据说他们做了一百多个数据——在我的资料中。 但是在最近的一次招标中,万方的也宣传他们也开始采用这种元数据收割的方式。超星说已经收割了1.5亿条,而万方的说,他们已经收割了1.7亿条。

简单 17:44:55

不管是多少条,不和管理系统和服务系统做整合,也仅仅是一个数据库而已。

简单 17:45:51

当然这不是关键,关键就是,我发现数字图书馆建设中,很多问题我都可以尝试去解决,但是在我刚才提到这个问题前面,我感觉太难了。

或许只有时间。

但是图书馆行业作为甲方,必须清楚地认识到这个问题,是数字图书馆自身发展的最核心问题,就比较好办了。

高MM 17:47:11

昨天万方的告诉我他们收割了1.8亿条

简单 17:48:00

才3周,他们就收了1千万。

挣钱这么容易就好了。

高MM 17:48:53

你说的这个是需要整个图书馆行业应认识到的问题

不是哪个单一的馆可以做到的

简单 17:49:54

对。作为单馆来说,管理和服务的需求都很好提出。个性化也能实现。

ok,不聊了。

下班带孩子去了。

高MM 17:50:17

88

原文连接:http://blog.sina.com.cn/s/blog_5372e1620100di8x.html