隐私暴露——2009年6月某天下午对数字图书馆感悟
2009/6/13 点击数:1199
[作者] 强巴曲丹
[单位] 强巴曲丹
[摘要] 隐私暴露——2009年6月某天下午对数字图书馆感悟。
(源自博主与某mM的QQ记录)
简单 17:22:57
做数字图书馆这么多年。
我终于在前段时间,发现了最难的,也是最核心的一件事情——别笑我啊
高MM 17:24:01
不笑,静听
简单 17:24:48
元数据整合!
简单 17:27:13
在我们的三层体系中,我分别将其特色做了总结。读者的个人门户,采用了SNS的方法论和相关技术。业务管理,争取实现全业务的信息化。这些其实都是比较简单的事情。
高MM 17:27:29
不愧是大侠
简单 17:28:39
但是在以前,也就是2002年以前,图书馆的检索系统可以检索到全部的资源,也就是opac,然后基于这个开展服务。可是2002后,数字图书馆的加入,没有办法实现了,于是很多服务和管理,都不好开展了。都是和日常运行脱节的。如比calis的文献传递,是独立的。
读者检索不到需要的资源,谈什么进一步申请获取全文。独立的系统,不便推广。
简单 17:33:15
但是所谓的异构跨库检索,不能实现全部资源的检索,效率也差。我已经判断是不合适的。
好的解决方案是类似google和百度,将相关元数据收割在一起,然后进行图书馆资源体系的整合检索。
有两个方法:
1、人肉。(正确性、完整性?)
2、系统自动收割。(全部的数据库商会提供接口么?)
高MM 17:33:48
超星的medalink和艾利贝斯的SFX呢?
简单 17:35:53
系统自动收割的方式是最合理的,进而又有两个问题:
1、元数据标准?数据库商就算同意,也要知道如何做?
2、图书馆作为强势的甲方,却无法给作为乙方的数据库商提出这个要求,尤其是在比较散乱的、不团结的中国。
简单 17:37:33
medalink采用人肉的方式进行元数据收割。
sfx仅仅是全文资源的链接服务,该公司metalib提供上一代的异构跨库检索方案。流程是先用异构检索出来,然后sfx全文链接到本馆购买的数据库中。
高MM 17:40:19
那使用medalink的人肉方式的准确性与全面性如何?
简单 17:41:48
如果我们有一个全部文献资源的检索系统,所有服务就好开展了。数据库提供的各种平台,就不需要了。
理想的状态是:
1、图书馆有一套标准体系。也有一个标准的类似原来marc的元数据接口插件,采用web service方式。
2、作为甲方的合同要求,乙方数据库商自动采用这个标准接口,实时将更新资源的索引、摘要等,抽取到图书馆的整合检索系统中。——全部数据库!
所以现在就发现,这个东西,好难好难啊!因为有很多非技术和非理念的因素。
简单 17:42:44
medalink的正确性现在我还没有时间去考察,全面性方面,据说他们做了一百多个数据——在我的资料中。 但是在最近的一次招标中,万方的也宣传他们也开始采用这种元数据收割的方式。超星说已经收割了1.5亿条,而万方的说,他们已经收割了1.7亿条。
简单 17:44:55
不管是多少条,不和管理系统和服务系统做整合,也仅仅是一个数据库而已。
简单 17:45:51
当然这不是关键,关键就是,我发现数字图书馆建设中,很多问题我都可以尝试去解决,但是在我刚才提到这个问题前面,我感觉太难了。
或许只有时间。
但是图书馆行业作为甲方,必须清楚地认识到这个问题,是数字图书馆自身发展的最核心问题,就比较好办了。
高MM 17:47:11
昨天万方的告诉我他们收割了1.8亿条
简单 17:48:00
才3周,他们就收了1千万。
挣钱这么容易就好了。
高MM 17:48:53
你说的这个是需要整个图书馆行业应认识到的问题
不是哪个单一的馆可以做到的
简单 17:49:54
对。作为单馆来说,管理和服务的需求都很好提出。个性化也能实现。
ok,不聊了。
下班带孩子去了。
高MM 17:50:17
88