博客聚合

首页 >> 博客聚合 >>隐私暴露——2009年6月某天下午对数字图书馆感悟

隐私暴露——2009年6月某天下午对数字图书馆感悟

2009/6/13 点击数：1199

[作者] 强巴曲丹

[单位] 强巴曲丹

[摘要] 隐私暴露——2009年6月某天下午对数字图书馆感悟。

[关键词] 隐私数字图书馆

（源自博主与某mM的QQ记录）

简单 17:22:57

做数字图书馆这么多年。

我终于在前段时间，发现了最难的，也是最核心的一件事情——别笑我啊

高MM 17:24:01

不笑，静听

简单 17:24:48

元数据整合！

简单 17:27:13

在我们的三层体系中，我分别将其特色做了总结。读者的个人门户，采用了SNS的方法论和相关技术。业务管理，争取实现全业务的信息化。这些其实都是比较简单的事情。

高MM 17:27:29

不愧是大侠

简单 17:28:39

但是在以前，也就是2002年以前，图书馆的检索系统可以检索到全部的资源，也就是opac，然后基于这个开展服务。可是2002后，数字图书馆的加入，没有办法实现了，于是很多服务和管理，都不好开展了。都是和日常运行脱节的。如比calis的文献传递，是独立的。

读者检索不到需要的资源，谈什么进一步申请获取全文。独立的系统，不便推广。

简单 17:33:15

但是所谓的异构跨库检索，不能实现全部资源的检索，效率也差。我已经判断是不合适的。

好的解决方案是类似google和百度，将相关元数据收割在一起，然后进行图书馆资源体系的整合检索。

有两个方法：

1、人肉。（正确性、完整性？）

2、系统自动收割。（全部的数据库商会提供接口么？）

高MM 17:33:48

超星的medalink和艾利贝斯的SFX呢？

简单 17:35:53

系统自动收割的方式是最合理的，进而又有两个问题：

1、元数据标准？数据库商就算同意，也要知道如何做？

2、图书馆作为强势的甲方，却无法给作为乙方的数据库商提出这个要求，尤其是在比较散乱的、不团结的中国。

简单 17:37:33

medalink采用人肉的方式进行元数据收割。

sfx仅仅是全文资源的链接服务，该公司metalib提供上一代的异构跨库检索方案。流程是先用异构检索出来，然后sfx全文链接到本馆购买的数据库中。

高MM 17:40:19

那使用medalink的人肉方式的准确性与全面性如何？

简单 17:41:48

如果我们有一个全部文献资源的检索系统，所有服务就好开展了。数据库提供的各种平台，就不需要了。

理想的状态是：

1、图书馆有一套标准体系。也有一个标准的类似原来marc的元数据接口插件，采用web service方式。

2、作为甲方的合同要求，乙方数据库商自动采用这个标准接口，实时将更新资源的索引、摘要等，抽取到图书馆的整合检索系统中。——全部数据库！

所以现在就发现，这个东西，好难好难啊！因为有很多非技术和非理念的因素。

简单 17:42:44

medalink的正确性现在我还没有时间去考察，全面性方面，据说他们做了一百多个数据——在我的资料中。但是在最近的一次招标中，万方的也宣传他们也开始采用这种元数据收割的方式。超星说已经收割了1.5亿条，而万方的说，他们已经收割了1.7亿条。

简单 17:44:55

不管是多少条，不和管理系统和服务系统做整合，也仅仅是一个数据库而已。

简单 17:45:51

当然这不是关键，关键就是，我发现数字图书馆建设中，很多问题我都可以尝试去解决，但是在我刚才提到这个问题前面，我感觉太难了。

或许只有时间。

但是图书馆行业作为甲方，必须清楚地认识到这个问题，是数字图书馆自身发展的最核心问题，就比较好办了。

高MM 17:47:11

昨天万方的告诉我他们收割了1.8亿条

简单 17:48:00

才3周，他们就收了1千万。

挣钱这么容易就好了。

高MM 17:48:53

你说的这个是需要整个图书馆行业应认识到的问题

不是哪个单一的馆可以做到的

简单 17:49:54

对。作为单馆来说，管理和服务的需求都很好提出。个性化也能实现。

ok，不聊了。

下班带孩子去了。

高MM 17:50:17

原文连接：http://blog.sina.com.cn/s/blog_5372e1620100di8x.html