http://www.chinalibs.net 2025/2/7
[作者] 李丹,敬海燕
[单位] 中央党校(国家行政学院)图书和文化馆,吉林大学图书馆
[摘要] 历史报纸是重要的文化资源,拥有着丰富的历史文化和知识内涵。历史报纸资源的数字化处理和挖掘分析,对了解特定时期的社会发展及经济、政治等状况具有重要意义。以欧洲NewsEye项目为例,分析其建设内容框架、数据模型、深度学习算法模型、自动文本处理工具及动态文本分析方式方法,总结项目建设过程中以用户为导向、多元跨界协同等建设经验,提出我国历史报纸文本化、知识化解决方案和实现途径,包括实现基于人工智能技术的报纸文献自动化加工流程、构建开放数据集和高质量语料库、结合数字人文技术开展知识化应用,以及通过行业共建、跨界合作促进历史报纸资源的开放和共享、创新和活化。
历史报纸是重要的文化资源,拥有着丰富的历史文化和知识内涵。历史报纸资源的数字化处理和挖掘分析,对了解特定时期的社会发展及经济、政治等状况具有重要意义。以欧洲NewsEye项目为例,分析其建设内容框架、数据模型、深度学习算法模型、自动文本处理工具及动态文本分析方式方法,总结项目建设过程中以用户为导向、多元跨界协同等建设经验,提出我国历史报纸文本化、知识化解决方案和实现途径,包括实现基于人工智能技术的报纸文献自动化加工流程、构建开放数据集和高质量语料库、结合数字人文技术开展知识化应用,以及通过行业共建、跨界合作促进历史报纸资源的开放和共享、创新和活化。
文章目录
0 引言
1 NewsEye项目概述
1. 1 NewsEye项目参与机构
1. 2 NewsEye项目内容框架
2 NewsEye项目技术和工具分析
2. 1 采用国际图像互操作框架IIIF来描述报纸资源
2. 2 探索基于Transkribus的自动文本识别工具
2. 3 通过深度学习模型进行命名实体识别和事件检测
2. 4 构建多语言主题模型进行动态文本分析
3 NewsEye项目建设成果和实施经验
3. 1 形成多个开放的研究数据集
3. 2 提供内容获取和研究助理服务
3. 3 对数字人文研究提供有效支持
3. 4 多学科研究团队的跨界协同
4 对我国历史报纸数字化工作的启示
4. 1 基于人工智能技术探索历史报纸资源自动化加工流程
4. 2 构建基于历史报纸资源的开放数据集和高质量语料库
4. 3 结合数字人文技术开展历史报纸知识化服务
4. 4 通过行业共建共享形成更大规模的知识体系
4. 5 开展跨界合作推动历史报纸数字化工作
5 结语
引用本文:
李丹,敬海燕.历史报纸访问的智能化解决方案:欧洲NewsEye项目实践及思考[DB/OL].[2025-05-02].http://www.chinalibs.net/ArticleInfo.aspx?id=590700.
温馨提示:
如果您的作品引用了本文,请您发邮件(leisun@chinalibs.net )告诉我们,我们会给您一个小小的惊喜哟!
——【北京雷速科技有限公司】