中信所学术报告通知:多语言领域本体学习研究

2010/1/12   点击数:1117

[作者] 章成志的博客

[单位] 章成志的博客

[摘要] 多语言领域本体在跨语言信息检索、机器翻译等多语言科技信息服务中具有重要作用。以EuroWordNet为代表的通用多语本体主要依靠手工构建。但在很多的多语言信息服务中,构建多语言领域本体的需求更加迫切,若仍然主要依靠手工构建,则在构建周期和成本上不能满足实际需求。因此,如何利用现有的多语资源,采用自然语言处理和机器学习技术来自动构建多语言领域本体(或称为多语言领域本体学习)是实现多语言科技信息服务的重要研究课题。

[关键词]  本体学 信息检索



中信所学术报告通知:多语言领域本体学习研究

题目:多语言领域本体学习研究

报告人:章成志博士

时间:2010年1月19日(星期二)下午2:00

地点:中国科学技术信息研究所三层333教室

(北京复兴路15号,中央电视台西侧)

报告内容:

多语言领域本体在跨语言信息检索、机器翻译等多语言科技信息服务中具有重要作用。以EuroWordNet为代表的通用多语本体主要依靠手工构建。但在很多的多语言信息服务中,构建多语言领域本体的需求更加迫切,若仍然主要依靠手工构建,则在构建周期和成本上不能满足实际需求。因此,如何利用现有的多语资源,采用自然语言处理和机器学习技术来自动构建多语言领域本体(或称为多语言领域本体学习)是实现多语言科技信息服务的重要研究课题。

本报告将简要介绍当前国内外关于多语言本体学习方法、工具以及应用项目等相关动态,重点介绍报告人在该领域的研究进展情况,内容包括:

1、利用领域平行语料抽取双语核心术语;

2、一体化策略的术语抽取;

3、利用术语度优化双语术语对齐结果;

4、利用多语言对象聚类技术生成多语言概念层次体系。

欢迎相关专家莅临指导,欢迎各位朋友参加并提出宝贵意见。

中国科学技术信息研究所

信息技术支持中心

零一零年一月十九日

原文连接:http://www.sciencenet.cn/m/user_content.aspx?id=286475