中信所学术报告通知:多语言领域本体学习研究
2010/1/12 点击数:1117
[作者] 章成志的博客
[单位] 章成志的博客
[摘要] 多语言领域本体在跨语言信息检索、机器翻译等多语言科技信息服务中具有重要作用。以EuroWordNet为代表的通用多语本体主要依靠手工构建。但在很多的多语言信息服务中,构建多语言领域本体的需求更加迫切,若仍然主要依靠手工构建,则在构建周期和成本上不能满足实际需求。因此,如何利用现有的多语资源,采用自然语言处理和机器学习技术来自动构建多语言领域本体(或称为多语言领域本体学习)是实现多语言科技信息服务的重要研究课题。
中信所学术报告通知:多语言领域本体学习研究
题目:多语言领域本体学习研究
报告人:章成志博士
时间:2010年1月19日(星期二)下午2:00
地点:中国科学技术信息研究所三层333教室
(北京复兴路15号,中央电视台西侧)
报告内容:
多语言领域本体在跨语言信息检索、机器翻译等多语言科技信息服务中具有重要作用。以EuroWordNet为代表的通用多语本体主要依靠手工构建。但在很多的多语言信息服务中,构建多语言领域本体的需求更加迫切,若仍然主要依靠手工构建,则在构建周期和成本上不能满足实际需求。因此,如何利用现有的多语资源,采用自然语言处理和机器学习技术来自动构建多语言领域本体(或称为多语言领域本体学习)是实现多语言科技信息服务的重要研究课题。
本报告将简要介绍当前国内外关于多语言本体学习方法、工具以及应用项目等相关动态,重点介绍报告人在该领域的研究进展情况,内容包括:
1、利用领域平行语料抽取双语核心术语;
2、一体化策略的术语抽取;
3、利用术语度优化双语术语对齐结果;
4、利用多语言对象聚类技术生成多语言概念层次体系。
欢迎相关专家莅临指导,欢迎各位朋友参加并提出宝贵意见。
中国科学技术信息研究所
信息技术支持中心
零一零年一月十九日