bet188体育官网_188比分直播【首页】

首页
我们
党建
科研
学人
资源
教学
搜索

2025年第五届语料库建设与应用学术研讨会综述

作者:关越 来源:今日语言学 时间: 2025-10-16
字号:

 

  2025年9月19日上午,中国社会科学院语言研究所语言研究所语料库暨计算语言学研究中心、中国社会科学院语言学重点实验室主办召开了“2025第五届语料库建设与应用研讨会”。会议在语言所大会议室举行,来自中国社会科学院语言研究所、北京语言大学、洛杉矶加州大学等科研单位和高校的二十余位专家学者参加了本次会议。

  中国社会科学院语言研究所副所长、语料库暨计算语言学研究中心、中国社会科学院语言学重点实验室负责人李爱军研究员首先致开幕词,向与会专家学者表示热烈欢迎和衷心感谢。她在回顾往届语料库建设与应用研讨会的发展以及本届会议的主旨和意义的基础上,进一步指出应当把语料库建设作为一项基础性、战略性工程,共同探索面向国家社会重大需求的多模态语料库建设之路。

 

李爱军研究员致开幕词

 

  4位专家学者在研讨会上作了主旨报告。

  陶红印教授报告的题目是“多模态视野下的动态语体观与实证研究”。他指出,多模态语料库建设不仅是当前基于用法的语言学研究的焦点,也是推动语言学科发展的基础性工作。现有语体分类多依赖宏观范畴,往往将语言形式与语体类型简单对应,存在界限模糊、解释力不足等问题。针对这一现状,他倡导一种更精细化、动态化的语体研究方法,并通过对日常会话、法庭庭审、网络代销及二语课堂等多类场景的实证观察,发现同一说话人在相同语境中可实现系统且规律的微观语体转换,此类现象可借助多模态手段清晰呈现。该研究为语体分析提供了新的理论视角与实践路径,具有重要的学术价值与应用潜力。

 

陶红印教授作报告

 

  方梅研究员报告的题目是“自然口语语料库的语料平衡问题”。她在报告中强调,语料库建设应力求全面、均衡地反映实际语言使用面貌。她指出,传统平衡语料库多关注文本的体裁或语体覆盖,常将口语视为一个整体,缺乏内部系统性分类。而专门的自然口语语料库要真正实现语料平衡,则应从口语本身的交际属性出发,以互动性与活动类型为主要维度,系统考虑互动等级、活动类型及交际行为差异等多重因素,从而更科学地呈现口语的多样性与复杂性,为语言学研究、教学及言语工程应用提供更可靠的资源基础。

 

方梅研究员作报告

 

  李先银研究员报告的题目是“我国口语语料库建设的一些思考”。他在系统梳理汉语口语研究的百年历程和近些年自然口语研究的突出成果的基础上,指出当前口语语料库建设所面临的资源匮乏、标准缺失、操作不规范及专门语料库短缺等突出问题,并提出我国口语语料库建设的几点建议:一是构建覆盖多模态、多领域、多类型、多场景、多年龄及多语体的综合性语料资源体系;二是推动建立普通话、方言与少数民族语言对应的口语语料库矩阵;三是在语料库基础上进一步建设口语博物馆,强化其在历史传承与文化保护方面的社会功能。

 

李先银研究员作报告

 

  关越博士报告的题目是“口语语料库建设工程项目设计与开展”。报告介绍了国家口语语料库建设工程项目的总体设想与实施路径,提出在语料采集、标注和平台建设的各个环节所面临不同程度的挑战以及相应的解决方案。其中,兼顾通用性和功能性是口语语料库建设的难点,应通过构建灵活可扩展的开放式架构予以应对,包括引入精度分区体系、支持多模态语料集成,以增强语料库的适应性和持续扩展能力。此外,报告还倡导建立“共建共享”机制,鼓励多方机构协作参与,推动语料资源在合规基础上的开放与流通,最大化提升语料库的学术价值和社会效益。

 

关越博士作报告

 

  报告结束后,在场学者对语料库建设过程中的理论和实践问题进行了积极的提问并得到报告人的认真回答,现场讨论气氛热烈。中国社会科学院语言学重点实验室语言资源与智能技术子实验室主任张永伟研究员做总结发言,对本次会议给予了高度评价,并向学界提出对未来语料共建工作的期待。

  本次研讨会作为中国社会科学院语言研究所语料库暨计算语言学研究中心的品牌系列学术活动之一,主题鲜明、讨论深入,与会专家交流充分、见解深刻,为未来语料库建设工作的推进奠定了重要基础,指明了发展方向。

 

会人员合影