首页 > 中国语言资源有声数据库建设项目

  中国语言资源有声数据库建设项目介绍

  中国语言资源有声数据库是国家语言资源建设工程之一,它用现代信息技术采录语言数据,经转写、标记等加工程序将相关的文本文件、音频文件及视频文件整理入库,以数据库、互联网、博物馆、语言实验室等形式向学界和社会提供服务。
    根据《中国语言资源有声数据库调查手册》,中国语言资源有声数据库(汉语)部分设计为:
    一、语言和方言调查
    1.调查点:根据县级行政单位设置调查点,原则上“一县一点”,特殊情况下可以增点或减点。本调查重在反映当下语言的实态,因此调查点选择县城等在当地影响较大的地方。
    2.调查对象:每个调查点根据性别因素和年龄因素选择有代表性的4名发音合作人,其中男女各2人,老年青年各2人。
    3.调查内容:调查内容分语言结构调查和话语调查两大部分。
    语言结构调查是基础,用1000字调查语音系统,用1200词调查基本词汇系统,用50个句子调查主要的语法现象。
    话语调查是重点,分为讲述和对话两部分。讲述包括“规定故事”和“自选话题”。规定故事为《牛郎和织女》
    4.调查方法:采用规定的录音设备、软件进行录音,辅之以录像和照片。并且,对调查内容还要按照一定要求进行必要的国际音标转写和汉字转写。最后,对一个调查点的所有调查资料和电子文件进行命名、分类、归档。
    5.建库:国家组织专人进行验收,将调查材料统一建档入库。并及时组织专家对数据库进行开发。
    二、“地方普通话”调查
    地方普通话调查与语言和方言调查一同进行。其选点要求也与语言和方言的调查相同,原则上是一县一点。每调查点选择3名发音合作人,这3名发音合作人的普通话水平处在不同的等级:1名相当于《普通话水平测试等级标准》 规定的三级甲等,1名仅次于三级乙等,1名普通话水平最差,接近方言。
地方普通话的调查内容是:1、用普通话讲述规定故事《牛郎和织女》;2、用普通话朗读两篇短文《诚实与信任》《大学生村官》。调查得到的音频文件等经整理验收,建档入库,形成地方普通话语料库。
    地方普通话语料库是中国语言资源有声数据库的一个分库。
  
 


发布日期:2010-12-27 访问次数: 字号:[ ]
【打印本页】 【关闭窗口】
 
Produced By 大汉网络 大汉版通发布系统