当前位置:首页 > 工作总结 > 浅谈西南地区少数民族语言数据库建设_西南地区少数民族
 

浅谈西南地区少数民族语言数据库建设_西南地区少数民族

发布时间:2019-03-30 04:20:37 影响了:

  摘要:本文结合西南地区少数民族语言特点及初期的一些研究成果,着重探讨西南地区(涉及贵州、云南、四川、广西地区)少数民族语言数据库的特点、设想和规划,以期对今后的研究有所借鉴。
  关键词:西南地区 民族语言 数据库建设
  中图分类号:G64 文献标识码:A 文章编号:1008-925X(2012)O8-0018-02
  1、西南地区的民族和语言
  西南地区有31个世居民族,分别是属于壮侗语族的壮族、布依族、傣族、侗族、水族、毛南族、仫佬族和仡佬族,属于苗瑶语族的苗族和瑶族,属于藏缅语族的藏族、羌族、普米族、彝族、哈尼族、傈僳族、拉祜族、白族、纳西族、基诺族、怒族、阿昌族、景颇族、独龙族和土家族,属于南亚语族的佤族、布朗族、德昂族和京族,以及汉族和回族。汉族和回族系近一两千年来尤其是近数百年来陆续自北向南迁到西南地区的。
  此外,还有一些少数民族群体,由于人口较少尚未单列民族(有的归入邻近的某一个少数民族),如操侗台语族仡央语支语言的拉基人(部分归入壮族或彝族)、普标人(部分归入彝族)、布央人(归入壮族或瑶族),操侗水语支语言的茶洞人(少数归入壮族),操南亚语的布干人(归入彝族)、克木人、莽人、俫人(归入仡佬族)、户人等。
  2、研究及保护民族语言的价值
  我国众多少数民族主要分布在东北、西北和西南地区。这些语言以其结构形式的多样性、独特性以及系属归类上的孤立性展现了其高度的研究价值。其研究价值不仅体现在语言学上,也体现在文学、人类学、历史学乃至自然科学上。
  首先,语言是思维的工具,是帮助人们认识世界的工具,每种语言都与某个特定人群的思维模式及认识世界的方式有关。从这一意义上说,一种语言的消失意味着一种人类认识世界的模式的丧失。
  其次,加强少数民族语言,尤其是濒危语言的保护、抢救记录也是对弱势社会群体的一种特殊的人文关怀,能促进民族团结和社会和谐。
  再次,西南地区归属不易确定的语言往往蕴含着丰富的语言史、文化史信息,对其进行深入研究有助于加深我们对人类语言发展史的认识。
  最后,少数民族语言的研究对相关学科的发展也有促进作用。如仡佬族可能跟历史上活跃于西南地区的濮、夜郎有关系,挖掘记录语言材料对解决这些古代民族研究中的疑难问题有帮助。
  一、语言数据库简述
  数据库就是按照研究目的或者根据研究对象的性质将材料或者数据组织起来的集合体。针对语言材料的规模化,以及语言材料自身复杂的异源性、零散性、异质性、数量不等性等特点,语言学家需要利用现代计算机来帮助自己处理语言材料。其中最常见的方法就是建立数据库。[1]
  过去的语言数据库只包含单一文字信息,例如文字、国际音标。进行田野调查时,调查者一般通过听音、辨音记录某种语言的语音,这样得出的语言调查结果往往有较强的主观性,在他人对记音表示怀疑时,缺乏有力的对证。现在图像和语音媒体文件作为语言数据库的重要信息成分逐渐被引入。
  1.1 图像文件
  图像文件在语言数据库中的应用主要体现在民族语地图的制作上。民族语地图是语言地理学的最重要体现形式。我们可以使用语言地图软件,通过密集的布点调查,制作多幅民族语特征地图和民族语同言线,比较精确地将西南各少数民族语言的特征差异和地理分布展示出来。
  1.2 语音文件
  语音文件一方面可以真实地记录该民族语的读音,对纯书面记录的语言资料起到很好的补充和印证作用,还可以节省实地调查的费用,降低调查的成本。另一方面,所录语音数据库可以在语音分析平台(例如Praat)进行语音试验分析,对一些拿捏不准的语音加以定性,从而提高语言调查的精确度和科学性。此外,语音文件可以反复播放,减少了调查过程中发音人的发音次数,缩短了田野调查的时间,提高了田野调查的工作效率。
  可见,语言地图的绘制注重表现语言空间上的分布,而语言语音数据库注重语音调查结果的精确程度,并进一步拓展至语音学的实验分析。
  二、西南少数民族语言数据库的设想和规划
  2.1 研究现状
  2.1.1专著研究状况
  20世纪80年代,由国家民委组织国内专家学者编撰了《中国少数民族语言简志丛书》,现已出版57本。20世纪90年代,有关专家学者再一次开展了少数民族语言的调查,编写了《中国新发现语言丛书》,现已出版约30部。另外孙宏开主编的《中国少数民族语言方言研究丛书》已出版13本,《中国少数民族语言系列词典丛书》已出版20本。
  由此看来,西南地区各少数民族语言的调查研究工作开展较早,除了铺开面较广的大型项目外,单点或微观的研究成果也不胜枚举,但由于受到当时的技术和资金条件的限制,尤其是计算机技术在语言研究领域里的应用还不成熟,大部分调查成果只有纸笔记录的书面形式,没有做成可以随机调阅的数据库形式,更不用说配备多媒体音频资料了。虽然以目前的技术要把以往的纸质调查成果直接转为电子形式并不困难,但也只是电子图书,并不方便查询和交互数据。
  2.1.2 语言数据库建设状况
  随着语言信息化的进一步深入,语言数据库的建设日渐成为民族学、语言学、计算语言学等学科关注的热点。2001年国家设立“十五”社会科学规划研究课题,关注少数民族濒危语言的保护和研究。2005年11月在北京大学举办“语言学研究手段现代化问题学术研讨会”探讨信息处理与语言学研究的相关议题。2007年3月29日国家民委发布的《少数民族事业“十一五”规划》中提出,我国将开展调查、收集、研究、整理少数民族濒危语言文字,建立少数民族濒危语言文字数据库等工作。
  总体来看,近些年教育部在民族语言文字规范标准建设和信息化方面开展的主要工作如下:第一,少数民族文字的字符集及其平台建设;第二,民族语言文字规范化建设 ;第三,民族语言文字资源库建设。取得的研究成果较为丰富,如国家语委2007年12月29日结题的《蒙古语术语数据库》;截至2009年4月,云南民族大学已经建立了彝族、哈尼族、傣族、傈僳族、拉祜族、景颇族、布朗族等民族的20种语言数据库。中国社会科学院在语言数据库建设方面取得了一系列成果:《中国少数民族语言音档(修订)》、《中国少数民族濒危语言语音语料库》、《中国少数民族说汉语中介语语音语料库》。

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3