鑒于藏語實驗語音學和計算語言學在研究方法和研究對象上各有偏重,在實踐過程中又互有交叉,本文將二者放在一起進行討論。藏語實驗語音學和計算語言學在2009年都取得了令人可喜的成績,據(jù)不完全統(tǒng)計,2009年度有近30篇相關(guān)論文發(fā)表。
(一)實驗語音學
藏語實驗語音學,主要以人的發(fā)音生理為主要研究對象。語音韻律、音節(jié)時長、語音識別和具體的語音特征等都是藏語實驗語音學研究關(guān)注的對象。相關(guān)的研究有:李勇、于洪志、達哇彭措的《基于關(guān)聯(lián)規(guī)則的藏語語音韻律參數(shù)提取》(《微計算機信息》第6期),陳琪、李永宏、陳小瑩、周一心、于洪志等人的《藏語天氣預報語音基于詞匯層面的藏語拉薩話音節(jié)時長統(tǒng)計》(《科技信息》第19期),姚徐、李永宏、單廣榮、于洪志等人的《藏語孤立詞語音識別系統(tǒng)研究》(《西北民族大學學報》自然科學版第1期),陳小瑩、陳晨、胡妍茹、李永宏、華侃的《基于EGG信號的安多藏語元音嗓音特征研究》(《第十屆全國人機語音通訊學術(shù)會議暨國際語音語言處理研討會論文摘要集》2009年),龍從軍的《藏語瑪曲話元音央化分析》(《第十屆全國人機語音通訊學術(shù)會議暨國際語音語言處理研討會論文摘要集》2009年)。
言語聲學參數(shù)系統(tǒng)和語音語料庫的設(shè)計對實驗語音學的研究來講極其重要。楊陽蕊、李永宏、于洪志等的《言語聲學參數(shù)分析系統(tǒng)設(shè)計》(《西北民族大學學報》自然科學版第1期)和《基于半音節(jié)的藏語連續(xù)語音語料庫設(shè)計》(《第十屆全國人機語音通訊學術(shù)會議暨國際語音語言處理研討會論文摘要集》2009年)對上述問題進行了闡述。文章結(jié)合實驗語音學和傳統(tǒng)語言學的研究方法,以不同語音類型所表現(xiàn)出的具有代表性的聲學參數(shù)為基礎(chǔ),設(shè)計并實現(xiàn)了言語聲學參數(shù)分析系統(tǒng)并根據(jù)古藏文音韻體系,建立了基于半音節(jié)的藏語連續(xù)語音語料庫,為語音的分析和研究提供了方便的工具。
(二)計算語言學
計算語言學通常意義上是指通過建立形式化的數(shù)學模型,來分析、處理自然語言,并在計算機上用程序來實現(xiàn)分析和處理語言材料,從而達到以機器來模擬人的部分乃至全部語言能力。2009年度藏語計算語言學研究涉及藏語文數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計、分類、編碼、排列、選擇、統(tǒng)計等,還有部分研究涉及人工智能、機器翻譯以及藏語文的信息化。
藏文的編碼與識別是實現(xiàn)藏語文信息化的基礎(chǔ)。與之相關(guān)的研究主要有:李永宏、何向真、艾金勇、于洪志的《藏文編碼方式及其相互轉(zhuǎn)換》(《計算機應用》7期),張高杰、付濤、于洪志的《藏文桑布扎1.0編碼與同元編碼轉(zhuǎn)換技術(shù)》(《電腦知識與技術(shù)》27期),武光利、于洪志、柳春的《藏文同元碼與基本集相互轉(zhuǎn)換的規(guī)則與實現(xiàn)》(《計算機工程與應用》29期),群諾的《藏文短消息UNICODE編碼傳輸協(xié)議的實現(xiàn)》(《西藏大學學報》自然科學版第1期),安見才讓的《多編碼環(huán)境下藏字內(nèi)碼識別算法的研究》(《微機處理》第5期),陳蕙的《藏語非編網(wǎng)編譯制作系統(tǒng)的應用》(《電視技術(shù)》第9期),陳小瑩、李永宏、陳晨、陳琪、于洪志的《基于大字符集編碼的藏梵文的混合排序》(《西北民族大學學報》自然科學版第3期),梁弼、王維蘭、錢建軍的《基于HMM的分類器在聯(lián)機手寫藏文識別中的應用》(《微電子學與計算機》第4期)以及才智杰的《藏文自動分詞系統(tǒng)中緊縮詞的識別》(《中文信息學報》第1期)。
高定國、關(guān)白的《回顧藏文信息處理技術(shù)的發(fā)展》(《西藏大學學報》社科版第3期)和石方夏、王亮的《藏文信息處理歷史及現(xiàn)狀分析》(《西藏民族學院學報》第4期)是對中國藏語文信息化建設(shè)的一次總結(jié)。文章通過對藏文信息處理歷史的回顧,結(jié)合目前的研究狀況和研究成果,對藏文信息處理的標準化工作、藏文字處理工作、藏文操作系統(tǒng)的研發(fā)等方面進行了分析,對我國在藏文信息處理方面所取得的成就作了介紹,并對這一領(lǐng)域研究工作中存在的問題進行了分析,旨在從整體上掌握和了解我國藏文信息處理的研發(fā)情況,有利于今后藏文信息處理研究工作的開展。
藏語文數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計、排列、數(shù)據(jù)分類、統(tǒng)計等同樣是藏語文計算語言學關(guān)注的重點。這方面的主要研究成果有:才讓加的《藏語語料庫詞語分類體系及標記集研究》(《中文信息報》第4期),姚徐、郭淑妮、李永宏、于洪志的《多級索引的藏語分詞詞典設(shè)計》(《計算機應用》S1期),楊陽蕊、李永宏、于洪志的《基于半音節(jié)的藏語連續(xù)語音語料庫設(shè)計》,(《第十屆全國人機語音通訊學術(shù)會議暨國際語音語言處理研討會論文摘要集》2009),劉文香的《藏文音節(jié)校對模型建設(shè)研究》(《西北民族大學學報》自然科學版第2期);廖艷莎、楊陽蕊、李永宏、于洪志、華侃等人的《藏文單音節(jié)動詞的形態(tài)變化及類型統(tǒng)計》(《科技信息》第5期),蘇俊峰、祁坤鈺、本太的《基于HMM的藏語語料庫詞性自動標注研究》(《西北民族大學學報》自然科學版第1期),曹玉林、索南當周的《英藏機器翻譯系統(tǒng)的語言模型及總體結(jié)構(gòu)設(shè)計》(《西南民族大學學報》自然科學版第2期);才藏太的《班智達藏文語料切分詞典的建立與算法研究》(《計算機應用》第7期),艾金勇、于洪志、李永宏的《藏文字形結(jié)構(gòu)計量統(tǒng)計分析》(《計算機應用》第7期)和金慧敏、廖燕莎、史菁、陳琪等的《藏語方言計算機輔助系統(tǒng)的研究》(《科技信息》第1期)。
版權(quán)所有 中國藏學研究中心。 保留所有權(quán)利。 京ICP備06045333號-1
京公網(wǎng)安備 11010502035580號