珍愛中華語言資源
來源:發(fā)布時間:2008-12-22 11:58:05
更不可忽視的是,當(dāng)今時代,一些語言職業(yè)和語言產(chǎn)業(yè)逐漸形成,語言已經(jīng)進入到經(jīng)濟和高新科技領(lǐng)域,成為經(jīng)濟發(fā)展的重要資源。比如英語教育產(chǎn)業(yè)、語言翻譯產(chǎn)業(yè)、文字速錄師職業(yè)、計算機字庫提供商、語言文字信息處理軟件產(chǎn)業(yè)等。隨著信息時代的發(fā)展,語言作為經(jīng)濟資源的性質(zhì)會體現(xiàn)得越來越明顯,其經(jīng)濟意義越來越顯著。
二、急需開展中國語言普查
看待問題的角度往往決定認識問題的深度。當(dāng)具有了語言資源意識、回眸審視中華語言資源之時,突然發(fā)現(xiàn):
(1)對中國語言狀況了解不夠。中國究竟有多少種語言?各語言又有多少方言?這些語言與方言的分布區(qū)域、使用人口、功能活力如何?無人能清晰地回答這些問題。
(2)對語言資源的保護和開發(fā)利用不夠。例如:許多語言職業(yè)和語言產(chǎn)業(yè)沒有得到重視;許多語料庫質(zhì)量不高,沒有發(fā)揮其應(yīng)有的作用;對于現(xiàn)實世界和虛擬空間的語言資源保護,沒有明確的法規(guī)制度等。
(3)語言資源流失嚴(yán)重,許多語言及方言衰落或瀕危。許多兒童已不能熟練掌握方言,母語水平滑坡,一些少數(shù)民族青少年甚至放棄了母語。中國的一些語言和方言已經(jīng)處于瀕危狀態(tài)甚或消亡。當(dāng)然,語言資源流失、一些語言瀕危,是當(dāng)今世界普遍存在的問題。目前世界上大約有5000至6000種語言,90%的語言只被10%的人使用,如果不采取有效措施,這90%的語言在百年或幾百年內(nèi)可能消亡。語言消亡意味著:人類將失去不可復(fù)得的語言樣品,將失去不可再生的文化基因,將永遠失去一些歷史記憶。有鑒于此,在新世紀(jì)我國應(yīng)當(dāng)盡快開展語言普查工作,以了解基本的語言國情,保護和開發(fā)中華語言資源。
20世紀(jì)30年代以來,一直有學(xué)者對中國語言和方言的種類、分布、結(jié)構(gòu)特點、譜系關(guān)系等進行調(diào)查研究,出版了若干漢語方言和民族語言的系列叢書和詞典,繪制了中國語言的分布圖等。作為國家組織的大型語言普查有兩次:
第一次是根據(jù)國務(wù)院指示1956年開始的漢語和少數(shù)民族語言調(diào)查。當(dāng)時主要調(diào)查的是語言結(jié)構(gòu),旨在為方言區(qū)學(xué)習(xí)普通話服務(wù),為創(chuàng)制民族文字服務(wù),沒有顧及到語言運用;而且限于技術(shù)條件,調(diào)查得較為粗糙。當(dāng)時調(diào)查了1849個縣市的漢語方言,并組成7個民族調(diào)查隊,調(diào)查了主要民族地區(qū)的語言。那次大規(guī)模的調(diào)查,培養(yǎng)了一支從事方言和民族語言調(diào)查的專業(yè)隊伍,發(fā)展了語言學(xué)學(xué)科,積累了經(jīng)驗,了解了一些語言國情。
第二次是1999年教育部等11部委聯(lián)合開展的中國語言文字使用情況調(diào)查。當(dāng)時主要關(guān)心的是語言文字的使用現(xiàn)狀,但是沒有采錄語料,不能了解語言及方言的話語實態(tài),也不能直接解決語言保護等問題。這次調(diào)查涉及全國1063個縣(市、區(qū)),被調(diào)查對象47萬多人,積累了田野調(diào)查和問卷調(diào)查的豐富經(jīng)驗。
現(xiàn)在一些有識之士正在呼吁開展新世紀(jì)的語言普查。果若能成,這次語言普查就應(yīng)兼取上兩次之長,弄清中國語言及其方言的種類、分布區(qū)域、運用人群、及其使用變化狀況等,建立起可永久保存的中國語言多媒體語料庫及相關(guān)數(shù)據(jù)庫,繪制細致的可傳至后代的多媒體語言地圖。
語言普查是一項工程浩繁、利在當(dāng)代而惠及千秋的事業(yè),應(yīng)由國家立項、調(diào)動全國的語言學(xué)力量、社會各界積極支持配合,這是不言而喻、毋需論證的。就普查工作而言,首先要對國內(nèi)外已有的相關(guān)成果進行梳理、整合。這些成果,包括各種語言和方言的調(diào)查報告、辭書和語言地圖、記錄的音檔,也包括地方志中的相關(guān)內(nèi)容。通過這些成果的收集梳理和整合集成,為新的語言普查提供工作基礎(chǔ)。當(dāng)然,這本身就是一項浩瀚的文化工程。
其次,在語言普查、成果整理的一系列過程中,應(yīng)充分利用現(xiàn)代語言處理手段和各種信息技術(shù)與設(shè)備。如用于語言普查的錄音、轉(zhuǎn)寫技術(shù),地理信息系統(tǒng)(GIS)技術(shù)和衛(wèi)星定位(GPS)技術(shù),用于語料存儲和檢索的多媒體數(shù)據(jù)庫技術(shù),用于語料分析、標(biāo)注的軟件技術(shù),以及錄音筆、計算機、服務(wù)器、大容量存儲器等多種硬件設(shè)備。
第三,也是最為重要的,就是要制定科學(xué)的普查方案。參考已有的研究成果,根據(jù)語言國情、技術(shù)條件和工作目標(biāo),對普查內(nèi)容、普查方式、采錄標(biāo)準(zhǔn)、人員培訓(xùn)、資料匯總、成果管理、項目監(jiān)督等一系列問題進行科學(xué)論證,形成方案。并選取有典意義的縣(旗)作普查試點,在試點中積累經(jīng)驗、完善方案。語言普查以縣(旗)為單位布點為宜,語言情況復(fù)雜的地方加大調(diào)查點的密度。在調(diào)查清楚每個調(diào)查點語音、詞匯、語法等語言結(jié)構(gòu)的情況之外,還應(yīng)錄取實態(tài)語音材料。
第四,重視數(shù)據(jù)的保存、開發(fā)與共享。普查數(shù)據(jù)(特別是語言、方言的實態(tài)語料數(shù)據(jù))要多備份異介質(zhì)異地方安全保存,重視對這些資源的行政開發(fā)和學(xué)術(shù)開發(fā),為國家的各行各業(yè)和學(xué)術(shù)的發(fā)展提供數(shù)據(jù)支撐。通過網(wǎng)站、開放實驗室、語言博物館等方式,實現(xiàn)數(shù)據(jù)共享,最大限度地讓這些數(shù)據(jù)造福國家、人類與學(xué)界。
第五,重視人員培訓(xùn)。語言普查的專業(yè)性很強,也很辛苦,需要對普查人員進行培訓(xùn),以保證普查使用統(tǒng)一的方式、技術(shù)和工作規(guī)范。培訓(xùn)的專業(yè)內(nèi)容主要包括聽音訓(xùn)練,用國際音標(biāo)記音,語言調(diào)查字表和詞表的使用,計算機輔助田野調(diào)查技術(shù),語言數(shù)據(jù)的建庫技術(shù)等等。
三、結(jié)語
對文獻文化的保存、整理與利用,中國有著悠久的傳統(tǒng),歷來受到重視。國務(wù)院正組織開展全國第三次文物普查,這是對實物文化進行收集、整理的新世紀(jì)的國家行動。但是,對于由口語涵載的文化,常被忽視。語言普查如果能夠?qū)嵤,并且重視文化因素的采集,比如用結(jié)構(gòu)訪談和采風(fēng)的方式采錄各地有特色的文化語料,增加語料的文化含量等,其實也就是對中華口頭文化的大規(guī)模收集,意義宏大而深遠。
語言及其方言是國家不可再生的、彌足珍貴的非物質(zhì)文化,是構(gòu)成文化多樣性的前提條件。通過語言普查建立中華語言的語料庫,其實就是建立中華文化的知識庫、“基因庫”,是語言資源保存與開發(fā)的重大而有效的舉措。中國是世界上語言資源最豐富的國家之一,保護好中國的語言資源,也是中國對人類的貢獻。
二、急需開展中國語言普查
看待問題的角度往往決定認識問題的深度。當(dāng)具有了語言資源意識、回眸審視中華語言資源之時,突然發(fā)現(xiàn):
(1)對中國語言狀況了解不夠。中國究竟有多少種語言?各語言又有多少方言?這些語言與方言的分布區(qū)域、使用人口、功能活力如何?無人能清晰地回答這些問題。
(2)對語言資源的保護和開發(fā)利用不夠。例如:許多語言職業(yè)和語言產(chǎn)業(yè)沒有得到重視;許多語料庫質(zhì)量不高,沒有發(fā)揮其應(yīng)有的作用;對于現(xiàn)實世界和虛擬空間的語言資源保護,沒有明確的法規(guī)制度等。
(3)語言資源流失嚴(yán)重,許多語言及方言衰落或瀕危。許多兒童已不能熟練掌握方言,母語水平滑坡,一些少數(shù)民族青少年甚至放棄了母語。中國的一些語言和方言已經(jīng)處于瀕危狀態(tài)甚或消亡。當(dāng)然,語言資源流失、一些語言瀕危,是當(dāng)今世界普遍存在的問題。目前世界上大約有5000至6000種語言,90%的語言只被10%的人使用,如果不采取有效措施,這90%的語言在百年或幾百年內(nèi)可能消亡。語言消亡意味著:人類將失去不可復(fù)得的語言樣品,將失去不可再生的文化基因,將永遠失去一些歷史記憶。有鑒于此,在新世紀(jì)我國應(yīng)當(dāng)盡快開展語言普查工作,以了解基本的語言國情,保護和開發(fā)中華語言資源。
20世紀(jì)30年代以來,一直有學(xué)者對中國語言和方言的種類、分布、結(jié)構(gòu)特點、譜系關(guān)系等進行調(diào)查研究,出版了若干漢語方言和民族語言的系列叢書和詞典,繪制了中國語言的分布圖等。作為國家組織的大型語言普查有兩次:
第一次是根據(jù)國務(wù)院指示1956年開始的漢語和少數(shù)民族語言調(diào)查。當(dāng)時主要調(diào)查的是語言結(jié)構(gòu),旨在為方言區(qū)學(xué)習(xí)普通話服務(wù),為創(chuàng)制民族文字服務(wù),沒有顧及到語言運用;而且限于技術(shù)條件,調(diào)查得較為粗糙。當(dāng)時調(diào)查了1849個縣市的漢語方言,并組成7個民族調(diào)查隊,調(diào)查了主要民族地區(qū)的語言。那次大規(guī)模的調(diào)查,培養(yǎng)了一支從事方言和民族語言調(diào)查的專業(yè)隊伍,發(fā)展了語言學(xué)學(xué)科,積累了經(jīng)驗,了解了一些語言國情。
第二次是1999年教育部等11部委聯(lián)合開展的中國語言文字使用情況調(diào)查。當(dāng)時主要關(guān)心的是語言文字的使用現(xiàn)狀,但是沒有采錄語料,不能了解語言及方言的話語實態(tài),也不能直接解決語言保護等問題。這次調(diào)查涉及全國1063個縣(市、區(qū)),被調(diào)查對象47萬多人,積累了田野調(diào)查和問卷調(diào)查的豐富經(jīng)驗。
現(xiàn)在一些有識之士正在呼吁開展新世紀(jì)的語言普查。果若能成,這次語言普查就應(yīng)兼取上兩次之長,弄清中國語言及其方言的種類、分布區(qū)域、運用人群、及其使用變化狀況等,建立起可永久保存的中國語言多媒體語料庫及相關(guān)數(shù)據(jù)庫,繪制細致的可傳至后代的多媒體語言地圖。
語言普查是一項工程浩繁、利在當(dāng)代而惠及千秋的事業(yè),應(yīng)由國家立項、調(diào)動全國的語言學(xué)力量、社會各界積極支持配合,這是不言而喻、毋需論證的。就普查工作而言,首先要對國內(nèi)外已有的相關(guān)成果進行梳理、整合。這些成果,包括各種語言和方言的調(diào)查報告、辭書和語言地圖、記錄的音檔,也包括地方志中的相關(guān)內(nèi)容。通過這些成果的收集梳理和整合集成,為新的語言普查提供工作基礎(chǔ)。當(dāng)然,這本身就是一項浩瀚的文化工程。
其次,在語言普查、成果整理的一系列過程中,應(yīng)充分利用現(xiàn)代語言處理手段和各種信息技術(shù)與設(shè)備。如用于語言普查的錄音、轉(zhuǎn)寫技術(shù),地理信息系統(tǒng)(GIS)技術(shù)和衛(wèi)星定位(GPS)技術(shù),用于語料存儲和檢索的多媒體數(shù)據(jù)庫技術(shù),用于語料分析、標(biāo)注的軟件技術(shù),以及錄音筆、計算機、服務(wù)器、大容量存儲器等多種硬件設(shè)備。
第三,也是最為重要的,就是要制定科學(xué)的普查方案。參考已有的研究成果,根據(jù)語言國情、技術(shù)條件和工作目標(biāo),對普查內(nèi)容、普查方式、采錄標(biāo)準(zhǔn)、人員培訓(xùn)、資料匯總、成果管理、項目監(jiān)督等一系列問題進行科學(xué)論證,形成方案。并選取有典意義的縣(旗)作普查試點,在試點中積累經(jīng)驗、完善方案。語言普查以縣(旗)為單位布點為宜,語言情況復(fù)雜的地方加大調(diào)查點的密度。在調(diào)查清楚每個調(diào)查點語音、詞匯、語法等語言結(jié)構(gòu)的情況之外,還應(yīng)錄取實態(tài)語音材料。
第四,重視數(shù)據(jù)的保存、開發(fā)與共享。普查數(shù)據(jù)(特別是語言、方言的實態(tài)語料數(shù)據(jù))要多備份異介質(zhì)異地方安全保存,重視對這些資源的行政開發(fā)和學(xué)術(shù)開發(fā),為國家的各行各業(yè)和學(xué)術(shù)的發(fā)展提供數(shù)據(jù)支撐。通過網(wǎng)站、開放實驗室、語言博物館等方式,實現(xiàn)數(shù)據(jù)共享,最大限度地讓這些數(shù)據(jù)造福國家、人類與學(xué)界。
第五,重視人員培訓(xùn)。語言普查的專業(yè)性很強,也很辛苦,需要對普查人員進行培訓(xùn),以保證普查使用統(tǒng)一的方式、技術(shù)和工作規(guī)范。培訓(xùn)的專業(yè)內(nèi)容主要包括聽音訓(xùn)練,用國際音標(biāo)記音,語言調(diào)查字表和詞表的使用,計算機輔助田野調(diào)查技術(shù),語言數(shù)據(jù)的建庫技術(shù)等等。
三、結(jié)語
對文獻文化的保存、整理與利用,中國有著悠久的傳統(tǒng),歷來受到重視。國務(wù)院正組織開展全國第三次文物普查,這是對實物文化進行收集、整理的新世紀(jì)的國家行動。但是,對于由口語涵載的文化,常被忽視。語言普查如果能夠?qū)嵤,并且重視文化因素的采集,比如用結(jié)構(gòu)訪談和采風(fēng)的方式采錄各地有特色的文化語料,增加語料的文化含量等,其實也就是對中華口頭文化的大規(guī)模收集,意義宏大而深遠。
語言及其方言是國家不可再生的、彌足珍貴的非物質(zhì)文化,是構(gòu)成文化多樣性的前提條件。通過語言普查建立中華語言的語料庫,其實就是建立中華文化的知識庫、“基因庫”,是語言資源保存與開發(fā)的重大而有效的舉措。中國是世界上語言資源最豐富的國家之一,保護好中國的語言資源,也是中國對人類的貢獻。
【糾錯】