<noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"><delect id="ixm7d"></delect></rt><noframes id="ixm7d"><rt id="ixm7d"><rt id="ixm7d"></rt></rt><rt id="ixm7d"></rt> <noframes id="ixm7d"><rt id="ixm7d"><delect id="ixm7d"></delect></rt><delect id="ixm7d"></delect><bdo id="ixm7d"></bdo><rt id="ixm7d"></rt><bdo id="ixm7d"></bdo><noframes id="ixm7d"><rt id="ixm7d"><rt id="ixm7d"></rt></rt><rt id="ixm7d"><rt id="ixm7d"></rt></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt> <noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><noframes id="ixm7d"><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d"><rt id="ixm7d"></rt><noframes id="ixm7d">

關于建立渤海大學非洲留學生中介語語音語料庫的設想

2022-09-12

根據教育部發布的2015年全國來華留學生數據顯示, 從2003-2015年, 來華非洲留學生增長26倍, 增長率排名第一, 來華非洲留學生已然成為我國外國留學生中規模增長最快的主體。因此, 非洲留學生的語言教育問題也逐漸在對外漢語教學界引起重視。

漢語中介語語料庫建設是對外漢語教學學科理論研究中一項基礎性的課題, 也是一項迫切的任務 (儲誠志、陳小荷, 1993) 。語料庫語言學作為語言研究的一種方法, 因其方便快捷高效, 各大高校紛紛建立。比較著名的有北大的《人民日報》標注語料庫, 北京語言大學的HSK動態作文語料庫。開展面對特定對象、特定環境的漢語中介語音語料庫研究和建設雖在21世界初期就已提出, 但近幾年來研究成果零零散散, 規模較小, 非裔中介語語音語料庫更是語料庫語言學中的一個新興領域。為此提出針對非洲留學生的中介語語音語料庫建設的設想, 希望可以推動這方面的研究。渤海大學留學生人數眾多, 且多以非洲留學生為主, 這為針對非洲留學生的語音語料庫的建設可以提供豐富充足的語料。

一、前期準備

語料庫設計和編篡的出發點是:如何使得在其基礎上開展的語言調查是合理的和可靠的 (黃昌寧、李娟子, 2001) 。為此我們必須保證在建設語音語料庫的各個環節中采用科學合理的手段, 在前期準備的過程中, 我們需要做好以下幾方面的工作:

(一) 選取調查對象

本文選取了15位渤海大學非洲留學生 (包括來自不同地區的12位男生和3位女生) 作為調查對象, 其中男生漢語水平均為中高級, 女生為初級, 且普遍以當地語為母語, 以法語為第一外語。選取多位來自不同地區的調查對象, 旨在保證語料的豐富性, 避免因為調查對象人數少而產生的個體語音失誤誤導調查結果。

(二) 文本設計

文本設計需要解決這樣一個問題:既要涵蓋目的語的基本語音要素, 又要嚴控其大小。因為文本過大, 單人收錄成本過高, 不利于收集更多的語料 (王瑋、張勁松, 2019) 。因為經費和時間問題, 前期只設計了單音節、雙音節、三音節和四音節文本, 后期設計將會包含短語和句子, 本文只探討單音節、雙音節、三音節和四音節文本的設計方法。

1. 單音節

對于初學者而言, “字”音是漢語語音學習的基礎 (林燾, 1996) 。關于單音節文本的設計, 首先要統計普通話中所有的有意義的音節, 然后再與聲調組合, 去除其中沒有實字的音節與聲調的組合, 最后與漢字相匹配。其中與之匹配的漢字, 先在HSK的甲級詞匯中尋找, 如甲級詞匯中沒有, 可在乙級詞匯中找, 以此類推。因為漢字難度過大, 會影響調查對象的語音產出的準確性, 造成語音采集工作的困難。為此, 我們制作的文本均會有拼音標注。依照以上方法, 我們最終選取了1031個漢字和30個兒化詞作為單音節文本。

2. 雙音節

雙音節文本設計主要用于考察和統計學習者對兩個音節連續的掌握情況及其音節間的音聯表現 (曹文、張勁松, 2009) 。所以首先要統計聲調的組合類型, “陰、陽、上、去”四聲加上輕聲共有20種組合類型。其次我們要使各種音調組合和聲韻母組合最大面積的覆蓋, 從HSK詞匯中選取較為簡單的詞匯與之相匹配。最后選取443個詞匯為雙音節文本。

3. 三音節

三音節也是基本節奏單元的常見形式 (吳宗濟, 1990) 。其文本的設計不僅要考慮聲調組合的問題, 還要考慮結構關系的問題。在盡量包含所有的聲調組合的基礎上, 每種聲調組合下應有不同結構的三音節詞語。三音節聲調組合共有80種, 加上不同的結構, 我們共選取了227個三音節詞匯作為三音節文本。

4. 四音節

四音節的文本設計較為復雜。從組成成分上來看, 它可以是“東西南北”四個單音節詞的組合, 也可以是“青山綠水”兩個雙音節詞的組合;從結構來看, 它可以是聯合結構, 如“古城鐘樓”, 也可以是偏正結構, 如“高雅文化”, 也可以是主謂結構, 如“失物招領”等;從輕重音格式來看, 它可以是中-次輕-中-重格式, 如“高高興興”, 也可以是中-次輕-重-最終, 如“如意算盤”等等。本著控制語料庫大小的原則, 本文不考慮其他因素, 只根據聲調組合來選擇四音節詞匯。最后選取了167個詞匯作為四音節語料文本。

二、語音錄制和采集

語料的采集在封閉的教室進行, 由實驗人員操作設備。發音人根據亂序文本, 在距離話筒10厘米左右的位置發音。對錄音設備的選取, 綜合考慮經費問題和錄音效果后, 最終選取了筆記本電腦里的軟件audacity進行錄音, 話筒選用Sony ECM T115, 使用外置聲卡。所有語料的采樣率為44100HZ, 采樣精度為16bits, 單聲道錄音。

考慮到錄制語料時環境和設備帶來的不可避免的噪音, 后期采用audacity軟件進行降噪。

三、語音的標注

只有當語言研究者能夠從語料庫獲取知識和信息時, 才能說這個語料庫是有用的。事實上, 為了從語料庫中抽取語言信息, 必須首先向語料庫中植入信息——即添加標注 (黃昌寧、李涓子, 2002) 。該庫語音標注使用Praat軟件, 語音標注需要的一切聲學參數都從Praat軟件中尋找, 參照漢語音段標注系統SAMPA-C進行分級標注, 并且采用曹文、張勁松在2009年提出的漢語中介語語音語料庫音段標注規范 (BLCU-CAPL) 對語音偏誤進行標注。該庫的語音標注分為文本層、音節層、音素層、聲調層、偏誤層和信息層 (如果是句子則加入語調層) 。

(一) 文本層

本層主要標注的是發音人實際發音的詞匯, 之所以標注這一層, 是為了方便使用者檢索。

(二) 音節層

本層標注的是實際發音詞匯的音節, 并用1、2、3、4、0代表聲調的陰陽上去和輕聲來標注詞匯的正確聲調。

(三) 音素層

本層標注的是組成音節的音素。

(四) 聲調層

本層標注調查對象實際發音的聲調, 該層的標注方法:以音節為單位, 每個音節自動取音高曲線的起點、折點和終點等三點, 如果沒有折點, 則取起、終兩點 (周學文、呼和, 2014) 。并且在聲調層采用BLUC-CAPL對偏誤的聲調進行標注。

(五) 偏誤層

本層標注的是發音人實際存在并且表現在所采集語料上的語音偏誤, 對于這一層級的標注, 目前并沒有軟件自動標注, 因此必須采取人工標注。這就要求標注人對非洲留學生的語音偏誤有所研究。為了避免標注錯誤, 應選用多名擁有專業知識的同學同時進行標注, 如果意見不統一時, 則請教指導老師。偏誤層的標注規范參考BLUC-CAPL。

(六) 信息層

本層標注主要是語音發音人的信息, 包括哪個國家, 漢語水平, 以及年齡等信息。這一層的標注主要是考慮到中介語是一個動態的語言系統, 標注發音人信息, 主要是為以后把該庫拓展為動態語料庫建立條件。

四、語音庫的建立和維護

對于數據庫的選擇, 由于在語音庫中, 需要存儲大量的語音波形數據, 其特點是數據量大, 長度不固定, 對事務處理和恢復、安全性和對網絡的支持等方面要求較低。因此, 我們可以選用較易實現的vfp數據庫管理系統 (陳小瑩、陳晨、華侃、于洪志, 2008) 。關于語音庫的維護, 這是一個和語音庫的建設相輔相成的問題。隨著渤海大學非洲留學生數量不斷增多, 我們可以每年選取不同的調查對象, 進行語音的采集。也可以對同一調查對象定期進行語音采集, 研究中介語的發展變化。如此, 在建設中維護語音庫的數據, 在維護中擴大語音庫的規模。

五、結語

建立一個專門針對非洲留學生的中介語語音語料庫, 可以推動關于非洲留學生的語言教育事業的發展, 也有利于幫助我校在構建中介語語音語料庫研究領域處于領先地位。同時, 我們的創作思路和技術尚不成熟, 亟待在日后的實際創作過程中不斷完善。

摘要:本文主要探討建立渤海大學非洲留學生中介語語音語料庫的創作思路, 分析錄音文本設計和語音庫標注等問題。錄音文本設計力求全面、典型、合理, 盡量涵蓋所有的音段和超音段的漢語音節, 為此我們設計了單音節、雙音節、三音節和四音節四個子庫。語音標注體系決定著語音庫的建設能否成功, 該庫采用SAMPA-C漢語音段標注體系, 并且采用曹文、張勁松在2009年提出的漢語中介語語音語料庫音段標注規范 (BLCU-CAPL) 對語音偏誤進行標注, 使使用者通過文本的標注能了解學習者的偏誤, 為語言研究和語言教學提供支持。

關鍵詞:中介語語音語料庫,文本設計,語音標注

參考文獻

[1] 曹文, 張勁松.面向計算機輔助正音的漢語中介語語音語料庫的創制與標注[J].語言文字應用, 2009 (4) :122-131.

[2] 周學文, 呼和.語音聲學參數自動標注/提取系統簡介[J].中文信息學報, 2014, 28 (3) :123-128.

[3] 王瑋, 張勁松.漢語中介語語音庫的文本設計[J].世界漢語教學, 2019, 33 (01) :104-116.

[4] 林燾.語音研究和對外漢語教學[J].世界漢語教學, 1996 (3) :20-23.

[5] 陳小瑩, 陳晨, 華侃, 等.語音語料庫的設計研究[J].科技信息, 2008 (36) :5-6.

[6] 儲誠志, 陳小荷.建立“漢語中介語語料庫系統”的基本設想[J].世界漢語教學, 1993 (3) :199-205.

[7] 吳瓊.基于非洲來華留學生漢語學習策略的口語教學研究[J].語文教學通訊·D刊 (學術刊) , 2018, No.998 (06) :67-69.

[8] 周文華.漢語中介語語料庫建設的多樣性和層次性[J].漢語學習, 2015 (6) :97-105.

本文來自 99學術網(www.gaojutz.com),轉載請保留網址和出處

上一篇:《科技創新導報》稿件要求及投稿說明下一篇:如何指導小學生寫出真情作文

91尤物免费视频-97这里有精品视频-99久久婷婷国产综合亚洲-国产91精品老熟女泄火