本文摘要:摘要:HSK是一項(xiàng)國際漢語能力標(biāo)準(zhǔn)化考試。新HSK大綱中附表所列650個(gè)默認(rèn)詞多依據(jù)專家知識(shí)人工列舉式的擴(kuò)充。該文在《現(xiàn)代漢語詞典》《現(xiàn)代漢語語法信息詞典》等資源的基礎(chǔ)上,利用知識(shí)工程的方法,迭代使用減字默認(rèn)、組合默認(rèn)等詞匯等級(jí)類推規(guī)則,力爭實(shí)現(xiàn)類
摘要:HSK是一項(xiàng)國際漢語能力標(biāo)準(zhǔn)化考試。新HSK大綱中附表所列650個(gè)“默認(rèn)詞”多依據(jù)專家知識(shí)人工列舉式的擴(kuò)充。該文在《現(xiàn)代漢語詞典》《現(xiàn)代漢語語法信息詞典》等資源的基礎(chǔ)上,利用知識(shí)工程的方法,迭代使用減字默認(rèn)、組合默認(rèn)等詞匯等級(jí)類推規(guī)則,力爭實(shí)現(xiàn)類推過程中隱性知識(shí)的顯性化、分散知識(shí)的系統(tǒng)化,使得詞匯等級(jí)類推的每一個(gè)環(huán)節(jié)都有章可循、有據(jù)可依,完成了基于新HSK大綱詞匯等級(jí)的系統(tǒng)類推工作。接著,結(jié)合所構(gòu)建的漢語詞法知識(shí)庫對(duì)類推結(jié)果進(jìn)行了篩選•最終得到了23762個(gè)詞語的類推等級(jí)。最后•通過對(duì)類推結(jié)果的統(tǒng)計(jì)分析,表明該文的研究工作可以更好地發(fā)揮新HSK詞匯大綱在漢語詞匯定級(jí)、文本難度分級(jí)中的指導(dǎo)作用,也可為其他領(lǐng)域教學(xué)詞匯大綱的制定提供一定的借鑒。
關(guān)鍵詞:新HSK大綱;等級(jí)類推;詞法知識(shí)庫;相對(duì)爛
漢語教學(xué)論文投稿刊物:《國際漢語教學(xué)研究》以推進(jìn)漢語國際教育研究與事業(yè)發(fā)展為宗旨,以漢語教學(xué)研究為核心,依托海內(nèi)外漢語國際教育領(lǐng)域的專家、學(xué)者、教師、研究人員的學(xué)識(shí)與實(shí)踐,搭建學(xué)術(shù)研究成果的交流平臺(tái),構(gòu)筑學(xué)科人才與優(yōu)秀教師的發(fā)展園地。
o引言
HSK是一項(xiàng)國際漢語能力標(biāo)準(zhǔn)化考試。目前,HSK已成為留學(xué)中國的通行證、申請(qǐng)來華留學(xué)獎(jiǎng)學(xué)金的必備條件和學(xué)校教學(xué)評(píng)估的重要手段•并被越來越多國家的政府部門和跨國企業(yè)作為員工招聘、提薪和晉升的重要依據(jù)。為使?jié)h語水平考試(HSK)更好地服務(wù)于漢語學(xué)習(xí)者,國家漢辦組織中外漢語教學(xué)、語言學(xué)、心理學(xué)和教育測量學(xué)等領(lǐng)域的專家,在充分調(diào)查、了解海外漢語教學(xué)實(shí)際情況的基礎(chǔ)上.吸收原有HSK的優(yōu)點(diǎn),借鑒近年來國際語言測試研究最新成果,推出新漢語水平考試(HSK)[I\新HSK詞匯大綱由于收詞規(guī)模的限制,對(duì)于許多類型的詞匯只是象征性的收詞.從而導(dǎo)致本應(yīng)收入大綱的詞匯沒有收入進(jìn)來。例如,大綱只收了“星期、星期一、星期日”,而沒有收錄“星期二”至“星期六”等詞語;收錄了“月、正月、八月”,而沒有收錄其他月份詞語;收錄了“春、夏、秋、冬”,而沒有收錄“春天、夏天、秋天、冬天”。
類似地,像“這個(gè)、很多、這么、人們、每天、這些、那兒、一天、那個(gè)、每個(gè)、上學(xué)、老人、大熊貓、打開、外國、男人、春節(jié)……”這些常用詞語都沒有收錄。但如果把這些詞都算作超綱詞,顯然是不合理的。這些詞匯對(duì)應(yīng)的大綱等級(jí)信息缺失,將給教材編寫、水平測評(píng)等一系列應(yīng)用問題帶來巨大的障礙。本文旨在探索詞匯等級(jí)的類推機(jī)制,力爭實(shí)現(xiàn)類推過程中隱性知識(shí)的顯性化及分散知識(shí)的系統(tǒng)化.使得詞匯等級(jí)類推的每一個(gè)環(huán)節(jié)都有章可循,有據(jù)可依,從而更好地發(fā)揮新HSK詞匯大綱在漢語詞匯定級(jí)、文本難度分級(jí)中的指導(dǎo)作用,夯實(shí)其在本領(lǐng)域的基礎(chǔ)資源地位。同時(shí),也可為其他領(lǐng)域教學(xué)詞匯大綱的制定提供一定的借鑒。
1資源基礎(chǔ)
1.1詞匯大綱資源
1.1.1新HSK詞匯大綱
新HSK詞匯大綱采用2015年9月人民教育出版社岀版的《HSK考試大綱》最新版本皿。大綱收錄了國際漢語教學(xué)中常用的基礎(chǔ)詞匯,并對(duì)這些詞匯按照一至六級(jí)進(jìn)行了等級(jí)劃分。另外,在每一級(jí)詞表之后舉例式地給出了若干個(gè)類推詞匯,共計(jì)650個(gè)。
1.1.2《通用大綱》《國際漢語教學(xué)通用課程大綱》⑵(以下簡稱《通用大綱》)中,漢字部分分為六級(jí),共計(jì)2500個(gè)漢字;詞匯部分基本沿用《HSK考試大綱》。
1.1.3《音節(jié)大綱》詞匯《漢語國際教育用音節(jié)漢字詞匯等級(jí)劃分》⑷(以下簡稱《音節(jié)大綱》),是面向全球漢語國際教育的國家標(biāo)準(zhǔn),是一種標(biāo)準(zhǔn)化、系統(tǒng)化、規(guī)范化的等級(jí)水平劃分!兑艄(jié)大綱》詞匯三個(gè)等級(jí)共收詞11092個(gè)。
1.2漢語詞典資源
1.2.1現(xiàn)代漢語詞典
《現(xiàn)代漢語詞典》(以下簡稱《現(xiàn)漢》)⑷是我國第一部規(guī)范性的語文詞典,以規(guī)范性、科學(xué)性和實(shí)用性為主要特點(diǎn),在漢語語言教學(xué)理論研究界具有較強(qiáng)的權(quán)威性。作為一部全面收錄現(xiàn)代漢語中基本詞、常用詞等的綜合性詞典.在漢語普及、推廣普通話、漢語規(guī)范等方面發(fā)揮著重要作用可。
1.2.2現(xiàn)代漢語語法信息詞典
《現(xiàn)代漢語語法信息詞典》(以下簡稱《GKB》)是為計(jì)算機(jī)實(shí)現(xiàn)漢語句子的自動(dòng)分析與生成而由北京大學(xué)研制的一部面向中文信息處理領(lǐng)域的電子詞典。其收詞從包括《現(xiàn)代漢語詞典》《現(xiàn)代漢語頻率詞典》《信息處理用現(xiàn)代漢語五千詞表》在內(nèi)的多部詞典中選出,經(jīng)過時(shí)間和實(shí)踐檢驗(yàn)證明能夠有效服務(wù)于中文信息處理領(lǐng)域.適合作為中文信息處理用基本單位。
1.3詞法標(biāo)注資源
1.3.1現(xiàn)代漢語構(gòu)詞結(jié)構(gòu)模式
對(duì)于漢語的構(gòu)詞,研究者們很早就注意到詞匯的構(gòu)詞結(jié)構(gòu)與句法結(jié)構(gòu)具有相似性。趙元任⑷認(rèn)為在詞語的構(gòu)詞成分之間存在著類似于句子之間的關(guān)系。根據(jù)詞語內(nèi)語素與語素之間的關(guān)系,朱德熙®也有過類似的論述。苑春法等指出,復(fù)合詞的基本結(jié)構(gòu)基本上和詞組、短語、句子的結(jié)構(gòu)一樣,也存在著主謂、偏正、聯(lián)合、述賓、述補(bǔ)等結(jié)構(gòu);跇(gòu)詞結(jié)構(gòu)的這種思想,郭冬冬等⑴切設(shè)計(jì)了一套描述構(gòu)詞結(jié)構(gòu)的符號(hào)集.用來描述詞素之間的組合關(guān)系,在此基礎(chǔ)上構(gòu)建了包含672條詞匯構(gòu)詞結(jié)構(gòu)模式的現(xiàn)代漢語構(gòu)詞模式知識(shí)庫。
2基于規(guī)則的新HSK詞匯等級(jí)類推
索緒爾〔⑷把凡是不屬于語音性質(zhì)的詞的外形變化,都看作是類推引起的,而類推必須有一個(gè)模型及對(duì)此模型的有規(guī)則的模仿。類推形式就是以一個(gè)或幾個(gè)其他形式為模型,按照一定規(guī)則構(gòu)成的形式。在漢語領(lǐng)域,姜同絢指出,類推變化在漢語詞語中表現(xiàn)得非常充分,不僅表現(xiàn)在詞語的構(gòu)成、語音的演變上,還表現(xiàn)在詞義發(fā)展上。類推作用于構(gòu)詞,一方面跟語義有關(guān),另一方面與人們總是善于由已知知識(shí)去推知和掌握未知知識(shí)的認(rèn)知規(guī)律相一致。
類推機(jī)制在新詞語結(jié)構(gòu)生成中的作用主要可以從音節(jié)的增減、附加法構(gòu)詞能力、詞族現(xiàn)象和外來詞語的借用及類推影響等方面分析考慮。本研究將《現(xiàn)漢》收錄詞語刪除非Unicode編碼詞語后,共得詞形65831個(gè);與GKB收錄詞形取并集,共得92091個(gè),作為詞匯等級(jí)類推的候選集。另外,由于單音節(jié)詞匯等級(jí)的類推相對(duì)更不穩(wěn)定,故直接將《通用大綱》收錄而新HSK大綱沒有收錄的1579個(gè)單音節(jié)詞匯及其等級(jí)納入進(jìn)來。
2.1基于減字類推規(guī)則的詞匯等級(jí)類推
所謂的減字類推規(guī)則,指的是一個(gè)多音節(jié)詞語通過減去部分音節(jié)的方法而得到新的詞語,并且新得到詞語的等級(jí)由原多音節(jié)詞語的等級(jí)確定。即:由一個(gè)詞語減字默認(rèn)詞的等級(jí)與原詞的等級(jí)相同。例如,電子郵件3=>郵件3;日用品5=〉用品5;知足常樂6=>知足6;等等。如果對(duì)于同一個(gè)詞語的等級(jí),可由多個(gè)不同的多音節(jié)詞語通過減字默認(rèn)的方式得到,并且所得出的等級(jí)不同,則取最低的類推等級(jí)。例如:“服務(wù)員2=>服務(wù)2;服務(wù)區(qū)4=>服務(wù)4”,則“服務(wù)”的減字默認(rèn)級(jí)別為“2”?偟膩碚f,減字默認(rèn)類推規(guī)則可概括為,“類推等級(jí)同原詞匯等級(jí)”、“就低不就高”。類推算法流程如圖2所示。通過減字類推共得到207個(gè)雙音節(jié)詞匯及其等級(jí)。
2.2基于詞義合成方式知識(shí)庫的詞匯等級(jí)篩選
類推是否合理不僅與構(gòu)詞結(jié)構(gòu)方式有關(guān),還與類推詞匯的意指方式有著密切的聯(lián)系。例如,天1,書1=>天書1;冷l,n2=>冷門2;白2,臉3=>白臉3;發(fā)3,毛4=>發(fā)毛4;白2,領(lǐng)5=>白領(lǐng)5;用I6,熬6=〉煎熬6o上述這些例子中類推得到的詞匯大多發(fā)生了轉(zhuǎn)義,無法很好地根據(jù)類推前詞匯的等級(jí)來類推這些詞匯的等級(jí)。在前面幾節(jié)中通過類推得到了25229個(gè)詞語及其等級(jí)。利用所構(gòu)建的詞義合成方式知識(shí)庫對(duì)該部分進(jìn)行篩選過濾.過濾掉詞義合成方式為慣指部分以外的1467個(gè)詞語,最終剩余23762個(gè)詞語及其類推等級(jí).將此詞匯集合稱為“HSK類推擴(kuò)充集”。
3實(shí)驗(yàn)結(jié)果數(shù)據(jù)分析
3.1八套國家漢辦主干教材詞匯覆蓋對(duì)比分析
本文采用國家漢辦8套主干教材課文文本作為實(shí)驗(yàn)對(duì)象,分別以新HSK詞匯大綱和類推詞匯集對(duì)八套教材進(jìn)行詞匯覆蓋情況的統(tǒng)計(jì)。8套教材為:《新實(shí)用漢語》《快樂漢語》《長城漢語》《跟我學(xué)漢語》《漢語教學(xué)直通車》《當(dāng)代中文》《漢語樂園》《中文聽說讀寫》。從人工標(biāo)注好的8套教材語料"⑷統(tǒng)計(jì)得到詞形6191個(gè)、詞次111929個(gè),去除其中的人名、地名、機(jī)構(gòu)名、數(shù)字等非通用詞匯之后•剩余詞形5888個(gè)詞、詞次108532個(gè)。類推前后詞匯集對(duì)教材語料的覆蓋情況對(duì)比如表12所示。從計(jì)算所得到的相鄰級(jí)別之間相對(duì)爛來看,對(duì)于初、中難度級(jí)別的文本類推前后的區(qū)分度比較接近,說明HSK類推集的詞匯等級(jí)基本符合原大綱的難度定級(jí)標(biāo)準(zhǔn)。而對(duì)于較高難度級(jí)別的文本,原大綱由于收詞過少,直接用其作標(biāo)準(zhǔn)進(jìn)行文本難度級(jí)別判斷,明顯存在區(qū)分度偏低的問題;而基于HSK類推擴(kuò)充集統(tǒng)計(jì)高難度語料的詞匯等級(jí)分布,不同級(jí)別之間相對(duì)爛有明顯的提升,這說明類推工作對(duì)于原大綱的補(bǔ)足作用是明顯的。
4結(jié)語
本文利用知識(shí)工程的方法,迭代使用減字默認(rèn)、組合默認(rèn)等詞匯等級(jí)類推規(guī)則.力爭實(shí)現(xiàn)類推過程中隱性知識(shí)的顯性化、分散知識(shí)的系統(tǒng)化,使得詞匯等級(jí)類推的每一個(gè)環(huán)節(jié)都有章可循,有據(jù)可依,完成了基于新HSK大綱詞匯等級(jí)的系統(tǒng)類推工作,并結(jié)合所構(gòu)建的漢語詞法知識(shí)庫對(duì)類推結(jié)果進(jìn)行了篩選。最后,通過對(duì)類推結(jié)果的統(tǒng)計(jì)分析.表明本文的研究工作可以更好地發(fā)揮新HSK詞匯大綱在漢語詞匯定級(jí)、文本難度分級(jí)中的指導(dǎo)作用.也可為其他領(lǐng)域教學(xué)詞匯大綱的制定提供一定的借鑒。
參考文獻(xiàn)
[1]孔子學(xué)院總部/國家漢辦.HSK考試大綱(一級(jí)〜六級(jí))[M1北京:人民教育出版社,2015.
[2]孔子學(xué)院總部/國家漢辦.國際漢語教學(xué)通用課程大綱[M].北京:北京語言大學(xué)出版社,2014.
轉(zhuǎn)載請(qǐng)注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///jylw/22033.html