現代漢語基本詞彙自動識別方法研究(簡體書)
- 系列名:國家語言資源監測與研究中心少數民族語言分中心計算語言學系列叢書
- ISBN13:9787566002525
- 出版社:中央民族大學出版社
- 作者:趙小兵
- 裝訂/頁數:平裝/230頁
- 規格:23.5cm*16.8cm (高/寬)
- 版次:1
- 出版日:2012/10/01
商品簡介
《現代漢語基本詞彙自動識別方法研究》的主要貢獻體現在:第一,在大規模的動態流通語料庫中.考察了大眾媒體報紙的詞匯真實使用情況。處理考察的語料規模龐大,覆蓋文本數632255個,詞次總數247257749,不同詞種數8750105。第二,首次提出了在動態流通語料庫中定量分析和考察CBVE基本詞彙特徵的一種方法,為今後基本詞彙從定性研究過渡到定量研究提供了一種途徑。第三,提出了一種詞匯通用程度的計算方法,為詞匯統計特徵考察提供了一種新的計量指標。第四,借鑒了模式識別領域的研究方法,依據遺傳算法搜尋特徵向量空間範圍廣、收斂速度快、魯棒性強等特點,將其應用到對CBVE自動識別及提取模型的參數訓練上,獲得了令人滿意的結果。
目次
1.1 基本詞彙的來源及爭論
1.2 基於動態流通語料庫的現代漢語基本詞彙概念的界定
1.3 基本詞彙的研究意義
1.4 基本詞彙研究及相關文獻綜述
1.5 研究目標和研究內容
1.6 本書內容結構
第二章 CBVE及其自動提取方法相關理論探討
2.1 現代漢語詞匯的層級關係
2.2 動態流通語料庫與詞匯的穩態研究
2.3 從“相對時間觀”看基本詞彙的穩固性特徵
2.4 關於模式識別的概念及其方法理論
2.5 小結
第三章 CBVE自動識別與提取的研究方法論
3.1 CBVE自動識別與提取研究的技術路線
3.2 研究語料的選擇
3.3 CBVE自動提取的基本詞彙先驗集研究
3.4 詞匯統計的預處理
3.5 小結
第四章 CCWE的自動識別與提取方法研究
4.1 CCWE通用度的定量分析方法探討
4.2 詞匯通用度的計算
4.3 CCWE的提取步驟
4.4 CCWE自動提取實驗結果分析
4.5 小結
第五章 狹義的CBVE自動識別與提取方法研究
5.1 CBVE的特徵向量描述
5.2 CBVE特徵向量的選取
5.3 CBVE的自動識別與提取模型構造
5.4 基本詞彙先驗集聚類
5.5 標注CBVE的初始訓練集
5.6 遺傳算法訓練狹義CBVE的自動提取模型
5.7 小結
第六章 廣義CBVE自動識別與提取方法研究
6.1 廣義CBVE的特徵向量描述
6.2 廣義CBVE特徵向量的選取
6.3 構造廣義CBVE自動識別與提取模型
6.4 訓練CBVE遺傳算法的自動提取模型
6.5 小結
第七章 CCWE與CBVE詞匯專項考察與分析
7.1 CBVE與CCWE特性統計分析
7.2 CCWE語素分析
7.3 CBVE的釋義能力分析
7.4 報紙媒體用詞特徵分析
7.5 領域類用詞特徵分析
7.6 小結
第八章 結語
8.1 存在的問題
8.2 今後的研究設想
參考文獻
附錄
附錄1 現代漢語基本詞彙先驗集收錄情況
附錄2 2002-2006年度的語言工程漢語通用詞(詞語帶詞性,共13484,前1100詞)
附錄3.1 CBVE備選集詞語語素過濾的“不成詞語素”表
……
主題書展
更多主題書展
更多書展本週66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。