TOP
0
0
【簡體曬書區】 單本79折,5本7折,活動好評延長至5/31,趕緊把握這一波!
智能聊天機器人:核心技術與算法(簡體書)
滿額折

智能聊天機器人:核心技術與算法(簡體書)

人民幣定價:128 元
定  價:NT$ 768 元
優惠價:87668
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:20 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次
書摘/試閱

商品簡介

隨著人工智能技術的發展,人類對智能化服務更加渴望,聊天機器人成為研發熱門之一。
《智能聊天機器人:核心技術與算法》從聊天機器人所涉及的多個方面出發,先理論後實踐,讓讀者不僅能了解其中的原理,還能自己動手編程。
《智能聊天機器人:核心技術與算法》共9章,第1章以該領域的背景知識作為開篇,重點介紹了聊天系統中的主要模塊;第2章闡述了語音識別和隱馬爾可夫模型;第3章側重於通用的自然語言處理技術;第4章講解如何使用信息檢索技術,來實現問答型的聊天系統;第5章介紹一些主流的機器學習算法,以及如何使用這些算法來提升基於信息檢索的問答系統;第6章介紹推薦系統相關的知識以及常見的推薦算法,並將其應用到問答系統中;第7章介紹如何使用深度學習來優化問答系統;第8章講述了聊天系統的前沿領域——知識圖譜;第9章討論任務型和閑聊型聊天系統中更有挑戰性的幾個課題。
《智能聊天機器人:核心技術與算法》可為高等院校計算機科學、信息科學、電子工程和人工智能等領域的科研人員提供參考,也可作為相關專業本科生和研究生教學的參考書,對於從事深度學習及其應用的開發人員同樣具有參考價值。

作者簡介

黃申,博士,2015年美國杰出人才,微軟學者,IBMExtremeBlue天才計劃成員。2006年博士畢業於上海交通大學計算機科學與工程專業,師從俞勇教授,擁有20餘篇國際論文和30多項國際專利。他有超過20年機器學習和大數據領域的從業經驗,現任Glassdoor機器學習資深研發經理,曾任職於LinkedIn全球數據科學部、微軟亞洲研究院、IBM研究院、eBay中國研發中心、1號店和***飛牛網。出版過《大數據架構和算法實現之路:電商系統的技術實戰》《大數據架構商業之路:從業務需求到技術方案》《程序員的數學》等技術書籍和專欄,累計讀者數萬人。

名人/編輯推薦

本書消除了智能聊天領域的門檻,目的是培養復合型技術人才。本書通過多個案例,逐步介紹聊天機器人開發各個階段可能遇到的技術難題、業務需求以及相對應的技術解決方案和實踐解析,讓讀者身臨其境,探尋智能聊天機器人的奧秘。本書覆蓋面全,涵蓋了所有最關鍵的技術。可實踐性強,通過大量實踐才能積累寶貴的經驗,最大限度地根據理論知識彌補技術方案的空白。這有利於技術人員針對不同的業務需求,制定更為合理的技術方案。


毋庸置疑,聊天機器人是最近幾年最火的人工智能領域之一,各種智能家居和語音助手層出不窮。可是,中國真正有實力構建此類系統的公司並不多。筆者閱讀了不少業界的觀察性文章,也走訪了一些業內的專家,發現導致這一現狀的原因主要在於以下幾點:
涉及的技術範圍廣,技術人才數量有限。聊天系統需要“理解”人類的語音和語意,然後進行一定的“思考”,甚至幫助用戶“完成”任務。這其中就涉及了語音識別、自然語言處理和理解、信息檢索、推薦、知識圖譜、機器學習、深度學習等多個領域的專業知識,而精通所有這些領域的人才少之又少。
發展速度快,技術含量高。如果說語音識別、自然語言處理和信息檢索領域相對成熟,那麼機器學習、深度學習、知識圖譜領域仍處於高速發展中,這類技術相對於普通的應用開發而言,需要更多理論知識和實踐經驗的積累。而商業價值的挖掘程度,往往取決於使用的技術深度。越是鉆研得深入,所產生的價值就會越大。
成熟方案少。很多智能的和大數據的技術是免費的,這對於盈利模式而言無疑是重大利好。不過代價就是其中存在穩定性和易用性問題。現在有一些大型技術公司提供更成熟的解決方案,但是價格高昂,對於經費並不寬裕的初創公司而言,選擇餘地太小。
以上這些因素,都會形成進入智能聊天領域的門檻,而高門檻勢必導致相關技術在工業界應用的步伐放緩。為了解決這個問題,企業需要培養自己的復合型技術人才,才能讓企業使用適合的工具、獲得準確的數據、制定合理的實現方案。為此,筆者萌生了一個想法:通過本書幫助企業快速建立復合型團隊,並搭建基礎的智能聊天系統。筆者在寫作過程中,力求做到以下幾點:

目次

第1章 聊天機器人概述
1.1 聊天機器人的發展歷史
1.2 聊天機器人的類型和應用
1.3 聊天機器人的模塊和框架

第2章 自動語音識別
2.1 自動語音識別的發展概述
2.2 隱馬爾可夫模型
2.2.1 概率論基礎知識
2.2.2 隱馬爾可夫模型是怎麼來的
2.2.3 求解隱馬爾可夫模型
2.3 Python實戰

第3章 自然語言處理
3.1 自然語言處理的發展概述
3.2 常見的自然語言處理技術
3.2.1 停用詞
3.2.2 同義詞和近義詞
3.2.3 多元語法
3.2.4 詞袋模型和TF-IDF機制
3.2.5 語義相關的詞
3.2.6 詞性標注
3.2.7 實體識別
3.2.8 語法分析和語義分析
3.3 針對中英文的特殊處理
3.3.1 取詞幹和詞形還原
3.3.2 中文分詞

第4章 基於信息檢索的問答系統
4.1 問答系統的發展概述
4.2 信息檢索
4.2.1 如何高效地找到信息
4.2.2 相關性模型
4.2.3 其他擴展
4.2.4 基於信息檢索的問答系統架構
4.3 基於Elasticsearch搜索引擎的問答系統
4.3.1 軟件和數據的準備
4.3.2 Elasticsearch的基本概念和使用
4.3.3 在Elasticsearch中處理自然語言
4.3.4 自定義Elasticsearch的排序
4.3.5 Elasticsearch中搜索結果的統計
4.3.6 Elasticsearch集群
4.3.7 集成的問答系統
……

第5章 用機器學習提升基於信息檢索的問答系統
第6章 基於社區和推薦的問答系統
第7章 使用深度學習加強問答系統
第8章 使用知識圖譜構建問答系統
第9章 打造任務型和閑聊型聊天系統

書摘/試閱

第2章 自動語音識別

2.1 自動語音識別的發展概述

有時候,我們需要通過語音和聊天機器人進行溝通,這種方式更加符合我們的行為習慣。可是,讓機器理解我們的語音不是件容易的事情。自從19世紀電話機問世以來,人們就可以通過機器進行人類聲音的處理。可是,無論是電話機對講機,還是錄音機,都只能存儲和播放人類說話的聲音,而無法理解這些話語。從20世紀至今,科學家們一直在探索如何利用計算機領域的知識,讓機器“聽懂”我們的語言,這也是本章的主題—自動語音識別(以下簡稱語音識別)。

最早的語音識別系統可以追溯到20世紀的50年代,專家們根據具體的業務需求,設計了簡單的語音交互系統。客戶只需要簡單地說出“是”“否”或者一些基於數字和單詞的簡單選項,就能和系統進行交互。時至今日,在一些銀行等企事業單位的電話熱線中,我們還能常常碰到並使用這種系統。這種系統已經具備了語音識別的基本形式,只需要區分固定集合內、數量有限的若幹語音模式。

20世紀70年代初期,語音識別技術進入快速發展時期,其中比較有代表性的方法包括模式識別、動態規劃和線性預測編碼。由於口語的發音數量是有限的,所以通過這些技術,機器能夠比較準確地識別單個詞的語音。美國國防部高級研究計劃署(Defense Advanced Research Projects Agency,DARPA)也曾經投資語音識別項目,在其資助下,卡內基-梅隆大學創造出了一臺能夠識別1000多個單詞的機器,識別成功率也是不錯的。到了20世紀70年代後期,一些大公司包括IBM、Bell等開始研發基於海量詞匯的連續語音識別系統,而此時基於專家系統的方法逐步被淘汰,而基於統計建模的方法逐步興起。

我們可以認為20世紀80、90年代是語音識別技術的一個突破期。一些成熟的算法,如基於隱馬爾可夫模型和N元語法(N-gram)語言模型。特別是HMM,它從基於簡單的模板匹配方法轉向基於概率統計建模的方法,時下主流的方法也有一部分采用了HMM框架。在各種HMM中,最為主流的方法是GMM-HMM,它一方面通過高斯混合模型(Gaussian Mixture Model,GMM)對語音狀態的觀察概率進行建模;另一方面通過HMM對語音狀態的時序進行建模。進入20世紀90年代之後,基於HMM的一系列語音識別技術趨於成熟,商業軟件和應用也層出不窮,包括DragonDecitate的Dragon系統,微軟的Whisper系統,IBM的Via-vioce系統和英國劍橋大學的HTK系統等。

可是,這些方法和系統在進入21世紀之後,面臨不少新的挑戰。人們使用語音識別的場景越來越多,不再局限於專業性的文稿輸入。比如,汽車、手機、會議室裡的語音助手,它們需要處理的是隨意性的對話,甚至是多人之間的交談。隨著深度學習的興起,語音識別技術找到了新的發展方向。其實,早在20世紀80年代,已經有學者開始將神經網絡運用到語音識別中,只是未能取得滿意的效果。而在目前深度學習的研究領域中,人們已經可以構建並訓練深層的神經網絡(DNN)和循環神經網絡(RNN)。某些實驗數據表明,在理想情況下,基於RNN模型的語音識別準確度達到了90%~95%,這一指標已經非常接近人類大腦識別的精度了。

正是由於語音識別技術的長足進步,時下各種語音識別的硬件、軟件和應用層出不窮。這項技術讓人類可以通過一種更自然的方式和機器進行交互,所以被廣泛運用在各種聊天機器人中。其中比較主流的形式是語音助手,包括亞馬遜在2014年推出的Echo,谷歌在2016年推出的Google Home等。而國內的公司也正在迎頭趕上,推出了智能音響、智能鼠標、智能遙控器等各種周邊設備,作為語音識別的硬件載體。

在經歷了幾十年的發展後,語音識別技術日趨成熟,其主流的處理框架也相對穩定。圖2-1列出了其中很常見的一種語音識別框架。

圖2-1 常用的語音識別框架

對於聊天機器人來說,最重要的是需要理解人們對它表達的意思,對應圖2-1來說,就是單詞(字)識別和句子識別的過程。在這裡,我們通過最經典的隱馬爾可夫模型,重點說說語音識別中從單詞、字到句子的識別過程。

2.2 隱馬爾可夫模型


您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 668
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區