商品簡介
名人/編輯推薦
序
本書簡潔且全面地介紹了現代神經網絡、人工智能和深度學習技術,專門為軟件工程師和數據科學家設計。它是另外兩本著作Deep Learning with Keras[1]和TensorFlow 1x Deep Learning Cookbook[2]的延續。
本書目標
本書對過去幾年中深度學習技術的演進做了概括,並給出了用Python寫的數十種可運行的深度神經網絡代碼,它們都是用基於類Keras[1] API的模塊化深度網絡庫TensorFlow 20實現的。
本書將循序漸進地介紹有監督學習算法,包括簡單線性回歸、經典多層感知器,以及更為復雜的深度卷積網絡和生成對抗網絡。本書還涵蓋無監督學習算法,包括自編碼器和生成網絡,並對循環網絡和長短期記憶網絡進行詳細解釋。此外,本書還會對深度強化學習進行全面介紹,並涵蓋深度學習加速器(GPU和TPU)、云開發以及在桌面系統、云服務、移動設備/物聯網(IoT)和瀏覽器上的多環境部署。
實際應用包括將文本分類為預定義類別、語法分析、語義分析、文本合成以及詞性標注。書中我們還會探討圖像處理,包括手寫數字圖像識別、圖像分類以及具有相關圖像注釋的高級物件識別。
聲音分析包括識別來自多個揚聲器的離散語音。本書還介紹使用自編碼器和GAN生成圖像,使用強化學習技術構建能夠自主學習的深度Q學習網絡。實驗是本書的精髓。每個網絡都增加了多種變體,這些變體通過更改輸入參數、網絡形狀、損失函數和優化算法來逐步提高學習性能。本書還提供在CPU、GPU和TPU上進行訓練的對比。本書將介紹新領域AutoML,在該領域中,我們將學習如何高效和自動地構建深度學習模型。第15章專門介紹機器學習相關的數學知識。
機器學習、人工智能和深度學習寒武紀爆炸
人工智能(Artificial Intelligence,AI)為本書討論的所有內容奠定了基礎。機器學習(Machine Learning,ML)是AI的一個分支,而深度學習(Deep Learning,DL)又是ML中的一個子集。下面簡要討論本書中經常出現的這三個概念。
AI表示機器模仿人類通常表現出的智能行為的任何活動。更正式地說,這是一個研究領域,機器旨在復制認知能力,例如學習行為、與環境的主動交互、推理和演繹、計算機視覺、語音識別、問題求解、知識表示和感知。AI建立在計算機科學、數學和統計學以及心理學和其他研究人類行為的科學的基礎上。建立AI有多種策略。在20世紀70年代和20世紀80年代,“專家”系統變得非常流行。這些系統的目標是通過用大量手動定義的if-then規則表示知識來解決復雜的問題。這種方法適用於非常特定的領域中的小問題,但無法擴展到較大的問題和多領域中。後來,AI越來越關注基於統計的方法。
ML是AI的一個子學科,它專注於教授計算機如何對特定任務進行學習而無須編程。ML背後的關鍵思想是可以創建從數據中學習並做出預測的算法。ML有三類:
有監督學習,向機器提供輸入數據及期望輸出,目的是從這些訓練實例中學習,以使機器可以對從未見過的數據做出有意義的預測。
無監督學習,僅向機器提供輸入數據,機器隨後必須自己尋找一些有意義的結構,而無須外部監督或輸入。
增強學習,機器充當代理,與環境交互。如果機器的行為符合要求,就會有“獎勵”;否則,就會受到“懲罰”。機器試圖通過學習相應地發展其行為來最大化獎勵。
DL在2012年席卷全球。在那一年,ImageNet 2012挑戰賽[3]發起,其目的是使用大型手工標記數據集的子集來預測照片的內容。名為AlexNet[4]的深度學習模型達到了153%的top-5錯誤率,這與早前的結果相比有了顯著改進。根據《經濟學人》 [5]的說法,“突然之間,人們開始關注深度學習,不僅是在AI社區內部,而且是整個技術行業。” 自2012年以來,我們看到了對ImageNet圖像進行分類的多個模型的持續進展[5](見圖1),錯誤率低於2%,優於51%的預計人為錯誤率。
那僅僅是開始。如今,DL技術已成功應用於異構領域,包括但不限於醫療保健、環境工程、綠色能源、計算機視覺、文本分析、多媒體、金融、零售、遊戲、模擬、工業、機器人技術和自動駕駛汽車。在每一個領域中,DL技術都可以以一定的準確度解決問題,而這是以前的方法無法實現的。
毫無疑問,人們對DL的興趣也在增加。有報告[9]顯示,“每20分鐘就會有新的ML論文發表。機器學習論文的增長率約為每月35%,每年50%”。在過去的三年中,我們好像生活在DL的寒武紀大爆炸中,arXiv上論文數量的增長速度超過了摩爾定律(見圖2)。正如評論所說:“這使你感到人們相信這是計算的未來價值的來源。”
圖1 ImageNet 2012上不同的深度學習模型實現的top-5準確度
圖2 arXiv上ML論文數量似乎比摩爾定律增長更快
arXiv是電子預印本的存儲庫,預印本尚未進行完整的同行評審。
深度學習模型的復雜性也在增加。ResNet-50是一種圖像識別模型(參見第4章和第5章),具有約2600萬個參數。每個參數都是用於微調模型的權重。Transformer、gpt-1、bert和gpt-2[7]都是自然語言處理模型(參見第8章),具備在文本上執行各種任務
目次
前言
作者簡介
審校者簡介
第1章 基於TensorFlow 20的神經網絡基礎1
11 TensorFlow是什麼1
12 Keras是什麼3
13 TensorFlow 20有哪些重要的改動3
14 神經網絡概述4
15 感知器5
16 多層感知器—第一個神經網絡示例6
161 感知器訓練的問題及對策6
162 激活函數—sigmoid函數7
163 激活函數—tanh函數7
164 激活函數—ReLU函數8
165 兩個拓展激活函數—ELU函數和LeakyReLU函數8
166 激活函數總結9
167 神經網絡到底是什麼9
17 示例—識別手寫數字10
171 獨熱編碼10
172 在TensorFlow 20中定義一個簡單的神經網絡10
173 運行一個簡單的TensorFlow 20神經網絡並建立測試基線14
174 使用隱藏層改進TensorFlow 20的簡單神經網絡15
175 利用隨機失活進一步改進Ten-sor Flow 20的簡單神經網絡18
176 測試TensorFlow 20的不同優化器19
177 增加epoch數24
178 控制優化器學習率25
179 增加內部隱藏神經元的數量25
1710 增加批量計算的大小26
1711 手寫圖識別實驗總結26
18 正則化27
181 采用正則化以避免過擬合27
182 理解批量歸一化28
19 Google Colab—CPU、GPU和TPU29
110 情感分析31
111 超參數調諧和AutoML33
112 預測輸出34
113 反向傳播的實用概述34
114 我們學到了什麼35
115 邁向深度學習方式35
116 參考文獻36
第2章 TensorFlow 1x與2x37
21 理解TensorFlow 1x37
211 TensorFlow 1x計算圖程序結構37
212 常量、變量和占位符的使用39
213 操作物件示例40
214 TensorFlow 2x中的TensorFlow 1x示例43
22 理解TensorFlow 2x44
221 即刻執行44
222 AutoGraph45
223 Keras API的三種編程模型47
224 回調49
225 保存模型和權重50
226 使用tfdatadatasets訓練50
227 tfkeras還是估算器53
228 不規則張量55
229 自定義訓練55
2210 TensorFlow 2x中的分布式訓練56
2211 命名空間的改動59
2212 1x至2x的轉換59
2213 高效使用TensorFlow 2x59
23 TensorFlow 2x生態系統60
24 Keras還是tfkeras61
25 小結62
第3章 回歸64
31 什麼是回歸64
32 使用線性回歸進行預測65
321 簡單線性回歸65
322 多線性回歸68
323 多元線性回歸68
33 TensorFlow Estimator69
331 特征列69
332 輸入函數70
333 使用TensorFlow EstimatorAPI的MNIST70
34 使用線性回歸預測房價71
35 分類任務和決策邊界75
351 logistic回歸75
352 MNIST數據集上的logistic回歸76
36 小結80
37 參考文獻80
第4章 卷積神經網絡81
41 深度卷積神經網絡81
411 局部感受野82
412 共享權重和偏差82
413 數學示例83
414 TensorFlow 2x中的ConvNets83
415 池化層84
42 DCNN的示例—LeNet85
421 TensorFlow 20中的LeNet代碼85
422 理解深度學習的力量90
43 通過深度學習識別CIFAR-10圖像91
431 用更深的網絡提高CIFAR-10的性能93
432 用數據增強提高CIFAR-10的性能95
433 基於CIFAR-10預測97
44 用於大規模圖像識別的超深度卷積網絡98
441 基於VGG16神經網絡識別貓100
442 使用tfkeras內置的VGG16 Net模塊101
443 復用預建深度學習模型以提取特征102
45 小結103
46 參考文獻103
第5章 高級卷積神經網絡104
51 計算機視覺104
511 復雜任務的CNN組合104
512 用tfkeras-estimator模型對Fashion-MNIST分類111
513 在GPU上運行Fashion-MNISTtfkeras-estimator模型113
514 用於遷移學習的Deep Inception-v3 Net114
515 遷移學習:分類人和馬117
516 基於tfkeras和TensorFlow Hub的Application Zoo120
517 其他CNN架構121
518 回答有關圖像的問題124
519 風格遷移127
5110 創建DeepDream網絡129
5111 查看深度網絡學到的內容132
52 視頻133
53 文本文件134
54 音頻和音樂137
55 卷積運算小結141
551 基本卷積神經網絡141
552 空洞卷積141
553 可分離卷積141
554 深度卷積142
555 深度可分離卷積142
56 膠囊網絡142
561 CNN有什麼問題142
562 Capsule網絡有什麼新功能143
57 小結144
58 參考文獻144
第6章 生成對抗網絡146
61 什麼是GAN146
62 深度卷積GAN152
63 一些有趣的GAN架構161
631 SRGAN161
632 CycleGAN162
633 I
主題書展
更多主題書展
更多書展本週66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。