TOP
0
0
【簡體曬書區】 單本79折,5本7折,活動好評延長至5/31,趕緊把握這一波!
機器學習實踐:數據科學應用與工作流的開發及優化(簡體書)
滿額折

機器學習實踐:數據科學應用與工作流的開發及優化(簡體書)

人民幣定價:99 元
定  價:NT$ 594 元
優惠價:87517
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:15 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

本書以作者在BuzzFeed的工作經驗為基礎,將機器學習和計算機工程巧妙地結合在一起。第壹部分的基本原則是數據科學世界堅實的基礎;第二部分介紹現實問題中的常用算法,幫助讀者迅速解決實際問題,避免被數據誤導、產生結論錯誤;第三部分則著眼於工程實踐,基於工程角度突破瓶頸,讓算法能夠在現實條件中得以實現。

作者簡介

安德魯‧凱萊赫,Venmo的一名高級軟件工程師和分布式系統架構師。

名人/編輯推薦

這本實用書籍同時介紹了機器學習和數據科學,填補了數據科學家和工程師之間的空白

目次

譯者序

前言
作者簡介
第一部分 框架原則
第1章 數據科學家的定位 2
1.1 引言 2
1.2 數據科學家扮演的角色 2
1.2.1 公司規模 3
1.2.2 團隊背景 3
1.2.3 職業晉升和發展 4
1.2.4 重要性 5
1.2.5 工作細分 5
1.3 結論 5
第2章 項目流程 7
2.1 引言 7
2.2 數據團隊背景 7
2.2.1 專門崗位與資源池 8
2.2.2 研究分析 8
2.2.3 原型設計 9
2.2.4 集成的工作流 10
2.3 敏捷開發與產品定位 10
2.4 結論 15
第3章 量化誤差 16
3.1 引言 16
3.2 量化測量值的誤差 16
3.3 抽樣誤差 18
3.4 誤差傳遞 20
3.5 結論 22
第4章 數據編碼與預處理 23
4.1 引言 23
4.2 簡單文本預處理 24
4.2.1 分詞 24
4.2.2 n元模型 26
4.2.3 稀疏 26
4.2.4 特徵選擇 27
4.2.5 表示學習 29
4.3 信息量損失 31
4.4 結論 33
第5章 假設檢驗 34
5.1 引言 34
5.2 什麼是假設 34
5.3 假設檢驗的錯誤類型 36
5.4 p值和置信區間 37
5.5 多重測試和p值操控 38
5.6 實例 39
5.7 假設檢驗的設計 40
5.8 結論 41
第6章 數據可視化 43
6.1 引言 43
6.2 數據分佈和匯總統計 43
6.2.1 數據分佈和直方圖 44
6.2.2 散點圖和熱力圖 48
6.2.3 箱線圖和誤差條 52
6.3 時間序列圖 54
6.3.1 移動統計 54
6.3.2 自相關 56
6.4 圖可視化 57
6.4.1 佈局算法 57
6.4.2 時間複雜度 59
6.5 結論 60
第二部分 算法與架構
第7章 算法和架構簡介 62
7.1 引言 62
7.2 架構 64
7.2.1 服務 64
7.2.2 數據源 65
7.2.3 分批及在線計算 66
7.2.4 規模擴展 66
7.3 模型 67
7.3.1 訓練 68
7.3.2 預測 68
7.3.3 驗證 69
7.4 結論 70
第8章 距離度量 71
8.1 引言 71
8.2 Jaccard距離 71
8.2.1 算法 72
8.2.2 時間複雜度 73
8.2.3 內存注意事項 73
8.2.4 分布式方法 73
8.3 MinHash 74
8.3.1 假設 75
8.3.2 時空複雜度 75
8.3.3 工具 75
8.3.4 分布式方法 75
8.4 余弦相似度 76
8.4.1 複雜度 78
8.4.2 內存注意事項 78
8.4.3 分布式方法 78
8.5 馬氏距離 78
8.5.1 複雜度 79
8.5.2 內存注意事項 79
8.5.3 分布式方法 79
8.6 結論 80
第9章 回歸 81
9.1 引言 81
9.1.1 選擇模型 82
9.1.2 選擇目標函數 82
9.1.3 模型擬合 83
9.1.4 模型驗證 84
9.2 線性最小二乘 87
9.2.1 假設 88
9.2.2 複雜度 89
9.2.3 內存注意事項 89
9.2.4 工具 89
9.2.5 分布式方法 89
9.2.6 實例 90
9.3 線性回歸中的非線性回歸 97
9.4 隨機森林 100
9.4.1 決策樹 100
9.4.2 隨機森林 103
9.5 結論 106
第10章 分類和聚類 107
10.1 引言 107
10.2 邏輯回歸 108
10.2.1 假設 111
10.2.2 時間複雜度 111
10.2.3 內存注意事項 112
10.2.4 工具 112
10.3 貝葉斯推斷與樸素貝葉斯 112
10.3.1 假設 114
10.3.2 複雜度 114
10.3.3 內存注意事項 114
10.3.4 工具 114
10.4 K-Means 115
10.4.1 假設 118
10.4.2 複雜度 118
10.4.3 內存注意事項 118
10.4.4 工具 118
10.5 最大特徵值 118
10.5.1 複雜度 120
10.5.2 內存注意事項 120
10.5.3 工具 120
10.6 Louvain貪心算法 120
10.6.1 假設 121
10.6.2 複雜度 121
10.6.3 內存注意事項 121
10.6.4 工具 121
10.7 最近鄰算法 121
10.7.1 假設 123
10.7.2 複雜度 123
10.7.3 內存注意事項 123
10.7.4 工具 123
10.8 結論 123
第11章 貝葉斯網絡 125
11.1 引言 125
11.2 因果圖、條件獨立和馬爾
 可夫 126
11.2.1 因果圖和條件獨立 126
11.2.2 穩定性和依賴性 127
11.3 d分離和馬爾可夫性質 128
11.3.1 馬爾可夫和因式
 分解 128
11.3.2 d分離 129
11.4 貝葉斯網絡的因果圖 132
11.5 模型擬合 133
11.6 結論 136
第12章 降維與隱變量模型 137
12.1 引言 137
12.2 先驗 137
12.3 因子分析 139
12.4 主成分分析 140
12.4.1 複雜度 142
12.4.2 內存注意事項 142
12.4.3 工具 142
12.5 獨立成分分析 142
12.5.1 假設 145
12.5.2 複雜度 145
12.5.3 內存注意事項 146
12.5.4 工具 146
12.6 LDA主題模型 146
12.7 結論 152
第13章 因果推斷 153
13.1 引言 153
13.2 實驗 154
13.3 觀測值:一個實例 157
13.4 非因果阻斷控制法 163
13.5 機器學習估計量 167
13.5.1 重新審視G公式 167
13.5.2 實例 168
13.6 結論 172
第14章 高級機器學習 173
14.1 引言 173
14.2 優化 173
14.3 神經網絡 175
14.3.1 神經網絡層 176
14.3.2 神經網絡容量 177
14.3.3 過擬合 179
14.3.4 批擬合 183
14.3.5 損失函數 183
14.4 結論 185
第三部分 瓶頸和優化
第15章 硬件基礎 188
15.1 引

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 517
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區