TOP
0
0
【簡體曬書節】 單本79折,5本7折,優惠只到5/31,點擊此處看更多!
統計學習必學的十個問題:理論與實踐(簡體書)
滿額折

統計學習必學的十個問題:理論與實踐(簡體書)

商品資訊

人民幣定價:49.8 元
定價
:NT$ 299 元
優惠價
87260
領券後再享88折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:7 點
相關商品
商品簡介
作者簡介
名人/編輯推薦
目次

商品簡介

統計學習是機器學習的重要分支,本書兼顧了數學上的理解和代碼實踐,內容主要包括基礎知識和統計學習模型。第1章、第2章結合VC維介紹過擬合的本質,並介紹手動特征選擇的辦法;第3章、第4章從最簡單的線性模型出發經過概率統計的解讀而得到分類和回歸算法;第5章討論了不依賴於假設分布的非參數模型;第6章將核方法作為一種非線性拓展的技巧介紹如何將該方法應用到很多算法中,並且引出了著名的高斯過程;第7章以混合高斯作為軟分配聚類的代表性方法,從而引出著名的EM算法;第8章討論了機器學習的集成算法;第9章介紹的線性和非線性降維方法將會解決維度災難問題,並且不同於單純的特征選擇;第10章討論了不依賴於獨立同分布假設的時間序列算法。
本書適合對於統計學習感興趣的大學生、工程師閱讀參考。閱讀本書需要具備基礎的Python編程技術和基本的數學知識。

作者簡介

李軒涯,單位:百度公司,職務、職稱:高級工程師,性別:男,年齡:33,專業:計算機科學與技術,學歷:博士,研究成果:中國計算機學會杰出會員、常務理事,中國計算機實踐教育聯合會副理事長。現主管百度校企合作、校企聯合人才培養、校園粉絲生態圈,幫助百度技術、人才及產品品牌在高校領域的推廣與影響力傳播。

名人/編輯推薦

本書包含機器學習的基礎知識和統計學習模型,更強調理論的深入理解以及用代碼實踐結合理論進行講解。

前言



人工智能技術廣泛出現在各個應用場景中,包括人臉識別、語音識別、機器對話、推薦系統等方面,其背後離不開數據的增加和算力的增強。統計學習和深度學習作為人工智能技術的兩大核心也日益受到人們的關注,雖然目前現階段的人工智能和真正的“智能”無法相提並論,但理解和掌握統計學習和深度學習知識會讓我們更加接近“通用智能”的理想。

關於人工智能的書籍浩如煙海,大部分人已經對於大部頭的書籍望而生畏,但又希望獲得體系化的知識,而本書有兩個重要的特點:

1. 更強調對理論的深入理解。針對性地選擇了20個主題,希望可以解決很多人面臨的困境——不滿足於知識堆砌,想達到體系化的理解。例如,對於大多數書直接引入的sigmoid和softmax函數,本書會介紹其背後隱藏的廣義線性模型; 大多數書直接引入的正則化作為過擬合的常用手段,本書會介紹其與極大後驗估計的關係……

2. 用代碼實踐結合理論講解。采用了算法理論和代碼實踐相結合的方式,代碼實踐提供了算法實現的某一種或者某幾種方式,其目的主要是用來更好地理解算法。在這裡,算法和代碼的關係,更像是理論與實踐的關係,我們用實踐來幫助大家更好地理解理論。

本書包含機器學習的基礎知識和統計學習模型,分為10章。第1章將過擬合問題結合VC維作為機器學習的基礎概念進行講解,並提供參數模型中防止過擬合的一般方法; 第2章提供機器學習的手動特征選擇的辦法; 第3章、第4章從最簡單的線性模型出發經過概率統計的解讀來得到分類和回歸算法; 第5章討論不依賴於假設分布的非參數模型; 第6章將核方法作為一種非線性拓展的技巧,介紹如何將該方法應用到很多算法中,並且引出了著名的高斯過程; 第7章以混合高斯作為軟分配聚類的代表性方法,來引出著名的EM算法; 第8章討論了機器學習的集成算法; 第9章介紹的線性和非線性降維方法將會解決維度災難問題,並且不同於單純的特征選擇; 第10章討論不依賴於獨立同分布假設的時間序列算法。

人工智能的發展太過迅速,本書只是廣闊無邊大海裡的一艘小船。學問廣袤無際,做學問更要勤勉躬親,作者深知詮才末學,書中難免錯漏謬言,希望讀者指正和交流,感激不盡。


編者


2021年5月


目次

第1章 防止過擬合
1.1 過擬合和欠擬合的背後
1.2 性能度量和損失函數
1.3 假設空間和VC維
1.4 偏差方差分解的意義
1.5 正則化和參數綁定
1.6 使用scikit-learn
第2章 特征選擇
2.1 包裹法Warpper
2.2 過濾法Filter
2.3 嵌入法Embedded
2.4 使用scikit-learn
第3章 回歸算法中的貝葉斯
3.1 快速理解判別式模型和生成式模型
3.2 極大似然估計和平方損失
3.3 最大後驗估計和正則化
3.4 貝葉斯線性估計
3.5 使用scikit-learn
第4章 分類算法中的貝葉斯
4.1 廣義線性模型下的sigmoid函數和softmax函數
4.2 對數損失和交叉熵
4.3 邏輯回歸的多項式拓展和正則化
4.4 樸素貝葉斯分類器
4.5 拉普拉斯平滑和連續特征取值的處理方法
4.6 使用scikit-learn
第5章 非參數模型
5.1 K近鄰與距離度量
5.2 K近鄰與kd樹
5.3 決策樹和條件嫡
5.4 決策樹的剪枝
5.5 連續特征取值的處理方法和基尼指數
5.6 回歸樹
5.7 使用scikit-learn
第6章 核方法
6.1 核方法的本質
6.2 對偶表示和拉格朗日乘子法
6.3 常見算法的核化拓展
6.4 高斯過程
6.5 使用scikit-learn
第7章 混合高斯:比高斯分布更強大
7.1 聚類的重要問題
7.2 潛變量與K均值
7.3 混合高斯和極大似然估計的失效
7.4 EM算法的核心步驟
7.5 使用scikit-learn
第8章 模型組合策略
8.1 Bagging和隨機森林
8.2 Boosting的基本框架
8.3 Adaboost
8.4 GBDT和XGBoost
8.5 使用scikit-learn
第9章 核化降維和學習流形
9.1 線性降維
9.2 核化線性降維
9.3 流形學習
9.4 使用scikit-learn
第10章 處理時間序列
10.1 概率圖模型和隱變量
10.2 高階馬爾可夫模型
10.3 隱馬爾可夫模型
10.4 隱馬爾可夫模型的EM算法
10.5 使用scikit-learn
參考文獻

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 260
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區