TOP
0
0
【23號簡體館日】限時三天領券享優惠!!
數據挖掘算法與Clementine實踐(簡體書)
滿額折

數據挖掘算法與Clementine實踐(簡體書)

人民幣定價:29 元
定  價:NT$ 174 元
優惠價:87151
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:4 點
相關商品
商品簡介
名人/編輯推薦
目次
書摘/試閱

商品簡介

《數據挖掘算法與Clementine實踐》主要介紹了幾種最成熟的數據挖掘方法,并針對每種方法,介紹了應用最廣泛的幾種實現算法。書中以Clementine12.0為平臺,用實例介紹了每種算法的具體應用。全書各章分別介紹了數據挖掘和Clementine軟件、決策樹分類方法(包括ID3、C4.5、C5.0、CART等算法)、聚類分析方法(包括K-Means算法和TwoStep算法)、關聯規則挖掘方法(包括Apriori算法、CARMA算法和序列模式挖掘算法)、數據篩選算法(包括特征選擇算法和異常檢測算法)、回歸分析方法(包括線性回歸算法和二項Logistic回歸)、神經網絡構建方法(包括多層感知器網絡、RBF網絡以及Kohonen網絡的構建算法)、時間序列分析方法(包括指數平滑法和ARIMA模型構建方法)。

名人/編輯推薦

《數據挖掘算法與Clementine實踐》是由清華大學出版社出版的。

目次

第1章 數據挖掘概述
1.1 數據挖掘簡介
1.1.1 數據、信息和知識
1.1.2 數據挖掘的定義
1.2 數據挖掘過程
1.3 數據挖掘方法
1.4 數據挖掘工具及軟件

第2章 Clementine概述
2.1 Clementine簡介
2.2 Clementine基本操作
2.2.1 Clementine主窗口
2.2.2 數據流的基本操作

第3章 決策樹
3.1 分類與決策樹概述
3.1.1 分類與預測
3.1.2 決策樹的基本原理
3.2 ID3、C4.5 與C5.0
3.2.1 ID3
3.2.2 C4.5
3.2.3 C5.O
3.2.4 在Clementine中應用C5.0
3.3 CAR.T
3.3.1 生成最大樹
3.3.2 樹的修剪
3.3.3 子樹評估
3.3.4 在Clementine中應用CART

第4章 聚類分析
4.1 聚類分析概述
4.1.1 聚類分析的概念
4.1.2 聚類分析的基本方法
4.2 K-Mealls算法
4.2.1 數據預處理
4.2.2 K-Means算法流程
4.2.3 在Clementine中應用K.Means
4.3 Two Step算法
4.3.1 構建CF樹
4.3.2 聚類
4.3.3 在Clementine中應用 Two Step

第5章 關聯規則
5.1 關聯規則概述
5.1.1 關聯規則的定義
5.1.2 關聯規則的基本概念
5.1.3 關聯規則挖掘算法
5.2 Apriori算法
5.2.1 Apriori算法原理
5.2.2 在Clementine中應用Apfiori算法
5.3 CARMA算法
5.3.1 CARMA算法原理
5.3.2 在Clementine中應用CARMA算法
5.4 序列模式
5.4.1 序列與序列模式
5.4.2 序列模式挖掘算法
5.4.3 在Clementine中應用序列模式挖掘

第6章 數據篩選
6.1 特征選擇
6.1.1 特征選擇算法概述
6.1.2 篩選
6.1.3 分級
6.1.4 選擇
6.1.5 在Clementine中應用特征選擇
6.2 異常檢測
6.2.1 異常數據挖掘概述
6.2.2 異常檢測算法
6.2.3 在Clementine中應用異常檢測

第7章 統計模型
7.1 線性回歸
7.1.1 線性回歸的基本原理
7.1.2 在Clementine中應用線性回歸
7.2 二項Logistic回歸
7.2.1 二項Logistic回歸的基本原理
7.2.2 在Clementine中應用Logistic回歸

第8章 神經網絡
8.1 神經網絡原理
8.1.1 神經網絡基本概念
8.1.2 神經網絡及其學習
8.2 多層感知器與RBF網絡
8.2.1 多層感知器
8.2.2 徑向基函數網絡
8.2.3 在Clementine中應用神經網絡
8.3 Kohonen網絡
8.3.1 自組織神經網絡
8.3.2 自組織特征映射網絡
8.3.3 在Clementine中應用Kohonen網絡

第9章 時間序列分析與預測
9.1 時間序列概述
9.1.1 時間序列基本概念
9.1.2 時間序列預測的傳統方法
9.2 指數平滑法
9.2.1 指數平滑法概述
9.2.2 指數平滑模型
9.3 ARIMA模型
9.3.1 ARMA模型
9.3.2 差分運算與ARIMA模型
9.3.3 ARIMA建模過程
9.3.4 在Clementine中應用
時間序列分析
參考文獻

書摘/試閱

統計方法COBWEB-是一個常用的且簡單的增量式概念聚類方法。它的輸入對象是采用符號量(屬性一值)對來加以描述的。采用分類樹的形式來創建一個層次聚類。
CLASSIT是COBWEB的另一個版本。它可以對連續取值屬性進行增量式聚類。它為每個節點中的每個屬性保存相應的連續正態分布(均值與方差);并利用一個改進的分類能力描述方法,即不像COBWEB那樣計算離散屬性(取值)和而是對連續屬性求積分。但是CLASSIT方法也存在與COBWEB類似的問題。因此它們都不適合對大數據庫進行聚類處理。
傳統的聚類算法已經比較成功地解決了低維數據的聚類問題。但是由于實際應用中數據的復雜性,在處理許多問題時,現有的算法經常失效,特別是對于高維數據和大型數據的情況。因為傳統聚類方法在高維數據集中進行聚類時,主要遇到兩個問題。首先,高維數據集中存在大量無關的屬性使得在所有維中存在簇的可能性幾乎為零。另外,高維空間中數據較低維空間中數據分布要稀疏,其中數據間距離幾乎相等是普遍現象,而傳統聚類方法是基于距離進行聚類的,因此在高維空間中無法基于距離來構建簇。
高維聚類分析已成為聚類分析的一個重要研究方向。同時高維數據聚類也是聚類技術的難點。隨著技術的進步使得數據收集變得越來越容易,導致數據庫規模越來越大、復雜性越來越高,如各種類型的貿易交易數據、Web文檔、基因表達數據等,它們的維度(屬性)通常可以達到成百上千維,甚至更高。但是,受“維度效應”的影響,許多在低維數據空間表現良好的聚類方法運用在高維空間上往往無法獲得好的聚類效果。高維數據聚類分析是聚類分析中一個非常活躍的領域,同時它也是一個具有挑戰性的工作。

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 151
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區