TOP
0
0
【簡體曬書區】 單本79折,5本7折,活動好評延長至5/31,趕緊把握這一波!
數據倉庫與數據挖掘(簡體書)
滿額折

數據倉庫與數據挖掘(簡體書)

人民幣定價:39 元
定  價:NT$ 234 元
優惠價:87204
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:6 點
相關商品
商品簡介
目次
書摘/試閱

商品簡介

《計算機科學與技術學科研究生教材:數據倉庫與數據挖掘》第1章介紹數據倉庫、數據挖掘的一般知識和應用領域。第2~8章介紹數據倉庫和數據挖掘的理論和技術,其中第2、3章側重數據倉庫,重點闡述了數據倉庫的架構、OLAP等內容,第4~8章側重數據挖掘,重點闡述了關聯規則、粗糙集、決策樹、聚類分析和興趣度量等內容。第9章給出了數據倉庫與數據挖掘方面的應用案例。
《計算機科學與技術學科研究生教材:數據倉庫與數據挖掘》是為軟件工程碩士量身定做的教材,也可作為計算機專業、信息類專業、管理類專業相關課程的教材和教學參考書。

隨著數據采集手段的逐漸豐富,存儲裝置容量的提升和成本的下降,人類已經進入海量數據存儲的時代。如何有效地利用海量數據,分析其內在規律,挖掘潛藏在數據背后的知識,這些問題促使人們開始探索新的技術和方法。從應用的角度看,人們希望從已有的數據中分析未來的趨勢,在技術和工具上提供有效的輔助決策手段。在此背景下,數據倉庫和數據挖掘技術應運而生。目前,該領域成果已經應用到人類社會、經濟、科技等各個方面,相關的理論、標準和工具日趨成熟。數據倉庫和數據挖掘技術的發展又催生了大數據時代的降臨。
本書第l章是緒論,通過討論數據采集、數據存儲和數據管理技術的發展過程,引人數據倉庫、數據挖掘的一般知識,并討論了與本書主題相關的技術領域,對在應用領域中取得的成果進行了簡單綜述。第2—8章介紹數據倉庫和數據挖掘的理論和技術,是本書的重點。其中,第2、3章側重介紹數據倉庫,從OLTP到OLAP,系統地形成了數據倉庫的架構,這部分重點介紹了。LAP、數據倉庫實現等內容,第4—8章介紹數據挖掘,有選擇性地介紹關聯規則、粗糙集、決策樹、聚類分析等基本原理和典型算法,并以興趣度量為主討論對挖掘到的知識的評估問題。第9章給出數據倉庫與數據挖掘方面的應用案例,考慮教學需要,僅選擇部分與教材內容相關的案例,并進行適度裁剪和修改。
本書注重內容的科學性、技術性和工程性。基本原理部分盡量做到嚴謹、完整。技術實現和技巧性上力求經典、特征突出。在工程方面節選部分成功案例,期望以點帶面。在教學過程中可以根據學時數、專業特點、課程性質等對教學內容適當取舍。
本書由吉林大學李雄飛、長春大學杜欽生、吉林大學珠海學院吳吳共同編著。另外,長春理工大學董元方、李軍也為本書出版做出了貢獻。
作者

目次

前言
教學建議
第1章 緒論
1.1 引言
1.2 數據倉庫
1.2.1 從數據庫到數據倉庫
1.2.2 數據倉庫的基本概念
1.2.3 數據倉庫的體系結構
1.3 數據挖掘
1.3.1 KDD與數據挖掘
1.3.2 數據庫與數據挖掘發展歷程
1.3.3 數據挖掘的特征與對象
1.3.4 數據挖掘相關領域
1.4 數據倉庫與數據挖掘的關系
1.5 應用前景與發展趨勢
本章小結
習題
第2章 聯機分析處理
2.1 引言
2.2 OLAP的定義
2.3 OLAP的相關概念
2.4 OLAP與OLTP的關系和比較
2.5 OLAP準則
2.6 多維數據分析方法
2.7 關系數據的組織
2.8 多維數據的存儲方式
2.9 OLAP體系結構
2.10 OLAP的展現方式
2.11 OLAP工具的評價指標
2.12 OLAP的局限性
本章小結
習題
第3章 數據倉庫的設計與開發
3.1 引言
3.2 數據倉庫的數據模型概述
3.3 數據倉庫的分析與設計
3.3.1 需求分析
3.3.2 概念模型設計
3.3.3 邏輯模型設計
3.3.4 物理模型設計
3.3.5 數據倉庫的索引技術
3.4 數據倉庫的開發
3.4.1 風險因素
3.4.2 數據倉庫系統的生命周期
3.4.3 建立數據倉庫系統的思維模式
3.4.4 數據倉庫數據庫的設計步驟
3.4.5 數據質量與數據清洗
3.4.6 數據粒度與維度建模
3.4.7 選擇數據倉庫工具
3.4.8 提高數據倉庫性能
3.4.9 數據倉庫的安全性
3.5 主要的數據倉庫產品
本章小結
習題
第4章 關聯規則
4.1 引言
4.2 關聯規則模型
4.3 Apriori算法
4.3.1 發現頻繁項集
4.3.2 生成關聯規則
4.4 頻繁模式增長算法
4.4.1 建樹方法
4.4.2 用FP樹挖掘頻繁模式
4.5 關聯規則模型擴展
4.5.1 多級關聯規則
4.5.2 多維關聯規則
本章小結
習題
第5章 粗糙集
5.1 引言
5.2 近似空間
5.2.1 近似空間與不可分辨關系
5.2.2 知識與知識庫
5.3 近似與粗糙集
5.3.1 基本概念
5.3.2 基本性質
5.4 描述粗糙集的特征的方法
5.4.1 近似精度
5.4.2 拓撲特征
5.5 信息系統
5.5.1 信息系統的定義
5.5.2 約簡和核
5.5.3 分辨矩陣與分辨函數
5.5.4 信息系統約簡
5.6 決策表
5.6.1 相對約簡與知識依賴性
5.6.2 決策表及其約簡
5.6.3 近似約簡算法
5.6.4 決策規則
本章小結
習題
第6章 決策樹
6.1 引言
6.2 構建決策樹的理論問題
6.2.1 為當前結點選擇屬性
6.2.2 過擬合問題
6.3 ID3算法
6.3.1 生成決策樹的算法
6.3.2 生成規則和決策
6.4 決策樹的剪枝
6.4.1 預剪枝
6.4.2 后剪枝
6.5 C4.5算法
本章小結
習題
第7章 聚類分析
7.1 引言
7.2 聚類分析簡介
7.2.1 聚類分析
7.2.2 聚類分析應用領域與算法特征
7.3 數據類型、距離和相似系數
7.3.1 數據類型
7.3.2 距離和相似系數
7.4 聚類方法與聚類分類
7.4.1 聚類方法
7.4.2 聚類方法的分類
7.5 劃分方法
7.5.1 k-均值算法
7.5.2 k-中心點算法
7.5.3 關于參數K
7.5.4 EM聚類
7.6 層次方法
7.6.1 層次聚類中的距離度量
7.6.2 分裂方法
7.6.3 凝聚方法
7.7 基于密度的方法
7.7.1 DBSCAN算法
7.7.2 矢量感應聚類算法
7.8 聚類評估
7.8.1 假設檢驗
7.8.2 聚類評估中的假設檢驗
7.8.3 相對準則
本章小結
習題
第8章 興趣度量
8.1 引言
8.2 用于關聯規則和分類規則的度量
8.2.1 客觀度量
8.2.2 主觀度量
8.2.3 語義度量
8.3 用于總結的度量
8.4 分類器的興趣度
本章小結
習題
第9章 應用案例
9.1 數據倉庫應用案例
9.1.1 案例一:網絡購物數據倉庫
9.1.2 案例二:社會保障卡數據倉庫
9.1.3 案例三:醫院信息系統數據倉庫
9.2 數據挖掘應用案例
9.2.1 案例一:零售商系統貨籃數據挖掘
9.2.2 案例二:通信用戶滿意度指數評測
9.2.3 案例三:城市環境質量評價
本章小結
參考文獻

 

書摘/試閱

1.3.3 數據挖掘的特征與對象
1.數據挖掘系統的特征
數據挖掘技術可以應用在很多領域中,已經開發出很多系統并已部分投入應用。
SKICA了是由MIT噴氣推進實驗室與天文科學家合作開發的用于幫助天文學家發現遙遠的類星體的工具。該工具采用決策樹構造分類器,與以往方法相比SKICAT能分辨出亮度低出一個數量級的星體,而且效率提高了40倍以上。利用SKICAT’天文學家已經發現了16顆新的極遙遠的類星體。
Health—KEFIR是用于健康狀況預警的知識發現系統。該系統根據用戶實際情況集中了多種不同的事件類別,致力于大規模動態數據庫上的知識發現。發現的結果用Netscap形成超文本報告。
Kepler是一個可擴展數據挖掘平臺,它只是從數據訪問和準備到分析和可視化的整個知識發現過程。它的主要特點是開放的插件結構,允許第三方開發者在不修改已有軟件的情況下很方便地集成分析工具,導人數據格式,或預處理操作。大量的分析算法可以作為Kepler插件,如分類與回歸、決策樹、關聯規則和聚類,當然也有基于實例的方法’如Bayesian算法、子組發現方法等。Kepler能夠分析存儲于多個關系表中的數據。
TASA是為預測通信網絡故障而開發的通信網絡預警分析系統。典型網絡每天會產生成百的報警信息,TASA會生成形如“如果在一個時間段內發生某些預警信息組合’那么其他類型的預警將在某個時間范圍內發生”的規則。時間段的大小由用戶設定。
R—MINI運用分類技術從噪聲中提取有價值的信息。它用邏輯生成具有完備性和一致性的最小規則集。該工具首先為每個例子生成一個規則,然后分兩步進行規則約簡。第一步歸納能覆蓋更多正例子而不覆蓋負例子的規則,然后刪除冗余規則;第二步用更簡單的規則進行規則替換。由于是在微弱的變化中獲取信息,該系統也可以用于證券領域中的股市行情預測。
KDW是大型商業數據庫中的交互分析系統。它包括聚類、分類、總結、相關性分析等多種模式。由于需要用戶來指導系統的挖掘工作,如果用戶能熟練使用這個工具并具有很好的領域知識,那么KDW就是領域無關、通用的系統。
DBMincr是加拿大Simon Fraser大學開發的一個多任務KDD系統。DBMiner能夠完成多種知識發現(如泛化規則、特征規則、關聯規則、分類規則、演化規則和偏離知識等),該系統綜合了多種數據挖掘技術(包括面向屬性的歸納、統計分析、逐級深化發現多級關聯規則、元規則引導發現等方法)。DBMiner提供了一種交互式類SQI,語言DMSQL,能與關系數據庫無縫集成。
ROSETTA系統可能是最完整的粗糙集軟件環境。它在工作空間上以樹形結構顯示輸入、輸出數據以及它們之間的關系。ROSETTA系統具備從瀏覽、數據預處理,到約簡計算、規則生成,再到規則評估與分析整個KDD過程。
……

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 204
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區