瀏覽紀錄

TOP
除夕至初二春節期間,物流配送將視情況調整,請依出貨/取貨通知函為主,造成不便,敬請見諒。三民網路書店祝您新年快樂、萬事如意。
1/1
無庫存,下單後進貨(採購期約45個工作天)
Python數據分析與數據化運營(第2版)(簡體書)
人民幣定價:129元
定  價:NT$774元
優惠價: 87673
可得紅利積點:20 點

無庫存,下單後進貨(採購期約45個工作天)

商品簡介

作者簡介

目次

這是一本將數據分析技術與數據使用場景深度結合的著作,從實戰角度講解了如何利用Python進行數據分析和數據化運營。
暢銷書全新、大幅升級,第1版近乎100%的好評,第2版不僅將Python升級到了*新的版本,而且對具體內容進行了大幅度的補充和優化。作者是有10餘年數據分析與數據化運營的大數據專家,書中對50餘個數據工作流知識點、14個數據分析與挖掘主題、4個數據化運營主題、8個綜合性案例進行了全面的講解,能讓數據化運營結合數據使用場景360°落地。
全書一共9章,分為兩個部分:
第壹部分(第1-4章) Python數據分析與挖掘
首先介紹了Python和數據化運營的基本知識,然後詳細講解了Python數據獲取(結構化和非結構化)、預處理、分析和挖掘的關鍵技術和經驗,包含10大類預處理經驗、14個數據分析與挖掘主題,50餘個知識點。
第二部分(第5~9章) Python數據化運營
這是本書的核心,詳細講解了會員運營、商品運營、流量運營和內容運營4大主題,以及提升數據化運營價值的方法。每個運營主題中都包含了基本知識、評估指標、應用場景、數據分析模型、數據分析小技巧、數據分析大實話以及2個綜合性的應用案例。
------
添加作者微信(TonySong2013)可在線獲取實時解答,同時加入本書溝通群(作者拉入群),交流更多數據工作的感悟和心得並認識更多同行從業者;本書提供案例數據和源代碼(中文注釋)下載,供讀者實操時使用。
宋天龍,(TonySong)大數據技術專家,觸脈諮詢合夥人兼副總裁,前Webtrekk中國區技術和諮詢負責人(Webtrekk,德國*大的在線數據分析服務提供商)。擅長數據挖掘、建模、分析與運營,精通端到端數據價值場景設計、業務需求轉換、數據結構梳理、數據建模與學習以及數據工程交付。在電子商務、零售、銀行、保險等多個行業擁有豐富的數據項目工作經驗,參與過集團和企業級數據體系規劃、DMP與數據倉庫建設、大數據產品開發、網站流量系統建設、個性化智能推薦與精准營銷、企業大數據智能等。參與實施客戶案例包括聯合利華、Webpower、德國OTTO集團電子商務(中國)、Esprit中國、豬八戒網、順豐優選、樂視商城、泰康人壽、酒仙網、國美在線、迪信通等。著有多部暢銷書:《Python數據分析與數據化運營》《網站數據挖掘與分析:系統方法與商業實踐》《企業大數據系統構建實戰:技術、架構、實施與應用》。
前言第1章 Python和數據化運營11.1 用Python做數據化運營11.1.1 Python是什麼11.1.2 數據化運營是什麼21.1.3 Python用於數據化運營51.2 數據化運營所需的Python相關工具和組件51.2.1 Python程序61.2.2 Python交互環境Jupyter71.2.3 Python第三方庫231.2.4 數據庫和客戶端291.2.5 SSH遠程客戶端301.3 內容延伸:Python的OCR和tensorflow311.3.1 OCR工具:Tesseract-ocr311.3.2 機器學習框架:TensorFlow311.4 第1個用Python實現的數據化運營分析實例、銷售預測321.4.1 案例概述321.4.2 案例過程321.4.3 案例小結361.5 本章小結37第2章 數據化運營的數據來源402.1 數據化運營的數據來源類型402.1.1 數據文件402.1.2 數據庫412.1.3 API422.1.4 流式數據432.1.5 外部公開數據432.1.6 其他來源442.2 使用Python獲取運營數據442.2.1 從文本文件讀取運營數據442.2.2 從Excel獲取運營數據552.2.3 從關係型數據庫MySQL讀取運營數據572.2.4 從非關係型數據庫MongoDB讀取運營數據642.2.5 從API獲取運營數據682.3 內容延伸:讀取非結構化網頁、文本、圖像、視頻、語音722.3.1 從網頁中獲取運營數據722.3.2 讀取非結構化文本數據732.3.3 讀取圖像數據742.3.4 讀取視頻數據782.3.5 讀取語音數據812.4 本章小結85第3章 10條數據化運營不得不知道的數據預處理經驗873.1 數據清洗:缺失值、異常值和重複值的處理873.1.1 數據列缺失的4種處理方法873.1.2 不要輕易拋棄異常數據893.1.3 數據重複就需要去重嗎903.1.4 代碼實操:Python數據清洗923.2 將分類數據和順序數據轉換為標誌變量1003.2.1 分類數據和順序數據是什麼1003.2.2 運用標誌方法處理分類和順序變量1013.2.3 代碼實操:Python標誌轉換1013.3 大數據時代的數據降維1043.3.1 需要數據降維的情況1043.3.2 基於特徵選擇的降維1053.3.3 基於特徵轉換的降維1063.3.4 基於特徵組合的降維1123.3.5 代碼實操:Python數據降維1143.4 解決樣本類別分佈不均衡的問題1233.4.1 哪些運營場景中容易出現樣本不均衡1243.4.2 通過過抽樣和欠抽樣解決樣本不均衡1243.4.3 通過正負樣本的懲罰權重解決樣本不均衡1243.4.4 通過組合/集成方法解決樣本不均衡1253.4.5 通過特徵選擇解決樣本不均衡1253.4.6 代碼實操:Python處理樣本不均衡1253.5 數據化運營要抽樣還是全量數據1283.5.1 什麼時候需要抽樣1283.5.2 如何進行抽樣1293.5.3 抽樣需要注意的幾個問題1303.5.4 代碼實操:Python數據抽樣1313.6 解決運營數據的共線性問題1353.6.1 如何檢驗共線性1353.6.2 解決共線性的5種常用方法1363.6.3 代碼實操:Python處理共線性問題1373.7 有關相關性分析的混沌1393.7.1 相關和因果是一回事嗎1393.7.2 相關係數低就是不相關嗎1393.7.3 代碼實操:Python相關性分析1403.8 標準化,讓運營數據落入相同的範圍1413.8.1 實現中心化和正態分佈的Z-Score1413.8.2 實現歸一化的Max-Min1423.8.3 用於稀疏數據的MaxAbs1423.8.4 針對離群點的RobustScaler1423.8.5 代碼實操:Python數據標準化處理1423.9 離散化,對運營數據做邏輯分層1453.9.1 針對時間數據的離散化1453.9.2 針對多值離散數據的離散化1463.9.3 針對連續數據的離散化1463.9.4 針對連續數據的二值化1473.9.5 代碼實操:Python數據離散化處理1473.10 內容延伸:非結構化數據的預處理1513.10.1 網頁數據解析1513.10.2 網絡用戶日誌解析1593.10.3 圖像的基本預處理1643.10.4 自然語言文本預處理1693.11 本章小結172第4章 跳過運營數據分析和挖掘的“大坑”1744.1 聚類分析1744.1.1 當心數據異常對聚類結果的影響1754.1.2 超大數據量時應該放棄K均值算法1754.1.3 聚類不僅是建模的終點,更是重要的中間預處理過程1774.1.4 高維數據上無法應用聚類嗎1784.1.5 如何選擇聚類分析算法1794.1.6 案例:客戶特徵的聚類與探索性分析1794.2 回歸分析1964.2.1 注意回歸自變量之間的共線性問題1974.2.2 相關係數、判定係數和回歸係數之間是什麼關係1974.2.3 判定係數是否意味著相應的因果聯繫1974.2.4 注意應用回歸模型時研究自變量是否產生變化1984.2.5 如何選擇回歸分析算法1984.2.6 案例:大型促銷活動前的銷售預測1994.3 分類分析2064.3.1 防止分類模型的過擬合問題2074.3.2 使用關聯算法做分類分析2074.3.3 用分類分析來提煉規則、提取變量、處理缺失值2084.3.4 類別劃分:分類算法和聚類算法都是好手2094.3.5 如何選擇分類分析算法2104.3.6 案例:用戶流失預測分析與應用2104.4 關聯分析2214.4.1 頻繁規則不一定是有效規則2214.4.2 不要被啤酒尿布的故事禁錮你的思維2224.4.3 被忽略的“負相關”模式真的毫無用武之地嗎2234.4.4 頻繁規則只能打包組合應用嗎2

購物須知

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約20個工作天;
海外無庫存之書籍,平均作業時間約45個工作天,然不保證確定可調到貨,尚請見諒。