Spark快速數據處理(簡體書)
商品簡介
作者簡介
名人/編輯推薦
凱洛編寫的《Spark快速數據處理》系統講解Spark的使用方法。
目次
作者簡介
前言
第1章 安裝Spark以及構建Spark集群 / 1
1.1 單機運行Spark / 4
1.2 在EC2上運行Spark / 5
1.3 在ElasticMapReduce上部署Spark / 11
1.4 用Chef(opscode)部署Spark / 12
1.5 在Mesos上部署Spark / 14
1.6 在Yarn上部署Spark / 15
1.7 通過SSH部署集群 / 16
1.8 鏈接和參考 / 21
1.9 小結 / 21
第2章 Spark shell的使用 / 23
2.1 加載一個簡單的text文件 / 24 譯者序作者簡介前言第1章 安裝Spark以及構建Spark集群 / 11.1 單機運行Spark / 41.2 在EC2上運行Spark / 51.3 在ElasticMapReduce上部署Spark / 111.4 用Chef(opscode)部署Spark / 121.5 在Mesos上部署Spark / 141.6 在Yarn上部署Spark / 151.7 通過SSH部署集群 / 161.8 鏈接和參考 / 211.9 小結 / 21第2章 Spark shell的使用 / 232.1 加載一個簡單的text文件 / 242.2 用Spark shell運行邏輯回歸 / 262.3 交互式地從S3加載數據 / 282.4 小結 / 30第3章 構建并運行Spark應用 / 313.1 用sbt構建Spark作業 / 323.2 用Maven構建Spark作業 / 363.3 用其他工具構建Spark作業 / 393.4 小結 / 39第4章 創建SparkContext / 414.1 Scala / 434.2 Java / 434.3 Java和Scala共享的API / 444.4 Python / 454.5 鏈接和參考 / 454.6 小結 / 46第5章 加載與保存數據 / 475.1 RDD / 485.2 加載數據到RDD中 / 495.3 保存數據 / 545.4 連接和參考 / 555.5 小結 / 55第6章 操作RDD / 576.1 用Scala和Java操作RDD / 586.2 用Python操作RDD / 796.3 鏈接和參考 / 836.4 小結 / 84第7章 Shark-Hive和Spark的綜合運用 / 857.1 為什么用Hive/Shark / 867.2 安裝Shark / 867.3 運行Shark / 887.4 加載數據 / 887.5 在Spark程序中運行HiveQL查詢 / 897.6 鏈接和參考 / 927.7 小結 / 93第8章 測試 / 958.1 用Java和Scala測試 / 968.2 用Python測試 / 1038.3 鏈接和參考 / 1048.4 小結 / 105第9章 技巧和竅門 / 1079.1 日志位置 / 1089.2 并發限制 / 1089.3 內存使用與垃圾回收 / 1099.4 序列化 / 1109.5 IDE集成環境 / 1119.6 Spark與其他語言 / 1129.7 安全提示 / 1139.8 郵件列表 / 1139.9 鏈接和參考 / 1139.10 小結 / 114
書摘/試閱
主題書展
更多主題書展
更多書展本週66折
您曾經瀏覽過的商品
購物須知
大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。
特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。
無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。
為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。
若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。