評論

滿額折

零基礎學Python網絡爬蟲案例實戰全流程詳解：入門與提高篇（簡體書）

ISBN13：9787111683681
出版社：機械工業出版社
作者：王宇韜; 吳子湛
出版日：2021/06/25
裝訂／頁數：平裝／344頁
規格：24cm*17cm (高/寬)
版次：一版
關鍵字：零基礎學Python網絡爬蟲案例實戰全流程詳解：入門與提高篇（簡體書）、零基、基礎、 Python、網絡、爬蟲、案例、實戰、流程、詳解、入門、提高、簡體、機械工業出版社、王宇韜、吳子湛、簡體書、電腦〈計算機〉、電腦入門、

人民幣定價：99 元

定價

：NT$ 594 元

優惠價

：87 折 517 元

領券後再享88折起

領

海外經銷商無庫存，到貨日平均30天至45天

可得紅利積點：15 點

相關商品

商品簡介

作者簡介

名人/編輯推薦

序

商品簡介

網絡爬蟲是當今獲取數據不可或缺的重要手段。本書講解了Python 爬蟲的基礎知識和必備技能，幫助零基礎的讀者快速入門並熟練使用爬蟲。

全書共8 章。第1 章講解Python 開發環境的安裝與配置以及Python 的基礎語法知識。第2 章講解如何運用Requests 庫和Selenium 庫獲取網頁源代碼。第3 章講解如何運用正則表達式和BeautifulSoup 庫解析和提取數據。第4 章深入講解Selenium 庫在商業實戰中的進階應用。第5 章講解爬蟲數據的處理與可視化。第6 章講解爬蟲數據結構化神器pandas 庫，以及如何通過Python 在MySQL 數據庫中讀寫數據。第7 章講解如何運用多線程和多進程技術提高爬蟲效率。第8 章講解如何運用IP 代理應對網站的反爬機制。

本書對於編程新手來說非常友好，從Python 基礎到爬蟲原理再到實戰應用，循序漸進地幫助讀者打好基礎。對於有一定Python 爬蟲基礎的讀者，本書也針對實戰中常見的疑點和難點提供了解決技巧。

作者簡介

王宇韜

華能貴誠信托金融科技實驗室發起人，賓夕法尼亞大學碩士，上海交通大學學士，曾在劍橋大學交流學習，兩年內通過CFA 3 級、FRM 2 級、AQF。在華能貴誠信托自主研發了輿情監控系統、資金雷達、流程自動化AI 系統、機器視頻面試系統等；專注於科技在金融領域的應用，編著有《Python 金融大數據挖掘與分析全流程詳解》和《Python 大數據分析與機器學習商業案例實戰》。

吳子湛

畢業於合肥工業大學計算機學院，就職於南京市秦淮區大數據中心；擁有多年IT 研發經驗，擅長大數據分析與挖掘。

名人/編輯推薦

本書講解了Python 爬蟲的基礎知識和必備技能，幫助零基礎的讀者快速入門並熟練使用爬蟲。本書囊括了媒體熱點采集、金融數據爬取、網絡文件下載、電商數據研究等四大類42個爬蟲實戰案例，共計3000餘行代碼，涉及17個網站的數據與文件獲取，詳解了Requests 庫、Selenium 庫、正則表達式、BeautifulSoup 庫、多線程多進程爬蟲、IP 反爬機制應對等知識。

序

筆者編寫的《Python金融大數據挖掘與分析全流程詳解》於2019年出版面市後，陸續有不少讀者表示對該書的爬蟲部分非常感興趣，想做進一步的學習。筆者由此萌生了一個想法：專門針對Python爬蟲技術編寫一套書籍，在保留之前核心內容的基礎上，新增更多實戰案例，方便讀者在練中學，並體會Python爬蟲在實戰中的應用。

書稿編寫完成後，為了更好地滿足不同水平讀者的需求，方便他們根據自身情況更靈活地學習，筆者決定將書稿分為兩冊出版：第一冊為《零基礎學Python網絡爬蟲案例實戰全流程詳解（入門與提高篇）》，主要針對編程零基礎的讀者；第二冊為《零基礎學Python網絡爬蟲案例實戰全流程詳解（高級進階篇）》，主要針對有一定Python爬蟲編程基礎並且需要進階提高的讀者。

本書為《零基礎學Python網絡爬蟲案例實戰全流程詳解（入門與提高篇）》，分8章講解了Python爬蟲的基礎知識和必備技能，幫助零基礎的讀者快速入門並熟練使用爬蟲。

第1章從Python開發環境的安裝與配置講起，循序漸進地過渡到Python的基礎語法知識，包括變量、數據類型、語句、函數與庫等，讓新手讀者能夠自己輸入簡單的代碼並使其運行起來。

任何爬蟲任務的起點都是獲取網頁源代碼。第2章講解了Python爬蟲中用於獲取網頁源代碼的兩個核心庫—Requests庫和Selenium庫，並簡單介紹了網頁結構和HTML標簽的知識，為第3章學習數據的解析與提取做好鋪墊。

獲取網頁源代碼後，接著需要從中解析與提取數據。第3章講解了Python爬蟲中解析與提取數據的兩種核心方法—正則表達式和BeautifulSoup庫，並通過豐富的案例進行實戰演練，包括百度新聞、證券日報網、中證網、新浪微博的數據爬取，以及上海證券交易所PDF文件和豆瓣電影海報圖片的下載等。

講解完Python爬蟲的基礎知識和基本技能，第4章進一步深入講解爬蟲神器Selenium庫，並通過案例講解了商業實戰中常用的大量進階爬蟲技術，案例包括新浪財經股票行情數據爬取、東方財富網（股吧、新聞、研報）相關數據爬取、上海證券交易所問詢函信息爬取及PDF文件下載、銀行間拆借利率爬取、雪球股票評論信息爬取、京東商品評價信息爬取、淘寶天貓商品銷量數據爬取、網頁自動投票等。

第5章講解爬蟲數據的處理與可視化，包括數據清洗、文本內容過濾、亂碼問題處理、輿情評分、中文分詞、詞云圖繪制等，讓讀者可以對獲取的數據進行深入的整理與挖掘。

第6章講解爬蟲數據結構化與數據存儲。首先介紹了爬蟲數據結構化神器pandas庫，並通過多個案例進行實戰演練，包括新浪財經資產負債表獲取、百度新聞文本數據結構化、百度愛企查股權穿透研究、天天基金網股票型基金信息爬取、集思錄可轉債信息爬取、東方財富網券商研報信息爬取等。然後介紹了用於存儲和管理數據的MySQL數據庫，以及如何通過Python在MySQL數據庫中讀寫數據。

第7章講解如何運用多線程和多進程技術提高爬蟲效率，重點分析了線程和進程的概念、多線程和多進程的邏輯，並通過百度新聞的多線程和多進程爬取進行實戰演練。

在爬蟲任務中最讓人煩惱的就是遇到網站的反爬機制，因此，第8章講解了應對反爬機制的常用手段—IP代理的原理和使用方法，並以爬取微信公眾號文章為例對IP代理進行了實戰演練。

本書對於編程零基礎的讀者來說非常友好，從Python基礎到爬蟲原理再到實戰應用，循序漸進地幫助讀者打好基礎。對於有一定Python爬蟲基礎的讀者，本書也針對實戰中常見的疑點和難點提供了解決技巧。

讀者如果想進一步學習反爬機制應對、手機App內容爬取、爬蟲框架、爬蟲云服務器部署等技術，可以閱讀《零基礎學Python網絡爬蟲案例實戰全流程詳解（高級進階篇）》。

由於筆者水平有限，書中難免有不足之處，懇請廣大讀者批評指正。讀者除了可掃描封底上的二維碼關注公眾號獲取信息以外，也可通過“本書學習資源”中列出的方法與我們交流。

主題書展

更多書展

本週66折

非對稱：愚蠢或瘋狂，哪一個描述了你的世界？

牧羊犬山姆

每天3行，寫小日記練出好英文：天天寫短句，訓練用「英文思考」的大腦，程度突飛猛進！

過好這一生

禪僧與癌共生

穗子物語─三民叢刊295

心靈治療：信仰與精神醫學

死亡的真諦：從容迎接死亡的睿智

斑斑學汪汪叫

劉真傳－三民叢刊182

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大，除封面破損、內頁脫落等較嚴重的狀態，其餘商品將正常出貨。

特別提醒：部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供，需以QR CODE 連結至當地網站註冊“並通過驗證程序”，方可下載使用。

無現貨庫存之簡體書，將向海外調貨：
海外有庫存之書籍，等候約45個工作天;
海外無庫存之書籍，平均作業時間約60個工作天，然不保證確定可調到貨，尚請見諒。

為了保護您的權益，「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨，請在商品鑑賞期內寄回，且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

熱搜：

零基礎學Python網絡爬蟲案例實戰全流程詳解：入門與提高篇（簡體書）

商品資訊

ISBN13：9787111683681

出版社：機械工業出版社

作者：王宇韜; 吳子湛

出版日：2021/06/25

裝訂／頁數：平裝／344頁

規格：24cm*17cm (高/寬)

版次：一版

商品簡介

作者簡介

名人/編輯推薦

序

目次

主題書展

限時加碼舞一發

簡體熱門影劇書展

簡體書新到貨

魅力．花火特展

悅讀紀特展

簡體新書搶先報

簡體新生代華文原創小說特展

文具禮品大賞

悅讀日

母親節書展

本週66折

非對稱：愚蠢或瘋狂，哪一個描述了你的世界？

牧羊犬山姆

每天3行，寫小日記練出好英文：天天寫短句，訓練用「英文思考」的大腦，程度突飛猛進！

過好這一生

禪僧與癌共生

穗子物語─三民叢刊295

心靈治療：信仰與精神醫學

死亡的真諦：從容迎接死亡的睿智

斑斑學汪汪叫

劉真傳－三民叢刊182

您曾經瀏覽過的商品

購物須知