TOP
0
0
【簡體曬書區】 單本79折,5本7折,活動好評延長至5/31,趕緊把握這一波!
走進搜索引擎(簡體書)
滿額折

走進搜索引擎(簡體書)

人民幣定價:49.8 元
定  價:NT$ 299 元
優惠價:87260
領券後再享88折
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:7 點
相關商品
商品簡介
作者簡介
目次

商品簡介

在網絡普及的今天,人們經常在信息海洋中彷徨,在萬維網迷宮般的復雜與魅力之間掙扎。直到搜索引擎這一偉大的技術產生,才使得人們猶如找到了走出迷宮的燈塔,可以非常便捷地找到自己所需要的信息。
正是因為搜索引擎離我們越來越近,所以越來越多的人期待著能夠揭開她神秘的面紗。其實搜索引擎並不是變幻莫測的大海,也不是高不可攀的山峰。請拿起本書,它就是引領你的火炬,它就是你身邊的伙伴,它將帶著你走進搜索引擎。在那里,你必將會被搜索引擎精致的設計和宏偉的架構所征服。
本書由搜索引擎開發研究領域年輕而有活力的科學家精心編寫,作者將自己對搜索引擎的深刻理解和實際應用巧妙地結合,使得從未接觸過搜索引擎原理的讀者也能夠輕鬆地在搜索引擎的大廈中遨游一番。
本書作為搜索引擎原理與技術的入門書籍,面向那些有志從事搜索引擎行業的青年學生、需要完整理解并優化搜索引擎的專業技術人員、搜索引擎的營銷人員,以及網站的負責人等。
本書是從事搜索引擎開發的工程技術人員難得的參考書,也可作為大中專院校相關專業的教學輔導書。

作者簡介

梁斌畢業于南京大學,獲得軟件工程碩士學位,曾經發表過多篇論文,獲得1項國家專利,作者主要的興趣方向包括數據挖掘、Wed挖掘、搜索引擎和軟件工程等,目前在清華大學信息科學與技術國家實驗室從事搜索引擎相關研究工作。

目次

第一章 引言
第一節 什麼是搜索引擎
 第二節 搜索引擎的發展簡史
搜索引擎的發展歷史
 第三節 搜索引擎大事快覽
 第四節 國內著名搜索引擎
百度(www.baidu.com)
中搜(www.zhongsou.com)
天網(e.pku.edu.cn)
搜狗(www.sogou.com)
 參考文獻
第二章 搜索引擎概貌
 第一節 搜索引擎的主要需求
查得快
查得全
查得準
查得穩
 第二節 搜索引擎的大系統
搜索引擎的體系結構
第三章 搜索引擎的下載系統
 第一節 爬蟲的發展歷史
世界上第個爬蟲
爬蟲的發展歷程
 第二節 萬維網及其網頁分析
蝴蝶結型的萬維網
萬維網的直徑
萬維網的規模及變化特徵
網頁的特徵
 第三節 有關爬蟲的基本概念
爬蟲
種子站點
URL
Backlinks
 第四節 網頁抓取原理
telnet和wget
從種子站點開始逐層抓取
不重復抓取策略
網頁抓取優先策略
網頁重訪策略★
Robots協議
其他應該注意的禮貌性問題
抓取提速策略(合作抓取策略)
 第五節 網頁庫
 第六節 下載系統回顧及未來發展
參考文獻
第四章 搜索引擎的分析系統
 第一節 知識準備
HTML語言
錨文本(anchor text)
半結構化數據(Semi-structured data)
第二節 信息抽取及網頁信息結構化
網頁結構化的目標
建立HTML標簽樹
通過投票方法得到正文
網頁結構化過程回顧
第三節 網頁查重
網頁查重技術發展歷史
網頁查重實現方法
第四節 中文分詞
什麼是中文分詞
通過字典實現分詞
通過統計學方法實現分詞
第五節 PageRank
PageRank的來由
PageRank的基本想法
PageRank的計算公式
PageRank的計算方法 ★
第六節 分析系統結構圖
參考文獻
第五章 搜索引擎的索引系統
第一節 知識準備
信息
索引
倒排索引、倒排表、臨時倒排文件、最終倒排文件
其他概念
第二節 全文檢索
全文檢索
第三節 文檔編號
編號的本質
文檔編號的方法
游程編碼
第四節 倒排索引
經典的倒排索引
正排索引(前向索引)
倒排索引
第五節 數據規模的估計
齊普夫法則
布爾檢索模型下的索引規模估計★
第六節 涉及存儲規模的一些計算
正排表與倒排表的合併
多個臨時倒排文件的歸并
倒排索引分布式存儲
倒排文件緩存
倒排索引詞典統計信息的計算
第七節 倒排索引文件的創建過程
創建倒排表
計算統計信息
參考文獻
第六章 搜索引擎的查詢系統
第一節 知識準備
什麼是信息熵
檢索和查詢的區別
檢索詞和查詢詞的區別
自動文本摘要(Automatic Text Summarization)
第二節 網頁信息檢索
早期的檢索模型
向量空間模型(Vector Space Models)
關鍵詞權重的量化方法TF/IDF★
搜索引擎采用的檢索模型
多文檔列表求交計算
檢索結果排序
堆排序
第三節 中文自動摘要
自動摘要的發展歷史
自動摘要的含義和實現
第四節 生成搜索結果頁
生成搜索結果頁
第五節 搜索結果頁的緩存
搜索結果頁的緩存
第六節 推測用戶查詢意圖
查詢分類
推測信息類、事物類的查詢意圖
第七節 查詢系統的當前熱點和發展方向
查詢系統的當前熱點
參考文獻
第七章 搜索引擎的其他話題
第一節 搜索引擎問與答
為什麼搜索引擎的搜索速度這麼快
為什麼搜索引擎能夠返回那么多的查詢結果
為什麼搜索引擎總能返回最想要的結果
搜索引擎如何大規模存儲網頁的
什麼是SEO
什麼是元搜索引擎
搜索引擎認為的作弊行為是哪些
如何進一步學習和了解搜索引擎發展的最新成果
第二節 搜索引擎未來的發展
新興的搜索產品
搜索技術的未來
參考文獻
附錄A 搜索引擎系統結構全觀圖

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 260
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區