TOP
0
0
【簡體曬書節】 單本79折,5本7折,優惠只到5/31,點擊此處看更多!
面向千萬億次計算的算法與應用(簡體書)
滿額折

面向千萬億次計算的算法與應用(簡體書)

商品資訊

人民幣定價:49 元
定價
:NT$ 294 元
優惠價
87256
絕版無法訂購
相關商品
商品簡介
作者簡介
目次

商品簡介

在過去的幾十年內,在高性能計算應用、算法和體系結構的支持下,科學、工程和社會領域發生了許多突破性的進展。本書是那些在千萬億次計算領域前沿性研究成果的結晶。作者試圖通過匯集在高性能計算和計算科學領域最成熟和已積累豐富經驗的應用的最新成果,來解決在開發千萬億次系統應用代碼中的一些挑戰性應用,這些應用能夠在新的千萬億次系統產生和部署之前,就提前針對其體系結構的特點來進行開發。開發千萬億次應用需要豐富的關于千萬億次系統硬件和系統軟件方面的知識,需要大量的時間來做擴展、測試、評估以及優化千萬億次代碼、庫、算法、系統軟件的工作。所有這些工作都將基于即將構建的新系統來進行。
對于高性能計算來說,這是一個激動人心的時代,這個時代將會在一個新的規模和尺度上產生大量史無前例的新發現,這些發現將會對科學和社會帶來切實的好處。本書可以讓你對千萬億次應用和算法前沿性挑戰性研究工作的第一次浪潮有一個概觀,為目前和未來的千萬億次研究提供非常必要的基礎。

作者簡介

David A Bader是高性能計算所的所長,教授,長期從事計算科學與工程領域研究,該研究所隸屬于佐治亞理工學院計算學部。他在1996年從馬里蘭大學(University of Ma ryland)獲得博士學位,后贏得美國國家自然科學基金支持在實驗計算機科學方面從事博士后研究。他獲得了美國自然科學基金CAREER支持,是IEEE計算機學會優秀訪問人員計劃中的杰出演講者,是IBM PERCS組DARPA高吞吐率計算機系統計劃項目組的成員,佐治亞理工學院sony-Toshlba-IBM CeII處理器中心的主任。他還是Internet2研究顧問委員會的成員,是IPDPS和HiPC會議指導委員會的成員,作為主席組織了很多高性能計算以及計算科學與工程方面的會議。Bader博士是許多高級重要出版物的編輯,包括IEEE Transactions on Parallel and Distributed Systems,ACM Journal of Experimental Algorithmics,IEEE DSOnline,以及Parallel Computing。他是IEEE計算機協會的資深會員,ACM會員。
Bader博士在用高性能計算解決生物信息學以及計算基因問題方面是取得前沿性研究成果的科學家。他作為聯合主席主持了高性能計算生物學IEEE International Workshop on High-Performance ComDurational Biology(HiCOMB)的系列會議,曾為幾本書撰寫了部分章節,聯合編輯Journal of Parallel and Distributed Computing(JPDC)和IEEE Transactions on Parallel and Distributed Systems(TPD5)在高性能計算生物學方面研究的專刊。他還是80余篇被同行審閱過的期刊論文、會議論文的作者,他的主要研究領域是并行算法,組合優化,計算生物學與計算基因學。

目次

第1章 千萬億次計算科學應用的性能特征
1.1 介紹
1.2 測試的各種體系結構
1.3 科學應用概述
1.4 GTC:Particle-in-Cell磁融解
1.5 ELBM3D:晶格玻耳茲曼流體動力學
1.6 Cactus:通用的相對天體物理學
1.7 PARATEC:材料科學的第一原理
1.8 HyperCLaw:雙曲AMR氣體動力學
1.9 總結與結論
1.10 致謝
參考文獻
第2章 千萬億次的計算對NASA未來使命的影響
2.1 介紹
2.2 Columbia超級計算機
2.3 航空宇宙分析及計算
2.3.1 方法論
2.3.2 結果
2.3.3 NASA使用千萬億次計算的好處
2.4 推進子系統分析
2.4.1 方法
2.4.2 結果
2.4.3 千萬億次計算給NASA帶來的益處
2.5 颶風預測
2.5.1 方法
2.5.2 結果
2.5.3 千萬億計算對NASA的益處
2.6 瓶頸
2.7 總結
參考文獻
第3章 多物理模擬與千萬億次計算
3.1 引言
3.2 下一代超級計算機
3.3 適用于大規模并行機的編程模型
3.3.1 新型并行語言
3.3.2 MPI-2
3.3.3 協作式并行
3.3.4 協作式并行的應用實例
3.4 多尺度算法
3.4.1 并行的多重網格方法
3.4.2 ALE-AMR離散化
3.4.3 離散-連續統混合算法
3.5 目前及將來的應用
3.5.1 萬億次仿真的技術現狀
3.5.2 通過協作并行進行多物理模擬
3.6 未來展望
3.7 致謝
參考文獻
第4章 針對Uintah多物理程序代碼的可擴展并行AMR算法研究
4.1 前言

4.2 自適應格網優化
4.3 Uintah程序框架
4.3.1 仿真組件
4.3.2 負載均衡器
4.3.3 調度器
4.4 格網重構器
4.5 提高性能
4.6 將來的工作
4.7 致謝
參考文獻
第5章 使用Enzo對宇宙進化進行仿真
5.1 宇宙結構的形成
5.2 Enzo的編碼
5.2.1 物理層建模和數值算法
5.2.2 自適應格網細化
5.2.3 實現
5.2.4 并行化
5.2.5 快速的鄰居格網搜索
5.2.6 Enzo的I/O
5.3 在萬億次平臺上的性能和可擴展性
5.3.1 單格網應用
5.3.2 AMR應用
5.3.3 并行展
5.4 將Enzo運行在萬億次計算機平臺上
5.4.1 新的AMR數據結構
5.4.2 混合型并行
5.4.3 天體運動和宇宙射線之間的隱性關聯
5.4.4 內部數據關系分析工具
5.5 致謝
參考文獻
第6章 重大影響天氣現象數值預測:千萬億次計算的重要動力
6.1 引言
6.2 計算方法和工具
6.2.1 區域性天氣預測模型
6.2.2 千萬億系統中的內存和性能問題
6.2.3 分布式內存并行和消息傳遞
6.2.4 負載均衡
6.2.5 時間消耗和可擴展性
6.2.6 NWP系統中其他重要的組件
6.2.7 其他問題
6.3 NWP實際應用例子
6.3.1 大規模的天氣預報
6.3.2 高分辨率的龍卷風仿真
6.3.3 通過觀測現象對龍卷風進行預測
6.4 數值天氣預報的挑戰和需求
6.5 總結
6.6 致謝
參考文獻
第7章 千萬億次氣象科學應用的軟件設計
7.1 介紹

7.2 氣象科學
7.3 千萬億次計算機的體系結構
7.4 區域氣象系統模型CCSM(Community Climate System Model)
7.4.1 當前CCSM概述
7.4.2 區域大氣模型CAM(CommunityAtmosphere Model)
7.4.3 并行海洋程序POP(Parallel Ocean Program)
7.4.4 區域陸地模型
7.4.5 社區海洋冰川模型
7.4.6 模型的耦合
7.5 總結
7.6 致謝
參考文獻
第8章 邁向分布式千萬億次計算
8.1 引言
8.2 網格計算
8.3 基于網格的千萬億次計算
8.4 虛擬銀河
8.4.1 銀河的多物理學模型
8.4.2 銀河仿真的性能模型
8.4.3 千萬億次虛擬銀河仿真
8.5 討論與總結
參考文獻
第9章 千萬億次計算時代的生物分子建模
9.1 引言
9.2 NAMD的設計
9.2.1 混合分解
9.2.2 動態負載平衡
9.3 面對千萬億次的挑戰與所需的改進
9.3.1 目前的性能
9.3.2 在未來千萬億次機器上的性能
9.3.3 協處理器加速
9.4 生物分子應用
9.4.1 水通道蛋白
9.4.2 鉀通道
9.4.3 病毒
9.4.4 核糖體
9.4.5 色素體
9.4.6 BAR域囊泡
9.5 總結
9.6 致謝
參考文獻
第10章 用于分子動力學模擬的千萬億次計算機
10.1 介紹
10.2 MDGRAPE-3的硬件
10.3 MDGRAPE-3進行的計算
10.4 MDGRAPE-3的芯片
10.4.1 力計算流水線
10.4.2 粒子j的內存和控制單元
10.4.3 芯片說明
10.5 系統結構
10.6 MDGRAPE-3的軟件
10.7 MDGRAPE-3的性能
10.8 總結和展望
10.9 致謝
參考文獻
第11章 在千萬億次超級計算機上進行生物分子仿真
11.1 引言
11.2 機遇
11.2.1 研究更大生物分子系統的能力
11.2.2 研究更長時間范圍的能力
11.2.3 混合量子與經典仿真
11.2.4 更精確的仿真
11.3 挑戰
11.3.1 在大于100K數量的處理器上擴大生物分子模擬代碼的規模
11.3.2 適應硬件的變化
11.3.3 容錯性
11.3.4 包含可配置計算的多范型硬件
11.3.5 千萬億次計算帶來的新的仿真方法
11.4 總結和展望
11.5 致謝
參考文獻
第12章 處理大規模圖的多線程算法
12.1 引言
12.1.1 圖運算中的問題
12.1.2 分布式存儲圖運算的擴展局限性
12.2 Cray MTA-2平臺
12.2.1 并行性表示
12.2.2 對細粒度同步的支持
12.3 案例分析:最短路徑算法
12.3.1 初步分析
12.3.2 △-分步算法
12.3.3 Thorup算法
12.3.4 實驗結果
12.4 案例分析:連通分量
12.4.1 傳統PRAM算法
12.4.2 Kahan的多層次算法
12.4.3 性能比較
12.5 結論
12.6 致謝
參考文獻
第13章 千萬億次計算中的災難恢復算法研究
13.1 FT-MPI:一個實現容錯功能的MPI
13.1.1 FT-MPI概述
13.1.2 FT-MPI:一個實現容錯功能的MPI
13.1.3 FT-MPI的使用
13.2 應用級的無盤檢查點技術
13.2.1 基于鄰居的檢查點方案
13.2.2 基于校驗和的檢查點方案
13.2.3 基于加權校驗和的檢查點方案
13.3 一種容錯的遞歸方程求解器
13.3.1 有條件的共軛梯度算法
13.3.2 將容錯機制添加到PCG算法中
13.4 實驗評估
13.4.1 使用不同MPI實現的PCG算法的性能
13.4.2 設置檢查點的性能開銷
13.4.3 執行恢復操作的性能開銷
13.4.4 恢復操作中的舍入錯誤所帶來的數值影響
13.5 討論
13.6 結論和未來工作
參考文獻
第14章 TSUBAME的研制與未來發展
14.1 引言-2通向TSUBAME之路
14.2 TSUBAME的架構需求
14.3 TSUBAME一瞥
14.4 TSUBAME之旅——使世人皆能超級計算的性能和操作
14.5 結論和展望—TSUBAME 2.0
參考文獻
第15章 通過SMP模塊構造千萬億次的性能
15.1 引言
15.2 OpenMP編程體系結構
15.3 通過OpenMP實現的循環級并行
15.4 C++與OpenMP
15.4.1 迭代循環
15.4.2 ccNUMA的關鍵問題
15.4.3 并行化面向對象代碼
15.4.4 線程安全性
15.5 應用OpenMe實現嵌套并行化
15.5.1 目前OpenMP規范中的嵌套并行化
15.5.2 FIRE的基于目錄圖像修復
15.5.3 多塊CFD數據集中3D關鍵點的計算
15.5.4 TFS流體求解器
15.6 結論與展望
參考文獻
第16章 千萬億次系統的性能及其復雜性分析
16.1 引言
16.2 千萬億次系統體系結構的發展趨勢及其并發度
16.3 性能特征和基準測試的現狀
16.3.1 基準測試創新
16.3.2 應用程序的性能特征
16.3.3 性能復雜性和性能效能的測量
16.4 APEX-MAIP
16.4.1 APEX-Map的設計原則
16.4.2 并行編程范式與APEX-MAP的對比
16.5 性能復雜性特征描述
16.5.1 性能復雜度定義
16.5.2 性能模型選擇
16.5.3 若干并行系統的性能復雜性分析
16.6 小結
參考文獻
第17章 高度可擴展的性能分析工具
17.1 引言
17.2 性能分析概念回顧
17.3 Paradyn
17.4 SCAlASCA
17.5 Vampir Next Generation
17.6 Periscope
17.6.1 體系結構
17.6.2 ASL性能屬性描述
17.6.3 Periscope結點代理
17.6.4 性能屬性搜索
17.6.5 Peirscope高層代理
17.6.6 代理通信基礎構造
17.6.7 評價
17.7 工具對比和未來研究
參考文獻
第18章 面向千萬億次計算規模的多級有限元求解器
18.1 引言
18.1.1 概述
18.1.2 千萬億次架構示例
18.2 設計范例
18.2.1 分層混合格網
18.2.2 ParExPDE
18.3 評估與比較
18.4 結論
參考文獻
第19章 高效有限元代碼開發的混合方法
19.1 簡介
19.2 高級應用代碼
19.3 代碼生成
19.3.1 元編程
19.3.2 變分問題的實時編譯
19.3.3 FFC
19.3.4 SyFi
19.4 有限元集成的統一框架
19.4.1 有限元集成
19.4.2 UFC接口
19.4.3 實現UFC接口
19.5 總結
19.6 致謝
參考文獻
第20章 使用Charm++編寫千萬億次應用程序
20.1 動機
20.2 Charm++和AMPI:編程模型
20.2.1 動態負載均衡
20.2.2 投影
20.2.3 其他特性概述
20.3 Charm++應用程序
20.3.1 NAMD
20.3.2 LeanCP
20.3.3 ChaNGa

20.3.4 其他應用
20.4 大型系統仿真
20.5 新型并行語言
20.6 總結
20.7 致謝
參考文獻
第21章 基于注解的高產出率和性能移植性
21.1 引言
21.2 實現
21.2.1 總體設計
21.2.2 注解語法
21.2.3 系統擴展
21.2.4 代碼生成模塊
21.3 性能研究
21.3.1 STREAM基準測試
21.3.2 AXPY操作
21.4 相關工作
21.4.1 自調節的庫和代碼
21.4.2 編譯器方法
21.4.3 性能相關的用戶注解
21.5 總結與未來的方向
21.6 致謝
參考文獻
第22章 高效能編程語言的局部性感知特性
22.1 引言
22.2 Chapel中關于數據并行化的基本概念
22.2.1 域
22.2.2 數組
22.3 數據分布
22.3.1 基本方法
22.3.2 “分布”接口
22.3.3 局部存儲對象上的分配策略
22.4 實例與討論
22.4.1 一個負載平衡塊分布
22.4.2 一個稀疏數據分布
22.5 實現
22.5.1 編譯器實現進展
22.5.2 分布實現策略
22.6 相關工作
22.7 結論和未來展望
22.8 致謝
參考文獻
第23章 體系結構與程序設計方法對獲得持續千萬億次計算性能的影響
23.1 引言
23.2 數值計算和計算機發展的歷史簡介
23.2.1 20世紀60年代
23.2.2 20世紀70年代
23.2.3 20世紀80年代
23.2.4 20世紀90年代
23.2.5 2000年及以后
23.3 體系結構
23.3.1 處理器發展
23.3.2 Cell Broad Engine處理器
23.3.3 ClearSpeed卡
23.3.4 類向量體系結構
23.3.5 能耗和成本因素
23.3.6 通信網絡
23.3.7 通信協議和并行范式
23.4 超大型計算機的算法
23.4.1 大規模計算機
23.4.2 Linpack局限性
23.4.3 選擇算法實現方法
23.5 其他技術的影響
參考文獻
第24章 Cactus框架:從黑洞到伽瑪射線脈沖
24.1 相對天體物理學目前的挑戰和伽瑪射線脈沖問題
24.2 Cactus框架
24.3 時空代碼和流體動力學代碼
24.3.1 Ccatie:時空進化
24.3.2 Whisky:廣義相對論流體動力學
24.4 并行化的實現和格網細化
24.4.1 PUGH
24.4.2 使用Carpet實現自適應格網細化
24.4.3 I/O
24.5 當前機器的擴展性
24.5.1 浮點性能
24.5.2 I/O性能
24.6 在千萬億次計算上的發展
24.6.1 物理學:輻射傳輸
24.6.2 擴展性
24.6.3工具
24.7 致謝
參考文獻

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 256
絕版無法訂購

暢銷榜

客服中心

收藏

會員專區