TOP
0
0
【簡體曬書節】 單本79折,5本7折,優惠只到5/31,點擊此處看更多!
高性能科學與工程計算(簡體書)
滿額折

高性能科學與工程計算(簡體書)

商品資訊

人民幣定價:69.00 元
定價
:NT$ 414 元
優惠價
87360
領券後再享89折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:10 點
相關商品
商品簡介
作者簡介
目次

商品簡介

海格、韋雷因著的《高性能科學與工程計算》主 要面向科學家、研究者和工程師,采取一種循序漸進 的方式介紹高性能計算的基礎知識,即使不熟悉計算 科學的讀者也非常容易理解。本書主要覆蓋了當代處 理器體系結構基礎知識、各種基本的程序串行優化策 略和基本并行模式。此外,在并行編程模型方面,還 包括基于OpenMP的共享并行和基于MPI的分布式并行 編程,并包含大量Fortran代碼實例,方便讀者學習 理解。總之,本書以一種獨特的視角介紹高性能計算 知識,適合各應用領域的專家和學生研讀。

作者簡介

GeorgHager是一位理論物理學家,擁有Greifswald大學計算物理博士學位。他從1995年致力于高性能計算研究,現在是ErlangenRegionalComputingCenter(RRZE)高性能計算組的高級科學家。最近研究興趣包括現代微處理器的體系結構優化、處理器和系統級的性能建模以及異構系統優化。他的日常工作涉及高性能計算的全方位用戶支持,例如講座、報告、培訓、代碼并行化、代碼分析和優化以及新型計算機體系結構和工具的評估。
GerhardWellein擁有Bayreuth大學固體物理博士學位,現在是Erlangen大學計算機系教授。他是ErlangerRegionalComputingCenter(RRZE)高性能計算組的主任,有十余年的高性能計算教學經驗,其教學對象包括計算科學和工程編程領域的學生和科學家。他的研究興趣包括大規模稀疏特征值問題求解、新奇并行化方法、性能建模以及體系結構優化方法。

目次

出版者的話
譯者序

前言
縮略詞
第1章 當代處理器
1.1 存儲程序的計算機體系結構
1.2 基于高速緩存的通用微處理器體系結構
1.2.1 性能指標和基準測試
1.2.2 晶體管:摩爾定律
1.2.3 流水線
1.2.4 超標量
1.2.5
1.3 存儲層次
1.3.1 高速緩存
出版者的話
譯者序

前言
縮略詞
第1章 當代處理器
1.1 存儲程序的計算機體系結構
1.2 基于高速緩存的通用微處理器體系結構
1.2.1 性能指標和基準測試
1.2.2 晶體管:摩爾定律
1.2.3 流水線
1.2.4 超標量
1.2.5 
1.3 存儲層次
1.3.1 高速緩存
1.3.2 高速緩存映射
1.3.3 預取
1.4 多核處理器
1.5 多線程處理器
1.6 向量處理器
1.6.1 設計原理
1.6.2 最高性能估計
1.6.3 程序設計
習題
第2章 串行代碼基本優化技術
2.1 標量剖析
2.1.1 基于函數和代碼行的程序剖析
2.1.2 硬件性能計數器
2.1.3 手工代碼插入
2.2 優化常識
2.2.1 少做工作
2.2.2 避免耗時運算
2.2.3 縮減工作集
2.3 小方法,大改進
2.3.1 消除常用子表達式
2.3.2 避免分支
2.3.3 使用SIMD指令集
2.4 編譯器作用
2.4.1 通用優化選項
2.4.2 內聯
2.4.3 別名
2.4.4 計算準確性
2.4.5 寄存器優化
2.4.6 利用編譯日志
2.5 C++優化
2.5.1 臨時變量
2.5.2 動態內存管理
2.5.3 循環與迭代器
習題
第3章 數據訪存優化
3.1 平衡分析與lightspeed評估
3.1.1 基于帶寬的性能建模
3.1.2 STREAM 基準測試
3.2 存儲順序
3.3 案例分析:Jacobi算法
3.4 案例分析:稠密矩陣轉置
3.5 算法分類和訪存優化
3.5.1 O(N
3.5.2 O(N2)/
3.5.3 O(N3)/
3.6 案例分析:稀疏矩陣向量乘
3.6.1 稀疏矩陣的存儲機制
3.6.2 JDS sMVM優化
習題
第4章 并行計算機
4.1 并行計算模式分類
4.2 共享存儲計算機
4.2.1 cache一致性
4.2.2
4.2.3 c
4.3 分布式存儲計算機
4.4 混合型系統
4.5 網絡
4.5.1 網絡的基本性能特征
4.5.2 總線
4.5.3 交換網絡和胖樹網絡
4.5.4 Mesh 網絡
4.5.5 混合網絡
習題
第5章 并行性基礎
5.1 為什么并行化
5.2 并行性
5.2.1 數據并行性
5.2.2 功能并行性
5.3 并行擴展性
5.3.1 限制并行執行的因素
5.3.2 可擴展性指標
5.3.3 簡單可擴展性定律
5.3.4 并行效率
5.3.5 串行性能與強可擴展性
5.3.6 改進的性能模型
5.3.7 選擇正確的擴展性基準
5.3.8 案例分析:低速處理器計算機能否變得更快
5.3.9 負載不均衡
習題
第6章 使用OpenMP進行共享存儲并行編程
6.1 OpenMP簡介
6.1.1 并行執行
6.1.2 數據作用域
6.1.3 循環的OpenMP工作共享
6.1.4 同步
6.1.5 歸約
6.1.6 循環調度
6.1.7 任務
6.1.8 其他方面
6.2 案例分析:OpenMP并行實現Jacobi算法
6.3 高級OpenMP:波前并行化
習題
第7章 高效OpenMP編程
7.1 OpenMP程序性能分析
7.2 性能缺陷
7.2.1 減輕Open MP共享區開銷
7.2.2 決定短循環的OpenMP開銷
7.2.3 串行化
7.2.4 偽共享
7.3 案例分析:并行稀疏矩陣向量乘
習題
第8章 ccNUMA體系結構的局部性優化
8.1 ccNUMA的局部訪問
8.1.1 首次訪問方式分配頁面
8.1.2 通過其他方式的局部性訪問
8.2 案例分析:稀疏MVM的ccNUMA優化
8.3 頁面布局缺陷
8.3.1 非NUMA友好的OpenMP調度
8.3.2 文件系統高速緩存
8.4 C++中的ccNUMA問題
8.4.1 對象數組
8.4.2 標準模板庫
習題
第9章 使用MPI進行分布式存儲并行內存編程
9.1 消息傳遞
9.2 MPI簡介
9.2.1 一個簡單例子
9.2.2 消息和點對點通信
9.2.3 集合通信
9.2.4 非阻塞點對點通信
9.2.5 虛擬拓撲
9.3 實例:Jacobi解法器的MPI并行
9.3.1 MPI實現
9.3.2 性能特征
習題
第10章 高效MPI編程
10.1 MPI性能工具
10.2 通信參數
10.3 同步、串行化和競爭
10.3.1 隱式串行化和同步
10.3.2 競爭
10.4 降低通信開銷
10.4.1 最優化區域分解
10.4.2 聚合消息
10.4.3 非阻塞與異步通信
10.4.4 集合通信
10.5 理解節點內點對點通信
習題
第11章 MPI與OpenMP混合編程
11.1 基本MPI/OpenMP混合編程模型
11.1.1 向量模式實現
11.1.2 任務模式實現
11.1.3 案例分析:混合Jacobi解法器
11.2 MPI線程交互分類
11.3 混合分解及映射
11.3.1 每個節點一個MPI進程
11.3.2 每個插槽一個MPI進程
11.3.3 每個插槽多個MPI進程
11.4 混合編程的優勢和劣勢
11.4.1 改善的收斂速度
11.4.2 共享高速緩存中的數據重用
11.4.3 利用額外級別的并行性
11.4.4 重疊MPI通信和計算
11.4.5 減少MPI開銷
11.4.6 多級別開銷
11.4.7 向量模式下批量同步通信
附錄A 多核環境中的拓撲和親緣性
A.1 拓撲
A.2 線程和進程分布
A.2.1 外部親緣性工具
A.2.2 程序控制親緣性
A.3 非頁面首次訪問分配策略
附錄B 習題解答
參考文獻

顯示全部信息

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 360
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區