CUDA FORTRAN并行计算程序设计及应用

CUDA FORTRAN并行计算程序设计及应用

强晟, 张勇强, 郭晓娜, 编译

出版社:河海大学出版社

年代:2014

定价:28.0

书籍简介:

CUDA作为一种由NVIDIA推出的通用并行计算架构,该架构消除了GPGPU的障碍,使GPU(显卡核心)能够解决复杂的大规模高性能计算问题。目前国内有关中文的教材或参考书很少。本书立足于Portland Group(PGI)公司和NVDIA公司合作推出的Fortran编译器,着重介绍CUDA FORTRAN的相关基本理论知识,并给出若干混凝土结构温控仿真计算的实例详解。

书籍目录:

第一章 基础知识

1.1 并行计算

1.2 CUDA FORTRAN的入门程序

1.2.1 第一个CDUA FORTRAN程序

1.2.2 扩展到大型数组

1.2.3 扩展到多维数组

1.3 支持CUDA的硬件特性和限制

1.4 错误的处理

1.5 CUDA代码的编译

1.6 系统和环境管理

第二章 CUDA FORTRAN编程指导和语法参考

2.1 基本概念介绍

2.1.1 CUDA FORTRAN核函数

2.1.2 设备子程序中的预定义变量

2.1.3 线程块

2.1.4 存储体系

2.1.5 执行配置

2.2 Subroutine和function的新属性

2.2.1 Host subroutine and function

2.2.2 G10baI subroutine

2.2.3 Device subroutine和function

2.2.4 Device subprogram限制

2.3 变量修饰符

2.3.1 设备数据

2.3.2 常量数据

2.3.3 共享数据

2.3.4 形参value

2.3.5 pinned数组

2.4 CUDA FORTRAN模块

2.4.1 设备模块(Device module)

2.4.2 主机模块(Host module)

2.5 主机和设备空间的数据传输

2.5.1 使用赋值语句传输数据

2.5.2 使用表达式的隐性数据传输

2.5.3 使用runtime routine传输数据

2.6 异步并发执行

2.6.1 主机和设备并发执行

2.6.2 流的并发执行

2.7 Kernel循环指令

2.8 FORTRAN内置函数

第三章 代码性能测试

3.1 测量kernel的执行时间

3.1.1 主机到设备的同步和CPU计时器

3.1.2 应用CUDA event计时

3.1.3 命令行编译

3.2 指令、带宽及kernel延迟

3.3 存储带宽

3.3.1 理论带宽

3.3.2 有效带宽

3.3.3 有效带宽下的数据传输量

第四章 代码优化

4.1 主机和设备的数据传输

4.1.1 固定内存

4.1.2 应用cudaMemcpy()显式地传输数据

……

第五章 案例一:蒙特卡罗方法

第六章 案例二:有限差分法

第七章 案例三:非稳定温度场有限元法

附录

参考文献

内容摘要:

通过阅读《CUDA FORTRAN并行计算程序设计及应用》,读者将获得使用CUDAFORTRAN进行GPU编程的基本概念、测试和优化方法,以及典型的单功能程序案例和大型工程仿真计算子程序案例。

书籍规格:

书籍详细信息
书名CUDA FORTRAN并行计算程序设计及应用站内查询相似图书
9787563037148
如需购买下载《CUDA FORTRAN并行计算程序设计及应用》pdf扫描版电子书或查询更多相关信息,请直接复制isbn,搜索即可全网搜索该ISBN
出版地南京出版单位河海大学出版社
版次1版印次1
定价(元)28.0语种简体中文
尺寸26 × 19装帧平装
页数印数

书籍信息归属:

CUDA FORTRAN并行计算程序设计及应用是河海大学出版社于2014.7出版的中图分类号为 TP391.41 的主题关于 计算机图形学 的书籍。