HMPP开放标准
HMPP用于异构多核并行编程。 OpenHMPP标准基于一组指令,是用于处理硬件加速器的编程模型,但又没有GPU编程的相关复杂性。这种基于指令的方法已经实现,因为他们使应用程序代码和硬件加速器使用之间形成松散关系。 本文涉及组成OpenHMPP标准的HMPP指令, 但并不处理指令的执行链接到指令执行。 简介OpenHMPP基于指令的编程模型提供了一种语法,有效地减轻硬件加速器上的计算,优化数据向/从硬件存储器移动。
OpenHMPP标准概念OpenHMPP标准基于codelets的概念, 可以在硬件上远程执行。 OpenHMPP Codelet 概念codelet具有以下属性:
这些属性确保codelet RPC可以通过硬件远程执行。此RPC及其相关的数据传输可以是异步的。 Codelet RPCsHMPP提供同步和异步的RPC。异步操作的执行依赖于硬件。 ![]() HMPP 存储器模型HMPP考虑到两个地址空间: 一个主机处理器和硬件存储器。 ![]() 指令概念OpenHMPP指令可能被视为“元信息” 添加到应用程序源代码。它们是安全的元信息,即不会改变原始代码的行为。它们处理函数的远程执行(RPC),以及数据向/从硬件存储器传输。
指令集的概念HMPP方法的基本点之一是指令的概念及其关联的标签,使它能够在分布于应用程序中的整个指令集上公开一个相干结构。 有两种类型的标签:
OpenHMPP指令语法为了简化符号, 正则表达式 将用于描述HMPP指令的语法。 下面的颜色通常用于描述指令的语法:
一般语法OpenHMPP指令的一般语法如下:
#pragma hmpp <grp_label> [codelet_label]? directive_type [,directive_parameters]* [&]
!$hmpp <grp_label> [codelet_label]? directive_type [,directive_parameters]* [&] 其中:
指令参数关联到一个指令的参数可能是不同类型。以下是 在HMPP中定义的指令参数:
OpenHMPP 指令声明和执行一个codelet的指令codelet指令声明在硬件加速器上远程执行计算。
该指令的语法是: #pragma hmpp <grp_label> codelet_label codelet [, version = major.minor[.micro]?]? [, args[arg_items].io=[[in|out|inout]]* [, args[arg_items].size={dimsize[,dimsize]*}]* [, args[arg_items].const=true]* [, cond = "expr"] [, target=target_name[:target_name]*] 可以在一个函数中加入多个codelet指令,以便指定不同用途或不同执行文本。但是, 一个给定调用站点标签只能有一个codelet指令。
Callsite指令指定程序内的给定点如何使用一个codelet。 #pragma hmpp <grp_label> codelet_label callsite [, asynchronous]? [, args[arg_items].size={dimsize[,dimsize]*}]* [, args[arg_items].advancedload=[[true|false]]* [, args[arg_items].addr="expr"]* [, args[arg_items].noupdate=true]* 这里有一个例子: /* declaration of the codelet */ #pragma hmpp simple1 codelet, args[outv].io=inout, target=CUDA static void matvec(int sn, int sm, loat inv[sm], float inm[sn][sm], float *outv){ int i, j; for (i = 0 ; i < sm ; i++) { float temp = outv[i]; for (j = 0 ; j < sn ; j++) { temp += inv[j] * inm[i][ j]; } outv[i] = temp; } int main(int argc, char **argv) { int n; ........ /* codelet use */ #pragma hmpp simple1 callsite, args[outv].size={n} matvec(n, m, myinc, inm, myoutv); ........ } 某些情况下, 需要具体管理整个应用程序的数据(CPU/GPU 数据移动优化, 共享变量...)。 该指令的语法是: #pragma hmpp <grp_label> group [, version = <major>.<minor>[.<micro>]?]? [, target = target_name[:target_name]*]]? [, cond = “expr”]? 数据传输指令可以优化通信开销硬件使用时的主要瓶颈通常是硬件和住处理器之间的数据传输。
allocate指令锁定硬件,并分配所需的内存量。 #pragma hmpp <grp_label> allocate [,args[arg_items].size={dimsize[,dimsize]*}]*
release指令指定何时为一组或一个独立codelet释放硬件。 #pragma hmpp <grp_label> release
advancedload指令在codelet远程执行之前预取数据。 #pragma hmpp <grp_label> [codelet_label]? advancedload ,args[arg_items] [,args[arg_items].size={dimsize[,dimsize]*}]* [,args[arg_items].addr="expr"]* [,args[arg_items].section={[subscript_triplet,]+}]* [,asynchronous]
delegatedstore指令是一个同步障,以等待一个异步codelet执行完成,然后下载结果。 #pragma hmpp <grp_label> [codelet_label]? delegatedstore ,args[arg_items] [,args[arg_items].addr="expr"]* [,args[arg_items].section={[subscript_triplet,]+}]*
同步指令指定等待,直到一个异步callsite执行完成。对于同步指令, codelet 标签始终是强制性的,并且若是codelet属于一个组,需要有组标签。 #pragma hmpp <grp_label> codelet_label synchronize
在下面的例子中,完成设备初始化,内存分配和输入数据的上载在循环外只有一次,而不是每次循环迭代。 int main(int argc, char **argv) { #pragma hmpp sgemm allocate, args[vin1;vin2;vout].siez={size,size} #pragma hmpp sgemm advancedload, args[vin1;vin2;vout], args[m,n,k,alpha,beta] for ( j = 0 ; j < 2 ; j ++) { #pragma hmpp sgemm callsite, asynchronous, args[vin1;vin2;vout].advancedload=true, args[m,n,k,alpha,beta].advancedload=true sgemm (size, size, size, alpha, vin1, vin2, beta, vout); #pragma hmpp sgemm synchronize } #pragma hmpp sgemm delegatedstore, args[vout] #pragma hmpp sgemm release Codelets之间共享数据这些指令共同映射所有参数共享所有组的给定名称。 此指令除了参数按其名称直接指定映射之外,与map指令很类似。 mapbyname 指令相当于多映射指令。 #pragma hmpp <grp_label> mapbyname [,variableName]+ 全局变量Resident指令声明某些变量在一个组内为全局变量。 然后可以从任何属于组的codelet中直接访问这些变量。此指令应用于源代码中在其之后的声明语句。 此指令的语法是: #pragma hmpp <grp_label> resident [, args[::var_name].io=[[in|out|inout]]* [, args[::var_name].size={dimsize[,dimsize]*}]* [, args[::var_name].addr="expr"]* [, args[::var_name].const=true]* 符号::var_name 以::为前缀, 表示一个应用程序的变量声明为resident。 加速区codelet/callsite指令合并为一个区域。目的是避免代码重构中构建codelet。 因此,所有codelet或callsite指令可用属性都可以用于regions指令。 在C语言中: #pragma hmpp [<MyGroup>] [label] region [, args[arg_items].io=[[in|out|inout]]* [, cond = "expr"]< [, args[arg_items].const=true]* [, target=target_name[:target_name]*] [, args[arg_items].size={dimsize[,dimsize]*}]* [, args[arg_items].advancedload=[[true|false]]* [, args[arg_items].addr="expr"]* [, args[arg_items].noupdate=true]* [, asynchronous]? [, private=[arg_items]]* { C BLOCK STATEMENTS } 实现HMPP开放标准基于HMPP 2.3版本(2009年5月, CAPS 公司). HMPP基于指令的编程模型已经实现如下:
参阅参考
|
Portal di Ensiklopedia Dunia