并行快速傅里叶变换串行算法回顾并行算法
将n个处理器排成的二维网孔连接网络,假设输入序列已经存放在了各个处理器中。 下面以16点变换来解释这个问题,连成的网络及编号如下图所示: 根据快速傅里叶变换的算法,我们来研究这16个点计算时四次循环的具体执行情况。
由上面的算法执行过程,我们发现,数据交换只在同一行或同一列之间的节点间进行。如果我们在第一,二步循环之后对网孔中的数据进行矩阵转置,那么就可以只在同一列节点之间进行运算。
如果我们按超立方体连接的格雷码将待变换点列填入,那么我们发现,数据交换将只在相邻节点间进行。因此数据通信花費恒为O(1)。 算法复杂度分析可扩放性分析首先,我们设消息传递并行计算机中通信模型使用的是Store-and-forward而不是cut-through模型。下面令表示通信开销,表示通信开始时间,表示传送一个字的通信时间,表示数据每一跳的延迟,表示第l次循环时的开销,而表示进行一个单位运算的时间。p为处理器数,d=log(p),n为待变换的序列大小。 那么我们有公式:
有这个公式,我们可以得出:
参阅 |
Index:
pl ar de en es fr it arz nl ja pt ceb sv uk vi war zh ru af ast az bg zh-min-nan bn be ca cs cy da et el eo eu fa gl ko hi hr id he ka la lv lt hu mk ms min no nn ce uz kk ro simple sk sl sr sh fi ta tt th tg azb tr ur zh-yue hy my ace als am an hyw ban bjn map-bms ba be-tarask bcl bpy bar bs br cv nv eml hif fo fy ga gd gu hak ha hsb io ig ilo ia ie os is jv kn ht ku ckb ky mrj lb lij li lmo mai mg ml zh-classical mr xmf mzn cdo mn nap new ne frr oc mhr or as pa pnb ps pms nds crh qu sa sah sco sq scn si sd szl su sw tl shn te bug vec vo wa wuu yi yo diq bat-smg zu lad kbd ang smn ab roa-rup frp arc gn av ay bh bi bo bxr cbk-zam co za dag ary se pdc dv dsb myv ext fur gv gag inh ki glk gan guw xal haw rw kbp pam csb kw km kv koi kg gom ks gcr lo lbe ltg lez nia ln jbo lg mt mi tw mwl mdf mnw nqo fj nah na nds-nl nrm nov om pi pag pap pfl pcd krc kaa ksh rm rue sm sat sc trv stq nso sn cu so srn kab roa-tara tet tpi to chr tum tk tyv udm ug vep fiu-vro vls wo xh zea ty ak bm ch ny ee ff got iu ik kl mad cr pih ami pwn pnt dz rmy rn sg st tn ss ti din chy ts kcg ve
Portal di Ensiklopedia Dunia