我是靠谱客的博主 机灵大树,最近开发中收集的这篇文章主要介绍FFT并行算法与应用-基于MPI(一),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

首先,介绍下FFT算法。
参考:
http://www.gatevin.moe/acm/fft%E7%AE%97%E6%B3%95%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/
博客写的很好,也很基础。

简单介绍以下FFT:

为什么需要FFT

  第一个问题是为什么要创造FFT,简单的说,为了速度。我们承认DFT很有用,但是我们发现他的速度不是很快,1D的DFT原始算法的时间复杂度是O(n^2),这个可以通过公式观察出来,对于2D的DFT其时间复杂度是O(n^4),这个速度真的很难接受,也就是说,你计算一幅1024x768的图像时,你将等大概。。。大概。。。我也没试过,反正很久。不信的自己去试试。所以找到一种快速方法的方法计算FFT势在必行。
  以下为DFT公式:
这里写图片描述

  计算一个4点DFT。计算量如下:
这里写图片描述

如何得到FFT

      通过观察DFT公式,我们发现DFT计算每一项X[u]的时候都遍历了完整的x[n]所以,我们的想法就是能不能通过其他的X[u+m](m为一个整数,可正可负)得到X[u],也就是充分利用之间的计算结构来构建现在的结果,这种方法就很容易表现成迭代的形式。本文介绍基2的FFT,及离散信号x[n]的个数为2的k次方,即如果完整的离散信号中有N个信分量{x1,x2,x3....xN}其中`(N=1<<k)`。

  数学基础
  FFT的数学基础其实就是:
这里写图片描述
这里写图片描述
  旋转因子具有以下性质:
这里写图片描述
  这些性质使得我们可以利用前面的计算结果来完成出后续的计算。
这里写图片描述

2-FFT

  观察:一个只有两个值的离散信号,假设N=2,利用性质2-对称性可以得到

4-FFT

  与上面2点的一样,推广到4点,将会是这样,其中方框内的操作为上述2-FFT:

  最终算法:
这里写图片描述

8-FFT

  废话不多说,和上面一样:
  计算过程为:
这里写图片描述
  结果为:
这里写图片描述

2^n-FFT

  同理,推广到2^n,可以得到类似的结果,不过我们发现,为了使输出结果为顺序结果,输入的顺序经过了一系列的调整,而且每一步WN的幂次参数也是变化,我们必须得到其变化规律才能更好的编写程序:
  观察WN的变化规律为:
这里写图片描述

  节点距离(设为z)就是从WN的0次幂开始连续加到WN的z次幂。然后间隔为z个式子,再次从0次幂加到z次。重复以上过程:
这里写图片描述

  例如第二级,间隔z=2,节点为实心黑色点,节点0,1,不做操作,节点2*W8^0,节点3*W8^2,节点4,5不做操作。。
  其内在规律就是节点i是否乘以WN:
  if(i%z==奇数)
  节点i*WN^(step);
  step每次增加的数量由当前的所在的计算级决定
  step=1<<(k(总级数)-i(当前级数))
  输入参数重新排序
  i行表示数组下标,蓝色数字表示实际数据:其内在规律就是,下标为偶数的将被映射到自己本身下标的1/2处,下表为奇数时被映射到数组后半段(size_n/2)的(下标-1)1/2处,将排列后的数据分为前后两个部分,递归次过程,直到只有两个元素。则停止。过程如下:

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

  观察算法
  观察至此,我们已经基本把FFT蝶形算法的所有特征都搞定了,接下来就是使用代码来实现了。
这里写图片描述
fft.c

#include "math.h"  
#include "fft.h"  
//精度0.0001弧度  

void conjugate_complex(int n,complex in[],complex out[])  
{  
  int i = 0;  
  for(i=0;i<n;i++)  
  {  
    out[i].imag = -in[i].imag;  
    out[i].real = in[i].real;  
  }   
}  

void c_abs(complex f[],float out[],int n)  
{  
  int i = 0;  
  float t;  
  for(i=0;i<n;i++)  
  {  
    t = f[i].real * f[i].real + f[i].imag * f[i].imag;  
    out[i] = sqrt(t);  
  }   
}  


void c_plus(complex a,complex b,complex *c)  
{  
  c->real = a.real + b.real;  
  c->imag = a.imag + b.imag;  
}  

void c_sub(complex a,complex b,complex *c)  
{  
  c->real = a.real - b.real;  
  c->imag = a.imag - b.imag;   
}  

void c_mul(complex a,complex b,complex *c)  
{  
  c->real = a.real * b.real - a.imag * b.imag;  
  c->imag = a.real * b.imag + a.imag * b.real;     
}  

void c_div(complex a,complex b,complex *c)  
{  
  c->real = (a.real * b.real + a.imag * b.imag)/(b.real * b.real +b.imag * b.imag);  
  c->imag = (a.imag * b.real - a.real * b.imag)/(b.real * b.real +b.imag * b.imag);  
}  

#define SWAP(a,b)  tempr=(a);(a)=(b);(b)=tempr  

void Wn_i(int n,int i,complex *Wn,char flag)  
{  
  Wn->real = cos(2*PI*i/n);  
  if(flag == 1)  
  Wn->imag = -sin(2*PI*i/n);  
  else if(flag == 0)  
  Wn->imag = -sin(2*PI*i/n);  
}  

//傅里叶变化  
void fft(int N,complex f[])  
{  
  complex t,wn;//中间变量  
  int i,j,k,m,n,l,r,M;  
  int la,lb,lc;  
  /*----计算分解的级数M=log2(N)----*/  
  for(i=N,M=1;(i=i/2)!=1;M++);   
  /*----按照倒位序重新排列原信号----*/  
  for(i=1,j=N/2;i<=N-2;i++)  
  {  
    if(i<j)  
    {  
      t=f[j];  
      f[j]=f[i];  
      f[i]=t;  
    }  
    k=N/2;  
    while(k<=j)  
    {  
      j=j-k;  
      k=k/2;  
    }  
    j=j+k;  
  }  

  /*----FFT算法----*/  
  for(m=1;m<=M;m++)  
  {  
    la=pow(2,m); //la=2^m代表第m级每个分组所含节点数       
    lb=la/2;    //lb代表第m级每个分组所含碟形单元数  
                 //同时它也表示每个碟形单元上下节点之间的距离  
    /*----碟形运算----*/  
    for(l=1;l<=lb;l++)  
    {  
      r=(l-1)*pow(2,M-m);     
      for(n=l-1;n<N-1;n=n+la) //遍历每个分组,分组总数为N/la  
      {  
        lc=n+lb;  //n,lc分别代表一个碟形单元的上、下节点编号       
        Wn_i(N,r,&wn,1);//wn=Wnr  
        c_mul(f[lc],wn,&t);//t = f[lc] * wn复数运算  
        c_sub(f[n],t,&(f[lc]));//f[lc] = f[n] - f[lc] * Wnr  
        c_plus(f[n],t,&(f[n]));//f[n] = f[n] + f[lc] * Wnr  
      }  
    }  
  }  
}  

//傅里叶逆变换  
void ifft(int N,complex f[])  
{  
  int i=0;  
  conjugate_complex(N,f,f);  
  fft(N,f);  
  conjugate_complex(N,f,f);  
  for(i=0;i<N;i++)  
  {  
    f[i].imag = (f[i].imag)/N;  
    f[i].real = (f[i].real)/N;  
  }  
}  

fft.h

#ifndef __FFT_H__  
#define __FFT_H__  

typedef struct complex //复数类型  
{  
  float real;       //实部  
  float imag;       //虚部  
}complex;  

#define PI 3.1415926535897932384626433832795028841971  


///////////////////////////////////////////  
void conjugate_complex(int n,complex in[],complex out[]);  
void c_plus(complex a,complex b,complex *c);//复数加  
void c_mul(complex a,complex b,complex *c) ;//复数乘  
void c_sub(complex a,complex b,complex *c); //复数减法  
void c_div(complex a,complex b,complex *c); //复数除法  
void fft(int N,complex f[]);//傅立叶变换 输出也存在数组f中  
void ifft(int N,complex f[]); // 傅里叶逆变换  
void c_abs(complex f[],float out[],int n);//复数数组取模  
////////////////////////////////////////////  
#endif  

最后

以上就是机灵大树为你收集整理的FFT并行算法与应用-基于MPI(一)的全部内容,希望文章能够帮你解决FFT并行算法与应用-基于MPI(一)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(55)

评论列表共有 0 条评论

立即
投稿
返回
顶部