MPI学习(六)-两个矩阵相加MPI版本

MPI学习(六)-两个矩阵相加MPI版本

这里,我们演示了两个简单的程序,一个是矩阵相加串行版本,一个是矩阵相加MPI版本

串行版本

程序源代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
#include<stdio.h>
#include<string.h>
int main()
{
int a[4][4]={1,2,3,4,
5,6,7,8,
9,10,11,12,
13,14,15,16};
int b[4][4]={4,2,5,7,
1,3,8,9,
11,12,17,5,
15,14,20,3};
int c[4][4];
memset(c,0,sizeof(c));
for(int i=0;i<4;i++)
{
for(int j=0;j<4;j++)
{
c[i][j]=a[i][j]+b[i][j];
}
}
for(int i=0;i<4;i++)
{
for(int j=0;j<4;j++)
{
printf("%d ",c[i][j]);
}
printf("\n");
}
return 0;
}

程序输出

1
2
3
4
5 4 8 11
6 9 15 17
20 22 28 17
28 28 35 19

MPI版本

程序运行平台

北京超级云计算中心A3分区

环境变量

mpi/intel/2017.5

编译指令

mpicxx mpi006.c -o mpi006

运行指令

srun -p amd_256 -N 1 -n 5 ./mpi006(使用SLURM任务调度系统)

1个分区,核数为5

程序源代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
#include<stdio.h>
#include<string.h>
#include<mpi.h>
int main(int argc ,char **argv)
{
int a[4][4]={1,2,3,4,
5,6,7,8,
9,10,11,12,
13,14,15,16};
int b[4][4]={4,2,5,7,
1,3,8,9,
11,12,17,5,
15,14,20,3};
int c[4][4];
int tmp[4];
memset(c,0,sizeof(c));
int myid, numprocs;
MPI_Status status;
MPI_Request request;
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&numprocs);
MPI_Comm_rank(MPI_COMM_WORLD,&myid);
if(myid == 0) //0号进程接受来自其他进程的消息
{
for(int i=1;i<numprocs;i++)
{
MPI_Irecv(&c[i-1][0],4,MPI_INT,i,0,MPI_COMM_WORLD,&request); //采用非阻塞接受
MPI_Wait(&request,&status);
}
for(int i=0;i<4;i++) //打印矩阵
{

for(int j=0;j<4;j++)
{
printf("%d ",c[i][j]);
}
printf("\n");
}
}
if(myid != 0 ) //当进程不是0号进程时,则向0号进程发送消息
{
memset(tmp,0,sizeof(tmp)); //初始化tmp数组
for(int i=0;i<4;i++)
{
tmp[i]=a[myid-1][i]+b[myid-1][i]; //用tmp来临时存储相加结果,随后发送给0号进程

}
MPI_Isend(&tmp,4,MPI_INT,0,0,MPI_COMM_WORLD,&request); //采用非阻塞发送
MPI_Wait(&request,&status);
}
MPI_Finalize();
return 0;
}

程序输出

1
2
3
4
5 4 8 11 
6 9 15 17
20 22 28 17
28 28 35 19

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!