Home

Context Navigation

source: palm/trunk/SOURCE/transpose.f90 @ 791

Last change on this file since 791 was 684, checked in by raasch, 14 years ago
last commit documented
Property svn:keywords set to `Id`
File size: 20.2 KB

Line
1	SUBROUTINE transpose_xy( f_in, work, f_out )
2
3	!------------------------------------------------------------------------------!
4	! Current revisions:
5	! -----------------
6	!
7	!
8	! Former revisions:
9	! -----------------
10	! $Id: transpose.f90 684 2011-02-09 14:49:31Z raasch $
11	!
12	! 683 2011-02-09 14:25:15Z raasch
13	! openMP parallelization of transpositions for 2d-domain-decomposition
14	!
15	! 622 2010-12-10 08:08:13Z raasch
16	! optional barriers included in order to speed up collective operations
17	!
18	! 164 2008-05-15 08:46:15Z raasch
19	! f_inv changed from subroutine argument to automatic array in order to do
20	! re-ordering from f_in to f_inv in one step, one array work is needed instead
21	! of work1 and work2
22	!
23	! February 2007
24	! RCS Log replace by Id keyword, revision history cleaned up
25	!
26	! Revision 1.2 2004/04/30 13:12:17 raasch
27	! Switched from mpi_alltoallv to the simpler mpi_alltoall,
28	! all former transpose-routine files collected in this file, enlarged
29	! transposition arrays introduced
30	!
31	! Revision 1.1 2004/04/30 13:08:16 raasch
32	! Initial revision (collection of former routines transpose_xy, transpose_xz,
33	! transpose_yx, transpose_yz, transpose_zx, transpose_zy)
34	!
35	! Revision 1.1 1997/07/24 11:25:18 raasch
36	! Initial revision
37	!
38	!
39	! Description:
40	! ------------
41	! Transposition of input array (f_in) from x to y. For the input array, all
42	! elements along x reside on the same PE, while after transposition, all
43	! elements along y reside on the same PE.
44	!------------------------------------------------------------------------------!
45
46	USE cpulog
47	USE indices
48	USE interfaces
49	USE pegrid
50	USE transpose_indices
51
52	IMPLICIT NONE
53
54	INTEGER :: i, j, k, l, m, ys
55
56	REAL :: f_in(0:nxa,nys_x:nyn_xa,nzb_x:nzt_xa), &
57	f_inv(nys_x:nyn_xa,nzb_x:nzt_xa,0:nxa), &
58	f_out(0:nya,nxl_y:nxr_ya,nzb_y:nzt_ya), &
59	work(nnxnnynnz)
60
61	#if defined( __parallel )
62
63	!
64	!-- Rearrange indices of input array in order to make data to be send
65	!-- by MPI contiguous
66	!$OMP PARALLEL PRIVATE ( i, j, k )
67	!$OMP DO
68	DO i = 0, nxa
69	DO k = nzb_x, nzt_xa
70	DO j = nys_x, nyn_xa
71	f_inv(j,k,i) = f_in(i,j,k)
72	ENDDO
73	ENDDO
74	ENDDO
75	!$OMP END PARALLEL
76
77	!
78	!-- Transpose array
79	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
80	IF ( collective_wait ) CALL MPI_BARRIER( comm2d, ierr )
81	CALL MPI_ALLTOALL( f_inv(nys_x,nzb_x,0), sendrecvcount_xy, MPI_REAL, &
82	work(1), sendrecvcount_xy, MPI_REAL, &
83	comm1dy, ierr )
84	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
85
86	!
87	!-- Reorder transposed array
88	!$OMP PARALLEL PRIVATE ( i, j, k, l, m, ys )
89	!$OMP DO
90	DO l = 0, pdims(2) - 1
91	m = l * ( nxr_ya - nxl_y + 1 ) * ( nzt_ya - nzb_y + 1 ) * &
92	( nyn_xa - nys_x + 1 )
93	ys = 0 + l * ( nyn_xa - nys_x + 1 )
94	DO i = nxl_y, nxr_ya
95	DO k = nzb_y, nzt_ya
96	DO j = ys, ys + nyn_xa - nys_x
97	m = m + 1
98	f_out(j,i,k) = work(m)
99	ENDDO
100	ENDDO
101	ENDDO
102	ENDDO
103	!$OMP END PARALLEL
104
105	#endif
106
107	END SUBROUTINE transpose_xy
108
109
110	SUBROUTINE transpose_xz( f_in, work, f_out )
111
112	!------------------------------------------------------------------------------!
113	! Description:
114	! ------------
115	! Transposition of input array (f_in) from x to z. For the input array, all
116	! elements along x reside on the same PE, while after transposition, all
117	! elements along z reside on the same PE.
118	!------------------------------------------------------------------------------!
119
120	USE cpulog
121	USE indices
122	USE interfaces
123	USE pegrid
124	USE transpose_indices
125
126	IMPLICIT NONE
127
128	INTEGER :: i, j, k, l, m, xs
129
130	REAL :: f_in(0:nxa,nys_x:nyn_xa,nzb_x:nzt_xa), &
131	f_inv(nys:nyna,nxl:nxra,1:nza), &
132	f_out(1:nza,nys:nyna,nxl:nxra), &
133	work(nnxnnynnz)
134
135	#if defined( __parallel )
136
137	!
138	!-- If the PE grid is one-dimensional along y, the array has only to be
139	!-- reordered locally and therefore no transposition has to be done.
140	IF ( pdims(1) /= 1 ) THEN
141	!
142	!-- Reorder input array for transposition
143	!$OMP PARALLEL PRIVATE ( i, j, k, l, m, xs )
144	!$OMP DO
145	DO l = 0, pdims(1) - 1
146	m = l * ( nzt_xa - nzb_x + 1 ) * nnx * ( nyn_xa - nys_x + 1 )
147	xs = 0 + l * nnx
148	DO k = nzb_x, nzt_xa
149	DO i = xs, xs + nnx - 1
150	DO j = nys_x, nyn_xa
151	m = m + 1
152	work(m) = f_in(i,j,k)
153	ENDDO
154	ENDDO
155	ENDDO
156	ENDDO
157	!$OMP END PARALLEL
158
159	!
160	!-- Transpose array
161	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
162	IF ( collective_wait ) CALL MPI_BARRIER( comm2d, ierr )
163	CALL MPI_ALLTOALL( work(1), sendrecvcount_zx, MPI_REAL, &
164	f_inv(nys,nxl,1), sendrecvcount_zx, MPI_REAL, &
165	comm1dx, ierr )
166	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
167
168	!
169	!-- Reorder transposed array in a way that the z index is in first position
170	!$OMP PARALLEL PRIVATE ( i, j, k )
171	!$OMP DO
172	DO k = 1, nza
173	DO i = nxl, nxra
174	DO j = nys, nyna
175	f_out(k,j,i) = f_inv(j,i,k)
176	ENDDO
177	ENDDO
178	ENDDO
179	!$OMP END PARALLEL
180	ELSE
181	!
182	!-- Reorder the array in a way that the z index is in first position
183	!$OMP PARALLEL PRIVATE ( i, j, k )
184	!$OMP DO
185	DO i = nxl, nxra
186	DO j = nys, nyna
187	DO k = 1, nza
188	f_inv(j,i,k) = f_in(i,j,k)
189	ENDDO
190	ENDDO
191	ENDDO
192	!$OMP END PARALLEL
193
194	!$OMP PARALLEL PRIVATE ( i, j, k )
195	!$OMP DO
196	DO k = 1, nza
197	DO i = nxl, nxra
198	DO j = nys, nyna
199	f_out(k,j,i) = f_inv(j,i,k)
200	ENDDO
201	ENDDO
202	ENDDO
203	!$OMP END PARALLEL
204
205	ENDIF
206
207
208	#endif
209
210	END SUBROUTINE transpose_xz
211
212
213	SUBROUTINE transpose_yx( f_in, work, f_out )
214
215	!------------------------------------------------------------------------------!
216	! Description:
217	! ------------
218	! Transposition of input array (f_in) from y to x. For the input array, all
219	! elements along y reside on the same PE, while after transposition, all
220	! elements along x reside on the same PE.
221	!------------------------------------------------------------------------------!
222
223	USE cpulog
224	USE indices
225	USE interfaces
226	USE pegrid
227	USE transpose_indices
228
229	IMPLICIT NONE
230
231	INTEGER :: i, j, k, l, m, ys
232
233	REAL :: f_in(0:nya,nxl_y:nxr_ya,nzb_y:nzt_ya), &
234	f_inv(nys_x:nyn_xa,nzb_x:nzt_xa,0:nxa), &
235	f_out(0:nxa,nys_x:nyn_xa,nzb_x:nzt_xa), &
236	work(nnxnnynnz)
237
238	#if defined( __parallel )
239
240	!
241	!-- Reorder input array for transposition
242	!$OMP PARALLEL PRIVATE ( i, j, k, l, m, ys )
243	!$OMP DO
244	DO l = 0, pdims(2) - 1
245	m = l * ( nxr_ya - nxl_y + 1 ) * ( nzt_ya - nzb_y + 1 ) * &
246	( nyn_xa - nys_x + 1 )
247	ys = 0 + l * ( nyn_xa - nys_x + 1 )
248	DO i = nxl_y, nxr_ya
249	DO k = nzb_y, nzt_ya
250	DO j = ys, ys + nyn_xa - nys_x
251	m = m + 1
252	work(m) = f_in(j,i,k)
253	ENDDO
254	ENDDO
255	ENDDO
256	ENDDO
257	!$OMP END PARALLEL
258
259	!
260	!-- Transpose array
261	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
262	IF ( collective_wait ) CALL MPI_BARRIER( comm2d, ierr )
263	CALL MPI_ALLTOALL( work(1), sendrecvcount_xy, MPI_REAL, &
264	f_inv(nys_x,nzb_x,0), sendrecvcount_xy, MPI_REAL, &
265	comm1dy, ierr )
266	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
267
268	!
269	!-- Reorder transposed array in a way that the x index is in first position
270	!$OMP PARALLEL PRIVATE ( i, j, k )
271	!$OMP DO
272	DO i = 0, nxa
273	DO k = nzb_x, nzt_xa
274	DO j = nys_x, nyn_xa
275	f_out(i,j,k) = f_inv(j,k,i)
276	ENDDO
277	ENDDO
278	ENDDO
279	!$OMP END PARALLEL
280
281	#endif
282
283	END SUBROUTINE transpose_yx
284
285
286	SUBROUTINE transpose_yxd( f_in, work, f_out )
287
288	!------------------------------------------------------------------------------!
289	! Description:
290	! ------------
291	! Transposition of input array (f_in) from y to x. For the input array, all
292	! elements along y reside on the same PE, while after transposition, all
293	! elements along x reside on the same PE.
294	! This is a direct transposition for arrays with indices in regular order
295	! (k,j,i) (cf. transpose_yx).
296	!------------------------------------------------------------------------------!
297
298	USE cpulog
299	USE indices
300	USE interfaces
301	USE pegrid
302	USE transpose_indices
303
304	IMPLICIT NONE
305
306	INTEGER :: i, j, k, l, m, recvcount_yx, sendcount_yx, xs
307
308	REAL :: f_in(1:nza,nys:nyna,nxl:nxra), f_inv(nxl:nxra,1:nza,nys:nyna), &
309	f_out(0:nxa,nys_x:nyn_xa,nzb_x:nzt_xa), &
310	work(nnxnnynnz)
311
312	#if defined( __parallel )
313
314	!
315	!-- Rearrange indices of input array in order to make data to be send
316	!-- by MPI contiguous
317	DO k = 1, nza
318	DO j = nys, nyna
319	DO i = nxl, nxra
320	f_inv(i,k,j) = f_in(k,j,i)
321	ENDDO
322	ENDDO
323	ENDDO
324
325	!
326	!-- Transpose array
327	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
328	IF ( collective_wait ) CALL MPI_BARRIER( comm2d, ierr )
329	CALL MPI_ALLTOALL( f_inv(nxl,1,nys), sendrecvcount_xy, MPI_REAL, &
330	work(1), sendrecvcount_xy, MPI_REAL, &
331	comm1dx, ierr )
332	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
333
334	!
335	!-- Reorder transposed array
336	m = 0
337	DO l = 0, pdims(1) - 1
338	xs = 0 + l * nnx
339	DO j = nys_x, nyn_xa
340	DO k = 1, nza
341	DO i = xs, xs + nnx - 1
342	m = m + 1
343	f_out(i,j,k) = work(m)
344	ENDDO
345	ENDDO
346	ENDDO
347	ENDDO
348
349	#endif
350
351	END SUBROUTINE transpose_yxd
352
353
354	SUBROUTINE transpose_yz( f_in, work, f_out )
355
356	!------------------------------------------------------------------------------!
357	! Description:
358	! ------------
359	! Transposition of input array (f_in) from y to z. For the input array, all
360	! elements along y reside on the same PE, while after transposition, all
361	! elements along z reside on the same PE.
362	!------------------------------------------------------------------------------!
363
364	USE cpulog
365	USE indices
366	USE interfaces
367	USE pegrid
368	USE transpose_indices
369
370	IMPLICIT NONE
371
372	INTEGER :: i, j, k, l, m, zs
373
374	REAL :: f_in(0:nya,nxl_y:nxr_ya,nzb_y:nzt_ya), &
375	f_inv(nxl_y:nxr_ya,nzb_y:nzt_ya,0:nya), &
376	f_out(nxl_z:nxr_za,nys_z:nyn_za,1:nza), &
377	work(nnxnnynnz)
378
379	#if defined( __parallel )
380
381	!
382	!-- Rearrange indices of input array in order to make data to be send
383	!-- by MPI contiguous
384	!$OMP PARALLEL PRIVATE ( i, j, k )
385	!$OMP DO
386	DO j = 0, nya
387	DO k = nzb_y, nzt_ya
388	DO i = nxl_y, nxr_ya
389	f_inv(i,k,j) = f_in(j,i,k)
390	ENDDO
391	ENDDO
392	ENDDO
393	!$OMP END PARALLEL
394
395	!
396	!-- Move data to different array, because memory location of work1 is
397	!-- needed further below (work1 = work2).
398	!-- If the PE grid is one-dimensional along y, only local reordering
399	!-- of the data is necessary and no transposition has to be done.
400	IF ( pdims(1) == 1 ) THEN
401	!$OMP PARALLEL PRIVATE ( i, j, k )
402	!$OMP DO
403	DO j = 0, nya
404	DO k = nzb_y, nzt_ya
405	DO i = nxl_y, nxr_ya
406	f_out(i,j,k) = f_inv(i,k,j)
407	ENDDO
408	ENDDO
409	ENDDO
410	!$OMP END PARALLEL
411	RETURN
412	ENDIF
413
414	!
415	!-- Transpose array
416	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
417	IF ( collective_wait ) CALL MPI_BARRIER( comm2d, ierr )
418	CALL MPI_ALLTOALL( f_inv(nxl_y,nzb_y,0), sendrecvcount_yz, MPI_REAL, &
419	work(1), sendrecvcount_yz, MPI_REAL, &
420	comm1dx, ierr )
421	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
422
423	!
424	!-- Reorder transposed array
425	!$OMP PARALLEL PRIVATE ( i, j, k, l, m, zs )
426	!$OMP DO
427	DO l = 0, pdims(1) - 1
428	m = l * ( nyn_za - nys_z + 1 ) * ( nzt_ya - nzb_y + 1 ) * &
429	( nxr_za - nxl_z + 1 )
430	zs = 1 + l * ( nzt_ya - nzb_y + 1 )
431	DO j = nys_z, nyn_za
432	DO k = zs, zs + nzt_ya - nzb_y
433	DO i = nxl_z, nxr_za
434	m = m + 1
435	f_out(i,j,k) = work(m)
436	ENDDO
437	ENDDO
438	ENDDO
439	ENDDO
440	!$OMP END PARALLEL
441
442	#endif
443
444	END SUBROUTINE transpose_yz
445
446
447	SUBROUTINE transpose_zx( f_in, work, f_out )
448
449	!------------------------------------------------------------------------------!
450	! Description:
451	! ------------
452	! Transposition of input array (f_in) from z to x. For the input array, all
453	! elements along z reside on the same PE, while after transposition, all
454	! elements along x reside on the same PE.
455	!------------------------------------------------------------------------------!
456
457	USE cpulog
458	USE indices
459	USE interfaces
460	USE pegrid
461	USE transpose_indices
462
463	IMPLICIT NONE
464
465	INTEGER :: i, j, k, l, m, xs
466
467	REAL :: f_in(1:nza,nys:nyna,nxl:nxra), f_inv(nys:nyna,nxl:nxra,1:nza), &
468	f_out(0:nxa,nys_x:nyn_xa,nzb_x:nzt_xa), &
469	work(nnxnnynnz)
470
471	#if defined( __parallel )
472
473	!
474	!-- Rearrange indices of input array in order to make data to be send
475	!-- by MPI contiguous
476	!$OMP PARALLEL PRIVATE ( i, j, k )
477	!$OMP DO
478	DO k = 1,nza
479	DO i = nxl, nxra
480	DO j = nys, nyna
481	f_inv(j,i,k) = f_in(k,j,i)
482	ENDDO
483	ENDDO
484	ENDDO
485	!$OMP END PARALLEL
486
487	!
488	!-- Move data to different array, because memory location of work1 is
489	!-- needed further below (work1 = work2).
490	!-- If the PE grid is one-dimensional along y, only local reordering
491	!-- of the data is necessary and no transposition has to be done.
492	IF ( pdims(1) == 1 ) THEN
493	!$OMP PARALLEL PRIVATE ( i, j, k )
494	!$OMP DO
495	DO k = 1, nza
496	DO i = nxl, nxra
497	DO j = nys, nyna
498	f_out(i,j,k) = f_inv(j,i,k)
499	ENDDO
500	ENDDO
501	ENDDO
502	!$OMP END PARALLEL
503	RETURN
504	ENDIF
505
506	!
507	!-- Transpose array
508	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
509	IF ( collective_wait ) CALL MPI_BARRIER( comm2d, ierr )
510	CALL MPI_ALLTOALL( f_inv(nys,nxl,1), sendrecvcount_zx, MPI_REAL, &
511	work(1), sendrecvcount_zx, MPI_REAL, &
512	comm1dx, ierr )
513	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
514
515	!
516	!-- Reorder transposed array
517	!$OMP PARALLEL PRIVATE ( i, j, k, l, m, xs )
518	!$OMP DO
519	DO l = 0, pdims(1) - 1
520	m = l * ( nzt_xa - nzb_x + 1 ) * nnx * ( nyn_xa - nys_x + 1 )
521	xs = 0 + l * nnx
522	DO k = nzb_x, nzt_xa
523	DO i = xs, xs + nnx - 1
524	DO j = nys_x, nyn_xa
525	m = m + 1
526	f_out(i,j,k) = work(m)
527	ENDDO
528	ENDDO
529	ENDDO
530	ENDDO
531	!$OMP END PARALLEL
532
533	#endif
534
535	END SUBROUTINE transpose_zx
536
537
538	SUBROUTINE transpose_zy( f_in, work, f_out )
539
540	!------------------------------------------------------------------------------!
541	! Description:
542	! ------------
543	! Transposition of input array (f_in) from z to y. For the input array, all
544	! elements along z reside on the same PE, while after transposition, all
545	! elements along y reside on the same PE.
546	!------------------------------------------------------------------------------!
547
548	USE cpulog
549	USE indices
550	USE interfaces
551	USE pegrid
552	USE transpose_indices
553
554	IMPLICIT NONE
555
556	INTEGER :: i, j, k, l, m, zs
557
558	REAL :: f_in(nxl_z:nxr_za,nys_z:nyn_za,1:nza), &
559	f_inv(nxl_y:nxr_ya,nzb_y:nzt_ya,0:nya), &
560	f_out(0:nya,nxl_y:nxr_ya,nzb_y:nzt_ya), &
561	work(nnxnnynnz)
562
563	#if defined( __parallel )
564
565	!
566	!-- If the PE grid is one-dimensional along y, the array has only to be
567	!-- reordered locally and therefore no transposition has to be done.
568	IF ( pdims(1) /= 1 ) THEN
569	!
570	!-- Reorder input array for transposition
571	!$OMP PARALLEL PRIVATE ( i, j, k, l, m, zs )
572	!$OMP DO
573	DO l = 0, pdims(1) - 1
574	m = l * ( nyn_za - nys_z + 1 ) * ( nzt_ya - nzb_y + 1 ) * &
575	( nxr_za - nxl_z + 1 )
576	zs = 1 + l * ( nzt_ya - nzb_y + 1 )
577	DO j = nys_z, nyn_za
578	DO k = zs, zs + nzt_ya - nzb_y
579	DO i = nxl_z, nxr_za
580	m = m + 1
581	work(m) = f_in(i,j,k)
582	ENDDO
583	ENDDO
584	ENDDO
585	ENDDO
586	!$OMP END PARALLEL
587
588	!
589	!-- Transpose array
590	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
591	IF ( collective_wait ) CALL MPI_BARRIER( comm2d, ierr )
592	CALL MPI_ALLTOALL( work(1), sendrecvcount_yz, MPI_REAL, &
593	f_inv(nxl_y,nzb_y,0), sendrecvcount_yz, MPI_REAL, &
594	comm1dx, ierr )
595	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
596
597	!
598	!-- Reorder transposed array in a way that the y index is in first position
599	!$OMP PARALLEL PRIVATE ( i, j, k )
600	!$OMP DO
601	DO j = 0, nya
602	DO k = nzb_y, nzt_ya
603	DO i = nxl_y, nxr_ya
604	f_out(j,i,k) = f_inv(i,k,j)
605	ENDDO
606	ENDDO
607	ENDDO
608	!$OMP END PARALLEL
609	ELSE
610	!
611	!-- Reorder the array in a way that the y index is in first position
612	!$OMP PARALLEL PRIVATE ( i, j, k )
613	!$OMP DO
614	DO k = nzb_y, nzt_ya
615	DO j = 0, nya
616	DO i = nxl_y, nxr_ya
617	f_inv(i,k,j) = f_in(i,j,k)
618	ENDDO
619	ENDDO
620	ENDDO
621	!$OMP END PARALLEL
622	!
623	!-- Move data to output array
624	!$OMP PARALLEL PRIVATE ( i, j, k )
625	!$OMP DO
626	DO k = nzb_y, nzt_ya
627	DO i = nxl_y, nxr_ya
628	DO j = 0, nya
629	f_out(j,i,k) = f_inv(i,k,j)
630	ENDDO
631	ENDDO
632	ENDDO
633	!$OMP END PARALLEL
634
635	ENDIF
636
637	#endif
638
639	END SUBROUTINE transpose_zy
640
641
642	SUBROUTINE transpose_zyd( f_in, work, f_out )
643
644	!------------------------------------------------------------------------------!
645	! Description:
646	! ------------
647	! Transposition of input array (f_in) from z to y. For the input array, all
648	! elements along z reside on the same PE, while after transposition, all
649	! elements along y reside on the same PE.
650	! This is a direct transposition for arrays with indices in regular order
651	! (k,j,i) (cf. transpose_zy).
652	!------------------------------------------------------------------------------!
653
654	USE cpulog
655	USE indices
656	USE interfaces
657	USE pegrid
658	USE transpose_indices
659
660	IMPLICIT NONE
661
662	INTEGER :: i, j, k, l, m, ys
663
664	REAL :: f_in(1:nza,nys:nyna,nxl:nxra), f_inv(nys:nyna,nxl:nxra,1:nza), &
665	f_out(0:nya,nxl_yd:nxr_yda,nzb_yd:nzt_yda), &
666	work(nnxnnynnz)
667
668	#if defined( __parallel )
669
670	!
671	!-- Rearrange indices of input array in order to make data to be send
672	!-- by MPI contiguous
673	DO i = nxl, nxra
674	DO j = nys, nyna
675	DO k = 1, nza
676	f_inv(j,i,k) = f_in(k,j,i)
677	ENDDO
678	ENDDO
679	ENDDO
680
681	!
682	!-- Move data to different array, because memory location of work1 is
683	!-- needed further below (work1 = work2).
684	!-- If the PE grid is one-dimensional along x, only local reordering
685	!-- of the data is necessary and no transposition has to be done.
686	IF ( pdims(2) == 1 ) THEN
687	DO k = 1, nza
688	DO i = nxl, nxra
689	DO j = nys, nyna
690	f_out(j,i,k) = f_inv(j,i,k)
691	ENDDO
692	ENDDO
693	ENDDO
694	RETURN
695	ENDIF
696
697	!
698	!-- Transpose array
699	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
700	IF ( collective_wait ) CALL MPI_BARRIER( comm2d, ierr )
701	CALL MPI_ALLTOALL( f_inv(nys,nxl,1), sendrecvcount_zyd, MPI_REAL, &
702	work(1), sendrecvcount_zyd, MPI_REAL, &
703	comm1dy, ierr )
704	CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
705
706	!
707	!-- Reorder transposed array
708	m = 0
709	DO l = 0, pdims(2) - 1
710	ys = 0 + l * nny
711	DO k = nzb_yd, nzt_yda
712	DO i = nxl_yd, nxr_yda
713	DO j = ys, ys + nny - 1
714	m = m + 1
715	f_out(j,i,k) = work(m)
716	ENDDO
717	ENDDO
718	ENDDO
719	ENDDO
720
721	#endif
722
723	END SUBROUTINE transpose_zyd

Note: See TracBrowser for help on using the repository browser.

Download in other formats:

| Impressum | ©Leibniz Universität Hannover |