Home

Context Navigation

← Previous Change
Next Change →

transpose.f90

Timestamp:

Aug 26, 2013 9:31:42 AM (11 years ago)

Author:

raasch

Message:

overlapping execution of fft and transpositions (MPI_ALLTOALL), but real overlapping is not activated so far,
fftw implemented for 1D-decomposition
resorting of arrays moved to separate routines resort_for_...
bugfix in mbuild concerning Makefile_check

File:

: 1 edited

palm/trunk/SOURCE/transpose.f90 (modified) (42 diffs)

Legend:

: Unmodified
: Added
: Removed

palm/trunk/SOURCE/transpose.f90

-                      r1112
+                      r1216
  SUBROUTINE transpose_xy( f_in, work, f_out )
+ SUBROUTINE resort_for_xy( f_in, f_inv )
 !--------------------------------------------------------------------------------!
 …
 ! Current revisions:
 ! -----------------
+!
+! re-sorting of the transposed / to be transposed arrays moved to separate
+! routines resort_for_...
+!
 ! Former revisions:
 …
 ! Initial revision
+!
+!
+!------------------------------------------------------------------------------!
+! Description:
+! ------------
+! Resorting data for the transposition from x to y. The transposition itself
+! is carried out in transpose_xy
+!------------------------------------------------------------------------------!
+     USE indices
+     USE transpose_indices
+     IMPLICIT NONE
+     REAL ::  f_in(0:nx,nys_x:nyn_x,nzb_x:nzt_x)
+     REAL ::  f_inv(nys_x:nyn_x,nzb_x:nzt_x,0:nx)
+     INTEGER ::  i, j, k
+!
+!-- Rearrange indices of input array in order to make data to be send
+!-- by MPI contiguous
+    !$OMP  PARALLEL PRIVATE ( i, j, k )
+    !$OMP  DO
+    !$acc kernels present( f_in, f_inv )
+    !$acc loop
+     DO  i = 0, nx
+         DO  k = nzb_x, nzt_x
+             !$acc loop vector( 32 )
+             DO  j = nys_x, nyn_x
+                 f_inv(j,k,i) = f_in(i,j,k)
+             ENDDO
+         ENDDO
+     ENDDO
+     !$acc end kernels
+     !$OMP  END PARALLEL
+ END SUBROUTINE resort_for_xy
+ SUBROUTINE transpose_xy( f_inv, f_out )
+!------------------------------------------------------------------------------!
 ! Description:
 ! ------------
 …
     INTEGER ::  i, j, k, l, ys
     REAL ::  f_in(0:nx,nys_x:nyn_x,nzb_x:nzt_x), f_out(0:ny,nxl_y:nxr_y,nzb_y:nzt_y)
+    REAL ::  f_inv(nys_x:nyn_x,nzb_x:nzt_x,0:nx), f_out(0:ny,nxl_y:nxr_y,nzb_y:nzt_y)
     REAL, DIMENSION(nyn_x-nys_x+1,nzb_y:nzt_y,nxl_y:nxr_y,0:pdims(2)-1) ::  work
-    !$acc declare create( f_inv )
-    REAL ::  f_inv(nys_x:nyn_x,nzb_x:nzt_x,0:nx)
+!
-!-- Rearrange indices of input array in order to make data to be send
-!-- by MPI contiguous
-!$OMP  PARALLEL PRIVATE ( i, j, k )
-!$OMP  DO
-    !$acc kernels present( f_in )
-    !$acc loop
-    DO  i = 0, nx
-       DO  k = nzb_x, nzt_x
-          !$acc loop vector( 32 )
-          DO  j = nys_x, nyn_x
-             f_inv(j,k,i) = f_in(i,j,k)
-          ENDDO
-       ENDDO
-    ENDDO
-    !$acc end kernels
-!$OMP  END PARALLEL
     IF ( numprocs /= 1 )  THEN
 …
                           work(1,nzb_y,nxl_y,0), sendrecvcount_xy, MPI_REAL, &
                           comm1dy, ierr )
-       !$acc update device( work )
        CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k, l, ys )
 !$OMP  DO
+       !$acc data copyin( work )
        DO  l = 0, pdims(2) - 1
           ys = 0 + l * ( nyn_x - nys_x + 1 )
 …
           !$acc end kernels
        ENDDO
+       !$acc end data
 !$OMP  END PARALLEL
 #endif
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k )
 !$OMP  DO
        !$acc kernels present( f_out )
+       !$acc kernels present( f_inv, f_out )
        !$acc loop
        DO  k = nzb_y, nzt_y
 …
+ SUBROUTINE transpose_xz( f_in, work, f_out )
+ SUBROUTINE resort_for_xz( f_inv, f_out )
+!------------------------------------------------------------------------------!
+! Description:
+! ------------
+! Resorting data after the transposition from x to z. The transposition itself
+! is carried out in transpose_xz
+!------------------------------------------------------------------------------!
+     USE indices
+     USE transpose_indices
+     IMPLICIT NONE
+     REAL ::  f_inv(nys:nyn,nxl:nxr,1:nz)
+     REAL ::  f_out(1:nz,nys:nyn,nxl:nxr)
+     INTEGER ::  i, j, k
+!
+!-- Rearrange indices of input array in order to make data to be send
+!-- by MPI contiguous.
+!-- In case of parallel fft/transposition, scattered store is faster in
+!-- backward direction!!!
+    !$OMP  PARALLEL PRIVATE ( i, j, k )
+    !$OMP  DO
+    !$acc kernels present( f_inv, f_out )
+    !$acc loop
+     DO  k = 1, nz
+         DO  i = nxl, nxr
+             !$acc loop vector( 32 )
+             DO  j = nys, nyn
+                 f_out(k,j,i) = f_inv(j,i,k)
+             ENDDO
+         ENDDO
+     ENDDO
+     !$acc end kernels
+     !$OMP  END PARALLEL
+ END SUBROUTINE resort_for_xz
+ SUBROUTINE transpose_xz( f_in, f_inv )
 !------------------------------------------------------------------------------!
 …
     INTEGER ::  i, j, k, l, xs
     REAL ::  f_in(0:nx,nys_x:nyn_x,nzb_x:nzt_x), f_out(1:nz,nys:nyn,nxl:nxr)
+    REAL ::  f_in(0:nx,nys_x:nyn_x,nzb_x:nzt_x), f_inv(nys:nyn,nxl:nxr,1:nz)
     REAL, DIMENSION(nys_x:nyn_x,nnx,nzb_x:nzt_x,0:pdims(1)-1) ::  work
-    !$acc declare create( f_inv )
-    REAL ::  f_inv(nys:nyn,nxl:nxr,1:nz)
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k, l, xs )
 !$OMP  DO
+       !$acc data copyout( work )
        DO  l = 0, pdims(1) - 1
           xs = 0 + l * nnx
 …
           !$acc end kernels
        ENDDO
+       !$acc end data
 !$OMP  END PARALLEL
 …
        CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
        IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
-       !$acc update host( work )
        CALL MPI_ALLTOALL( work(nys_x,1,nzb_x,0), sendrecvcount_zx, MPI_REAL, &
                           f_inv(nys,nxl,1),      sendrecvcount_zx, MPI_REAL, &
 …
        !$acc update device( f_inv )
        CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
+!
-!--    Reorder transposed array in a way that the z index is in first position
-!$OMP  PARALLEL PRIVATE ( i, j, k )
-!$OMP  DO
-       !$acc kernels present( f_out )
-       !$acc loop
-       DO  k = 1, nz
-          DO  i = nxl, nxr
-             !$acc loop vector( 32 )
-             DO  j = nys, nyn
-                f_out(k,j,i) = f_inv(j,i,k)
-             ENDDO
-          ENDDO
-       ENDDO
-       !$acc end kernels
-!$OMP  END PARALLEL
 #endif
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k )
 !$OMP  DO
        !$acc kernels present( f_in )
+       !$acc kernels present( f_in, f_inv )
        !$acc loop
        DO  i = nxl, nxr
 …
 !$OMP  END PARALLEL
-!$OMP  PARALLEL PRIVATE ( i, j, k )
-!$OMP  DO
-       !$acc kernels present( f_out )
-       !$acc loop
-       DO  k = 1, nz
-          DO  i = nxl, nxr
-             !$acc loop vector( 32 )
-             DO  j = nys, nyn
-                f_out(k,j,i) = f_inv(j,i,k)
-             ENDDO
-          ENDDO
-       ENDDO
-       !$acc end kernels
-!$OMP  END PARALLEL
     ENDIF
 …
+ SUBROUTINE transpose_yx( f_in, work, f_out )
+ SUBROUTINE resort_for_yx( f_inv, f_out )
+!------------------------------------------------------------------------------!
+! Description:
+! ------------
+! Resorting data after the transposition from y to x. The transposition itself
+! is carried out in transpose_yx
+!------------------------------------------------------------------------------!
+     USE indices
+     USE transpose_indices
+     IMPLICIT NONE
+     REAL ::  f_inv(nys_x:nyn_x,nzb_x:nzt_x,0:nx)
+     REAL ::  f_out(0:nx,nys_x:nyn_x,nzb_x:nzt_x)
+     INTEGER ::  i, j, k
+!
+!-- Rearrange indices of input array in order to make data to be send
+!-- by MPI contiguous
+    !$OMP  PARALLEL PRIVATE ( i, j, k )
+    !$OMP  DO
+    !$acc kernels present( f_inv, f_out )
+    !$acc loop
+     DO  i = 0, nx
+         DO  k = nzb_x, nzt_x
+             !$acc loop vector( 32 )
+             DO  j = nys_x, nyn_x
+                 f_out(i,j,k) = f_inv(j,k,i)
+             ENDDO
+         ENDDO
+     ENDDO
+     !$acc end kernels
+     !$OMP  END PARALLEL
+ END SUBROUTINE resort_for_yx
+ SUBROUTINE transpose_yx( f_in, f_inv )
 !------------------------------------------------------------------------------!
 …
     INTEGER ::  i, j, k, l, ys
     REAL ::  f_in(0:ny,nxl_y:nxr_y,nzb_y:nzt_y), f_out(0:nx,nys_x:nyn_x,nzb_x:nzt_x)
+    REAL ::  f_in(0:ny,nxl_y:nxr_y,nzb_y:nzt_y), f_inv(nys_x:nyn_x,nzb_x:nzt_x,0:nx)
     REAL, DIMENSION(nyn_x-nys_x+1,nzb_y:nzt_y,nxl_y:nxr_y,0:pdims(2)-1) ::  work
-    !$acc declare create( f_inv )
-    REAL ::  f_inv(nys_x:nyn_x,nzb_x:nzt_x,0:nx)
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k, l, ys )
 !$OMP  DO
+       !$acc data copyout( work )
        DO  l = 0, pdims(2) - 1
           ys = 0 + l * ( nyn_x - nys_x + 1 )
 …
           !$acc end kernels
        ENDDO
+       !$acc end data
 !$OMP  END PARALLEL
 …
        CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
        IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
-       !$acc update host( work )
        CALL MPI_ALLTOALL( work(1,nzb_y,nxl_y,0), sendrecvcount_xy, MPI_REAL, &
                           f_inv(nys_x,nzb_x,0),  sendrecvcount_xy, MPI_REAL, &
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k )
 !$OMP  DO
        !$acc kernels present( f_in )
+       !$acc kernels present( f_in, f_inv )
        !$acc loop
        DO  i = nxl_y, nxr_y
 …
     ENDIF
+!
-!-- Reorder transposed array in a way that the x index is in first position
-!$OMP  PARALLEL PRIVATE ( i, j, k )
-!$OMP  DO
-    !$acc kernels present( f_out )
-    !$acc loop
-    DO  i = 0, nx
-       DO  k = nzb_x, nzt_x
-          !$acc loop vector( 32 )
-          DO  j = nys_x, nyn_x
-             f_out(i,j,k) = f_inv(j,k,i)
-          ENDDO
-       ENDDO
-    ENDDO
-    !$acc end kernels
-!$OMP  END PARALLEL
  END SUBROUTINE transpose_yx
  SUBROUTINE transpose_yxd( f_in, work, f_out )
+ SUBROUTINE transpose_yxd( f_in, f_out )
 !------------------------------------------------------------------------------!
 …
+ SUBROUTINE transpose_yz( f_in, work, f_out )
+ SUBROUTINE resort_for_yz( f_in, f_inv )
+!------------------------------------------------------------------------------!
+! Description:
+! ------------
+! Resorting data for the transposition from y to z. The transposition itself
+! is carried out in transpose_yz
+!------------------------------------------------------------------------------!
+     USE indices
+     USE transpose_indices
+     IMPLICIT NONE
+     REAL ::  f_in(0:ny,nxl_y:nxr_y,nzb_y:nzt_y)
+     REAL ::  f_inv(nxl_y:nxr_y,nzb_y:nzt_y,0:ny)
+     INTEGER ::  i, j, k
+!
+!-- Rearrange indices of input array in order to make data to be send
+!-- by MPI contiguous
+    !$OMP  PARALLEL PRIVATE ( i, j, k )
+    !$OMP  DO
+    !$acc kernels present( f_in, f_inv )
+    !$acc loop
+     DO  j = 0, ny
+         DO  k = nzb_y, nzt_y
+             !$acc loop vector( 32 )
+             DO  i = nxl_y, nxr_y
+                 f_inv(i,k,j) = f_in(j,i,k)
+             ENDDO
+         ENDDO
+     ENDDO
+     !$acc end kernels
+     !$OMP  END PARALLEL
+ END SUBROUTINE resort_for_yz
+ SUBROUTINE transpose_yz( f_inv, f_out )
 !------------------------------------------------------------------------------!
 …
     INTEGER ::  i, j, k, l, zs
     REAL ::  f_in(0:ny,nxl_y:nxr_y,nzb_y:nzt_y), f_out(nxl_z:nxr_z,nys_z:nyn_z,1:nz)
+    REAL ::  f_inv(nxl_y:nxr_y,nzb_y:nzt_y,0:ny), f_out(nxl_z:nxr_z,nys_z:nyn_z,1:nz)
     REAL, DIMENSION(nxl_z:nxr_z,nzt_y-nzb_y+1,nys_z:nyn_z,0:pdims(1)-1) ::  work
+    !$acc declare create( f_inv )
+    REAL ::  f_inv(nxl_y:nxr_y,nzb_y:nzt_y,0:ny)
+!
+!-- Rearrange indices of input array in order to make data to be send
+!-- by MPI contiguous
+!$OMP  PARALLEL PRIVATE ( i, j, k )
+!$OMP  DO
+    !$acc kernels present( f_in )
+    !$acc loop
+    DO  j = 0, ny
+       DO  k = nzb_y, nzt_y
+          !$acc loop vector( 32 )
+          DO  i = nxl_y, nxr_y
+             f_inv(i,k,j) = f_in(j,i,k)
+          ENDDO
+       ENDDO
+    ENDDO
+    !$acc end kernels
+!$OMP  END PARALLEL
+!
+!-- Move data to different array, because memory location of work1 is
+!-- needed further below (work1 = work2).
+!
 !-- If the PE grid is one-dimensional along y, only local reordering
 !-- of the data is necessary and no transposition has to be done.
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k )
 !$OMP  DO
        !$acc kernels present( f_out )
+       !$acc kernels present( f_inv, f_out )
        !$acc loop
        DO  j = 0, ny
 …
                           work(nxl_z,1,nys_z,0), sendrecvcount_yz, MPI_REAL, &
                           comm1dx, ierr )
-       !$acc update device( work )
        CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k, l, zs )
 !$OMP  DO
+       !$acc data copyin( work )
        DO  l = 0, pdims(1) - 1
           zs = 1 + l * ( nzt_y - nzb_y + 1 )
           !$acc kernels present( f_out, work )
+          !$acc kernels present( f_out )
           !$acc loop
           DO  j = nys_z, nyn_z
 …
           !$acc end kernels
        ENDDO
+       !$acc end data
 !$OMP  END PARALLEL
 #endif
 …
+ SUBROUTINE transpose_zx( f_in, work, f_out )
+ SUBROUTINE resort_for_zx( f_in, f_inv )
+!------------------------------------------------------------------------------!
+! Description:
+! ------------
+! Resorting data for the transposition from z to x. The transposition itself
+! is carried out in transpose_zx
+!------------------------------------------------------------------------------!
+     USE indices
+     USE transpose_indices
+     IMPLICIT NONE
+     REAL ::  f_in(1:nz,nys:nyn,nxl:nxr)
+     REAL ::  f_inv(nys:nyn,nxl:nxr,1:nz)
+     INTEGER ::  i, j, k
+!
+!-- Rearrange indices of input array in order to make data to be send
+!-- by MPI contiguous
+    !$OMP  PARALLEL PRIVATE ( i, j, k )
+    !$OMP  DO
+    !$acc kernels present( f_in, f_inv )
+    !$acc loop
+     DO  k = 1,nz
+         DO  i = nxl, nxr
+             !$acc loop vector( 32 )
+             DO  j = nys, nyn
+                 f_inv(j,i,k) = f_in(k,j,i)
+             ENDDO
+         ENDDO
+     ENDDO
+     !$acc end kernels
+     !$OMP  END PARALLEL
+ END SUBROUTINE resort_for_zx
+ SUBROUTINE transpose_zx( f_inv, f_out )
 !------------------------------------------------------------------------------!
 …
     INTEGER ::  i, j, k, l, xs
     REAL ::  f_in(1:nz,nys:nyn,nxl:nxr), f_out(0:nx,nys_x:nyn_x,nzb_x:nzt_x)
+    REAL ::  f_inv(nys:nyn,nxl:nxr,1:nz), f_out(0:nx,nys_x:nyn_x,nzb_x:nzt_x)
     REAL, DIMENSION(nys_x:nyn_x,nnx,nzb_x:nzt_x,0:pdims(1)-1) ::  work
+    !$acc declare create( f_inv )
+    REAL ::  f_inv(nys:nyn,nxl:nxr,1:nz)
+!
+!-- Rearrange indices of input array in order to make data to be send
+!-- by MPI contiguous
+!$OMP  PARALLEL PRIVATE ( i, j, k )
+!$OMP  DO
+    !$acc kernels present( f_in )
+    !$acc loop
+    DO  k = 1,nz
+       DO  i = nxl, nxr
+          !$acc loop vector( 32 )
+          DO  j = nys, nyn
+             f_inv(j,i,k) = f_in(k,j,i)
+          ENDDO
+       ENDDO
+    ENDDO
+    !$acc end kernels
+!$OMP  END PARALLEL
+!
+!-- Move data to different array, because memory location of work1 is
+!-- needed further below (work1 = work2).
+!
 !-- If the PE grid is one-dimensional along y, only local reordering
 !-- of the data is necessary and no transposition has to be done.
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k )
 !$OMP  DO
        !$acc kernels present( f_out )
+       !$acc kernels present( f_inv, f_out )
        !$acc loop
        DO  k = 1, nz
 …
                           work(nys_x,1,nzb_x,0), sendrecvcount_zx, MPI_REAL, &
                           comm1dx, ierr )
-       !$acc update device( work )
        CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'stop' )
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k, l, xs )
 !$OMP  DO
+       !$acc data copyin( work )
        DO  l = 0, pdims(1) - 1
           xs = 0 + l * nnx
           !$acc kernels present( f_out, work )
+          !$acc kernels present( f_out )
           !$acc loop
           DO  k = nzb_x, nzt_x
 …
           !$acc end kernels
        ENDDO
+       !$acc end data
 !$OMP  END PARALLEL
 #endif
 …
+ SUBROUTINE transpose_zy( f_in, work, f_out )
+ SUBROUTINE resort_for_zy( f_inv, f_out )
+!------------------------------------------------------------------------------!
+! Description:
+! ------------
+! Resorting data after the transposition from z to y. The transposition itself
+! is carried out in transpose_zy
+!------------------------------------------------------------------------------!
+     USE indices
+     USE transpose_indices
+     IMPLICIT NONE
+     REAL ::  f_inv(nxl_y:nxr_y,nzb_y:nzt_y,0:ny)
+     REAL ::  f_out(0:ny,nxl_y:nxr_y,nzb_y:nzt_y)
+     INTEGER ::  i, j, k
+!
+!-- Rearrange indices of input array in order to make data to be send
+!-- by MPI contiguous
+    !$OMP  PARALLEL PRIVATE ( i, j, k )
+    !$OMP  DO
+    !$acc kernels present( f_inv, f_out )
+    !$acc loop
+     DO  k = nzb_y, nzt_y
+         DO  j = 0, ny
+             !$acc loop vector( 32 )
+             DO  i = nxl_y, nxr_y
+                 f_out(j,i,k) = f_inv(i,k,j)
+             ENDDO
+         ENDDO
+     ENDDO
+     !$acc end kernels
+     !$OMP  END PARALLEL
+ END SUBROUTINE resort_for_zy
+ SUBROUTINE transpose_zy( f_in, f_inv )
 !------------------------------------------------------------------------------!
 …
     INTEGER ::  i, j, k, l, zs
     REAL ::  f_in(nxl_z:nxr_z,nys_z:nyn_z,1:nz), f_out(0:ny,nxl_y:nxr_y,nzb_y:nzt_y)
+    REAL ::  f_in(nxl_z:nxr_z,nys_z:nyn_z,1:nz), f_inv(nxl_y:nxr_y,nzb_y:nzt_y,0:ny)
     REAL, DIMENSION(nxl_z:nxr_z,nzt_y-nzb_y+1,nys_z:nyn_z,0:pdims(1)-1) ::  work
-    !$acc declare create( f_inv )
-    REAL ::  f_inv(nxl_y:nxr_y,nzb_y:nzt_y,0:ny)
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k, l, zs )
 !$OMP  DO
+       !$acc data copyout( work )
        DO  l = 0, pdims(1) - 1
           zs = 1 + l * ( nzt_y - nzb_y + 1 )
 …
           !$acc end kernels
        ENDDO
+       !$acc end data
 !$OMP  END PARALLEL
 …
        CALL cpu_log( log_point_s(32), 'mpi_alltoall', 'start' )
        IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
-       !$acc update host( work )
        CALL MPI_ALLTOALL( work(nxl_z,1,nys_z,0), sendrecvcount_yz, MPI_REAL, &
                           f_inv(nxl_y,nzb_y,0),  sendrecvcount_yz, MPI_REAL, &
 …
 !$OMP  PARALLEL PRIVATE ( i, j, k )
 !$OMP  DO
        !$acc kernels present( f_in )
+       !$acc kernels present( f_in, f_inv )
        !$acc loop
        DO  k = nzb_y, nzt_y
 …
     ENDIF
+!
-!-- Reorder transposed array in a way that the y index is in first position
-!$OMP  PARALLEL PRIVATE ( i, j, k )
-!$OMP  DO
-    !$acc kernels present( f_out )
-    !$acc loop
-    DO  k = nzb_y, nzt_y
-       DO  i = nxl_y, nxr_y
-          !$acc loop vector( 32 )
-          DO  j = 0, ny
-             f_out(j,i,k) = f_inv(i,k,j)
-          ENDDO
-       ENDDO
-    ENDDO
-    !$acc end kernels
-!$OMP  END PARALLEL
  END SUBROUTINE transpose_zy
  SUBROUTINE transpose_zyd( f_in, work, f_out )
+ SUBROUTINE transpose_zyd( f_in, f_out )
 !------------------------------------------------------------------------------!

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 1216 for palm/trunk/SOURCE/transpose.f90

Legend:

palm/trunk/SOURCE/transpose.f90

Download in other formats: