Home

Context Navigation

← Previous Changeset
Next Changeset →

Changeset 4370

Timestamp:

Jan 10, 2020 2:00:44 PM (5 years ago)

Author:

raasch

Message:

bugfixes for previous commit: unused variables removed, Temperton-fft usage on GPU, openacc porting of vector version of Obukhov length calculation, collective read switched off on NEC to avoid hanging; some vector directives added in prognostic equations to force vectorization on Intel19 compiler, configuration files for NEC Aurora added

Location:

palm/trunk

Files:

: 2 added
: 27 edited

SCRIPTS/.palm.config.aurora (added)
SCRIPTS/.palm.config.aurora_debug (added)
SCRIPTS/create_basic_static_driver.py (modified) (1 diff)
SCRIPTS/document_changes (modified) (1 diff)
SOURCE/bulk_cloud_model_mod.f90 (modified) (5 diffs)
SOURCE/chemistry_model_mod.f90 (modified) (2 diffs)
SOURCE/fft_xy_mod.f90 (modified) (40 diffs)
SOURCE/netcdf_data_input_mod.f90 (modified) (2 diffs)
SOURCE/ocean_mod.f90 (modified) (2 diffs)
SOURCE/prognostic_equations.f90 (modified) (7 diffs)
SOURCE/surface_layer_fluxes_mod.f90 (modified) (8 diffs)
SOURCE/temperton_fft_mod.f90 (modified) (3 diffs)
SOURCE/transpose.f90 (modified) (7 diffs)
SOURCE/turbulence_closure_mod.f90 (modified) (2 diffs)
TUTORIALS/cases/dispersion_eulerian_and_lpm_extended/USER_CODE/user_module.f90 (modified) (1 diff)
TUTORIALS/cases/lsm_short/USER_CODE/user_module.f90 (modified) (1 diff)
UTIL/agent_preprocessing/agent_preprocessing.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/kpp4palm/templates/module_header (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_cbm4/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_passive/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_passive1/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_phstat/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_phstatp/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_salsa+phstat/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_salsa+simple/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_salsagas/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_simple/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_simplep/chem_gasphase_mod.f90 (modified) (1 diff)
UTIL/chemistry/gasphase_preproc/mechanisms/def_smog/chem_gasphase_mod.f90 (modified) (1 diff)

Legend:

: Unmodified
: Added
: Removed

palm/trunk/SCRIPTS/create_basic_static_driver.py

r4072	r4370
14	14	# PALM. If not, see <http://www.gnu.org/licenses/>.
15	15	#
16		# Copyright 1997-2019 Leibniz Universitaet Hannover
	16	# Copyright 1997-2020 Leibniz Universitaet Hannover
17	17	#------------------------------------------------------------------------------#
18	18

palm/trunk/SCRIPTS/document_changes

r3802	r4370
15	15	# PALM. If not, see <http://www.gnu.org/licenses/>.
16	16	#
17		# Copyright 1997-2019 Leibniz Universitaet Hannover
	17	# Copyright 1997-2020 Leibniz Universitaet Hannover
18	18	#------------------------------------------------------------------------------#
19	19	#

palm/trunk/SOURCE/bulk_cloud_model_mod.f90

-                      r4360
+                      r4370
 ! -----------------
 ! $Id$
+! vector directives added to force vectorization on Intel19 compiler
+!
+! 4360 2020-01-07 11:25:50Z suehring
 ! Introduction of wall_flags_total_0, which currently sets bits based on static
 ! topography information used in wall_flags_static_0
 …
           DO  i = nxl, nxr
              DO  j = nys, nyn
+                !following directive is required to vectorize on Intel19
+                !DIR$ IVDEP
                 DO  k = nzb+1, nzt
                    qc_p(k,j,i) = qc(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +   &
 …
           DO  i = nxl, nxr
              DO  j = nys, nyn
+                !following directive is required to vectorize on Intel19
+                !DIR$ IVDEP
                 DO  k = nzb+1, nzt
                    nc_p(k,j,i) = nc(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +   &
 …
           DO  i = nxl, nxr
              DO  j = nys, nyn
+                !following directive is required to vectorize on Intel19
+                !DIR$ IVDEP
                 DO  k = nzb+1, nzt
                    qr_p(k,j,i) = qr(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +   &
 …
           DO  i = nxl, nxr
              DO  j = nys, nyn
+                !following directive is required to vectorize on Intel19
+                !DIR$ IVDEP
                 DO  k = nzb+1, nzt
                    nr_p(k,j,i) = nr(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +   &

palm/trunk/SOURCE/chemistry_model_mod.f90

-                      r4346
+                      r4370
 ! -----------------
 ! $Id$
+! vector directives added to force vectorization on Intel19 compiler
+!
+! 4346 2019-12-18 11:55:56Z motisi
 ! Introduction of wall_flags_total_0, which currently sets bits based on static
 ! topography information used in wall_flags_static_0
 …
        DO  i = nxl, nxr
           DO  j = nys, nyn
+             !following directive is required to vectorize on Intel19
+             !DIR$ IVDEP
              DO  k = nzb+1, nzt
                 chem_species(ilsp)%conc_p(k,j,i) =   chem_species(ilsp)%conc(k,j,i)                &

palm/trunk/SOURCE/fft_xy_mod.f90

-                      r4366
+                      r4370
 ! -----------------
 ! $Id$
+! bugfix for Temperton-fft usage on GPU
+!
+! 4366 2020-01-09 08:12:43Z raasch
 ! Vectorized Temperton-fft added
+!
 …
     PRIVATE
     PUBLIC fft_x, fft_x_1d, fft_y, fft_y_1d, fft_init, fft_x_m, fft_y_m, f_vec, temperton_fft_vec
+    PUBLIC fft_x, fft_x_1d, fft_y, fft_y_1d, fft_init, fft_x_m, fft_y_m, f_vec_x, temperton_fft_vec
     INTEGER(iwp), DIMENSION(:), ALLOCATABLE, SAVE ::  ifax_x  !<
 …
     REAL(wp), DIMENSION(:), ALLOCATABLE, SAVE ::  trigs_y  !<
     REAL(wp), DIMENSION(:,:), ALLOCATABLE, SAVE ::  f_vec
+    REAL(wp), DIMENSION(:,:), ALLOCATABLE, SAVE ::  f_vec_x
 #if defined( __ibm )
 …
     REAL(wp), DIMENSION(nau1), SAVE ::  auy3  !<
 #elif defined( __nec )
+#elif defined( __nec_fft )
     INTEGER(iwp), SAVE ::  nz1  !<
 …
     SUBROUTINE fft_init
+       USE pegrid,                                                                                 &
+           ONLY:  pdims
        IMPLICIT NONE
 …
        REAL(wp), DIMENSION(nau2)   ::  aux4   !<
        REAL(wp), DIMENSION(nau2)   ::  auy4   !<
 #elif defined( __nec )
+#elif defined( __nec_fft )
        REAL(wp), DIMENSION(0:nx+3,nz+1)   ::  work_x  !<
        REAL(wp), DIMENSION(0:ny+3,nz+1)   ::  work_y  !<
 …
        ENDIF
+#if defined( _OPENACC ) && defined( __cuda_fft )
+       fft_method = 'system-specific'
+#endif
+!
 !--    Switch to tell the Poisson-solver that the vectorized version of Temperton-fft is to be used.
+       IF ( fft_method == 'temperton-algorithm' .AND. loop_optimization == 'vector' )  THEN
+       IF ( fft_method == 'temperton-algorithm'  .AND.  loop_optimization == 'vector'  .AND.       &
+            pdims(1) /= 1  .AND.  pdims(2) /= 1 )  THEN
           temperton_fft_vec = .TRUE.
        ENDIF
-#if defined( _OPENACC ) && defined( __cuda_fft )
-       fft_method = 'system-specific'
-#endif
        IF ( fft_method == 'system-specific' )  THEN
 …
           CALL DCRFT( 1, worky, 1, worky, 1, ny+1, 1, -1, sqr_dny, auy3, nau1, &
                       auy4, nau2 )
 #elif defined( __nec )
+#elif defined( __nec_fft )
           message_string = 'fft method "' // TRIM( fft_method) // &
                            '" currently does not work on NEC'
 …
           IF ( temperton_fft_vec )  THEN
              ALLOCATE( f_vec((nyn_x-nys_x+1)*(nzt_x-nzb_x+1),0:nx+2) )
+             ALLOCATE( f_vec_x((nyn_x-nys_x+1)*(nzt_x-nzb_x+1),0:nx+2) )
           ENDIF
 …
        REAL(wp), DIMENSION(nau2) ::  aux2  !<
        REAL(wp), DIMENSION(nau2) ::  aux4  !<
 #elif defined( __nec )
+#elif defined( __nec_fft )
        REAL(wp), DIMENSION(6*(nx+1)) ::  work2  !<
 #elif defined( __cuda_fft )
 …
                 ALLOCATE( work_vec( (nyn_x-nys_x+1)*(nzt_x-nzb_x+1),nx+2) )
+!
 !--             f_vec is already set in transpose_zx
                 CALL fft991cy_vec( f_vec, work_vec, trigs_x, ifax_x, nx+1, -1 )
+!--             f_vec_x is already set in transpose_zx
+                CALL fft991cy_vec( f_vec_x, work_vec, trigs_x, ifax_x, nx+1, -1 )
                 DEALLOCATE( work_vec )
 …
                          mm = j-nys_x+1+(k-nzb_x)*(nyn_x-nys_x+1)
                          DO  i = 0, (nx+1)/2
                             ar_inv(j,k,i) = f_vec(mm,2*i)
+                            ar_inv(j,k,i) = f_vec_x(mm,2*i)
                          ENDDO
                          DO  i = 1, (nx+1)/2-1
                             ar_inv(j,k,nx+1-i) = f_vec(mm,2*i+1)
+                            ar_inv(j,k,nx+1-i) = f_vec_x(mm,2*i+1)
                          ENDDO
                       ENDDO
 …
                          mm = j-nys_x+1+(k-nzb_x)*(nyn_x-nys_x+1)
                          DO  i = 0, (nx+1)/2
                             ar(i,j,k) = f_vec(mm,2*i)
+                            ar(i,j,k) = f_vec_x(mm,2*i)
                          ENDDO
                          DO  i = 1, (nx+1)/2-1
                             ar(nx+1-i,j,k) = f_vec(mm,2*i+1)
+                            ar(nx+1-i,j,k) = f_vec_x(mm,2*i+1)
                          ENDDO
                       ENDDO
 …
                          mm = j-nys_x+1+(k-nzb_x)*(nyn_x-nys_x+1)
                          DO  i = 0, (nx+1)/2
                             f_vec(mm,2*i) = ar_inv(j,k,i)
+                            f_vec_x(mm,2*i) = ar_inv(j,k,i)
                          ENDDO
                          DO  i = 1, (nx+1)/2-1
                             f_vec(mm,2*i+1) = ar_inv(j,k,nx+1-i)
+                            f_vec_x(mm,2*i+1) = ar_inv(j,k,nx+1-i)
                          ENDDO
                       ENDDO
 …
                          mm = j-nys_x+1+(k-nzb_x)*(nyn_x-nys_x+1)
                          DO  i = 0, (nx+1)/2
                             f_vec(mm,2*i) = ar(i,j,k)
+                            f_vec_x(mm,2*i) = ar(i,j,k)
                          ENDDO
                          DO  i = 1, (nx+1)/2-1
                             f_vec(mm,2*i+1) = ar(nx+1-i,j,k)
+                            f_vec_x(mm,2*i+1) = ar(nx+1-i,j,k)
                          ENDDO
                       ENDDO
 …
                 ENDIF
                 f_vec(:,1)    = 0.0_wp
                 f_vec(:,nx+2) = 0.0_wp
+                f_vec_x(:,1)    = 0.0_wp
+                f_vec_x(:,nx+2) = 0.0_wp
                 ALLOCATE( work_vec((nyn_x-nys_x+1)*(nzt_x-nzb_x+1),nx+2) )
                 CALL fft991cy_vec( f_vec, work_vec, trigs_x, ifax_x, nx+1, 1 )
+                CALL fft991cy_vec( f_vec_x, work_vec, trigs_x, ifax_x, nx+1, 1 )
                 DEALLOCATE( work_vec )
 …
           ENDIF
 #elif defined( __nec )
+#elif defined( __nec_fft )
           IF ( forward_fft )  THEN
 …
        REAL(wp), DIMENSION(nau2) ::  aux2       !<
        REAL(wp), DIMENSION(nau2) ::  aux4       !<
 #elif defined( __nec )
+#elif defined( __nec_fft )
        REAL(wp), DIMENSION(6*(nx+1)) ::  work2  !<
 #endif
 …
           ENDIF
 #elif defined( __nec )
+#elif defined( __nec_fft )
           IF ( forward_fft )  THEN
 …
        REAL(wp), DIMENSION(ny+2)   ::  work1  !<
        REAL(wp), DIMENSION(:,:), ALLOCATABLE ::  f_vec
+       REAL(wp), DIMENSION(:,:), ALLOCATABLE ::  f_vec_y
        REAL(wp), DIMENSION(:,:), ALLOCATABLE ::  work_vec
 …
        REAL(wp), DIMENSION(nau2) ::  auy2  !<
        REAL(wp), DIMENSION(nau2) ::  auy4  !<
 #elif defined( __nec )
+#elif defined( __nec_fft )
        REAL(wp), DIMENSION(6*(ny+1)) ::  work2  !<
 #elif defined( __cuda_fft )
 …
+!
 !--             Vector version of Temperton-fft. Computes multiple 1-D FFT's.
                 ALLOCATE( f_vec((nxr_y_l-nxl_y_l+1)*(nzt_y-nzb_y+1),0:ny+2) )
+                ALLOCATE( f_vec_y((nxr_y_l-nxl_y_l+1)*(nzt_y-nzb_y+1),0:ny+2) )
                 mm = 1
                 DO  k = nzb_y, nzt_y
                    DO  i = nxl_y_l, nxr_y_l
                       f_vec(mm,0:nx) = ar(0:nx,i,k)
+                      f_vec_y(mm,0:nx) = ar(0:nx,i,k)
                       mm = mm+1
                    ENDDO
 …
                 ALLOCATE( work_vec( (nxr_y_l-nxl_y_l+1)*(nzt_y-nzb_y+1),ny+2) )
                 CALL fft991cy_vec( f_vec, work_vec, trigs_y, ifax_y, ny+1, -1 )
+                CALL fft991cy_vec( f_vec_y, work_vec, trigs_y, ifax_y, ny+1, -1 )
                 DEALLOCATE( work_vec )
 …
                          mm = i-nxl_y_l+1+(k-nzb_y)*(nxr_y_l-nxl_y_l+1)
                          DO  j = 0, (ny+1)/2
                             ar_inv(i,k,j) = f_vec(mm,2*j)
+                            ar_inv(i,k,j) = f_vec_y(mm,2*j)
                          ENDDO
                          DO  j = 1, (ny+1)/2 - 1
                             ar_inv(i,k,ny+1-j) = f_vec(mm,2*j+1)
+                            ar_inv(i,k,ny+1-j) = f_vec_y(mm,2*j+1)
                          ENDDO
                       ENDDO
 …
                          mm = i-nxl_y_l+1+(k-nzb_y)*(nxr_y_l-nxl_y_l+1)
                          DO  j = 0, (ny+1)/2
                             ar(j,i,k) = f_vec(mm,2*j)
+                            ar(j,i,k) = f_vec_y(mm,2*j)
                          ENDDO
                          DO  j = 1, (ny+1)/2 - 1
                             ar(ny+1-j,i,k) = f_vec(mm,2*j+1)
+                            ar(ny+1-j,i,k) = f_vec_y(mm,2*j+1)
                          ENDDO
                       ENDDO
 …
                 ENDIF
                 DEALLOCATE( f_vec )
+                DEALLOCATE( f_vec_y )
              ENDIF
 …
              ELSE
                 ALLOCATE( f_vec((nxr_y_l-nxl_y_l+1)*(nzt_y-nzb_y+1),0:ny+2) )
+                ALLOCATE( f_vec_y((nxr_y_l-nxl_y_l+1)*(nzt_y-nzb_y+1),0:ny+2) )
                 IF ( PRESENT( ar_inv ) )  THEN
 …
                          mm = i-nxl_y_l+1+(k-nzb_y)*(nxr_y_l-nxl_y_l+1)
                          DO  j = 0, (ny+1)/2
                             f_vec(mm,2*j) = ar_inv(i,k,j)
+                            f_vec_y(mm,2*j) = ar_inv(i,k,j)
                          ENDDO
                          DO  j = 1, (ny+1)/2 - 1
                             f_vec(mm,2*j+1) = ar_inv(i,k,ny+1-j)
+                            f_vec_y(mm,2*j+1) = ar_inv(i,k,ny+1-j)
                          ENDDO
                       ENDDO
 …
                          mm = i-nxl_y_l+1+(k-nzb_y)*(nxr_y_l-nxl_y_l+1)
                          DO  j = 0, (ny+1)/2
                             f_vec(mm,2*j) = ar(j,i,k)
+                            f_vec_y(mm,2*j) = ar(j,i,k)
                          ENDDO
                          DO  j = 1, (ny+1)/2 - 1
                             f_vec(mm,2*j+1) = ar(ny+1-j,i,k)
+                            f_vec_y(mm,2*j+1) = ar(ny+1-j,i,k)
                          ENDDO
                       ENDDO
 …
                 ENDIF
                 f_vec(:,1)    = 0.0_wp
                 f_vec(:,ny+2) = 0.0_wp
+                f_vec_y(:,1)    = 0.0_wp
+                f_vec_y(:,ny+2) = 0.0_wp
                 ALLOCATE( work_vec((nxr_y_l-nxl_y_l+1)*(nzt_y-nzb_y+1),ny+2) )
                 CALL fft991cy_vec( f_vec, work_vec, trigs_y, ifax_y, ny+1, 1 )
+                CALL fft991cy_vec( f_vec_y, work_vec, trigs_y, ifax_y, ny+1, 1 )
                 DEALLOCATE( work_vec )
 …
                 DO  k = nzb_y, nzt_y
                    DO  i = nxl_y_l, nxr_y_l
                       ar(0:ny,i,k) = f_vec(mm,0:ny)
+                      ar(0:ny,i,k) = f_vec_y(mm,0:ny)
                       mm = mm+1
                    ENDDO
                 ENDDO
                 DEALLOCATE( f_vec )
+                DEALLOCATE( f_vec_y )
              ENDIF
 …
           ENDIF
 #elif defined( __nec )
+#elif defined( __nec_fft )
           IF ( forward_fft )  THEN
 …
        REAL(wp), DIMENSION(nau2) ::  auy2  !<
        REAL(wp), DIMENSION(nau2) ::  auy4  !<
 #elif defined( __nec )
+#elif defined( __nec_fft )
        REAL(wp), DIMENSION(6*(ny+1)) ::  work2  !<
 #endif
 …
           ENDIF
 #elif defined( __nec )
+#elif defined( __nec_fft )
           IF ( forward_fft )  THEN
 …
        INTEGER(iwp) ::  k     !<
        INTEGER(iwp) ::  siza  !<
 #if defined( __nec )
+#if defined( __nec_fft )
        INTEGER(iwp) ::  sizw
 #endif
 …
        REAL(wp), DIMENSION(6*(nx+4),nz+1) ::  work1  !<
 #if defined( __nec )
+#if defined( __nec_fft )
        COMPLEX(wp), DIMENSION(:,:), ALLOCATABLE ::  work
 #endif
 …
        ELSEIF ( fft_method == 'system-specific' )  THEN
 #if defined( __nec )
+#if defined( __nec_fft )
           ALLOCATE( work((nx+4)/2+1,nz+1) )
           siza = SIZE( ai, 1 )
 …
        INTEGER(iwp) ::  ny1   !<
        INTEGER(iwp) ::  siza  !<
 #if defined( __nec )
+#if defined( __nec_fft )
        INTEGER(iwp) ::  sizw
 #endif
 …
        REAL(wp), DIMENSION(6*(ny+4),nz+1) ::  work1  !<
 #if defined( __nec )
+#if defined( __nec_fft )
        COMPLEX(wp), DIMENSION(:,:), ALLOCATABLE ::  work
 #endif
 …
        ELSEIF ( fft_method == 'system-specific' )  THEN
 #if defined( __nec )
+#if defined( __nec_fft )
           ALLOCATE( work((ny+4)/2+1,nz+1) )
           siza = SIZE( ai, 1 )

palm/trunk/SOURCE/netcdf_data_input_mod.f90

-                      r4362
+                      r4370
 ! -----------------
 ! $Id$
+! collective read switched off on NEC Aurora to avoid hang situations
+!
+! 4362 2020-01-07 17:15:02Z suehring
 ! Input of plant canopy variables from static driver moved to plant-canopy
 ! model
 …
           collective_read = .FALSE.
        ELSE
+#if defined( __nec )
+          collective_read = .FALSE.   ! collective read causes hang situations on NEC Aurora
+#else
           collective_read = .TRUE.
+#endif
        ENDIF
 #else

palm/trunk/SOURCE/ocean_mod.f90

-                      r4346
+                      r4370
 ! -----------------
 ! $Id$
+! vector directives added to force vectorization on Intel19 compiler
+!
+! 4346 2019-12-18 11:55:56Z motisi
 ! Introduction of wall_flags_total_0, which currently sets bits based on static
 ! topography information used in wall_flags_static_0
 …
        DO  i = nxl, nxr
           DO  j = nys, nyn
+             !following directive is required to vectorize on Intel19
+             !DIR$ IVDEP
              DO  k = nzb+1, nzt
                 sa_p(k,j,i) = sa(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +            &

palm/trunk/SOURCE/prognostic_equations.f90

-                      r4360
+                      r4370
 ! -----------------
 ! $Id$
+! vector directives added to force vectorization on Intel19 compiler
+!
+! 4360 2020-01-07 11:25:50Z suehring
 ! Introduction of wall_flags_total_0, which currently sets bits based on static
 ! topography information used in wall_flags_static_0
 …
     DO  i = nxlu, nxr
        DO  j = nys, nyn
+          !following directive is required to vectorize on Intel19
+          !DIR$ IVDEP
           DO  k = nzb+1, nzt
              u_p(k,j,i) = u(k,j,i) + ( dt_3d * ( tsc(2) * tend(k,j,i) +          &
 …
     DO  i = nxl, nxr
        DO  j = nysv, nyn
+          !following directive is required to vectorize on Intel19
+          !DIR$ IVDEP
           DO  k = nzb+1, nzt
              v_p(k,j,i) = v(k,j,i) + ( dt_3d * ( tsc(2) * tend(k,j,i) +        &
 …
     DO  i = nxl, nxr
        DO  j = nys, nyn
+          !following directive is required to vectorize on Intel19
+          !DIR$ IVDEP
           DO  k = nzb+1, nzt-1
              w_p(k,j,i) = w(k,j,i) + ( dt_3d * ( tsc(2) * tend(k,j,i) +        &
 …
        DO  i = nxl, nxr
           DO  j = nys, nyn
+             !following directive is required to vectorize on Intel19
+             !DIR$ IVDEP
              DO  k = nzb+1, nzt
                 pt_p(k,j,i) = pt(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +      &
 …
        DO  i = nxl, nxr
           DO  j = nys, nyn
+             !following directive is required to vectorize on Intel19
+             !DIR$ IVDEP
              DO  k = nzb+1, nzt
                 q_p(k,j,i) = q(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +        &
 …
        DO  i = nxl, nxr
           DO  j = nys, nyn
+             !following directive is required to vectorize on Intel19
+             !DIR$ IVDEP
              DO  k = nzb+1, nzt
                 s_p(k,j,i) = s(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +        &

palm/trunk/SOURCE/surface_layer_fluxes_mod.f90

-                      r4366
+                      r4370
 ! -----------------
 ! $Id$
+! bugfix: openacc porting for vector version of OL calculation added
+!
+! 4366 2020-01-09 08:12:43Z raasch
 ! vector version for calculation of Obukhov length via Newton iteration added
+!
 …
        LOGICAL, DIMENSION(surf%ns) ::  convergence_reached  !< convergence switch for vectorization
+       !$ACC DECLARE CREATE( convergence_reached )
        REAL(wp)     :: f,      & !< Function for Newton iteration: f = Ri - [...]/[...]^2 = 0
 …
        REAL(wp), DIMENSION(surf%ns) ::  ol_old_vec  !< temporary array required for vectorization
        REAL(wp), DIMENSION(surf%ns) ::  z_mo_vec    !< temporary array required for vectorization
+       !$ACC DECLARE CREATE( ol_old_vec, z_mo_vec )
+!
 …
 !--       Calculate the Obukhov length using Newton iteration
 !--       First set arrays required for vectorization
+          !$ACC PARALLEL LOOP &
+          !$ACC PRESENT(surf)
           DO  m = 1, surf%ns
 …
                 IF ( surf%rib(m) < 0.0_wp ) surf%ol(m) = -0.01_wp
              ENDIF
+!
+!--          Initialize convergence flag
+             convergence_reached(m) = .FALSE.
           ENDDO
 …
+!
 !--       Iteration to find Obukhov length
-          convergence_reached(:) = .FALSE.
           iter = 0
           DO
 …
 !--          In case of divergence, use the value(s) of the previous time step
              IF ( iter > 1000 )  THEN
+                !$ACC PARALLEL LOOP &
+                !$ACC PRESENT(surf)
                 DO  m = 1, surf%ns
                    IF ( .NOT. convergence_reached(m) )  surf%ol(1:surf%ns) = ol_old
+                   IF ( .NOT. convergence_reached(m) )  surf%ol(m) = ol_old_vec(m)
                 ENDDO
                 EXIT
              ENDIF
+             !$ACC PARALLEL LOOP PRIVATE(ol_m, ol_l, ol_u, f, f_d_ol) &
+             !$ACC PRESENT(surf)
              DO  m = 1, surf%ns
 …
+!
 !--          Assure that Obukhov length does not become zero
+             !$ACC PARALLEL LOOP &
+             !$ACC PRESENT(surf)
              DO  m = 1, surf%ns
                 IF ( convergence_reached(m) )  CYCLE

palm/trunk/SOURCE/temperton_fft_mod.f90

-                      r4366
+                      r4370
 ! -----------------
 ! $Id$
+! unused variables removed
+!
+! 4366 2020-01-09 08:12:43Z raasch
 ! vectorized routines added
+!
 …
     INTEGER(iwp) ::  j      !<
     INTEGER(iwp) ::  jbase  !<
-    INTEGER(iwp) ::  jj     !<
     INTEGER(iwp) ::  k      !<
     INTEGER(iwp) ::  la     !<
-    INTEGER(iwp) ::  nb     !<
-    INTEGER(iwp) ::  nblox  !<
     INTEGER(iwp) ::  nfax   !<
     INTEGER(iwp) ::  nvex   !<
     INTEGER(iwp) ::  nx     !<
-    INTEGER(iwp) ::  mm     !<
 …
     nx   = n + 1
     IF ( MOD(n,2) == 1 )  nx = n
-    nblox = 1
     nvex = 1

palm/trunk/SOURCE/transpose.f90

-                      r4366
+                      r4370
 ! -----------------
 ! $Id$
+! vector array renamed
+!
+! 4366 2020-01-09 08:12:43Z raasch
 ! modifications for NEC vectorization
+!
 …
     USE fft_xy,                                                                &
         ONLY:  f_vec, temperton_fft_vec
+        ONLY:  f_vec_x, temperton_fft_vec
     USE indices,                                                               &
 …
+!
 !--    Reorder input array for transposition. Data from the vectorized Temperton-fft is stored in
 !--    different array format (f_vec).
+!--    different array format (f_vec_x).
        IF ( temperton_fft_vec )  THEN
 …
                    DO  j = nys_x, nyn_x
                       mm = j-nys_x+1+(k-nzb_x)*(nyn_x-nys_x+1)
                       work(j,i-xs+1,k,l) = f_vec(mm,i)
+                      work(j,i-xs+1,k,l) = f_vec_x(mm,i)
                    ENDDO
                 ENDDO
 …
     USE fft_xy,                                                                &
         ONLY:  f_vec, temperton_fft_vec
+        ONLY:  f_vec_x, temperton_fft_vec
     USE indices,                                                               &
 …
+!
 !--    Reorder transposed array.
 !--    Data for the vectorized Temperton-fft is stored in different array format (f_vec) which saves
 !--    additional data copy in fft_x.
+!--    Data for the vectorized Temperton-fft is stored in different array format (f_vec_x) which
+!--    saves additional data copy in fft_x.
        IF ( temperton_fft_vec )  THEN
 …
                    DO  j = nys_x, nyn_x
                       mm = j-nys_x+1+(k-nzb_x)*(nyn_x-nys_x+1)
                       f_vec(mm,i) = work(j,i-xs+1,k,l)
+                      f_vec_x(mm,i) = work(j,i-xs+1,k,l)
                    ENDDO
                 ENDDO

palm/trunk/SOURCE/turbulence_closure_mod.f90

-                      r4346
+                      r4370
 ! -----------------
 ! $Id$
+! vector directives added to force vectorization on Intel19 compiler
+!
+! 4346 2019-12-18 11:55:56Z motisi
 ! Introduction of wall_flags_total_0, which currently sets bits based on static
 ! topography information used in wall_flags_static_0
 …
        DO  i = nxl, nxr
           DO  j = nys, nyn
+             !following directive is required to vectorize on Intel19
+             !DIR$ IVDEP
              DO  k = nzb+1, nzt
                 e_p(k,j,i) = e(k,j,i) + ( dt_3d * ( sbt * tend(k,j,i) +        &

palm/trunk/TUTORIALS/cases/dispersion_eulerian_and_lpm_extended/USER_CODE/user_module.f90

r4002	r4370
15	15	! PALM. If not, see <http://www.gnu.org/licenses/>.
16	16	!
17		! Copyright 1997-2019 Leibniz Universitaet Hannover
	17	! Copyright 1997-2020 Leibniz Universitaet Hannover
18	18	!------------------------------------------------------------------------------!
19	19	!

palm/trunk/TUTORIALS/cases/lsm_short/USER_CODE/user_module.f90

r4222	r4370
15	15	! PALM. If not, see <http://www.gnu.org/licenses/>.
16	16	!
17		! Copyright 1997-2019 Leibniz Universitaet Hannover
	17	! Copyright 1997-2020 Leibniz Universitaet Hannover
18	18	!------------------------------------------------------------------------------!
19	19	!

palm/trunk/UTIL/agent_preprocessing/agent_preprocessing.f90

r3665	r4370
15	15	! PALM. If not, see <http://www.gnu.org/licenses/>.
16	16	!
17		! Copyright 1997-2019 Leibniz Universitaet Hannover
	17	! Copyright 1997-2020 Leibniz Universitaet Hannover
18	18	!------------------------------------------------------------------------------!
19	19	!

palm/trunk/UTIL/chemistry/gasphase_preproc/kpp4palm/templates/module_header

r3833	r4370
37	37	! PALM. If not, see <http://www.gnu.org/licenses/>.
38	38	!
39		! Copyright 1997-2019 Leibniz Universitaet Hannover
	39	! Copyright 1997-2020 Leibniz Universitaet Hannover
40	40	!--------------------------------------------------------------------------------!
41	41	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_cbm4/chem_gasphase_mod.f90

r3944	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_passive/chem_gasphase_mod.f90

r3833	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_passive1/chem_gasphase_mod.f90

r3944	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_phstat/chem_gasphase_mod.f90

r3944	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_phstatp/chem_gasphase_mod.f90

r3944	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_salsa+phstat/chem_gasphase_mod.f90

r3949	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_salsa+simple/chem_gasphase_mod.f90

r4016	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_salsagas/chem_gasphase_mod.f90

r3944	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_simple/chem_gasphase_mod.f90

r4016	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_simplep/chem_gasphase_mod.f90

r4016	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

palm/trunk/UTIL/chemistry/gasphase_preproc/mechanisms/def_smog/chem_gasphase_mod.f90

r3833	r4370
41	41	! PALM. If not,see <http://www.gnu.org/licenses/>.
42	42	!
43		! Copyright 1997-2019 Leibniz Universitaet Hannover
	43	! Copyright 1997-2020 Leibniz Universitaet Hannover
44	44	!--------------------------------------------------------------------------------!
45	45	!

Note: See TracChangeset for help on using the changeset viewer.

Context Navigation

Changeset 4370

Legend:

Download in other formats: