source: palm/trunk/SOURCE/init_pegrid.f90 @ 1947

Last change on this file since 1947 was 1933, checked in by hellstea, 9 years ago

last commit documented

  • Property svn:keywords set to Id
File size: 44.6 KB
RevLine 
[1682]1!> @file init_pegrid.f90
[1036]2!--------------------------------------------------------------------------------!
3! This file is part of PALM.
4!
5! PALM is free software: you can redistribute it and/or modify it under the terms
6! of the GNU General Public License as published by the Free Software Foundation,
7! either version 3 of the License, or (at your option) any later version.
8!
9! PALM is distributed in the hope that it will be useful, but WITHOUT ANY
10! WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR
11! A PARTICULAR PURPOSE.  See the GNU General Public License for more details.
12!
13! You should have received a copy of the GNU General Public License along with
14! PALM. If not, see <http://www.gnu.org/licenses/>.
15!
[1818]16! Copyright 1997-2016 Leibniz Universitaet Hannover
[1036]17!--------------------------------------------------------------------------------!
18!
[254]19! Current revisions:
[1322]20! ------------------
[1834]21!
[1923]22!
[1321]23! Former revisions:
24! -----------------
25! $Id: init_pegrid.f90 1933 2016-06-13 07:12:51Z suehring $
26!
[1933]27! 1923 2016-05-31 16:37:07Z boeske
28! Initial version of purely vertical nesting introduced.
29!
[1923]30! 1922 2016-05-31 16:36:08Z boeske
31! Bugfix: array transposition checks restricted to cases if a fourier
32! transform is used , removed unused variable nnx_z
33!
[1834]34! 1833 2016-04-07 14:23:03Z raasch
35! spectra related variables moved to spectra_mod
36!
[1816]37! 1815 2016-04-06 13:49:59Z raasch
38! cpp-directives for intel openmp bug removed
39!
[1805]40! 1804 2016-04-05 16:30:18Z maronga
41! Removed code for parameter file check (__check)
42!
[1780]43! 1779 2016-03-03 08:01:28Z raasch
44! changes regarding nested domain removed: virtual PE grid will be automatically
45! calculated for nested runs too
46!
[1765]47! 1764 2016-02-28 12:45:19Z raasch
48! cpp-statements for nesting removed
49!
[1763]50! 1762 2016-02-25 12:31:13Z hellstea
51! Introduction of nested domain feature
52!
[1683]53! 1682 2015-10-07 23:56:08Z knoop
54! Code annotations made doxygen readable
55!
[1678]56! 1677 2015-10-02 13:25:23Z boeske
57! New MPI-data types for exchange of 3D integer arrays.
58!
[1576]59! 1575 2015-03-27 09:56:27Z raasch
60! adjustments for psolver-queries, calculation of ngp_xz added
61!
[1566]62! 1565 2015-03-09 20:59:31Z suehring
63! Refine if-clause for setting nbgp.
64!
[1558]65! 1557 2015-03-05 16:43:04Z suehring
66! Adjustment for monotonic limiter
67!
[1469]68! 1468 2014-09-24 14:06:57Z maronga
69! Adapted for use on up to 6-digit processor cores
70!
[1436]71! 1435 2014-07-21 10:37:02Z keck
72! bugfix: added missing parameter coupling_mode_remote to ONLY-attribute
73!
[1403]74! 1402 2014-05-09 14:25:13Z raasch
75! location messages modified
76!
[1385]77! 1384 2014-05-02 14:31:06Z raasch
78! location messages added
79!
[1354]80! 1353 2014-04-08 15:21:23Z heinze
81! REAL constants provided with KIND-attribute
82!
[1323]83! 1322 2014-03-20 16:38:49Z raasch
84! REAL functions provided with KIND-attribute
85!
[1321]86! 1320 2014-03-20 08:40:49Z raasch
[1320]87! ONLY-attribute added to USE-statements,
88! kind-parameters added to all INTEGER and REAL declaration statements,
89! kinds are defined in new module kinds,
90! revision history before 2012 removed,
91! comment fields (!:) to be used for variable explanations added to
92! all variable declaration statements
[760]93!
[1305]94! 1304 2014-03-12 10:29:42Z raasch
95! bugfix: single core MPI runs missed some settings of transpose indices
96!
[1213]97! 1212 2013-08-15 08:46:27Z raasch
98! error message for poisfft_hybrid removed
99!
[1160]100! 1159 2013-05-21 11:58:22Z fricke
101! dirichlet/neumann and neumann/dirichlet removed
102!
[1140]103! 1139 2013-04-18 07:25:03Z raasch
104! bugfix for calculating the id of the PE carrying the recycling plane
105!
[1112]106! 1111 2013-03-08 23:54:10Z raasch
107! initialization of poisfft moved to module poisfft
108!
[1093]109! 1092 2013-02-02 11:24:22Z raasch
110! unused variables removed
111!
[1057]112! 1056 2012-11-16 15:28:04Z raasch
113! Indices for arrays n.._mg start from zero due to definition of arrays f2 and
114! p2 as automatic arrays in recursive subroutine next_mg_level
115!
[1042]116! 1041 2012-11-06 02:36:29Z raasch
117! a 2d virtual processor topology is used by default for all machines
118!
[1037]119! 1036 2012-10-22 13:43:42Z raasch
120! code put under GPL (PALM 3.9)
121!
[1004]122! 1003 2012-09-14 14:35:53Z raasch
123! subdomains must have identical size (grid matching = "match" removed)
124!
[1002]125! 1001 2012-09-13 14:08:46Z raasch
126! all actions concerning upstream-spline-method removed
127!
[979]128! 978 2012-08-09 08:28:32Z fricke
129! dirichlet/neumann and neumann/dirichlet added
130! nxlu and nysv are also calculated for inflow boundary
131!
[810]132! 809 2012-01-30 13:32:58Z maronga
133! Bugfix: replaced .AND. and .NOT. with && and ! in the preprocessor directives
134!
[808]135! 807 2012-01-25 11:53:51Z maronga
136! New cpp directive "__check" implemented which is used by check_namelist_files
137!
[1]138! Revision 1.1  1997/07/24 11:15:09  raasch
139! Initial revision
140!
141!
142! Description:
143! ------------
[1682]144!> Determination of the virtual processor topology (if not prescribed by the
145!> user)and computation of the grid point number and array bounds of the local
146!> domains.
[1]147!------------------------------------------------------------------------------!
[1682]148 SUBROUTINE init_pegrid
149 
[1]150
[1320]151    USE control_parameters,                                                    &
[1435]152        ONLY:  bc_lr, bc_ns, coupling_mode, coupling_mode_remote,              &
[1833]153               coupling_topology, gathered_size, grid_level,                   &
[1435]154               grid_level_count, host, inflow_l, inflow_n, inflow_r, inflow_s, &
155               io_blocks, io_group, maximum_grid_level,                        &
156               maximum_parallel_io_streams, message_string,                    &
[1762]157               mg_switch_to_pe0_level, momentum_advec, nest_bound_l,           &
[1933]158               nest_bound_n, nest_bound_r, nest_bound_s, nest_domain, neutral, &
159               psolver, outflow_l, outflow_n, outflow_r, outflow_s,            &
160               recycling_width, scalar_advec, subdomain_size 
[1]161
[1320]162    USE grid_variables,                                                        &
163        ONLY:  dx
164       
165    USE indices,                                                               &
166        ONLY:  mg_loc_ind, nbgp, nnx, nny, nnz, nx, nx_a, nx_o, nxl, nxl_mg,   &
167               nxlu, nxr, nxr_mg, ny, ny_a, ny_o, nyn, nyn_mg, nys, nys_mg,    &
168               nysv, nz, nzb, nzt, nzt_mg, wall_flags_1, wall_flags_2,         &
169               wall_flags_3, wall_flags_4, wall_flags_5, wall_flags_6,         &
170               wall_flags_7, wall_flags_8, wall_flags_9, wall_flags_10
[1]171
[1320]172    USE kinds
173     
174    USE pegrid
[1933]175   
176    USE pmc_interface,                                                         &   
177        ONLY:  nesting_mode
178   
[1833]179    USE spectra_mod,                                                           &
[1922]180        ONLY:  calculate_spectra, dt_dosp
[1833]181
[1320]182    USE transpose_indices,                                                     &
183        ONLY:  nxl_y, nxl_yd, nxl_z, nxr_y, nxr_yd, nxr_z, nyn_x, nyn_z, nys_x,&
184               nys_z, nzb_x, nzb_y, nzb_yd, nzt_x, nzt_yd, nzt_y
[667]185
[1]186    IMPLICIT NONE
187
[1682]188    INTEGER(iwp) ::  i                        !<
189    INTEGER(iwp) ::  id_inflow_l              !<
190    INTEGER(iwp) ::  id_recycling_l           !<
191    INTEGER(iwp) ::  ind(5)                   !<
192    INTEGER(iwp) ::  j                        !<
193    INTEGER(iwp) ::  k                        !<
194    INTEGER(iwp) ::  maximum_grid_level_l     !<
195    INTEGER(iwp) ::  mg_levels_x              !<
196    INTEGER(iwp) ::  mg_levels_y              !<
197    INTEGER(iwp) ::  mg_levels_z              !<
198    INTEGER(iwp) ::  mg_switch_to_pe0_level_l !<
199    INTEGER(iwp) ::  nnx_y                    !<
200    INTEGER(iwp) ::  nnx_z                    !<
201    INTEGER(iwp) ::  nny_x                    !<
202    INTEGER(iwp) ::  nny_z                    !<
203    INTEGER(iwp) ::  nnz_x                    !<
204    INTEGER(iwp) ::  nnz_y                    !<
205    INTEGER(iwp) ::  numproc_sqr              !<
206    INTEGER(iwp) ::  nxl_l                    !<
207    INTEGER(iwp) ::  nxr_l                    !<
208    INTEGER(iwp) ::  nyn_l                    !<
209    INTEGER(iwp) ::  nys_l                    !<
210    INTEGER(iwp) ::  nzb_l                    !<
211    INTEGER(iwp) ::  nzt_l                    !<
212    INTEGER(iwp) ::  omp_get_num_threads      !<
[1]213
[1682]214    INTEGER(iwp), DIMENSION(:), ALLOCATABLE ::  ind_all !<
215    INTEGER(iwp), DIMENSION(:), ALLOCATABLE ::  nxlf    !<
216    INTEGER(iwp), DIMENSION(:), ALLOCATABLE ::  nxrf    !<
217    INTEGER(iwp), DIMENSION(:), ALLOCATABLE ::  nynf    !<
218    INTEGER(iwp), DIMENSION(:), ALLOCATABLE ::  nysf    !<
[1]219
[1682]220    INTEGER(iwp), DIMENSION(2) :: pdims_remote          !<
[667]221
[1092]222#if defined( __mpi2 )
[1682]223    LOGICAL ::  found                                   !<
[1092]224#endif
[1]225
226!
227!-- Get the number of OpenMP threads
228    !$OMP PARALLEL
229!$  threads_per_task = omp_get_num_threads()
230    !$OMP END PARALLEL
231
232
233#if defined( __parallel )
[667]234
[1402]235    CALL location_message( 'creating virtual PE grids + MPI derived data types', &
236                           .FALSE. )
[1764]237
[1]238!
[1764]239!--    Determine the processor topology or check it, if prescribed by the user
[1779]240    IF ( npex == -1  .AND.  npey == -1 )  THEN
[1]241
242!
[1764]243!--       Automatic determination of the topology
[1779]244       numproc_sqr = SQRT( REAL( numprocs, KIND=wp ) )
245       pdims(1)    = MAX( numproc_sqr , 1 )
246       DO  WHILE ( MOD( numprocs , pdims(1) ) /= 0 )
247          pdims(1) = pdims(1) - 1
248       ENDDO
249       pdims(2) = numprocs / pdims(1)
[1]250
[1779]251    ELSEIF ( npex /= -1  .AND.  npey /= -1 )  THEN
[1]252
253!
[1779]254!--    Prescribed by user. Number of processors on the prescribed topology
255!--    must be equal to the number of PEs available to the job
256       IF ( ( npex * npey ) /= numprocs )  THEN
257          WRITE( message_string, * ) 'number of PEs of the prescribed ',   &
258              'topology (', npex*npey,') does not match & the number of ', &
259              'PEs available to the job (', numprocs, ')'
260          CALL message( 'init_pegrid', 'PA0221', 1, 2, 0, 6, 0 )
261       ENDIF
262       pdims(1) = npex
263       pdims(2) = npey
[1]264
[1779]265    ELSE
[1]266!
[1779]267!--    If the processor topology is prescribed by the user, the number of
268!--    PEs must be given in both directions
269       message_string = 'if the processor topology is prescribed by th' //  &
270                'e user& both values of "npex" and "npey" must be given' // &
271                ' in the &NAMELIST-parameter file'
272       CALL message( 'init_pegrid', 'PA0222', 1, 2, 0, 6, 0 )
[1]273
274    ENDIF
275
276!
[622]277!-- For communication speedup, set barriers in front of collective
278!-- communications by default on SGI-type systems
279    IF ( host(3:5) == 'sgi' )  collective_wait = .TRUE.
280
281!
[1]282!-- If necessary, set horizontal boundary conditions to non-cyclic
[722]283    IF ( bc_lr /= 'cyclic' )  cyclic(1) = .FALSE.
284    IF ( bc_ns /= 'cyclic' )  cyclic(2) = .FALSE.
[1]285
[807]286
[1]287!
288!-- Create the virtual processor grid
289    CALL MPI_CART_CREATE( comm_palm, ndim, pdims, cyclic, reorder, &
290                          comm2d, ierr )
291    CALL MPI_COMM_RANK( comm2d, myid, ierr )
[1468]292    WRITE (myid_char,'(''_'',I6.6)')  myid
[1]293
294    CALL MPI_CART_COORDS( comm2d, myid, ndim, pcoord, ierr )
295    CALL MPI_CART_SHIFT( comm2d, 0, 1, pleft, pright, ierr )
296    CALL MPI_CART_SHIFT( comm2d, 1, 1, psouth, pnorth, ierr )
297
298!
299!-- Determine sub-topologies for transpositions
300!-- Transposition from z to x:
301    remain_dims(1) = .TRUE.
302    remain_dims(2) = .FALSE.
303    CALL MPI_CART_SUB( comm2d, remain_dims, comm1dx, ierr )
304    CALL MPI_COMM_RANK( comm1dx, myidx, ierr )
305!
306!-- Transposition from x to y
307    remain_dims(1) = .FALSE.
308    remain_dims(2) = .TRUE.
309    CALL MPI_CART_SUB( comm2d, remain_dims, comm1dy, ierr )
310    CALL MPI_COMM_RANK( comm1dy, myidy, ierr )
311
312
313!
[1003]314!-- Calculate array bounds along x-direction for every PE.
[1]315    ALLOCATE( nxlf(0:pdims(1)-1), nxrf(0:pdims(1)-1), nynf(0:pdims(2)-1), &
[1003]316              nysf(0:pdims(2)-1) )
[1]317
[1003]318    IF ( MOD( nx+1 , pdims(1) ) /= 0 )  THEN
[274]319       WRITE( message_string, * ) 'x-direction: gridpoint number (',nx+1,') ',&
320                               'is not an& integral divisor of the number ',  &
321                               'processors (', pdims(1),')'
[254]322       CALL message( 'init_pegrid', 'PA0225', 1, 2, 0, 6, 0 )
[1]323    ELSE
[1003]324       nnx  = ( nx + 1 ) / pdims(1)
[1]325       IF ( nnx*pdims(1) - ( nx + 1) > nnx )  THEN
[274]326          WRITE( message_string, * ) 'x-direction: nx does not match the',    & 
327                       'requirements given by the number of PEs &used',       &
328                       '& please use nx = ', nx - ( pdims(1) - ( nnx*pdims(1) &
329                                   - ( nx + 1 ) ) ), ' instead of nx =', nx
[254]330          CALL message( 'init_pegrid', 'PA0226', 1, 2, 0, 6, 0 )
[1]331       ENDIF
332    ENDIF   
333
334!
335!-- Left and right array bounds, number of gridpoints
336    DO  i = 0, pdims(1)-1
337       nxlf(i)   = i * nnx
338       nxrf(i)   = ( i + 1 ) * nnx - 1
339    ENDDO
340
341!
342!-- Calculate array bounds in y-direction for every PE.
[1003]343    IF ( MOD( ny+1 , pdims(2) ) /= 0 )  THEN
[274]344       WRITE( message_string, * ) 'y-direction: gridpoint number (',ny+1,') ', &
345                           'is not an& integral divisor of the number of',     &
346                           'processors (', pdims(2),')'
[254]347       CALL message( 'init_pegrid', 'PA0227', 1, 2, 0, 6, 0 )
[1]348    ELSE
[1003]349       nny  = ( ny + 1 ) / pdims(2)
[1]350       IF ( nny*pdims(2) - ( ny + 1) > nny )  THEN
[274]351          WRITE( message_string, * ) 'y-direction: ny does not match the',    &
352                       'requirements given by the number of PEs &used ',      &
353                       '& please use ny = ', ny - ( pdims(2) - ( nnx*pdims(2) &
[254]354                                     - ( ny + 1 ) ) ), ' instead of ny =', ny
355          CALL message( 'init_pegrid', 'PA0228', 1, 2, 0, 6, 0 )
[1]356       ENDIF
357    ENDIF   
358
359!
360!-- South and north array bounds
361    DO  j = 0, pdims(2)-1
362       nysf(j)   = j * nny
363       nynf(j)   = ( j + 1 ) * nny - 1
364    ENDDO
365
366!
367!-- Local array bounds of the respective PEs
[1003]368    nxl = nxlf(pcoord(1))
369    nxr = nxrf(pcoord(1))
370    nys = nysf(pcoord(2))
371    nyn = nynf(pcoord(2))
372    nzb = 0
373    nzt = nz
374    nnz = nz
[1]375
376!
[707]377!-- Set switches to define if the PE is situated at the border of the virtual
378!-- processor grid
379    IF ( nxl == 0 )   left_border_pe  = .TRUE.
380    IF ( nxr == nx )  right_border_pe = .TRUE.
381    IF ( nys == 0 )   south_border_pe = .TRUE.
382    IF ( nyn == ny )  north_border_pe = .TRUE.
383
384!
[1]385!-- Calculate array bounds and gridpoint numbers for the transposed arrays
386!-- (needed in the pressure solver)
387!-- For the transposed arrays, cyclic boundaries as well as top and bottom
388!-- boundaries are omitted, because they are obstructive to the transposition
389
390!
391!-- 1. transposition  z --> x
[1001]392!-- This transposition is not neccessary in case of a 1d-decomposition along x
[1922]393    IF ( psolver == 'poisfft'  .OR.  calculate_spectra )  THEN
[1304]394
[1922]395       IF ( pdims(2) /= 1 )  THEN
396          IF ( MOD( nz , pdims(1) ) /= 0 )  THEN
397             WRITE( message_string, * ) 'transposition z --> x:',              &
398                       '&nz=',nz,' is not an integral divisior of pdims(1)=',  &
[274]399                                                                   pdims(1)
[1922]400             CALL message( 'init_pegrid', 'PA0230', 1, 2, 0, 6, 0 )
401          ENDIF
[1]402       ENDIF
[1922]403
404       nys_x = nys
405       nyn_x = nyn
406       nny_x = nny
407       nnz_x = nz / pdims(1)
408       nzb_x = 1 + myidx * nnz_x
409       nzt_x = ( myidx + 1 ) * nnz_x
410       sendrecvcount_zx = nnx * nny * nnz_x
411
[1]412    ENDIF
413
[1922]414
415    IF ( psolver == 'poisfft' )  THEN 
[1]416!
[1922]417!--    2. transposition  x --> y
418       IF ( MOD( nx+1 , pdims(2) ) /= 0 )  THEN
419          WRITE( message_string, * ) 'transposition x --> y:',                 &
420                            '&nx+1=',nx+1,' is not an integral divisor of ',   &
421                            'pdims(2)=',pdims(2)
422          CALL message( 'init_pegrid', 'PA0231', 1, 2, 0, 6, 0 )
423       ENDIF
[1]424
[1922]425       nnz_y = nnz_x
426       nzb_y = nzb_x
427       nzt_y = nzt_x
428       nnx_y = (nx+1) / pdims(2)
429       nxl_y = myidy * nnx_y
430       nxr_y = ( myidy + 1 ) * nnx_y - 1
431       sendrecvcount_xy = nnx_y * nny_x * nnz_y
[1]432!
[1922]433!--    3. transposition  y --> z 
434!--    (ELSE:  x --> y  in case of 1D-decomposition along x)
435       nxl_z = nxl_y
436       nxr_z = nxr_y
437       nny_z = (ny+1) / pdims(1)
438       nys_z = myidx * nny_z
439       nyn_z = ( myidx + 1 ) * nny_z - 1
440       sendrecvcount_yz = nnx_y * nny_z * nnz_y
[1304]441
[1922]442       IF ( pdims(2) /= 1 )  THEN
[1]443!
[1922]444!--       y --> z
445!--       This transposition is not neccessary in case of a 1d-decomposition
446!--       along x, except that the uptream-spline method is switched on
447          IF ( MOD( ny+1 , pdims(1) ) /= 0 )  THEN
448             WRITE( message_string, * ) 'transposition y --> z:',              &
449                               '& ny+1=',ny+1,' is not an integral divisor of',&
450                               ' pdims(1)=',pdims(1)
451             CALL message( 'init_pegrid', 'PA0232', 1, 2, 0, 6, 0 )
452          ENDIF
[1]453
[1922]454       ELSE
[1]455!
[1922]456!--       x --> y
457!--       This condition must be fulfilled for a 1D-decomposition along x
458          IF ( MOD( ny+1 , pdims(1) ) /= 0 )  THEN
459             WRITE( message_string, * ) 'transposition x --> y:',              &
460                               '& ny+1=',ny+1,' is not an integral divisor of',&
461                               ' pdims(1)=',pdims(1)
462             CALL message( 'init_pegrid', 'PA0233', 1, 2, 0, 6, 0 )
463          ENDIF
464
[1]465       ENDIF
466
467    ENDIF
468
469!
470!-- Indices for direct transpositions z --> y (used for calculating spectra)
[1922]471    IF ( calculate_spectra )  THEN
[1003]472       IF ( MOD( nz, pdims(2) ) /= 0 )  THEN
[1922]473          WRITE( message_string, * ) 'direct transposition z --> y (needed ',  &
474                    'for spectra):& nz=',nz,' is not an integral divisor of ', &
[274]475                    'pdims(2)=',pdims(2)
[254]476          CALL message( 'init_pegrid', 'PA0234', 1, 2, 0, 6, 0 )
[1]477       ELSE
[1003]478          nxl_yd = nxl
479          nxr_yd = nxr
480          nzb_yd = 1 + myidy * ( nz / pdims(2) )
481          nzt_yd = ( myidy + 1 ) * ( nz / pdims(2) )
482          sendrecvcount_zyd = nnx * nny * ( nz / pdims(2) )
[1]483       ENDIF
484    ENDIF
485
[1922]486    IF ( psolver == 'poisfft'  .OR.  calculate_spectra )  THEN
[1]487!
[1922]488!--    Indices for direct transpositions y --> x
489!--    (they are only possible in case of a 1d-decomposition along x)
490       IF ( pdims(2) == 1 )  THEN
491          nny_x = nny / pdims(1)
492          nys_x = myid * nny_x
493          nyn_x = ( myid + 1 ) * nny_x - 1
494          nzb_x = 1
495          nzt_x = nz
496          sendrecvcount_xy = nnx * nny_x * nz
497       ENDIF
498
[1]499    ENDIF
500
[1922]501    IF ( psolver == 'poisfft' )  THEN
[1]502!
[1922]503!--    Indices for direct transpositions x --> y
504!--    (they are only possible in case of a 1d-decomposition along y)
505       IF ( pdims(1) == 1 )  THEN
506          nnx_y = nnx / pdims(2)
507          nxl_y = myid * nnx_y
508          nxr_y = ( myid + 1 ) * nnx_y - 1
509          nzb_y = 1
510          nzt_y = nz
511          sendrecvcount_xy = nnx_y * nny * nz
512       ENDIF
513
[1]514    ENDIF
515
516!
517!-- Arrays for storing the array bounds are needed any more
518    DEALLOCATE( nxlf , nxrf , nynf , nysf )
519
[807]520
[145]521!
522!-- Collect index bounds from other PEs (to be written to restart file later)
523    ALLOCATE( hor_index_bounds(4,0:numprocs-1) )
524
525    IF ( myid == 0 )  THEN
526
527       hor_index_bounds(1,0) = nxl
528       hor_index_bounds(2,0) = nxr
529       hor_index_bounds(3,0) = nys
530       hor_index_bounds(4,0) = nyn
531
532!
533!--    Receive data from all other PEs
534       DO  i = 1, numprocs-1
535          CALL MPI_RECV( ibuf, 4, MPI_INTEGER, i, MPI_ANY_TAG, comm2d, status, &
536                         ierr )
537          hor_index_bounds(:,i) = ibuf(1:4)
538       ENDDO
539
540    ELSE
541!
542!--    Send index bounds to PE0
543       ibuf(1) = nxl
544       ibuf(2) = nxr
545       ibuf(3) = nys
546       ibuf(4) = nyn
547       CALL MPI_SEND( ibuf, 4, MPI_INTEGER, 0, myid, comm2d, ierr )
548
549    ENDIF
550
[807]551
[1]552#if defined( __print )
553!
554!-- Control output
555    IF ( myid == 0 )  THEN
556       PRINT*, '*** processor topology ***'
557       PRINT*, ' '
558       PRINT*, 'myid   pcoord    left right  south north  idx idy   nxl: nxr',&
559               &'   nys: nyn'
560       PRINT*, '------------------------------------------------------------',&
561               &'-----------'
562       WRITE (*,1000)  0, pcoord(1), pcoord(2), pleft, pright, psouth, pnorth, &
563                       myidx, myidy, nxl, nxr, nys, nyn
5641000   FORMAT (I4,2X,'(',I3,',',I3,')',3X,I4,2X,I4,3X,I4,2X,I4,2X,I3,1X,I3, &
565               2(2X,I4,':',I4))
566
567!
[108]568!--    Receive data from the other PEs
[1]569       DO  i = 1,numprocs-1
570          CALL MPI_RECV( ibuf, 12, MPI_INTEGER, i, MPI_ANY_TAG, comm2d, status, &
571                         ierr )
572          WRITE (*,1000)  i, ( ibuf(j) , j = 1,12 )
573       ENDDO
574    ELSE
575
576!
577!--    Send data to PE0
578       ibuf(1) = pcoord(1); ibuf(2) = pcoord(2); ibuf(3) = pleft
579       ibuf(4) = pright; ibuf(5) = psouth; ibuf(6) = pnorth; ibuf(7) = myidx
580       ibuf(8) = myidy; ibuf(9) = nxl; ibuf(10) = nxr; ibuf(11) = nys
581       ibuf(12) = nyn
582       CALL MPI_SEND( ibuf, 12, MPI_INTEGER, 0, myid, comm2d, ierr )       
583    ENDIF
584#endif
585
[1804]586#if defined( __parallel )
[102]587#if defined( __mpi2 )
588!
589!-- In case of coupled runs, get the port name on PE0 of the atmosphere model
590!-- and pass it to PE0 of the ocean model
591    IF ( myid == 0 )  THEN
592
593       IF ( coupling_mode == 'atmosphere_to_ocean' )  THEN
594
595          CALL MPI_OPEN_PORT( MPI_INFO_NULL, port_name, ierr )
[108]596
[102]597          CALL MPI_PUBLISH_NAME( 'palm_coupler', MPI_INFO_NULL, port_name, &
598                                 ierr )
[108]599
600!
[104]601!--       Write a flag file for the ocean model and the other atmosphere
602!--       processes.
603!--       There seems to be a bug in MPICH2 which causes hanging processes
604!--       in case that execution of LOOKUP_NAME is continued too early
605!--       (i.e. before the port has been created)
606          OPEN( 90, FILE='COUPLING_PORT_OPENED', FORM='FORMATTED' )
607          WRITE ( 90, '(''TRUE'')' )
608          CLOSE ( 90 )
[102]609
610       ELSEIF ( coupling_mode == 'ocean_to_atmosphere' )  THEN
611
[104]612!
613!--       Continue only if the atmosphere model has created the port.
614!--       There seems to be a bug in MPICH2 which causes hanging processes
615!--       in case that execution of LOOKUP_NAME is continued too early
616!--       (i.e. before the port has been created)
617          INQUIRE( FILE='COUPLING_PORT_OPENED', EXIST=found )
618          DO WHILE ( .NOT. found )
619             INQUIRE( FILE='COUPLING_PORT_OPENED', EXIST=found )
620          ENDDO
621
[102]622          CALL MPI_LOOKUP_NAME( 'palm_coupler', MPI_INFO_NULL, port_name, ierr )
623
624       ENDIF
625
626    ENDIF
627
628!
629!-- In case of coupled runs, establish the connection between the atmosphere
630!-- and the ocean model and define the intercommunicator (comm_inter)
631    CALL MPI_BARRIER( comm2d, ierr )
632    IF ( coupling_mode == 'atmosphere_to_ocean' )  THEN
633
634       CALL MPI_COMM_ACCEPT( port_name, MPI_INFO_NULL, 0, MPI_COMM_WORLD, &
635                             comm_inter, ierr )
[108]636       coupling_mode_remote = 'ocean_to_atmosphere'
637
[102]638    ELSEIF ( coupling_mode == 'ocean_to_atmosphere' )  THEN
639
640       CALL MPI_COMM_CONNECT( port_name, MPI_INFO_NULL, 0, MPI_COMM_WORLD, &
641                              comm_inter, ierr )
[108]642       coupling_mode_remote = 'atmosphere_to_ocean'
643
[102]644    ENDIF
[206]645#endif
[102]646
[667]647!
[709]648!-- Determine the number of ghost point layers
[1565]649    IF ( ( scalar_advec == 'ws-scheme' .AND. .NOT. neutral ) .OR.             &
[1557]650         scalar_advec == 'ws-scheme-mono' .OR.                                &
651         momentum_advec == 'ws-scheme' )  THEN
[667]652       nbgp = 3
653    ELSE
654       nbgp = 1
[709]655    ENDIF 
[667]656
[102]657!
[709]658!-- Create a new MPI derived datatype for the exchange of surface (xy) data,
659!-- which is needed for coupled atmosphere-ocean runs.
660!-- First, calculate number of grid points of an xy-plane.
[667]661    ngp_xy  = ( nxr - nxl + 1 + 2 * nbgp ) * ( nyn - nys + 1 + 2 * nbgp )
[102]662    CALL MPI_TYPE_VECTOR( ngp_xy, 1, nzt-nzb+2, MPI_REAL, type_xy, ierr )
663    CALL MPI_TYPE_COMMIT( type_xy, ierr )
[667]664
[709]665    IF ( TRIM( coupling_mode ) /= 'uncoupled' )  THEN
[667]666   
667!
668!--    Pass the number of grid points of the atmosphere model to
669!--    the ocean model and vice versa
670       IF ( coupling_mode == 'atmosphere_to_ocean' )  THEN
671
672          nx_a = nx
673          ny_a = ny
674
[709]675          IF ( myid == 0 )  THEN
676
677             CALL MPI_SEND( nx_a, 1, MPI_INTEGER, numprocs, 1, comm_inter,  &
678                            ierr )
679             CALL MPI_SEND( ny_a, 1, MPI_INTEGER, numprocs, 2, comm_inter,  &
680                            ierr )
681             CALL MPI_SEND( pdims, 2, MPI_INTEGER, numprocs, 3, comm_inter, &
682                            ierr )
683             CALL MPI_RECV( nx_o, 1, MPI_INTEGER, numprocs, 4, comm_inter,  &
684                            status, ierr )
685             CALL MPI_RECV( ny_o, 1, MPI_INTEGER, numprocs, 5, comm_inter,  &
686                            status, ierr )
687             CALL MPI_RECV( pdims_remote, 2, MPI_INTEGER, numprocs, 6,      &
[667]688                            comm_inter, status, ierr )
689          ENDIF
690
[709]691          CALL MPI_BCAST( nx_o, 1, MPI_INTEGER, 0, comm2d, ierr )
692          CALL MPI_BCAST( ny_o, 1, MPI_INTEGER, 0, comm2d, ierr ) 
693          CALL MPI_BCAST( pdims_remote, 2, MPI_INTEGER, 0, comm2d, ierr )
[667]694       
695       ELSEIF ( coupling_mode == 'ocean_to_atmosphere' )  THEN
696
697          nx_o = nx
698          ny_o = ny 
699
700          IF ( myid == 0 ) THEN
[709]701
702             CALL MPI_RECV( nx_a, 1, MPI_INTEGER, 0, 1, comm_inter, status, &
703                            ierr )
704             CALL MPI_RECV( ny_a, 1, MPI_INTEGER, 0, 2, comm_inter, status, &
705                            ierr )
706             CALL MPI_RECV( pdims_remote, 2, MPI_INTEGER, 0, 3, comm_inter, &
707                            status, ierr )
708             CALL MPI_SEND( nx_o, 1, MPI_INTEGER, 0, 4, comm_inter, ierr )
709             CALL MPI_SEND( ny_o, 1, MPI_INTEGER, 0, 5, comm_inter, ierr )
710             CALL MPI_SEND( pdims, 2, MPI_INTEGER, 0, 6, comm_inter, ierr )
[667]711          ENDIF
712
713          CALL MPI_BCAST( nx_a, 1, MPI_INTEGER, 0, comm2d, ierr)
714          CALL MPI_BCAST( ny_a, 1, MPI_INTEGER, 0, comm2d, ierr) 
715          CALL MPI_BCAST( pdims_remote, 2, MPI_INTEGER, 0, comm2d, ierr) 
716
717       ENDIF
718 
[709]719       ngp_a = ( nx_a+1 + 2 * nbgp ) * ( ny_a+1 + 2 * nbgp )
720       ngp_o = ( nx_o+1 + 2 * nbgp ) * ( ny_o+1 + 2 * nbgp )
[667]721
722!
[709]723!--    Determine if the horizontal grid and the number of PEs in ocean and
724!--    atmosphere is same or not
725       IF ( nx_o == nx_a  .AND.  ny_o == ny_a  .AND.  &
[667]726            pdims(1) == pdims_remote(1) .AND. pdims(2) == pdims_remote(2) ) &
727       THEN
728          coupling_topology = 0
729       ELSE
730          coupling_topology = 1
731       ENDIF 
732
733!
734!--    Determine the target PEs for the exchange between ocean and
735!--    atmosphere (comm2d)
[709]736       IF ( coupling_topology == 0 )  THEN
737!
738!--       In case of identical topologies, every atmosphere PE has exactly one
739!--       ocean PE counterpart and vice versa
740          IF ( TRIM( coupling_mode ) == 'atmosphere_to_ocean' ) THEN
[667]741             target_id = myid + numprocs
742          ELSE
743             target_id = myid 
744          ENDIF
745
746       ELSE
747!
748!--       In case of nonequivalent topology in ocean and atmosphere only for
749!--       PE0 in ocean and PE0 in atmosphere a target_id is needed, since
[709]750!--       data echxchange between ocean and atmosphere will be done only
751!--       between these PEs.   
752          IF ( myid == 0 )  THEN
753
754             IF ( TRIM( coupling_mode ) == 'atmosphere_to_ocean' )  THEN
[667]755                target_id = numprocs 
756             ELSE
757                target_id = 0
758             ENDIF
[709]759
[667]760          ENDIF
[709]761
[667]762       ENDIF
763
764    ENDIF
765
766
[102]767#endif
768
[1]769#else
770
771!
772!-- Array bounds when running on a single PE (respectively a non-parallel
773!-- machine)
[1003]774    nxl = 0
775    nxr = nx
776    nnx = nxr - nxl + 1
777    nys = 0
778    nyn = ny
779    nny = nyn - nys + 1
780    nzb = 0
781    nzt = nz
782    nnz = nz
[1]783
[145]784    ALLOCATE( hor_index_bounds(4,0:0) )
785    hor_index_bounds(1,0) = nxl
786    hor_index_bounds(2,0) = nxr
787    hor_index_bounds(3,0) = nys
788    hor_index_bounds(4,0) = nyn
789
[1]790!
791!-- Array bounds for the pressure solver (in the parallel code, these bounds
792!-- are the ones for the transposed arrays)
[1003]793    nys_x = nys
794    nyn_x = nyn
795    nzb_x = nzb + 1
796    nzt_x = nzt
[1]797
[1003]798    nxl_y = nxl
799    nxr_y = nxr
800    nzb_y = nzb + 1
801    nzt_y = nzt
[1]802
[1003]803    nxl_z = nxl
804    nxr_z = nxr
805    nys_z = nys
806    nyn_z = nyn
[1]807
808#endif
809
810!
811!-- Calculate number of grid levels necessary for the multigrid poisson solver
812!-- as well as the gridpoint indices on each level
[1575]813    IF ( psolver(1:9) == 'multigrid' )  THEN
[1]814
815!
816!--    First calculate number of possible grid levels for the subdomains
817       mg_levels_x = 1
818       mg_levels_y = 1
819       mg_levels_z = 1
820
821       i = nnx
822       DO WHILE ( MOD( i, 2 ) == 0  .AND.  i /= 2 )
823          i = i / 2
824          mg_levels_x = mg_levels_x + 1
825       ENDDO
826
827       j = nny
828       DO WHILE ( MOD( j, 2 ) == 0  .AND.  j /= 2 )
829          j = j / 2
830          mg_levels_y = mg_levels_y + 1
831       ENDDO
832
[181]833       k = nz    ! do not use nnz because it might be > nz due to transposition
834                 ! requirements
[1]835       DO WHILE ( MOD( k, 2 ) == 0  .AND.  k /= 2 )
836          k = k / 2
837          mg_levels_z = mg_levels_z + 1
838       ENDDO
839
840       maximum_grid_level = MIN( mg_levels_x, mg_levels_y, mg_levels_z )
841
842!
843!--    Find out, if the total domain allows more levels. These additional
[709]844!--    levels are identically processed on all PEs.
[197]845       IF ( numprocs > 1  .AND.  mg_switch_to_pe0_level /= -1 )  THEN
[709]846
[1]847          IF ( mg_levels_z > MIN( mg_levels_x, mg_levels_y ) )  THEN
[709]848
[1]849             mg_switch_to_pe0_level_l = maximum_grid_level
850
851             mg_levels_x = 1
852             mg_levels_y = 1
853
854             i = nx+1
855             DO WHILE ( MOD( i, 2 ) == 0  .AND.  i /= 2 )
856                i = i / 2
857                mg_levels_x = mg_levels_x + 1
858             ENDDO
859
860             j = ny+1
861             DO WHILE ( MOD( j, 2 ) == 0  .AND.  j /= 2 )
862                j = j / 2
863                mg_levels_y = mg_levels_y + 1
864             ENDDO
865
866             maximum_grid_level_l = MIN( mg_levels_x, mg_levels_y, mg_levels_z )
867
868             IF ( maximum_grid_level_l > mg_switch_to_pe0_level_l )  THEN
869                mg_switch_to_pe0_level_l = maximum_grid_level_l - &
870                                           mg_switch_to_pe0_level_l + 1
871             ELSE
872                mg_switch_to_pe0_level_l = 0
873             ENDIF
[709]874
[1]875          ELSE
876             mg_switch_to_pe0_level_l = 0
877             maximum_grid_level_l = maximum_grid_level
[709]878
[1]879          ENDIF
880
881!
882!--       Use switch level calculated above only if it is not pre-defined
883!--       by user
884          IF ( mg_switch_to_pe0_level == 0 )  THEN
885             IF ( mg_switch_to_pe0_level_l /= 0 )  THEN
886                mg_switch_to_pe0_level = mg_switch_to_pe0_level_l
887                maximum_grid_level     = maximum_grid_level_l
888             ENDIF
889
890          ELSE
891!
892!--          Check pre-defined value and reset to default, if neccessary
893             IF ( mg_switch_to_pe0_level < mg_switch_to_pe0_level_l  .OR.  &
894                  mg_switch_to_pe0_level >= maximum_grid_level_l )  THEN
[254]895                message_string = 'mg_switch_to_pe0_level ' // &
896                                 'out of range and reset to default (=0)'
897                CALL message( 'init_pegrid', 'PA0235', 0, 1, 0, 6, 0 )
[1]898                mg_switch_to_pe0_level = 0
899             ELSE
900!
901!--             Use the largest number of possible levels anyway and recalculate
902!--             the switch level to this largest number of possible values
903                maximum_grid_level = maximum_grid_level_l
904
905             ENDIF
[709]906
[1]907          ENDIF
908
909       ENDIF
910
[1056]911       ALLOCATE( grid_level_count(maximum_grid_level),                       &
912                 nxl_mg(0:maximum_grid_level), nxr_mg(0:maximum_grid_level), &
913                 nyn_mg(0:maximum_grid_level), nys_mg(0:maximum_grid_level), &
914                 nzt_mg(0:maximum_grid_level) )
[1]915
916       grid_level_count = 0
[1056]917!
918!--    Index zero required as dummy due to definition of arrays f2 and p2 in
919!--    recursive subroutine next_mg_level
920       nxl_mg(0) = 0; nxr_mg(0) = 0; nyn_mg(0) = 0; nys_mg(0) = 0; nzt_mg(0) = 0
[778]921
[1]922       nxl_l = nxl; nxr_l = nxr; nys_l = nys; nyn_l = nyn; nzt_l = nzt
923
924       DO  i = maximum_grid_level, 1 , -1
925
926          IF ( i == mg_switch_to_pe0_level )  THEN
[1804]927#if defined( __parallel )
[1]928!
929!--          Save the grid size of the subdomain at the switch level, because
930!--          it is needed in poismg.
931             ind(1) = nxl_l; ind(2) = nxr_l
932             ind(3) = nys_l; ind(4) = nyn_l
933             ind(5) = nzt_l
934             ALLOCATE( ind_all(5*numprocs), mg_loc_ind(5,0:numprocs-1) )
935             CALL MPI_ALLGATHER( ind, 5, MPI_INTEGER, ind_all, 5, &
936                                 MPI_INTEGER, comm2d, ierr )
937             DO  j = 0, numprocs-1
938                DO  k = 1, 5
939                   mg_loc_ind(k,j) = ind_all(k+j*5)
940                ENDDO
941             ENDDO
942             DEALLOCATE( ind_all )
943!
[709]944!--          Calculate the grid size of the total domain
[1]945             nxr_l = ( nxr_l-nxl_l+1 ) * pdims(1) - 1
946             nxl_l = 0
947             nyn_l = ( nyn_l-nys_l+1 ) * pdims(2) - 1
948             nys_l = 0
949!
950!--          The size of this gathered array must not be larger than the
951!--          array tend, which is used in the multigrid scheme as a temporary
[778]952!--          array. Therefore the subdomain size of an PE is calculated and
953!--          the size of the gathered grid. These values are used in 
954!--          routines pres and poismg
955             subdomain_size = ( nxr - nxl + 2 * nbgp + 1 ) * &
956                              ( nyn - nys + 2 * nbgp + 1 ) * ( nzt - nzb + 2 )
[1]957             gathered_size  = ( nxr_l - nxl_l + 3 ) * ( nyn_l - nys_l + 3 ) * &
958                              ( nzt_l - nzb + 2 )
959
[1804]960#else
[254]961             message_string = 'multigrid gather/scatter impossible ' // &
[1]962                          'in non parallel mode'
[254]963             CALL message( 'init_pegrid', 'PA0237', 1, 2, 0, 6, 0 )
[1]964#endif
965          ENDIF
966
967          nxl_mg(i) = nxl_l
968          nxr_mg(i) = nxr_l
969          nys_mg(i) = nys_l
970          nyn_mg(i) = nyn_l
971          nzt_mg(i) = nzt_l
972
973          nxl_l = nxl_l / 2 
974          nxr_l = nxr_l / 2
975          nys_l = nys_l / 2 
976          nyn_l = nyn_l / 2 
977          nzt_l = nzt_l / 2 
[778]978
[1]979       ENDDO
980
[780]981!
982!--    Temporary problem: Currently calculation of maxerror iin routine poismg crashes
983!--    if grid data are collected on PE0 already on the finest grid level.
984!--    To be solved later.
985       IF ( maximum_grid_level == mg_switch_to_pe0_level )  THEN
986          message_string = 'grid coarsening on subdomain level cannot be performed'
987          CALL message( 'poismg', 'PA0236', 1, 2, 0, 6, 0 )
988       ENDIF
989
[1]990    ELSE
991
[667]992       maximum_grid_level = 0
[1]993
994    ENDIF
995
[722]996!
997!-- Default level 0 tells exchange_horiz that all ghost planes have to be
998!-- exchanged. grid_level is adjusted in poismg, where only one ghost plane
999!-- is required.
1000    grid_level = 0
[1]1001
[1804]1002#if defined( __parallel )
[1]1003!
1004!-- Gridpoint number for the exchange of ghost points (y-line for 2D-arrays)
[667]1005    ngp_y  = nyn - nys + 1 + 2 * nbgp
[1]1006
1007!
[709]1008!-- Define new MPI derived datatypes for the exchange of ghost points in
1009!-- x- and y-direction for 2D-arrays (line)
1010    CALL MPI_TYPE_VECTOR( nxr-nxl+1+2*nbgp, nbgp, ngp_y, MPI_REAL, type_x, &
1011                          ierr )
[1]1012    CALL MPI_TYPE_COMMIT( type_x, ierr )
[709]1013    CALL MPI_TYPE_VECTOR( nxr-nxl+1+2*nbgp, nbgp, ngp_y, MPI_INTEGER, &
1014                          type_x_int, ierr )
[1]1015    CALL MPI_TYPE_COMMIT( type_x_int, ierr )
1016
[667]1017    CALL MPI_TYPE_VECTOR( nbgp, ngp_y, ngp_y, MPI_REAL, type_y, ierr )
1018    CALL MPI_TYPE_COMMIT( type_y, ierr )
1019    CALL MPI_TYPE_VECTOR( nbgp, ngp_y, ngp_y, MPI_INTEGER, type_y_int, ierr )
1020    CALL MPI_TYPE_COMMIT( type_y_int, ierr )
1021
1022
[1]1023!
1024!-- Calculate gridpoint numbers for the exchange of ghost points along x
1025!-- (yz-plane for 3D-arrays) and define MPI derived data type(s) for the
1026!-- exchange of ghost points in y-direction (xz-plane).
1027!-- Do these calculations for the model grid and (if necessary) also
1028!-- for the coarser grid levels used in the multigrid method
[1575]1029    ALLOCATE ( ngp_xz(0:maximum_grid_level), ngp_yz(0:maximum_grid_level),     &
1030               type_xz(0:maximum_grid_level), type_yz(0:maximum_grid_level) )
[1]1031
1032    nxl_l = nxl; nxr_l = nxr; nys_l = nys; nyn_l = nyn; nzb_l = nzb; nzt_l = nzt
[709]1033
[667]1034!
1035!-- Discern between the model grid, which needs nbgp ghost points and
1036!-- grid levels for the multigrid scheme. In the latter case only one
1037!-- ghost point is necessary.
[709]1038!-- First definition of MPI-datatypes for exchange of ghost layers on normal
[667]1039!-- grid. The following loop is needed for data exchange in poismg.f90.
1040!
1041!-- Determine number of grid points of yz-layer for exchange
1042    ngp_yz(0) = (nzt - nzb + 2) * (nyn - nys + 1 + 2 * nbgp)
[709]1043
[667]1044!
[709]1045!-- Define an MPI-datatype for the exchange of left/right boundaries.
1046!-- Although data are contiguous in physical memory (which does not
1047!-- necessarily require an MPI-derived datatype), the data exchange between
1048!-- left and right PE's using the MPI-derived type is 10% faster than without.
[667]1049    CALL MPI_TYPE_VECTOR( nxr-nxl+1+2*nbgp, nbgp*(nzt-nzb+2), ngp_yz(0), &
[709]1050                          MPI_REAL, type_xz(0), ierr )
[667]1051    CALL MPI_TYPE_COMMIT( type_xz(0), ierr )
[1]1052
[709]1053    CALL MPI_TYPE_VECTOR( nbgp, ngp_yz(0), ngp_yz(0), MPI_REAL, type_yz(0), &
1054                          ierr ) 
[667]1055    CALL MPI_TYPE_COMMIT( type_yz(0), ierr )
[709]1056
[667]1057!
[709]1058!-- Definition of MPI-datatypes for multigrid method (coarser level grids)
[1575]1059    IF ( psolver(1:9) == 'multigrid' )  THEN
[667]1060!   
[709]1061!--    Definition of MPI-datatyoe as above, but only 1 ghost level is used
1062       DO  i = maximum_grid_level, 1 , -1
1063
[1575]1064          ngp_xz(i) = (nzt_l - nzb_l + 2) * (nxr_l - nxl_l + 3)
[667]1065          ngp_yz(i) = (nzt_l - nzb_l + 2) * (nyn_l - nys_l + 3)
1066
1067          CALL MPI_TYPE_VECTOR( nxr_l-nxl_l+3, nzt_l-nzb_l+2, ngp_yz(i), &
[709]1068                                MPI_REAL, type_xz(i), ierr )
[667]1069          CALL MPI_TYPE_COMMIT( type_xz(i), ierr )
[1]1070
[709]1071          CALL MPI_TYPE_VECTOR( 1, ngp_yz(i), ngp_yz(i), MPI_REAL, type_yz(i), &
1072                                ierr )
[667]1073          CALL MPI_TYPE_COMMIT( type_yz(i), ierr )
1074
1075          nxl_l = nxl_l / 2
1076          nxr_l = nxr_l / 2
1077          nys_l = nys_l / 2
1078          nyn_l = nyn_l / 2
1079          nzt_l = nzt_l / 2
[709]1080
[667]1081       ENDDO
[709]1082
1083    ENDIF
[1677]1084!
1085!-- Define data types for exchange of 3D Integer arrays.
1086    ngp_yz_int = (nzt - nzb + 2) * (nyn - nys + 1 + 2 * nbgp)
1087
1088    CALL MPI_TYPE_VECTOR( nxr-nxl+1+2*nbgp, nbgp*(nzt-nzb+2), ngp_yz_int, &
1089                          MPI_INTEGER, type_xz_int, ierr )
1090    CALL MPI_TYPE_COMMIT( type_xz_int, ierr )
1091
1092    CALL MPI_TYPE_VECTOR( nbgp, ngp_yz_int, ngp_yz_int, MPI_INTEGER, type_yz_int, &
1093                          ierr )
1094    CALL MPI_TYPE_COMMIT( type_yz_int, ierr )
1095
[1]1096#endif
1097
[1804]1098#if defined( __parallel )
[1]1099!
[1933]1100!-- Setting of flags for inflow/outflow/nesting conditions.
1101    IF ( nesting_mode == 'vertical' .AND. nest_domain )  THEN
1102       IF ( nxl == 0 )  THEN
[1762]1103          nest_bound_l = .TRUE.
[1]1104       ENDIF
[1933]1105    ELSE
1106       IF ( pleft == MPI_PROC_NULL )  THEN
1107          IF ( bc_lr == 'dirichlet/radiation' )  THEN
1108             inflow_l  = .TRUE.
1109          ELSEIF ( bc_lr == 'radiation/dirichlet' )  THEN
1110             outflow_l = .TRUE.
1111          ELSEIF ( bc_lr == 'nested' )  THEN
1112             nest_bound_l = .TRUE.
1113          ENDIF
1114       ENDIF
[1]1115    ENDIF
[1933]1116 
1117    IF ( nesting_mode == 'vertical' .AND. nest_domain )  THEN
1118       IF ( nxr == nx )  THEN
[1762]1119          nest_bound_r = .TRUE.
[1]1120       ENDIF
[1933]1121    ELSE
1122       IF ( pright == MPI_PROC_NULL )  THEN
1123          IF ( bc_lr == 'dirichlet/radiation' )  THEN
1124             outflow_r = .TRUE.
1125          ELSEIF ( bc_lr == 'radiation/dirichlet' )  THEN
1126             inflow_r  = .TRUE.
1127          ELSEIF ( bc_lr == 'nested' )  THEN
1128             nest_bound_r = .TRUE.
1129          ENDIF
1130       ENDIF
[1]1131    ENDIF
1132
[1933]1133    IF ( nesting_mode == 'vertical' .AND. nest_domain )  THEN
1134       IF ( nys == 0 )  THEN
[1762]1135          nest_bound_s = .TRUE.
[1]1136       ENDIF
[1933]1137    ELSE
1138       IF ( psouth == MPI_PROC_NULL )  THEN
1139          IF ( bc_ns == 'dirichlet/radiation' )  THEN
1140             outflow_s = .TRUE.
1141          ELSEIF ( bc_ns == 'radiation/dirichlet' )  THEN
1142             inflow_s  = .TRUE.
1143          ELSEIF ( bc_ns == 'nested' )  THEN
1144             nest_bound_s = .TRUE.
1145          ENDIF
1146       ENDIF
[1]1147    ENDIF
1148
[1933]1149    IF ( nesting_mode == 'vertical' .AND. nest_domain )  THEN
1150       IF ( nyn == ny )  THEN
[1762]1151          nest_bound_n = .TRUE.
[1]1152       ENDIF
[1933]1153    ELSE
1154       IF ( pnorth == MPI_PROC_NULL )  THEN
1155          IF ( bc_ns == 'dirichlet/radiation' )  THEN
1156             inflow_n  = .TRUE.
1157          ELSEIF ( bc_ns == 'radiation/dirichlet' )  THEN
1158             outflow_n = .TRUE.
1159          ELSEIF ( bc_ns == 'nested' )  THEN
1160             nest_bound_n = .TRUE.
1161          ENDIF
1162       ENDIF
[1]1163    ENDIF
[1933]1164       
[151]1165!
1166!-- Broadcast the id of the inflow PE
1167    IF ( inflow_l )  THEN
[163]1168       id_inflow_l = myidx
[151]1169    ELSE
1170       id_inflow_l = 0
1171    ENDIF
[622]1172    IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
[151]1173    CALL MPI_ALLREDUCE( id_inflow_l, id_inflow, 1, MPI_INTEGER, MPI_SUM, &
1174                        comm1dx, ierr )
1175
[163]1176!
1177!-- Broadcast the id of the recycling plane
1178!-- WARNING: needs to be adjusted in case of inflows other than from left side!
[1139]1179    IF ( NINT( recycling_width / dx ) >= nxl  .AND. &
1180         NINT( recycling_width / dx ) <= nxr )  THEN
[163]1181       id_recycling_l = myidx
1182    ELSE
1183       id_recycling_l = 0
1184    ENDIF
[622]1185    IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
[163]1186    CALL MPI_ALLREDUCE( id_recycling_l, id_recycling, 1, MPI_INTEGER, MPI_SUM, &
1187                        comm1dx, ierr )
1188
[1402]1189    CALL location_message( 'finished', .TRUE. )
[1384]1190
[1804]1191#else
[1159]1192    IF ( bc_lr == 'dirichlet/radiation' )  THEN
[1]1193       inflow_l  = .TRUE.
1194       outflow_r = .TRUE.
[1159]1195    ELSEIF ( bc_lr == 'radiation/dirichlet' )  THEN
[1]1196       outflow_l = .TRUE.
1197       inflow_r  = .TRUE.
1198    ENDIF
1199
[1159]1200    IF ( bc_ns == 'dirichlet/radiation' )  THEN
[1]1201       inflow_n  = .TRUE.
1202       outflow_s = .TRUE.
[1159]1203    ELSEIF ( bc_ns == 'radiation/dirichlet' )  THEN
[1]1204       outflow_n = .TRUE.
1205       inflow_s  = .TRUE.
1206    ENDIF
1207#endif
[807]1208
[106]1209!
[978]1210!-- At the inflow or outflow, u or v, respectively, have to be calculated for
1211!-- one more grid point.
[1762]1212    IF ( inflow_l .OR. outflow_l .OR. nest_bound_l )  THEN
[106]1213       nxlu = nxl + 1
1214    ELSE
1215       nxlu = nxl
1216    ENDIF
[1762]1217    IF ( inflow_s .OR. outflow_s .OR. nest_bound_s )  THEN
[106]1218       nysv = nys + 1
1219    ELSE
1220       nysv = nys
1221    ENDIF
[1]1222
[114]1223!
1224!-- Allocate wall flag arrays used in the multigrid solver
[1575]1225    IF ( psolver(1:9) == 'multigrid' )  THEN
[114]1226
1227       DO  i = maximum_grid_level, 1, -1
1228
1229           SELECT CASE ( i )
1230
1231              CASE ( 1 )
1232                 ALLOCATE( wall_flags_1(nzb:nzt_mg(i)+1,         &
1233                                        nys_mg(i)-1:nyn_mg(i)+1, &
1234                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1235
1236              CASE ( 2 )
1237                 ALLOCATE( wall_flags_2(nzb:nzt_mg(i)+1,         &
1238                                        nys_mg(i)-1:nyn_mg(i)+1, &
1239                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1240
1241              CASE ( 3 )
1242                 ALLOCATE( wall_flags_3(nzb:nzt_mg(i)+1,         &
1243                                        nys_mg(i)-1:nyn_mg(i)+1, &
1244                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1245
1246              CASE ( 4 )
1247                 ALLOCATE( wall_flags_4(nzb:nzt_mg(i)+1,         &
1248                                        nys_mg(i)-1:nyn_mg(i)+1, &
1249                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1250
1251              CASE ( 5 )
1252                 ALLOCATE( wall_flags_5(nzb:nzt_mg(i)+1,         &
1253                                        nys_mg(i)-1:nyn_mg(i)+1, &
1254                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1255
1256              CASE ( 6 )
1257                 ALLOCATE( wall_flags_6(nzb:nzt_mg(i)+1,         &
1258                                        nys_mg(i)-1:nyn_mg(i)+1, &
1259                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1260
1261              CASE ( 7 )
1262                 ALLOCATE( wall_flags_7(nzb:nzt_mg(i)+1,         &
1263                                        nys_mg(i)-1:nyn_mg(i)+1, &
1264                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1265
1266              CASE ( 8 )
1267                 ALLOCATE( wall_flags_8(nzb:nzt_mg(i)+1,         &
1268                                        nys_mg(i)-1:nyn_mg(i)+1, &
1269                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1270
1271              CASE ( 9 )
1272                 ALLOCATE( wall_flags_9(nzb:nzt_mg(i)+1,         &
1273                                        nys_mg(i)-1:nyn_mg(i)+1, &
1274                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1275
1276              CASE ( 10 )
1277                 ALLOCATE( wall_flags_10(nzb:nzt_mg(i)+1,        &
1278                                        nys_mg(i)-1:nyn_mg(i)+1, &
1279                                        nxl_mg(i)-1:nxr_mg(i)+1) )
1280
1281              CASE DEFAULT
[254]1282                 message_string = 'more than 10 multigrid levels'
1283                 CALL message( 'init_pegrid', 'PA0238', 1, 2, 0, 6, 0 )
[114]1284
1285          END SELECT
1286
1287       ENDDO
1288
1289    ENDIF
1290
[759]1291!
1292!-- Calculate the number of groups into which parallel I/O is split.
1293!-- The default for files which are opened by all PEs (or where each
1294!-- PE opens his own independent file) is, that all PEs are doing input/output
1295!-- in parallel at the same time. This might cause performance or even more
1296!-- severe problems depending on the configuration of the underlying file
1297!-- system.
1298!-- First, set the default:
1299    IF ( maximum_parallel_io_streams == -1  .OR. &
1300         maximum_parallel_io_streams > numprocs )  THEN
1301       maximum_parallel_io_streams = numprocs
1302    ENDIF
1303
1304!
1305!-- Now calculate the number of io_blocks and the io_group to which the
1306!-- respective PE belongs. I/O of the groups is done in serial, but in parallel
1307!-- for all PEs belonging to the same group. A preliminary setting with myid
1308!-- based on MPI_COMM_WORLD has been done in parin.
1309    io_blocks = numprocs / maximum_parallel_io_streams
1310    io_group  = MOD( myid+1, io_blocks )
1311   
1312
[1]1313 END SUBROUTINE init_pegrid
Note: See TracBrowser for help on using the repository browser.