source: palm/trunk/SOURCE/poismg.f90 @ 1433

Last change on this file since 1433 was 1354, checked in by heinze, 11 years ago

last commit documented

  • Property svn:keywords set to Id
File size: 64.7 KB
RevLine 
[1]1 SUBROUTINE poismg( r )
2
[1036]3!--------------------------------------------------------------------------------!
4! This file is part of PALM.
5!
6! PALM is free software: you can redistribute it and/or modify it under the terms
7! of the GNU General Public License as published by the Free Software Foundation,
8! either version 3 of the License, or (at your option) any later version.
9!
10! PALM is distributed in the hope that it will be useful, but WITHOUT ANY
11! WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR
12! A PARTICULAR PURPOSE.  See the GNU General Public License for more details.
13!
14! You should have received a copy of the GNU General Public License along with
15! PALM. If not, see <http://www.gnu.org/licenses/>.
16!
[1310]17! Copyright 1997-2014 Leibniz Universitaet Hannover
[1036]18!--------------------------------------------------------------------------------!
19!
[1]20! Attention: Loop unrolling and cache optimization in SOR-Red/Black method
[707]21!            still does not give the expected speedup! Further work required.
[1]22!
[257]23! Current revisions:
[1]24! -----------------
[1354]25!
26!
[1321]27! Former revisions:
28! -----------------
29! $Id: poismg.f90 1354 2014-04-08 15:22:57Z keck $
30!
[1354]31! 1353 2014-04-08 15:21:23Z heinze
32! REAL constants provided with KIND-attribute
33!
[1323]34! 1322 2014-03-20 16:38:49Z raasch
35! REAL constants defined as wp-kind
36!
[1321]37! 1320 2014-03-20 08:40:49Z raasch
[1320]38! ONLY-attribute added to USE-statements,
39! kind-parameters added to all INTEGER and REAL declaration statements,
40! kinds are defined in new module kinds,
41! old module precision_kind is removed,
42! revision history before 2012 removed,
43! comment fields (!:) to be used for variable explanations added to
44! all variable declaration statements
[708]45!
[1319]46! 1318 2014-03-17 13:35:16Z raasch
47! module interfaces removed
48!
[1160]49! 1159 2013-05-21 11:58:22Z fricke
50! bc_lr/ns_dirneu/neudir removed
51!
[1093]52! 1092 2013-02-02 11:24:22Z raasch
53! unused variables removed
54!
[1057]55! 1056 2012-11-16 15:28:04Z raasch
56! Bugfix: all ghost points have to be used for allocating p3
57! arrays p2, f2, and f2_l changed from allocatable to automatic
58!
[1037]59! 1036 2012-10-22 13:43:42Z raasch
60! code put under GPL (PALM 3.9)
61!
[997]62! 996 2012-09-07 10:41:47Z raasch
63! little reformatting
64!
[979]65! 978 2012-08-09 08:28:32Z fricke
66! bc_lr/ns_dirneu/neudir added
67!
[881]68! 880 2012-04-13 06:28:59Z raasch
69! Bugfix: preprocessor statements for parallel execution added
70!
[779]71! 778 2011-11-07 14:18:25Z fricke
72! Allocation of p3 changes when multigrid is used and the collected field on PE0
73! has more grid points than the subdomain of an PE.
74!
[708]75! 707 2011-03-29 11:39:40Z raasch
[707]76! p_loc is used instead of p in the main routine (poismg).
77! On coarse grid levels, gathered data are identically processed on all PEs
78! (before, on PE0 only), so that the subsequent scattering of data is not
79! neccessary any more.
80! bc_lr/ns replaced by bc_lr/ns_cyc/dirrad/raddir
81! Bugfix: bottom (nzb) and top (nzt+1) boundary conditions set in routines
82! resid and restrict. They were missed before which may have led to
83! unpredictable results.
[1]84!
[668]85! 667 2010-12-23 12:06:00Z suehring/gryschka
86! Calls of exchange_horiz are modified.
87!
[623]88! 622 2010-12-10 08:08:13Z raasch
89! optional barriers included in order to speed up collective operations
90!
[392]91! 257 2009-03-11 15:17:42Z heinze
92! Output of messages replaced by message handling routine.
93!
[198]94! 181 2008-07-30 07:07:47Z raasch
95! Bugfix: grid_level+1 has to be used in restrict for flags-array
96!
[139]97! 114 2007-10-10 00:03:15Z raasch
98! Boundary conditions at walls are implicitly set using flag arrays. Only
99! Neumann BC is allowed. Upper walls are still not realized.
100! Bottom and top BCs for array f_mg in restrict removed because boundary
101! values are not needed (right hand side of SOR iteration).
102!
[77]103! 75 2007-03-22 09:54:05Z raasch
104! 2nd+3rd argument removed from exchange horiz
105!
[3]106! RCS Log replace by Id keyword, revision history cleaned up
107!
[1]108! Revision 1.6  2005/03/26 20:55:54  raasch
109! Implementation of non-cyclic (Neumann) horizontal boundary conditions,
110! routine prolong simplified (one call of exchange_horiz spared)
111!
112! Revision 1.1  2001/07/20 13:10:51  raasch
113! Initial revision
114!
115!
116! Description:
117! ------------
118! Solves the Poisson equation for the perturbation pressure with a multigrid
119! V- or W-Cycle scheme.
120!
121! This multigrid method was originally developed for PALM by Joerg Uhlenbrock,
122! September 2000 - July 2001.
123!------------------------------------------------------------------------------!
124
[1320]125    USE arrays_3d,                                                             &
126        ONLY:  d, p_loc
127
128    USE control_parameters,                                                    &
129        ONLY:  gathered_size, grid_level, grid_level_count,                    &
130               maximum_grid_level, message_string, mgcycles, mg_cycles,        &
131               mg_switch_to_pe0_level, residual_limit, subdomain_size
132
133    USE cpulog,                                                                &
134        ONLY:  cpu_log, log_point_s
135
136    USE indices,                                                               &
137        ONLY:  nxl, nxlg, nxl_mg, nxr, nxrg, nxr_mg, nys, nysg, nys_mg, nyn,   &
138               nyng, nyn_mg, nzb, nzt, nzt_mg
139
140    USE kinds
141
[1]142    USE pegrid
143
144    IMPLICIT NONE
145
[1320]146    REAL(wp) ::  maxerror          !:
147    REAL(wp) ::  maximum_mgcycles  !:
148    REAL(wp) ::  residual_norm     !:
[1]149
[1320]150    REAL(wp), DIMENSION(nzb:nzt+1,nys-1:nyn+1,nxl-1:nxr+1) ::  r  !:
[1]151
[1320]152    REAL(wp), DIMENSION(:,:,:), ALLOCATABLE ::  p3  !:
[1]153
154
155    CALL cpu_log( log_point_s(29), 'poismg', 'start' )
156!
157!-- Initialize arrays and variables used in this subroutine
158
[879]159!-- If the number of grid points of the gathered grid, which is collected
160!-- on PE0, is larger than the number of grid points of an PE, than array
161!-- p3 will be enlarged.
[778]162    IF ( gathered_size > subdomain_size )  THEN
[879]163       ALLOCATE( p3(nzb:nzt_mg(mg_switch_to_pe0_level)+1,nys_mg(               &
164                    mg_switch_to_pe0_level)-1:nyn_mg(mg_switch_to_pe0_level)+1,&
165                    nxl_mg(mg_switch_to_pe0_level)-1:nxr_mg(                   &
[778]166                    mg_switch_to_pe0_level)+1) )
167    ELSE
[1056]168       ALLOCATE ( p3(nzb:nzt+1,nysg:nyng,nxlg:nxrg) )
[778]169    ENDIF
[1056]170
[1353]171    p3 = 0.0_wp
[879]172 
[1]173!
[707]174!-- Ghost boundaries have to be added to divergence array.
175!-- Exchange routine needs to know the grid level!
176    grid_level = maximum_grid_level
[667]177    CALL exchange_horiz( d, 1)
[1]178    d(nzb,:,:) = d(nzb+1,:,:)
179
180!
181!-- Initiation of the multigrid scheme. Does n cycles until the
182!-- residual is smaller than the given limit. The accuracy of the solution
183!-- of the poisson equation will increase with the number of cycles.
184!-- If the number of cycles is preset by the user, this number will be
185!-- carried out regardless of the accuracy.
[707]186    grid_level_count =  0
187    mgcycles         =  0
[1]188    IF ( mg_cycles == -1 )  THEN
189       maximum_mgcycles = 0
[1353]190       residual_norm    = 1.0_wp
[1]191    ELSE
192       maximum_mgcycles = mg_cycles
[1353]193       residual_norm    = 0.0_wp
[1]194    ENDIF
195
196    DO WHILE ( residual_norm > residual_limit  .OR. &
197               mgcycles < maximum_mgcycles )
[778]198 
199       CALL next_mg_level( d, p_loc, p3, r)
[1]200
201!
202!--    Calculate the residual if the user has not preset the number of
203!--    cycles to be performed
204       IF ( maximum_mgcycles == 0 )  THEN
[707]205          CALL resid( d, p_loc, r )
[1]206          maxerror = SUM( r(nzb+1:nzt,nys:nyn,nxl:nxr)**2 )
[778]207
[1]208#if defined( __parallel )
[622]209          IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
[778]210             CALL MPI_ALLREDUCE( maxerror, residual_norm, 1, MPI_REAL, MPI_SUM, &
[1]211                              comm2d, ierr)
212#else
[778]213             residual_norm = maxerror
[1]214#endif
215          residual_norm = SQRT( residual_norm )
216       ENDIF
217
218       mgcycles = mgcycles + 1
219
220!
221!--    If the user has not limited the number of cycles, stop the run in case
222!--    of insufficient convergence
223       IF ( mgcycles > 1000  .AND.  mg_cycles == -1 )  THEN
[257]224          message_string = 'no sufficient convergence within 1000 cycles'
225          CALL message( 'poismg', 'PA0283', 1, 2, 0, 6, 0 )
[1]226       ENDIF
227
228    ENDDO
229
230    DEALLOCATE( p3 )
231
[707]232!
233!-- Unset the grid level. Variable is used to determine the MPI datatypes for
234!-- ghost point exchange
235    grid_level = 0 
236
[1]237    CALL cpu_log( log_point_s(29), 'poismg', 'stop' )
238
239 END SUBROUTINE poismg
240
241
242
243 SUBROUTINE resid( f_mg, p_mg, r )
244
245!------------------------------------------------------------------------------!
246! Description:
247! ------------
248! Computes the residual of the perturbation pressure.
249!------------------------------------------------------------------------------!
250
[1320]251    USE arrays_3d,                                                             &
252        ONLY:  f1_mg, f2_mg, f3_mg
[1]253
[1320]254    USE control_parameters,                                                    &
255        ONLY:  bc_lr_cyc, bc_ns_cyc, grid_level, ibc_p_b, ibc_p_t, inflow_l,   &
256               inflow_n, inflow_r, inflow_s, outflow_l, outflow_n, outflow_r,  &
257               outflow_s
258
259    USE grid_variables,                                                        &
260        ONLY:  ddx2_mg, ddy2_mg
261
262    USE indices,                                                               &
263        ONLY:  flags, wall_flags_1, wall_flags_2, wall_flags_3, wall_flags_4,  &
264               wall_flags_5, wall_flags_6, wall_flags_7, wall_flags_8,         &
265               wall_flags_9, wall_flags_10, nxl_mg, nxr_mg, nys_mg, nyn_mg,    &
266               nzb, nzt_mg
267
268    USE kinds
269
[1]270    IMPLICIT NONE
271
[1320]272    INTEGER(iwp) ::  i
273    INTEGER(iwp) ::  j
274    INTEGER(iwp) ::  k
275    INTEGER(iwp) ::  l
[1]276
[1320]277    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
[1]278                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
[1320]279                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg  !:
280    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
281                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
282                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  p_mg  !:
283    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
284                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
285                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  r     !:
[1]286
287!
288!-- Calculate the residual
289    l = grid_level
290
[114]291!
292!-- Choose flag array of this level
293    SELECT CASE ( l )
294       CASE ( 1 )
295          flags => wall_flags_1
296       CASE ( 2 )
297          flags => wall_flags_2
298       CASE ( 3 )
299          flags => wall_flags_3
300       CASE ( 4 )
301          flags => wall_flags_4
302       CASE ( 5 )
303          flags => wall_flags_5
304       CASE ( 6 )
305          flags => wall_flags_6
306       CASE ( 7 )
307          flags => wall_flags_7
308       CASE ( 8 )
309          flags => wall_flags_8
310       CASE ( 9 )
311          flags => wall_flags_9
312       CASE ( 10 )
313          flags => wall_flags_10
314    END SELECT
315
[1]316!$OMP PARALLEL PRIVATE (i,j,k)
317!$OMP DO
318    DO  i = nxl_mg(l), nxr_mg(l)
319       DO  j = nys_mg(l), nyn_mg(l) 
320          DO  k = nzb+1, nzt_mg(l)
[114]321             r(k,j,i) = f_mg(k,j,i)                                         &
322                        - ddx2_mg(l) *                                      &
323                            ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
324                                          ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
325                              p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
326                                          ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
327                        - ddy2_mg(l) *                                      &
328                            ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
329                                          ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
330                              p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
331                                          ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
332                        - f2_mg(k,l) * p_mg(k+1,j,i)                        &
333                        - f3_mg(k,l) *                                      &
334                            ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
335                                          ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
[1]336                        + f1_mg(k,l) * p_mg(k,j,i)
[114]337!
338!--          Residual within topography should be zero
[1353]339             r(k,j,i) = r(k,j,i) * ( 1.0_wp - IBITS( flags(k,j,i), 6, 1 ) )
[1]340          ENDDO
341       ENDDO
342    ENDDO
343!$OMP END PARALLEL
344
345!
346!-- Horizontal boundary conditions
[667]347    CALL exchange_horiz( r, 1)
[1]348
[707]349    IF ( .NOT. bc_lr_cyc )  THEN
[1]350       IF ( inflow_l .OR. outflow_l )  r(:,:,nxl_mg(l)-1) = r(:,:,nxl_mg(l))
351       IF ( inflow_r .OR. outflow_r )  r(:,:,nxr_mg(l)+1) = r(:,:,nxr_mg(l))
352    ENDIF
353
[707]354    IF ( .NOT. bc_ns_cyc )  THEN
[1]355       IF ( inflow_n .OR. outflow_n )  r(:,nyn_mg(l)+1,:) = r(:,nyn_mg(l),:)
356       IF ( inflow_s .OR. outflow_s )  r(:,nys_mg(l)-1,:) = r(:,nys_mg(l),:)
357    ENDIF
358
359!
[707]360!-- Boundary conditions at bottom and top of the domain.
361!-- These points are not handled by the above loop. Points may be within
362!-- buildings, but that doesn't matter.
363    IF ( ibc_p_b == 1 )  THEN
364       r(nzb,:,: ) = r(nzb+1,:,:)
365    ELSE
[1353]366       r(nzb,:,: ) = 0.0_wp
[707]367    ENDIF
368
[1]369    IF ( ibc_p_t == 1 )  THEN
370       r(nzt_mg(l)+1,:,: ) = r(nzt_mg(l),:,:)
371    ELSE
[1353]372       r(nzt_mg(l)+1,:,: ) = 0.0_wp
[1]373    ENDIF
374
375
376 END SUBROUTINE resid
377
378
379
380 SUBROUTINE restrict( f_mg, r )
381
382!------------------------------------------------------------------------------!
383! Description:
384! ------------
385! Interpolates the residual on the next coarser grid with "full weighting"
386! scheme
387!------------------------------------------------------------------------------!
388
[1320]389    USE control_parameters,                                                    &
390        ONLY:  bc_lr_cyc, bc_ns_cyc, grid_level, ibc_p_b, ibc_p_t, inflow_l,   &
391               inflow_n, inflow_r, inflow_s, outflow_l, outflow_n, outflow_r,  &
392               outflow_s
[1]393
[1320]394    USE indices,                                                               &
395        ONLY:  flags, wall_flags_1, wall_flags_2, wall_flags_3, wall_flags_4,  &
396               wall_flags_5, wall_flags_6, wall_flags_7, wall_flags_8,         &
397               wall_flags_9, wall_flags_10, nxl_mg, nxr_mg, nys_mg, nyn_mg,    &
398               nzb, nzt_mg
399
400    USE kinds
401
[1]402    IMPLICIT NONE
403
[1320]404    INTEGER(iwp) ::  i    !:
405    INTEGER(iwp) ::  ic   !:
406    INTEGER(iwp) ::  j    !:
407    INTEGER(iwp) ::  jc   !:
408    INTEGER(iwp) ::  k    !:
409    INTEGER(iwp) ::  kc   !:
410    INTEGER(iwp) ::  l    !:
[1]411
[1320]412    REAL(wp) ::  rkjim    !:
413    REAL(wp) ::  rkjip    !:
414    REAL(wp) ::  rkjmi    !:
415    REAL(wp) ::  rkjmim   !:
416    REAL(wp) ::  rkjmip   !:
417    REAL(wp) ::  rkjpi    !:
418    REAL(wp) ::  rkjpim   !:
419    REAL(wp) ::  rkjpip   !:
420    REAL(wp) ::  rkmji    !:
421    REAL(wp) ::  rkmjim   !:
422    REAL(wp) ::  rkmjip   !:
423    REAL(wp) ::  rkmjmi   !:
424    REAL(wp) ::  rkmjmim  !:
425    REAL(wp) ::  rkmjmip  !:
426    REAL(wp) ::  rkmjpi   !:
427    REAL(wp) ::  rkmjpim  !:
428    REAL(wp) ::  rkmjpip  !:
[114]429
[1320]430    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                            &
431                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,           &
432                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg  !:
[1]433
[1320]434    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level+1)+1,                          &
435                        nys_mg(grid_level+1)-1:nyn_mg(grid_level+1)+1,       &
436                        nxl_mg(grid_level+1)-1:nxr_mg(grid_level+1)+1) ::  r !:
[1]437
438!
439!-- Interpolate the residual
440    l = grid_level
441
[114]442!
443!-- Choose flag array of the upper level
[181]444    SELECT CASE ( l+1 )
[114]445       CASE ( 1 )
446          flags => wall_flags_1
447       CASE ( 2 )
448          flags => wall_flags_2
449       CASE ( 3 )
450          flags => wall_flags_3
451       CASE ( 4 )
452          flags => wall_flags_4
453       CASE ( 5 )
454          flags => wall_flags_5
455       CASE ( 6 )
456          flags => wall_flags_6
457       CASE ( 7 )
458          flags => wall_flags_7
459       CASE ( 8 )
460          flags => wall_flags_8
461       CASE ( 9 )
462          flags => wall_flags_9
463       CASE ( 10 )
464          flags => wall_flags_10
465    END SELECT
466   
[1]467!$OMP PARALLEL PRIVATE (i,j,k,ic,jc,kc)
468!$OMP DO
469    DO  ic = nxl_mg(l), nxr_mg(l)   
470       i = 2*ic 
471       DO  jc = nys_mg(l), nyn_mg(l) 
472          j = 2*jc
473          DO  kc = nzb+1, nzt_mg(l)
474             k = 2*kc-1
[114]475!
476!--          Use implicit Neumann BCs if the respective gridpoint is inside
477!--          the building
478             rkjim   = r(k,j,i-1)     + IBITS( flags(k,j,i-1), 6, 1 ) *     &
479                                        ( r(k,j,i) - r(k,j,i-1) )
480             rkjip   = r(k,j,i+1)     + IBITS( flags(k,j,i+1), 6, 1 ) *     &
481                                        ( r(k,j,i) - r(k,j,i+1) )
482             rkjpi   = r(k,j+1,i)     + IBITS( flags(k,j+1,i), 6, 1 ) *     &
483                                        ( r(k,j,i) - r(k,j+1,i) )
484             rkjmi   = r(k,j-1,i)     + IBITS( flags(k,j-1,i), 6, 1 ) *     &
485                                        ( r(k,j,i) - r(k,j-1,i) )
486             rkjmim  = r(k,j-1,i-1)   + IBITS( flags(k,j-1,i-1), 6, 1 ) *   &
487                                        ( r(k,j,i) - r(k,j-1,i-1) )
488             rkjpim  = r(k,j+1,i-1)   + IBITS( flags(k,j+1,i-1), 6, 1 ) *   &
489                                        ( r(k,j,i) - r(k,j+1,i-1) )
490             rkjmip  = r(k,j-1,i+1)   + IBITS( flags(k,j-1,i+1), 6, 1 ) *   &
491                                        ( r(k,j,i) - r(k,j-1,i+1) )
492             rkjpip  = r(k,j+1,i+1)   + IBITS( flags(k,j+1,i+1), 6, 1 ) *   &
493                                        ( r(k,j,i) - r(k,j+1,i+1) )
494             rkmji   = r(k-1,j,i)     + IBITS( flags(k-1,j,i), 6, 1 ) *     &
495                                        ( r(k,j,i) - r(k-1,j,i) )
496             rkmjim  = r(k-1,j,i-1)   + IBITS( flags(k-1,j,i-1), 6, 1 ) *   &
497                                        ( r(k,j,i) - r(k-1,j,i-1) )
498             rkmjip  = r(k-1,j,i+1)   + IBITS( flags(k-1,j,i+1), 6, 1 ) *   &
499                                        ( r(k,j,i) - r(k-1,j,i+1) )
500             rkmjpi  = r(k-1,j+1,i)   + IBITS( flags(k-1,j+1,i), 6, 1 ) *   &
501                                        ( r(k,j,i) - r(k-1,j+1,i) )
502             rkmjmi  = r(k-1,j-1,i)   + IBITS( flags(k-1,j-1,i), 6, 1 ) *   &
503                                        ( r(k,j,i) - r(k-1,j-1,i) )
504             rkmjmim = r(k-1,j-1,i-1) + IBITS( flags(k-1,j-1,i-1), 6, 1 ) * &
505                                        ( r(k,j,i) - r(k-1,j-1,i-1) )
506             rkmjpim = r(k-1,j+1,i-1) + IBITS( flags(k-1,j+1,i-1), 6, 1 ) * &
507                                        ( r(k,j,i) - r(k-1,j+1,i-1) )
508             rkmjmip = r(k-1,j-1,i+1) + IBITS( flags(k-1,j-1,i+1), 6, 1 ) * &
509                                        ( r(k,j,i) - r(k-1,j-1,i+1) )
510             rkmjpip = r(k-1,j+1,i+1) + IBITS( flags(k-1,j+1,i+1), 6, 1 ) * &
511                                        ( r(k,j,i) - r(k-1,j+1,i+1) )
512
[1353]513             f_mg(kc,jc,ic) = 1.0_wp / 64.0_wp * (                         &
514                              8.0_wp * r(k,j,i)                            &
515                            + 4.0_wp * ( rkjim   + rkjip   +               &
516                                         rkjpi   + rkjmi   )               &
517                            + 2.0_wp * ( rkjmim  + rkjpim  +               &
518                                         rkjmip  + rkjpip  )               &
519                            + 4.0_wp * rkmji                               &
520                            + 2.0_wp * ( rkmjim  + rkmjim  +               &
521                                         rkmjpi  + rkmjmi  )               &
522                            +          ( rkmjmim + rkmjpim +               &
523                                         rkmjmip + rkmjpip )               &
524                            + 4.0_wp * r(k+1,j,i)                          &
525                            + 2.0_wp * ( r(k+1,j,i-1)   + r(k+1,j,i+1)   + &
526                                         r(k+1,j+1,i)   + r(k+1,j-1,i)   ) &
527                            +          ( r(k+1,j-1,i-1) + r(k+1,j+1,i-1) + &
528                                         r(k+1,j-1,i+1) + r(k+1,j+1,i+1) ) &
529                                                 )
[114]530
[1353]531!             f_mg(kc,jc,ic) = 1.0_wp / 64.0_wp * (                         &
532!                              8.0_wp * r(k,j,i)                            &
533!                            + 4.0_wp * ( r(k,j,i-1)     + r(k,j,i+1)     + &
534!                                         r(k,j+1,i)     + r(k,j-1,i)     ) &
535!                            + 2.0_wp * ( r(k,j-1,i-1)   + r(k,j+1,i-1)   + &
536!                                         r(k,j-1,i+1)   + r(k,j+1,i+1)   ) &
537!                            + 4.0_wp * r(k-1,j,i)                          &
538!                            + 2.0_wp * ( r(k-1,j,i-1)   + r(k-1,j,i+1)   + &
539!                                         r(k-1,j+1,i)   + r(k-1,j-1,i)   ) &
540!                            +          ( r(k-1,j-1,i-1) + r(k-1,j+1,i-1) + &
541!                                         r(k-1,j-1,i+1) + r(k-1,j+1,i+1) ) &
542!                            + 4.0_wp * r(k+1,j,i)                          &
543!                            + 2.0_wp * ( r(k+1,j,i-1)   + r(k+1,j,i+1)   + &
544!                                         r(k+1,j+1,i)   + r(k+1,j-1,i)   ) &
545!                            +          ( r(k+1,j-1,i-1) + r(k+1,j+1,i-1) + &
546!                                         r(k+1,j-1,i+1) + r(k+1,j+1,i+1) ) &
547!                                                )
[1]548          ENDDO
549       ENDDO
550    ENDDO
551!$OMP END PARALLEL
552
553!
554!-- Horizontal boundary conditions
[667]555    CALL exchange_horiz( f_mg, 1)
[1]556
[707]557    IF ( .NOT. bc_lr_cyc )  THEN
[1]558       IF (inflow_l .OR. outflow_l)  f_mg(:,:,nxl_mg(l)-1) = f_mg(:,:,nxl_mg(l))
559       IF (inflow_r .OR. outflow_r)  f_mg(:,:,nxr_mg(l)+1) = f_mg(:,:,nxr_mg(l))
560    ENDIF
561
[707]562    IF ( .NOT. bc_ns_cyc )  THEN
[1]563       IF (inflow_n .OR. outflow_n)  f_mg(:,nyn_mg(l)+1,:) = f_mg(:,nyn_mg(l),:)
564       IF (inflow_s .OR. outflow_s)  f_mg(:,nys_mg(l)-1,:) = f_mg(:,nys_mg(l),:)
565    ENDIF
566
567!
[707]568!-- Boundary conditions at bottom and top of the domain.
569!-- These points are not handled by the above loop. Points may be within
570!-- buildings, but that doesn't matter.
571    IF ( ibc_p_b == 1 )  THEN
572       f_mg(nzb,:,: ) = f_mg(nzb+1,:,:)
573    ELSE
[1353]574       f_mg(nzb,:,: ) = 0.0_wp
[707]575    ENDIF
[1]576
[707]577    IF ( ibc_p_t == 1 )  THEN
578       f_mg(nzt_mg(l)+1,:,: ) = f_mg(nzt_mg(l),:,:)
579    ELSE
[1353]580       f_mg(nzt_mg(l)+1,:,: ) = 0.0_wp
[707]581    ENDIF
[1]582
[707]583
[1]584END SUBROUTINE restrict
585
586
587
588 SUBROUTINE prolong( p, temp )
589
590!------------------------------------------------------------------------------!
591! Description:
592! ------------
593! Interpolates the correction of the perturbation pressure
594! to the next finer grid.
595!------------------------------------------------------------------------------!
596
[1320]597    USE control_parameters,                                                    &
598        ONLY:  bc_lr_cyc, bc_ns_cyc, grid_level, ibc_p_b, ibc_p_t, inflow_l,   &
599               inflow_n, inflow_r, inflow_s, outflow_l, outflow_n, outflow_r,  &
600               outflow_s
[1]601
[1320]602    USE indices,                                                               &
603        ONLY:  nxl_mg, nxr_mg, nys_mg, nyn_mg, nzb, nzt_mg
604
605    USE kinds
606
[1]607    IMPLICIT NONE
608
[1320]609    INTEGER(iwp) ::  i  !:
610    INTEGER(iwp) ::  j  !:
611    INTEGER(iwp) ::  k  !:
612    INTEGER(iwp) ::  l  !:
[1]613
[1320]614    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level-1)+1,                           &
615                        nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,        &
616                        nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1 ) ::  p  !:
[1]617
[1320]618    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                           &
619                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,          &
620                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  temp  !:
[1]621
622
623!
624!-- First, store elements of the coarser grid on the next finer grid
625    l = grid_level
626
627!$OMP PARALLEL PRIVATE (i,j,k)
628!$OMP DO
629    DO  i = nxl_mg(l-1), nxr_mg(l-1)
630       DO  j = nys_mg(l-1), nyn_mg(l-1)
631!CDIR NODEP
632          DO  k = nzb+1, nzt_mg(l-1)
633!
634!--          Points of the coarse grid are directly stored on the next finer
635!--          grid
636             temp(2*k-1,2*j,2*i) = p(k,j,i) 
637!
638!--          Points between two coarse-grid points
[1353]639             temp(2*k-1,2*j,2*i+1) = 0.5_wp * ( p(k,j,i) + p(k,j,i+1) )
640             temp(2*k-1,2*j+1,2*i) = 0.5_wp * ( p(k,j,i) + p(k,j+1,i) )
641             temp(2*k,2*j,2*i)     = 0.5_wp * ( p(k,j,i) + p(k+1,j,i) )
[1]642!
643!--          Points in the center of the planes stretched by four points
644!--          of the coarse grid cube
[1353]645             temp(2*k-1,2*j+1,2*i+1) = 0.25_wp * ( p(k,j,i)   + p(k,j,i+1) + &
646                                                   p(k,j+1,i) + p(k,j+1,i+1) )
647             temp(2*k,2*j,2*i+1)     = 0.25_wp * ( p(k,j,i)   + p(k,j,i+1) + &
648                                                   p(k+1,j,i) + p(k+1,j,i+1) )
649             temp(2*k,2*j+1,2*i)     = 0.25_wp * ( p(k,j,i)   + p(k,j+1,i) + &
650                                                   p(k+1,j,i) + p(k+1,j+1,i) )
[1]651!
652!--          Points in the middle of coarse grid cube
[1353]653             temp(2*k,2*j+1,2*i+1) = 0.125_wp * ( p(k,j,i)     + p(k,j,i+1)   + &
654                                                  p(k,j+1,i)   + p(k,j+1,i+1) + &
655                                                  p(k+1,j,i)   + p(k+1,j,i+1) + &
656                                                  p(k+1,j+1,i) + p(k+1,j+1,i+1) )
[1]657          ENDDO
658       ENDDO
659    ENDDO
660!$OMP END PARALLEL
661                         
662!
663!-- Horizontal boundary conditions
[667]664    CALL exchange_horiz( temp, 1)
[1]665
[707]666    IF ( .NOT. bc_lr_cyc )  THEN
[1]667       IF (inflow_l .OR. outflow_l)  temp(:,:,nxl_mg(l)-1) = temp(:,:,nxl_mg(l))
668       IF (inflow_r .OR. outflow_r)  temp(:,:,nxr_mg(l)+1) = temp(:,:,nxr_mg(l))
669    ENDIF
670
[707]671    IF ( .NOT. bc_ns_cyc )  THEN
[1]672       IF (inflow_n .OR. outflow_n)  temp(:,nyn_mg(l)+1,:) = temp(:,nyn_mg(l),:)
673       IF (inflow_s .OR. outflow_s)  temp(:,nys_mg(l)-1,:) = temp(:,nys_mg(l),:)
674    ENDIF
675
676!
677!-- Bottom and top boundary conditions
678    IF ( ibc_p_b == 1 )  THEN
679       temp(nzb,:,: ) = temp(nzb+1,:,:)
680    ELSE
[1353]681       temp(nzb,:,: ) = 0.0_wp
[1]682    ENDIF
683
684    IF ( ibc_p_t == 1 )  THEN
685       temp(nzt_mg(l)+1,:,: ) = temp(nzt_mg(l),:,:)
686    ELSE
[1353]687       temp(nzt_mg(l)+1,:,: ) = 0.0_wp
[1]688    ENDIF
689
690 
691 END SUBROUTINE prolong
692
693
694 SUBROUTINE redblack( f_mg, p_mg )
695
696!------------------------------------------------------------------------------!
697! Description:
698! ------------
699! Relaxation method for the multigrid scheme. A Gauss-Seidel iteration with
700! 3D-Red-Black decomposition (GS-RB) is used.
701!------------------------------------------------------------------------------!
702
[1320]703    USE arrays_3d,                                                             &
704        ONLY:  f1_mg, f2_mg, f3_mg
[1]705
[1320]706    USE control_parameters,                                                    &
707        ONLY:  bc_lr_cyc, bc_ns_cyc, grid_level, ibc_p_b, ibc_p_t, inflow_l,   &
708               inflow_n, inflow_r, inflow_s, ngsrb, outflow_l, outflow_n,      &
709               outflow_r, outflow_s
710
711    USE cpulog,                                                                &
712        ONLY:  cpu_log, log_point_s
713
714    USE grid_variables,                                                        &
715        ONLY:  ddx2_mg, ddy2_mg
716
717    USE indices,                                                               &
718        ONLY:  flags, wall_flags_1, wall_flags_2, wall_flags_3, wall_flags_4,  &
719               wall_flags_5, wall_flags_6, wall_flags_7, wall_flags_8,         &
720               wall_flags_9, wall_flags_10, nxl_mg, nxr_mg, nys_mg, nyn_mg,    &
721               nzb, nzt_mg
722
723    USE kinds
724
[1]725    IMPLICIT NONE
726
[1320]727    INTEGER(iwp) :: color    !:
728    INTEGER(iwp) :: i        !:
729    INTEGER(iwp) :: ic       !:
730    INTEGER(iwp) :: j        !:
731    INTEGER(iwp) :: jc       !:
732    INTEGER(iwp) :: jj       !:
733    INTEGER(iwp) :: k        !:
734    INTEGER(iwp) :: l        !:
735    INTEGER(iwp) :: n        !:
[1]736
[1320]737    LOGICAL :: unroll        !:
[1]738
[1320]739    REAL(wp) ::  wall_left   !:
740    REAL(wp) ::  wall_north  !:
741    REAL(wp) ::  wall_right  !:
742    REAL(wp) ::  wall_south  !:
743    REAL(wp) ::  wall_total  !:
744    REAL(wp) ::  wall_top    !:
[114]745
[1320]746    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
747                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
748                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg  !:
749    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
750                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
751                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  p_mg  !:
[1]752
753    l = grid_level
754
[114]755!
756!-- Choose flag array of this level
757    SELECT CASE ( l )
758       CASE ( 1 )
759          flags => wall_flags_1
760       CASE ( 2 )
761          flags => wall_flags_2
762       CASE ( 3 )
763          flags => wall_flags_3
764       CASE ( 4 )
765          flags => wall_flags_4
766       CASE ( 5 )
767          flags => wall_flags_5
768       CASE ( 6 )
769          flags => wall_flags_6
770       CASE ( 7 )
771          flags => wall_flags_7
772       CASE ( 8 )
773          flags => wall_flags_8
774       CASE ( 9 )
775          flags => wall_flags_9
776       CASE ( 10 )
777          flags => wall_flags_10
778    END SELECT
779
[1]780    unroll = ( MOD( nyn_mg(l)-nys_mg(l)+1, 4 ) == 0  .AND. &
781               MOD( nxr_mg(l)-nxl_mg(l)+1, 2 ) == 0 )
782
783    DO  n = 1, ngsrb
784       
[1320]785       DO  color = 1, 2
[1]786
787          IF ( .NOT. unroll )  THEN
[778]788
[1]789             CALL cpu_log( log_point_s(36), 'redblack_no_unroll', 'start' )
790
791!
792!--          Without unrolling of loops, no cache optimization
793             DO  i = nxl_mg(l), nxr_mg(l), 2
[1320]794                DO  j = nys_mg(l) + 2 - color, nyn_mg(l), 2 
[1]795                   DO  k = nzb+1, nzt_mg(l), 2
[1353]796!                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]797!                                ddx2_mg(l) * ( p_mg(k,j,i+1) + p_mg(k,j,i-1) ) &
798!                              + ddy2_mg(l) * ( p_mg(k,j+1,i) + p_mg(k,j-1,i) ) &
799!                              + f2_mg(k,l) * p_mg(k+1,j,i)                     &
800!                              + f3_mg(k,l) * p_mg(k-1,j,i) - f_mg(k,j,i)       &
801!                                                       )
802
[1353]803                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]804                             ddx2_mg(l) *                                      &
805                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
806                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
807                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
808                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
809                           + ddy2_mg(l) *                                      &
810                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
811                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
812                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
813                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
814                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
815                           + f3_mg(k,l) *                                      &
816                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
817                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
818                           - f_mg(k,j,i)               )
[1]819                   ENDDO
820                ENDDO
821             ENDDO
822   
823             DO  i = nxl_mg(l)+1, nxr_mg(l), 2
[1320]824                DO  j = nys_mg(l) + (color-1), nyn_mg(l), 2
[1]825                   DO  k = nzb+1, nzt_mg(l), 2 
[1353]826                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]827                             ddx2_mg(l) *                                      &
828                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
829                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
830                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
831                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
832                           + ddy2_mg(l) *                                      &
833                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
834                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
835                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
836                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
837                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
838                           + f3_mg(k,l) *                                      &
839                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
840                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
841                           - f_mg(k,j,i)               )
[1]842                   ENDDO
843                ENDDO
844             ENDDO
845 
846             DO  i = nxl_mg(l), nxr_mg(l), 2
[1320]847                DO  j = nys_mg(l) + (color-1), nyn_mg(l), 2
[1]848                   DO  k = nzb+2, nzt_mg(l), 2
[1353]849                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]850                             ddx2_mg(l) *                                      &
851                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
852                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
853                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
854                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
855                           + ddy2_mg(l) *                                      &
856                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
857                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
858                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
859                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
860                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
861                           + f3_mg(k,l) *                                      &
862                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
863                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
864                           - f_mg(k,j,i)               )
[1]865                   ENDDO
866                ENDDO
867             ENDDO
868
869             DO  i = nxl_mg(l)+1, nxr_mg(l), 2
[1320]870                DO  j = nys_mg(l) + 2 - color, nyn_mg(l), 2
[1]871                   DO  k = nzb+2, nzt_mg(l), 2
[1353]872                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]873                             ddx2_mg(l) *                                      &
874                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
875                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
876                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
877                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
878                           + ddy2_mg(l) *                                      &
879                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
880                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
881                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
882                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
883                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
884                           + f3_mg(k,l) *                                      &
885                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
886                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
887                           - f_mg(k,j,i)               )
[1]888                   ENDDO
889                ENDDO
890             ENDDO
891             CALL cpu_log( log_point_s(36), 'redblack_no_unroll', 'stop' )
892
893          ELSE
894
895!
896!--          Loop unrolling along y, only one i loop for better cache use
897             CALL cpu_log( log_point_s(38), 'redblack_unroll', 'start' )
898             DO  ic = nxl_mg(l), nxr_mg(l), 2
899                DO  jc = nys_mg(l), nyn_mg(l), 4
900                   i  = ic
[1320]901                   jj = jc+2-color
[1]902                   DO  k = nzb+1, nzt_mg(l), 2
903                      j = jj
[1353]904                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]905                             ddx2_mg(l) *                                      &
906                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
907                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
908                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
909                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
910                           + ddy2_mg(l) *                                      &
911                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
912                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
913                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
914                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
915                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
916                           + f3_mg(k,l) *                                      &
917                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
918                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
919                           - f_mg(k,j,i)               )
[1]920                      j = jj+2
[1353]921                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]922                             ddx2_mg(l) *                                      &
923                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
924                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
925                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
926                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
927                           + ddy2_mg(l) *                                      &
928                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
929                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
930                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
931                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
932                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
933                           + f3_mg(k,l) *                                      &
934                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
935                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
936                           - f_mg(k,j,i)               )
[1]937                   ENDDO
938   
939                   i  = ic+1
[1320]940                   jj = jc+color-1
[1]941                   DO  k = nzb+1, nzt_mg(l), 2 
942                      j =jj
[1353]943                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]944                             ddx2_mg(l) *                                      &
945                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
946                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
947                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
948                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
949                           + ddy2_mg(l) *                                      &
950                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
951                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
952                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
953                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
954                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
955                           + f3_mg(k,l) *                                      &
956                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
957                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
958                           - f_mg(k,j,i)               )
[1]959                      j = jj+2
[1353]960                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]961                             ddx2_mg(l) *                                      &
962                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
963                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
964                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
965                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
966                           + ddy2_mg(l) *                                      &
967                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
968                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
969                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
970                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
971                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
972                           + f3_mg(k,l) *                                      &
973                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
974                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
975                           - f_mg(k,j,i)               )
[1]976                   ENDDO
977
978                   i  = ic
[1320]979                   jj = jc+color-1
[1]980                   DO  k = nzb+2, nzt_mg(l), 2
981                      j =jj
[1353]982                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]983                             ddx2_mg(l) *                                      &
984                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
985                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
986                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
987                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
988                           + ddy2_mg(l) *                                      &
989                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
990                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
991                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
992                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
993                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
994                           + f3_mg(k,l) *                                      &
995                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
996                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
997                           - f_mg(k,j,i)               )
[1]998                      j = jj+2
[1353]999                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]1000                             ddx2_mg(l) *                                      &
1001                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
1002                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
1003                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
1004                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
1005                           + ddy2_mg(l) *                                      &
1006                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
1007                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
1008                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
1009                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
1010                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
1011                           + f3_mg(k,l) *                                      &
1012                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
1013                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
1014                           - f_mg(k,j,i)               )
[1]1015                   ENDDO
1016
1017                   i  = ic+1
[1320]1018                   jj = jc+2-color
[1]1019                   DO  k = nzb+2, nzt_mg(l), 2
1020                      j =jj
[1353]1021                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]1022                             ddx2_mg(l) *                                      &
1023                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
1024                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
1025                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
1026                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
1027                           + ddy2_mg(l) *                                      &
1028                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
1029                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
1030                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
1031                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
1032                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
1033                           + f3_mg(k,l) *                                      &
1034                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
1035                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
1036                           - f_mg(k,j,i)               )
[1]1037                      j = jj+2
[1353]1038                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]1039                             ddx2_mg(l) *                                      &
1040                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
1041                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
1042                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
1043                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
1044                           + ddy2_mg(l) *                                      &
1045                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
1046                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
1047                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
1048                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
1049                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
1050                           + f3_mg(k,l) *                                      &
1051                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
1052                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
1053                           - f_mg(k,j,i)               )
[1]1054                   ENDDO
1055
1056                ENDDO
1057             ENDDO
1058             CALL cpu_log( log_point_s(38), 'redblack_unroll', 'stop' )
1059
1060          ENDIF
1061
1062!
1063!--       Horizontal boundary conditions
[667]1064          CALL exchange_horiz( p_mg, 1 )
[1]1065
[707]1066          IF ( .NOT. bc_lr_cyc )  THEN
[1]1067             IF ( inflow_l .OR. outflow_l )  THEN
1068                p_mg(:,:,nxl_mg(l)-1) = p_mg(:,:,nxl_mg(l))
1069             ENDIF
1070             IF ( inflow_r .OR. outflow_r )  THEN
1071                p_mg(:,:,nxr_mg(l)+1) = p_mg(:,:,nxr_mg(l))
1072             ENDIF
1073          ENDIF
1074
[707]1075          IF ( .NOT. bc_ns_cyc )  THEN
[1]1076             IF ( inflow_n .OR. outflow_n )  THEN
1077                p_mg(:,nyn_mg(l)+1,:) = p_mg(:,nyn_mg(l),:)
1078             ENDIF
1079             IF ( inflow_s .OR. outflow_s )  THEN
1080                p_mg(:,nys_mg(l)-1,:) = p_mg(:,nys_mg(l),:)
1081             ENDIF
1082          ENDIF
1083
1084!
1085!--       Bottom and top boundary conditions
1086          IF ( ibc_p_b == 1 )  THEN
1087             p_mg(nzb,:,: ) = p_mg(nzb+1,:,:)
1088          ELSE
[1353]1089             p_mg(nzb,:,: ) = 0.0_wp
[1]1090          ENDIF
1091
1092          IF ( ibc_p_t == 1 )  THEN
1093             p_mg(nzt_mg(l)+1,:,: ) = p_mg(nzt_mg(l),:,:)
1094          ELSE
[1353]1095             p_mg(nzt_mg(l)+1,:,: ) = 0.0_wp
[1]1096          ENDIF
1097
1098       ENDDO
1099
1100    ENDDO
1101
[114]1102!
1103!-- Set pressure within topography and at the topography surfaces
1104!$OMP PARALLEL PRIVATE (i,j,k,wall_left,wall_north,wall_right,wall_south,wall_top,wall_total)
1105!$OMP DO
1106    DO  i = nxl_mg(l), nxr_mg(l)
1107       DO  j = nys_mg(l), nyn_mg(l) 
1108          DO  k = nzb, nzt_mg(l)
1109!
1110!--          First, set pressure inside topography to zero
[1353]1111             p_mg(k,j,i) = p_mg(k,j,i) * ( 1.0_wp - IBITS( flags(k,j,i), 6, 1 ) )
[114]1112!
1113!--          Second, determine if the gridpoint inside topography is adjacent
1114!--          to a wall and set its value to a value given by the average of
1115!--          those values obtained from Neumann boundary condition
1116             wall_left  = IBITS( flags(k,j,i-1), 5, 1 )
1117             wall_right = IBITS( flags(k,j,i+1), 4, 1 )
1118             wall_south = IBITS( flags(k,j-1,i), 3, 1 )
1119             wall_north = IBITS( flags(k,j+1,i), 2, 1 )
1120             wall_top   = IBITS( flags(k+1,j,i), 0, 1 )
1121             wall_total = wall_left + wall_right + wall_south + wall_north + &
1122                          wall_top
[1]1123
[1353]1124             IF ( wall_total > 0.0_wp )  THEN
1125                p_mg(k,j,i) = 1.0_wp / wall_total *                 &
1126                                     ( wall_left  * p_mg(k,j,i-1) + &
1127                                       wall_right * p_mg(k,j,i+1) + &
1128                                       wall_south * p_mg(k,j-1,i) + &
1129                                       wall_north * p_mg(k,j+1,i) + &
1130                                       wall_top   * p_mg(k+1,j,i) )
[114]1131             ENDIF
1132          ENDDO
1133       ENDDO
1134    ENDDO
[1056]1135!$OMP END PARALLEL
[114]1136
1137!
1138!-- One more time horizontal boundary conditions
[667]1139    CALL exchange_horiz( p_mg, 1)
[114]1140
[778]1141
[1]1142 END SUBROUTINE redblack
1143
1144
1145
1146 SUBROUTINE mg_gather( f2, f2_sub )
1147
[1320]1148    USE control_parameters,                                                    &
1149        ONLY:  grid_level
1150
1151    USE cpulog,                                                                &
1152        ONLY:  cpu_log, log_point_s
1153
1154    USE indices,                                                               &
1155        ONLY:  mg_loc_ind, nxl_mg, nxr_mg, nys_mg, nyn_mg, nzb, nzt_mg
1156
1157    USE kinds
1158
[1]1159    USE pegrid
1160
1161    IMPLICIT NONE
1162
[1320]1163    INTEGER(iwp) ::  i       !:
1164    INTEGER(iwp) ::  il      !:
1165    INTEGER(iwp) ::  ir      !:
1166    INTEGER(iwp) ::  j       !:
1167    INTEGER(iwp) ::  jn      !:
1168    INTEGER(iwp) ::  js      !:
1169    INTEGER(iwp) ::  k       !:
1170    INTEGER(iwp) ::  nwords  !:
[1]1171
[1320]1172    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1173                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
1174                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f2    !:
1175    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1176                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
1177                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f2_l  !:
[1]1178
[1320]1179    REAL(wp), DIMENSION(nzb:mg_loc_ind(5,myid)+1,                              &
1180                        mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,             &
1181                        mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) ::  f2_sub  !:
[1]1182
1183
1184#if defined( __parallel )
1185    CALL cpu_log( log_point_s(34), 'mg_gather', 'start' )
1186
[1353]1187    f2_l = 0.0_wp
[1]1188
1189!
[707]1190!-- Store the local subdomain array on the total array
1191    js = mg_loc_ind(3,myid)
1192    IF ( south_border_pe )  js = js - 1
1193    jn = mg_loc_ind(4,myid)
1194    IF ( north_border_pe )  jn = jn + 1
1195    il = mg_loc_ind(1,myid)
1196    IF ( left_border_pe )   il = il - 1
1197    ir = mg_loc_ind(2,myid)
1198    IF ( right_border_pe )  ir = ir + 1
1199    DO  i = il, ir
1200       DO  j = js, jn
1201          DO  k = nzb, nzt_mg(grid_level)+1
1202             f2_l(k,j,i) = f2_sub(k,j,i)
1203          ENDDO
[1]1204       ENDDO
[707]1205    ENDDO
[1]1206
1207!
[707]1208!-- Find out the number of array elements of the total array
1209    nwords = SIZE( f2 )
[1]1210
[707]1211!
1212!-- Gather subdomain data from all PEs
1213    IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
1214    CALL MPI_ALLREDUCE( f2_l(nzb,nys_mg(grid_level)-1,nxl_mg(grid_level)-1), &
1215                        f2(nzb,nys_mg(grid_level)-1,nxl_mg(grid_level)-1),   &
1216                        nwords, MPI_REAL, MPI_SUM, comm2d, ierr )
1217
[1]1218    CALL cpu_log( log_point_s(34), 'mg_gather', 'stop' )
1219#endif
1220   
1221 END SUBROUTINE mg_gather
1222
1223
1224
1225 SUBROUTINE mg_scatter( p2, p2_sub )
1226!
1227!-- TODO: It may be possible to improve the speed of this routine by using
1228!-- non-blocking communication
1229
[1320]1230    USE control_parameters,                                                    &
1231        ONLY:  grid_level
1232
1233    USE cpulog,                                                                &
1234        ONLY:  cpu_log, log_point_s
1235
1236    USE indices,                                                               &
1237        ONLY:  mg_loc_ind, nxl_mg, nxr_mg, nys_mg, nyn_mg, nzb, nzt_mg
1238
1239    USE kinds
1240
[1]1241    USE pegrid
1242
1243    IMPLICIT NONE
1244
[1320]1245    INTEGER(iwp) ::  nwords  !:
[1]1246
[1320]1247    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level-1)+1,                            &
1248                        nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,         &
1249                        nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1) ::  p2  !:
[1]1250
[1320]1251    REAL(wp), DIMENSION(nzb:mg_loc_ind(5,myid)+1,                              &
1252                        mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,             &
1253                        mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) ::  p2_sub  !:
[1]1254
1255!
1256!-- Find out the number of array elements of the subdomain array
1257    nwords = SIZE( p2_sub )
1258
1259#if defined( __parallel )
1260    CALL cpu_log( log_point_s(35), 'mg_scatter', 'start' )
1261
[707]1262    p2_sub = p2(:,mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1, &
1263                  mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1)
[1]1264
1265    CALL cpu_log( log_point_s(35), 'mg_scatter', 'stop' )
1266#endif
1267   
1268 END SUBROUTINE mg_scatter
1269
1270
1271
1272 RECURSIVE SUBROUTINE next_mg_level( f_mg, p_mg, p3, r )
1273
1274!------------------------------------------------------------------------------!
1275! Description:
1276! ------------
1277! This is where the multigrid technique takes place. V- and W- Cycle are
1278! implemented and steered by the parameter "gamma". Parameter "nue" determines
1279! the convergence of the multigrid iterative solution. There are nue times
1280! RB-GS iterations. It should be set to "1" or "2", considering the time effort
1281! one would like to invest. Last choice shows a very good converging factor,
1282! but leads to an increase in computing time.
1283!------------------------------------------------------------------------------!
1284
[1320]1285    USE control_parameters,                                                    &
1286        ONLY:  bc_lr_dirrad, bc_lr_raddir, bc_ns_dirrad, bc_ns_raddir,         &
1287               gamma_mg, grid_level, grid_level_count, ibc_p_b, ibc_p_t,       &
1288               inflow_l, inflow_n, inflow_r, inflow_s, maximum_grid_level,     &
1289               mg_switch_to_pe0_level, mg_switch_to_pe0, ngsrb, outflow_l,     &
1290               outflow_n, outflow_r, outflow_s
1291
1292
1293    USE indices,                                                               &
1294        ONLY:  mg_loc_ind, nxl, nxl_mg, nxr, nxr_mg, nys, nys_mg, nyn,         &
1295               nyn_mg, nzb, nzt, nzt_mg
1296
1297    USE kinds
1298
[1]1299    USE pegrid
1300
1301    IMPLICIT NONE
1302
[1320]1303    INTEGER(iwp) ::  i            !:
1304    INTEGER(iwp) ::  j            !:
1305    INTEGER(iwp) ::  k            !:
1306    INTEGER(iwp) ::  nxl_mg_save  !:
1307    INTEGER(iwp) ::  nxr_mg_save  !:
1308    INTEGER(iwp) ::  nyn_mg_save  !:
1309    INTEGER(iwp) ::  nys_mg_save  !:
1310    INTEGER(iwp) ::  nzt_mg_save  !:
[1]1311
[1320]1312    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1313                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
1314                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: f_mg  !:
1315    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1316                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
1317                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: p_mg  !:
1318    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1319                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
1320                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: p3    !:
1321    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1322                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
1323                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: r     !:
[1]1324
[1320]1325    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level-1)+1,                            &
1326                        nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,         &
1327                        nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1) ::  f2  !:
1328    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level-1)+1,                            &
1329                        nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,         &
1330                        nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1) ::  p2  !:
[1]1331
[1320]1332    REAL(wp), DIMENSION(:,:,:), ALLOCATABLE ::  f2_sub  !:
1333    REAL(wp), DIMENSION(:,:,:), ALLOCATABLE ::  p2_sub  !:
[778]1334
[1]1335!
1336!-- Restriction to the coarsest grid
1337 10 IF ( grid_level == 1 )  THEN
1338
1339!
1340!--    Solution on the coarsest grid. Double the number of Gauss-Seidel
1341!--    iterations in order to get a more accurate solution.
1342       ngsrb = 2 * ngsrb
[778]1343
[1]1344       CALL redblack( f_mg, p_mg )
[778]1345
[1]1346       ngsrb = ngsrb / 2
1347
[778]1348
[1]1349    ELSEIF ( grid_level /= 1 )  THEN
1350
1351       grid_level_count(grid_level) = grid_level_count(grid_level) + 1
1352
1353!
1354!--    Solution on the actual grid level
1355       CALL redblack( f_mg, p_mg )
1356
1357!
1358!--    Determination of the actual residual
1359       CALL resid( f_mg, p_mg, r )
1360
1361!
1362!--    Restriction of the residual (finer grid values!) to the next coarser
1363!--    grid. Therefore, the grid level has to be decremented now. nxl..nzt have
1364!--    to be set to the coarse grid values, because these variables are needed
1365!--    for the exchange of ghost points in routine exchange_horiz
1366       grid_level = grid_level - 1
1367       nxl = nxl_mg(grid_level)
[778]1368       nys = nys_mg(grid_level)
[1]1369       nxr = nxr_mg(grid_level)
1370       nyn = nyn_mg(grid_level)
1371       nzt = nzt_mg(grid_level)
1372
1373       IF ( grid_level == mg_switch_to_pe0_level )  THEN
[778]1374
[1]1375!
1376!--       From this level on, calculations are done on PE0 only.
1377!--       First, carry out restriction on the subdomain.
1378!--       Therefore, indices of the level have to be changed to subdomain values
1379!--       in between (otherwise, the restrict routine would expect
1380!--       the gathered array)
[778]1381
[1]1382          nxl_mg_save = nxl_mg(grid_level)
1383          nxr_mg_save = nxr_mg(grid_level)
1384          nys_mg_save = nys_mg(grid_level)
1385          nyn_mg_save = nyn_mg(grid_level)
1386          nzt_mg_save = nzt_mg(grid_level)
1387          nxl_mg(grid_level) = mg_loc_ind(1,myid)
1388          nxr_mg(grid_level) = mg_loc_ind(2,myid)
1389          nys_mg(grid_level) = mg_loc_ind(3,myid)
1390          nyn_mg(grid_level) = mg_loc_ind(4,myid)
1391          nzt_mg(grid_level) = mg_loc_ind(5,myid)
1392          nxl = mg_loc_ind(1,myid)
1393          nxr = mg_loc_ind(2,myid)
1394          nys = mg_loc_ind(3,myid)
1395          nyn = mg_loc_ind(4,myid)
1396          nzt = mg_loc_ind(5,myid)
1397
1398          ALLOCATE( f2_sub(nzb:nzt_mg(grid_level)+1,                    &
1399                           nys_mg(grid_level)-1:nyn_mg(grid_level)+1,   &
1400                           nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) )
1401
1402          CALL restrict( f2_sub, r )
1403
1404!
1405!--       Restore the correct indices of this level
1406          nxl_mg(grid_level) = nxl_mg_save
1407          nxr_mg(grid_level) = nxr_mg_save
1408          nys_mg(grid_level) = nys_mg_save
1409          nyn_mg(grid_level) = nyn_mg_save
1410          nzt_mg(grid_level) = nzt_mg_save
1411          nxl = nxl_mg(grid_level)
1412          nxr = nxr_mg(grid_level)
1413          nys = nys_mg(grid_level)
1414          nyn = nyn_mg(grid_level)
1415          nzt = nzt_mg(grid_level)
1416!
1417!--       Gather all arrays from the subdomains on PE0
1418          CALL mg_gather( f2, f2_sub )
1419
1420!
1421!--       Set switch for routine exchange_horiz, that no ghostpoint exchange
1422!--       has to be carried out from now on
1423          mg_switch_to_pe0 = .TRUE.
1424
1425!
1426!--       In case of non-cyclic lateral boundary conditions, both in- and
[707]1427!--       outflow conditions have to be used on all PEs after the switch,
1428!--       because then they have the total domain.
[1159]1429          IF ( bc_lr_dirrad )  THEN
[707]1430             inflow_l  = .TRUE.
1431             inflow_r  = .FALSE.
1432             outflow_l = .FALSE.
1433             outflow_r = .TRUE.
[1159]1434          ELSEIF ( bc_lr_raddir )  THEN
[707]1435             inflow_l  = .FALSE.
1436             inflow_r  = .TRUE.
1437             outflow_l = .TRUE.
1438             outflow_r = .FALSE.
[1]1439          ENDIF
1440
[1159]1441          IF ( bc_ns_dirrad )  THEN
[707]1442             inflow_n  = .TRUE.
1443             inflow_s  = .FALSE.
1444             outflow_n = .FALSE.
1445             outflow_s = .TRUE.
[1159]1446          ELSEIF ( bc_ns_raddir )  THEN
[707]1447             inflow_n  = .FALSE.
1448             inflow_s  = .TRUE.
1449             outflow_n = .TRUE.
1450             outflow_s = .FALSE.
1451          ENDIF
1452
[1]1453          DEALLOCATE( f2_sub )
1454
1455       ELSE
[1056]1456
[1]1457          CALL restrict( f2, r )
1458
1459       ENDIF
[707]1460
[1353]1461       p2 = 0.0_wp
[1]1462
1463!
1464!--    Repeat the same procedure till the coarsest grid is reached
[707]1465       CALL next_mg_level( f2, p2, p3, r )
[1]1466
1467    ENDIF
1468
1469!
1470!-- Now follows the prolongation
1471    IF ( grid_level >= 2 )  THEN
1472
1473!
1474!--    Prolongation of the new residual. The values are transferred
1475!--    from the coarse to the next finer grid.
1476       IF ( grid_level == mg_switch_to_pe0_level+1 )  THEN
[879]1477
1478#if defined( __parallel )
[1]1479!
1480!--       At this level, the new residual first has to be scattered from
1481!--       PE0 to the other PEs
1482          ALLOCATE( p2_sub(nzb:mg_loc_ind(5,myid)+1,             &
1483                    mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,   &
1484                    mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) )
1485
1486          CALL mg_scatter( p2, p2_sub )
1487
1488!
1489!--       Therefore, indices of the previous level have to be changed to
1490!--       subdomain values in between (otherwise, the prolong routine would
1491!--       expect the gathered array)
1492          nxl_mg_save = nxl_mg(grid_level-1)
1493          nxr_mg_save = nxr_mg(grid_level-1)
1494          nys_mg_save = nys_mg(grid_level-1)
1495          nyn_mg_save = nyn_mg(grid_level-1)
1496          nzt_mg_save = nzt_mg(grid_level-1)
1497          nxl_mg(grid_level-1) = mg_loc_ind(1,myid)
1498          nxr_mg(grid_level-1) = mg_loc_ind(2,myid)
1499          nys_mg(grid_level-1) = mg_loc_ind(3,myid)
1500          nyn_mg(grid_level-1) = mg_loc_ind(4,myid)
1501          nzt_mg(grid_level-1) = mg_loc_ind(5,myid)
1502
1503!
1504!--       Set switch for routine exchange_horiz, that ghostpoint exchange
1505!--       has to be carried again out from now on
1506          mg_switch_to_pe0 = .FALSE.
1507
1508!
[707]1509!--       For non-cyclic lateral boundary conditions, restore the
1510!--       in-/outflow conditions
1511          inflow_l  = .FALSE.;  inflow_r  = .FALSE.
1512          inflow_n  = .FALSE.;  inflow_s  = .FALSE.
1513          outflow_l = .FALSE.;  outflow_r = .FALSE.
1514          outflow_n = .FALSE.;  outflow_s = .FALSE.
1515
1516          IF ( pleft == MPI_PROC_NULL )  THEN
[1159]1517             IF ( bc_lr_dirrad )  THEN
[707]1518                inflow_l  = .TRUE.
[1159]1519             ELSEIF ( bc_lr_raddir )  THEN
[707]1520                outflow_l = .TRUE.
[1]1521             ENDIF
[707]1522          ENDIF
1523
1524          IF ( pright == MPI_PROC_NULL )  THEN
[1159]1525             IF ( bc_lr_dirrad )  THEN
[707]1526                outflow_r = .TRUE.
[1159]1527             ELSEIF ( bc_lr_raddir )  THEN
[707]1528                inflow_r  = .TRUE.
[1]1529             ENDIF
1530          ENDIF
1531
[707]1532          IF ( psouth == MPI_PROC_NULL )  THEN
[1159]1533             IF ( bc_ns_dirrad )  THEN
[707]1534                outflow_s = .TRUE.
[1159]1535             ELSEIF ( bc_ns_raddir )  THEN
[707]1536                inflow_s  = .TRUE.
1537             ENDIF
1538          ENDIF
1539
1540          IF ( pnorth == MPI_PROC_NULL )  THEN
[1159]1541             IF ( bc_ns_dirrad )  THEN
[707]1542                inflow_n  = .TRUE.
[1159]1543             ELSEIF ( bc_ns_raddir )  THEN
[707]1544                outflow_n = .TRUE.
1545             ENDIF
1546          ENDIF
1547
[1]1548          CALL prolong( p2_sub, p3 )
1549
1550!
1551!--       Restore the correct indices of the previous level
1552          nxl_mg(grid_level-1) = nxl_mg_save
1553          nxr_mg(grid_level-1) = nxr_mg_save
1554          nys_mg(grid_level-1) = nys_mg_save
1555          nyn_mg(grid_level-1) = nyn_mg_save
1556          nzt_mg(grid_level-1) = nzt_mg_save
1557
1558          DEALLOCATE( p2_sub )
[879]1559#endif
[1]1560
1561       ELSE
[879]1562
[1]1563          CALL prolong( p2, p3 )
1564
1565       ENDIF
1566
1567!
1568!--    Computation of the new pressure correction. Therefore,
1569!--    values from prior grids are added up automatically stage by stage.
1570       DO  i = nxl_mg(grid_level)-1, nxr_mg(grid_level)+1
1571          DO  j = nys_mg(grid_level)-1, nyn_mg(grid_level)+1
1572             DO  k = nzb, nzt_mg(grid_level)+1 
1573                p_mg(k,j,i) = p_mg(k,j,i) + p3(k,j,i)
1574             ENDDO
1575          ENDDO
1576       ENDDO
1577
1578!
1579!--    Relaxation of the new solution
1580       CALL redblack( f_mg, p_mg )
1581
1582    ENDIF
1583
[778]1584
[1]1585!
1586!-- The following few lines serve the steering of the multigrid scheme
1587    IF ( grid_level == maximum_grid_level )  THEN
1588
1589       GOTO 20
1590
1591    ELSEIF ( grid_level /= maximum_grid_level  .AND.  grid_level /= 1  .AND. &
1592             grid_level_count(grid_level) /= gamma_mg )  THEN
1593
1594       GOTO 10
1595
1596    ENDIF
1597
1598!
1599!-- Reset counter for the next call of poismg
1600    grid_level_count(grid_level) = 0
1601
1602!
1603!-- Continue with the next finer level. nxl..nzt have to be
1604!-- set to the finer grid values, because these variables are needed for the
1605!-- exchange of ghost points in routine exchange_horiz
1606    grid_level = grid_level + 1
1607    nxl = nxl_mg(grid_level)
1608    nxr = nxr_mg(grid_level)
1609    nys = nys_mg(grid_level)
1610    nyn = nyn_mg(grid_level)
1611    nzt = nzt_mg(grid_level)
1612
1613 20 CONTINUE
1614
1615 END SUBROUTINE next_mg_level
Note: See TracBrowser for help on using the repository browser.