source: palm/trunk/SOURCE/poismg_noopt.f90 @ 2016

Last change on this file since 2016 was 2001, checked in by knoop, 8 years ago

last commit documented

  • Property svn:keywords set to Id
File size: 67.4 KB
RevLine 
[1931]1!> @file poismg_noopt.f90
[2000]2!------------------------------------------------------------------------------!
[1036]3! This file is part of PALM.
4!
[2000]5! PALM is free software: you can redistribute it and/or modify it under the
6! terms of the GNU General Public License as published by the Free Software
7! Foundation, either version 3 of the License, or (at your option) any later
8! version.
[1036]9!
10! PALM is distributed in the hope that it will be useful, but WITHOUT ANY
11! WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR
12! A PARTICULAR PURPOSE.  See the GNU General Public License for more details.
13!
14! You should have received a copy of the GNU General Public License along with
15! PALM. If not, see <http://www.gnu.org/licenses/>.
16!
[1818]17! Copyright 1997-2016 Leibniz Universitaet Hannover
[2000]18!------------------------------------------------------------------------------!
[1036]19!
[257]20! Current revisions:
[1]21! -----------------
[1354]22!
[2001]23!
[1321]24! Former revisions:
25! -----------------
26! $Id: poismg_noopt.f90 2001 2016-08-20 18:41:22Z lvollmer $
27!
[2001]28! 2000 2016-08-20 18:09:15Z knoop
29! Forced header and separation lines into 80 columns
30!
[1935]31! 1934 2016-06-13 09:46:57Z hellstea
32! Rename subroutines and cpu-measure log points to indicate _noopt version
33!
[1763]34! 1762 2016-02-25 12:31:13Z hellstea
35! Introduction of nested domain feature
36!
[1683]37! 1682 2015-10-07 23:56:08Z knoop
38! Code annotations made doxygen readable
39!
[1354]40! 1353 2014-04-08 15:21:23Z heinze
41! REAL constants provided with KIND-attribute
42!
[1323]43! 1322 2014-03-20 16:38:49Z raasch
44! REAL constants defined as wp-kind
45!
[1321]46! 1320 2014-03-20 08:40:49Z raasch
[1320]47! ONLY-attribute added to USE-statements,
48! kind-parameters added to all INTEGER and REAL declaration statements,
49! kinds are defined in new module kinds,
50! old module precision_kind is removed,
51! revision history before 2012 removed,
52! comment fields (!:) to be used for variable explanations added to
53! all variable declaration statements
[708]54!
[1319]55! 1318 2014-03-17 13:35:16Z raasch
56! module interfaces removed
57!
[1160]58! 1159 2013-05-21 11:58:22Z fricke
59! bc_lr/ns_dirneu/neudir removed
60!
[1093]61! 1092 2013-02-02 11:24:22Z raasch
62! unused variables removed
63!
[1057]64! 1056 2012-11-16 15:28:04Z raasch
65! Bugfix: all ghost points have to be used for allocating p3
66! arrays p2, f2, and f2_l changed from allocatable to automatic
67!
[1037]68! 1036 2012-10-22 13:43:42Z raasch
69! code put under GPL (PALM 3.9)
70!
[997]71! 996 2012-09-07 10:41:47Z raasch
72! little reformatting
73!
[979]74! 978 2012-08-09 08:28:32Z fricke
75! bc_lr/ns_dirneu/neudir added
76!
[881]77! 880 2012-04-13 06:28:59Z raasch
78! Bugfix: preprocessor statements for parallel execution added
79!
[779]80! 778 2011-11-07 14:18:25Z fricke
81! Allocation of p3 changes when multigrid is used and the collected field on PE0
82! has more grid points than the subdomain of an PE.
83!
[708]84! 707 2011-03-29 11:39:40Z raasch
[707]85! p_loc is used instead of p in the main routine (poismg).
86! On coarse grid levels, gathered data are identically processed on all PEs
87! (before, on PE0 only), so that the subsequent scattering of data is not
88! neccessary any more.
89! bc_lr/ns replaced by bc_lr/ns_cyc/dirrad/raddir
90! Bugfix: bottom (nzb) and top (nzt+1) boundary conditions set in routines
91! resid and restrict. They were missed before which may have led to
92! unpredictable results.
[1]93!
[668]94! 667 2010-12-23 12:06:00Z suehring/gryschka
95! Calls of exchange_horiz are modified.
96!
[623]97! 622 2010-12-10 08:08:13Z raasch
98! optional barriers included in order to speed up collective operations
99!
[392]100! 257 2009-03-11 15:17:42Z heinze
101! Output of messages replaced by message handling routine.
102!
[198]103! 181 2008-07-30 07:07:47Z raasch
104! Bugfix: grid_level+1 has to be used in restrict for flags-array
105!
[139]106! 114 2007-10-10 00:03:15Z raasch
107! Boundary conditions at walls are implicitly set using flag arrays. Only
108! Neumann BC is allowed. Upper walls are still not realized.
109! Bottom and top BCs for array f_mg in restrict removed because boundary
110! values are not needed (right hand side of SOR iteration).
111!
[77]112! 75 2007-03-22 09:54:05Z raasch
113! 2nd+3rd argument removed from exchange horiz
114!
[3]115! RCS Log replace by Id keyword, revision history cleaned up
116!
[1]117! Revision 1.6  2005/03/26 20:55:54  raasch
118! Implementation of non-cyclic (Neumann) horizontal boundary conditions,
119! routine prolong simplified (one call of exchange_horiz spared)
120!
121! Revision 1.1  2001/07/20 13:10:51  raasch
122! Initial revision
123!
124!
125! Description:
126! ------------
[1682]127!> Solves the Poisson equation for the perturbation pressure with a multigrid
128!> V- or W-Cycle scheme.
129!>
130!> This multigrid method was originally developed for PALM by Joerg Uhlenbrock,
131!> September 2000 - July 2001.
132!>
133!> @attention Loop unrolling and cache optimization in SOR-Red/Black method
134!>            still does not give the expected speedup!
135!>
136!> @todo Further work required.
[1]137!------------------------------------------------------------------------------!
[1931]138 SUBROUTINE poismg_noopt( r )
[1682]139 
[1]140
[1320]141    USE arrays_3d,                                                             &
142        ONLY:  d, p_loc
143
144    USE control_parameters,                                                    &
145        ONLY:  gathered_size, grid_level, grid_level_count,                    &
146               maximum_grid_level, message_string, mgcycles, mg_cycles,        &
147               mg_switch_to_pe0_level, residual_limit, subdomain_size
148
149    USE cpulog,                                                                &
150        ONLY:  cpu_log, log_point_s
151
152    USE indices,                                                               &
153        ONLY:  nxl, nxlg, nxl_mg, nxr, nxrg, nxr_mg, nys, nysg, nys_mg, nyn,   &
154               nyng, nyn_mg, nzb, nzt, nzt_mg
155
156    USE kinds
157
[1]158    USE pegrid
159
160    IMPLICIT NONE
161
[1682]162    REAL(wp) ::  maxerror          !<
163    REAL(wp) ::  maximum_mgcycles  !<
164    REAL(wp) ::  residual_norm     !<
[1]165
[1682]166    REAL(wp), DIMENSION(nzb:nzt+1,nys-1:nyn+1,nxl-1:nxr+1) ::  r  !<
[1]167
[1682]168    REAL(wp), DIMENSION(:,:,:), ALLOCATABLE ::  p3  !<
[1]169
170
[1931]171    CALL cpu_log( log_point_s(29), 'poismg_noopt', 'start' )
[1]172!
173!-- Initialize arrays and variables used in this subroutine
174
[879]175!-- If the number of grid points of the gathered grid, which is collected
176!-- on PE0, is larger than the number of grid points of an PE, than array
177!-- p3 will be enlarged.
[778]178    IF ( gathered_size > subdomain_size )  THEN
[879]179       ALLOCATE( p3(nzb:nzt_mg(mg_switch_to_pe0_level)+1,nys_mg(               &
180                    mg_switch_to_pe0_level)-1:nyn_mg(mg_switch_to_pe0_level)+1,&
181                    nxl_mg(mg_switch_to_pe0_level)-1:nxr_mg(                   &
[778]182                    mg_switch_to_pe0_level)+1) )
183    ELSE
[1056]184       ALLOCATE ( p3(nzb:nzt+1,nysg:nyng,nxlg:nxrg) )
[778]185    ENDIF
[1056]186
[1353]187    p3 = 0.0_wp
[879]188 
[1]189!
[707]190!-- Ghost boundaries have to be added to divergence array.
191!-- Exchange routine needs to know the grid level!
192    grid_level = maximum_grid_level
[667]193    CALL exchange_horiz( d, 1)
[1]194    d(nzb,:,:) = d(nzb+1,:,:)
195
196!
197!-- Initiation of the multigrid scheme. Does n cycles until the
198!-- residual is smaller than the given limit. The accuracy of the solution
199!-- of the poisson equation will increase with the number of cycles.
200!-- If the number of cycles is preset by the user, this number will be
201!-- carried out regardless of the accuracy.
[707]202    grid_level_count =  0
203    mgcycles         =  0
[1]204    IF ( mg_cycles == -1 )  THEN
205       maximum_mgcycles = 0
[1353]206       residual_norm    = 1.0_wp
[1]207    ELSE
208       maximum_mgcycles = mg_cycles
[1353]209       residual_norm    = 0.0_wp
[1]210    ENDIF
211
212    DO WHILE ( residual_norm > residual_limit  .OR. &
213               mgcycles < maximum_mgcycles )
[778]214 
[1931]215       CALL next_mg_level_noopt( d, p_loc, p3, r)
[1]216
217!
218!--    Calculate the residual if the user has not preset the number of
219!--    cycles to be performed
220       IF ( maximum_mgcycles == 0 )  THEN
[1931]221          CALL resid_noopt( d, p_loc, r )
[1]222          maxerror = SUM( r(nzb+1:nzt,nys:nyn,nxl:nxr)**2 )
[778]223
[1]224#if defined( __parallel )
[622]225          IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
[778]226             CALL MPI_ALLREDUCE( maxerror, residual_norm, 1, MPI_REAL, MPI_SUM, &
[1]227                              comm2d, ierr)
228#else
[778]229             residual_norm = maxerror
[1]230#endif
231          residual_norm = SQRT( residual_norm )
232       ENDIF
233
234       mgcycles = mgcycles + 1
235
236!
237!--    If the user has not limited the number of cycles, stop the run in case
238!--    of insufficient convergence
239       IF ( mgcycles > 1000  .AND.  mg_cycles == -1 )  THEN
[257]240          message_string = 'no sufficient convergence within 1000 cycles'
[1931]241          CALL message( 'poismg_noopt', 'PA0283', 1, 2, 0, 6, 0 )
[1]242       ENDIF
243
244    ENDDO
245
246    DEALLOCATE( p3 )
247
[707]248!
249!-- Unset the grid level. Variable is used to determine the MPI datatypes for
250!-- ghost point exchange
251    grid_level = 0 
252
[1931]253    CALL cpu_log( log_point_s(29), 'poismg_noopt', 'stop' )
[1]254
[1931]255 END SUBROUTINE poismg_noopt
[1]256
257
258!------------------------------------------------------------------------------!
259! Description:
260! ------------
[1682]261!> Computes the residual of the perturbation pressure.
[1]262!------------------------------------------------------------------------------!
[1931]263 SUBROUTINE resid_noopt( f_mg, p_mg, r )
[1]264
[1682]265
[1320]266    USE arrays_3d,                                                             &
267        ONLY:  f1_mg, f2_mg, f3_mg
[1]268
[1320]269    USE control_parameters,                                                    &
270        ONLY:  bc_lr_cyc, bc_ns_cyc, grid_level, ibc_p_b, ibc_p_t, inflow_l,   &
[1762]271               inflow_n, inflow_r, inflow_s, nest_bound_l, nest_bound_n,       &
272               nest_bound_r, nest_bound_s, outflow_l, outflow_n, outflow_r,    &
[1320]273               outflow_s
274
275    USE grid_variables,                                                        &
276        ONLY:  ddx2_mg, ddy2_mg
277
278    USE indices,                                                               &
279        ONLY:  flags, wall_flags_1, wall_flags_2, wall_flags_3, wall_flags_4,  &
280               wall_flags_5, wall_flags_6, wall_flags_7, wall_flags_8,         &
281               wall_flags_9, wall_flags_10, nxl_mg, nxr_mg, nys_mg, nyn_mg,    &
282               nzb, nzt_mg
283
284    USE kinds
285
[1]286    IMPLICIT NONE
287
[1320]288    INTEGER(iwp) ::  i
289    INTEGER(iwp) ::  j
290    INTEGER(iwp) ::  k
291    INTEGER(iwp) ::  l
[1]292
[1320]293    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
[1]294                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
[1682]295                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg  !<
[1320]296    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
297                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
[1682]298                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  p_mg  !<
[1320]299    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
300                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
[1682]301                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  r     !<
[1]302
303!
304!-- Calculate the residual
305    l = grid_level
306
[114]307!
308!-- Choose flag array of this level
309    SELECT CASE ( l )
310       CASE ( 1 )
311          flags => wall_flags_1
312       CASE ( 2 )
313          flags => wall_flags_2
314       CASE ( 3 )
315          flags => wall_flags_3
316       CASE ( 4 )
317          flags => wall_flags_4
318       CASE ( 5 )
319          flags => wall_flags_5
320       CASE ( 6 )
321          flags => wall_flags_6
322       CASE ( 7 )
323          flags => wall_flags_7
324       CASE ( 8 )
325          flags => wall_flags_8
326       CASE ( 9 )
327          flags => wall_flags_9
328       CASE ( 10 )
329          flags => wall_flags_10
330    END SELECT
331
[1]332!$OMP PARALLEL PRIVATE (i,j,k)
333!$OMP DO
334    DO  i = nxl_mg(l), nxr_mg(l)
335       DO  j = nys_mg(l), nyn_mg(l) 
336          DO  k = nzb+1, nzt_mg(l)
[114]337             r(k,j,i) = f_mg(k,j,i)                                         &
338                        - ddx2_mg(l) *                                      &
339                            ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
340                                          ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
341                              p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
342                                          ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
343                        - ddy2_mg(l) *                                      &
344                            ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
345                                          ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
346                              p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
347                                          ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
348                        - f2_mg(k,l) * p_mg(k+1,j,i)                        &
349                        - f3_mg(k,l) *                                      &
350                            ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
351                                          ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
[1]352                        + f1_mg(k,l) * p_mg(k,j,i)
[114]353!
354!--          Residual within topography should be zero
[1353]355             r(k,j,i) = r(k,j,i) * ( 1.0_wp - IBITS( flags(k,j,i), 6, 1 ) )
[1]356          ENDDO
357       ENDDO
358    ENDDO
359!$OMP END PARALLEL
360
361!
362!-- Horizontal boundary conditions
[667]363    CALL exchange_horiz( r, 1)
[1]364
[707]365    IF ( .NOT. bc_lr_cyc )  THEN
[1762]366       IF ( inflow_l .OR. outflow_l .OR. nest_bound_l )  THEN
367          r(:,:,nxl_mg(l)-1) = r(:,:,nxl_mg(l))
368       ENDIF
369       IF ( inflow_r .OR. outflow_r .OR. nest_bound_r )  THEN
370          r(:,:,nxr_mg(l)+1) = r(:,:,nxr_mg(l))
371       ENDIF
[1]372    ENDIF
373
[707]374    IF ( .NOT. bc_ns_cyc )  THEN
[1762]375       IF ( inflow_n .OR. outflow_n .OR. nest_bound_n )  THEN
376          r(:,nyn_mg(l)+1,:) = r(:,nyn_mg(l),:)
377       ENDIF
378       IF ( inflow_s .OR. outflow_s .OR. nest_bound_s )  THEN
379          r(:,nys_mg(l)-1,:) = r(:,nys_mg(l),:)
380       ENDIF
[1]381    ENDIF
382
383!
[707]384!-- Boundary conditions at bottom and top of the domain.
385!-- These points are not handled by the above loop. Points may be within
386!-- buildings, but that doesn't matter.
387    IF ( ibc_p_b == 1 )  THEN
388       r(nzb,:,: ) = r(nzb+1,:,:)
389    ELSE
[1353]390       r(nzb,:,: ) = 0.0_wp
[707]391    ENDIF
392
[1]393    IF ( ibc_p_t == 1 )  THEN
394       r(nzt_mg(l)+1,:,: ) = r(nzt_mg(l),:,:)
395    ELSE
[1353]396       r(nzt_mg(l)+1,:,: ) = 0.0_wp
[1]397    ENDIF
398
399
[1931]400 END SUBROUTINE resid_noopt
[1]401
402
403!------------------------------------------------------------------------------!
404! Description:
405! ------------
[1682]406!> Interpolates the residual on the next coarser grid with "full weighting"
407!> scheme.
[1]408!------------------------------------------------------------------------------!
[1931]409 SUBROUTINE restrict_noopt( f_mg, r )
[1]410
[1682]411
[1320]412    USE control_parameters,                                                    &
413        ONLY:  bc_lr_cyc, bc_ns_cyc, grid_level, ibc_p_b, ibc_p_t, inflow_l,   &
[1762]414               inflow_n, inflow_r, inflow_s, nest_bound_l, nest_bound_n,       &
415               nest_bound_r, nest_bound_s, outflow_l, outflow_n, outflow_r,    &
[1320]416               outflow_s
[1]417
[1320]418    USE indices,                                                               &
419        ONLY:  flags, wall_flags_1, wall_flags_2, wall_flags_3, wall_flags_4,  &
420               wall_flags_5, wall_flags_6, wall_flags_7, wall_flags_8,         &
421               wall_flags_9, wall_flags_10, nxl_mg, nxr_mg, nys_mg, nyn_mg,    &
422               nzb, nzt_mg
423
424    USE kinds
425
[1]426    IMPLICIT NONE
427
[1682]428    INTEGER(iwp) ::  i    !<
429    INTEGER(iwp) ::  ic   !<
430    INTEGER(iwp) ::  j    !<
431    INTEGER(iwp) ::  jc   !<
432    INTEGER(iwp) ::  k    !<
433    INTEGER(iwp) ::  kc   !<
434    INTEGER(iwp) ::  l    !<
[1]435
[1682]436    REAL(wp) ::  rkjim    !<
437    REAL(wp) ::  rkjip    !<
438    REAL(wp) ::  rkjmi    !<
439    REAL(wp) ::  rkjmim   !<
440    REAL(wp) ::  rkjmip   !<
441    REAL(wp) ::  rkjpi    !<
442    REAL(wp) ::  rkjpim   !<
443    REAL(wp) ::  rkjpip   !<
444    REAL(wp) ::  rkmji    !<
445    REAL(wp) ::  rkmjim   !<
446    REAL(wp) ::  rkmjip   !<
447    REAL(wp) ::  rkmjmi   !<
448    REAL(wp) ::  rkmjmim  !<
449    REAL(wp) ::  rkmjmip  !<
450    REAL(wp) ::  rkmjpi   !<
451    REAL(wp) ::  rkmjpim  !<
452    REAL(wp) ::  rkmjpip  !<
[114]453
[1320]454    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                            &
455                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,           &
[1682]456                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg  !<
[1]457
[1320]458    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level+1)+1,                          &
459                        nys_mg(grid_level+1)-1:nyn_mg(grid_level+1)+1,       &
[1682]460                        nxl_mg(grid_level+1)-1:nxr_mg(grid_level+1)+1) ::  r !<
[1]461
462!
463!-- Interpolate the residual
464    l = grid_level
465
[114]466!
467!-- Choose flag array of the upper level
[181]468    SELECT CASE ( l+1 )
[114]469       CASE ( 1 )
470          flags => wall_flags_1
471       CASE ( 2 )
472          flags => wall_flags_2
473       CASE ( 3 )
474          flags => wall_flags_3
475       CASE ( 4 )
476          flags => wall_flags_4
477       CASE ( 5 )
478          flags => wall_flags_5
479       CASE ( 6 )
480          flags => wall_flags_6
481       CASE ( 7 )
482          flags => wall_flags_7
483       CASE ( 8 )
484          flags => wall_flags_8
485       CASE ( 9 )
486          flags => wall_flags_9
487       CASE ( 10 )
488          flags => wall_flags_10
489    END SELECT
490   
[1]491!$OMP PARALLEL PRIVATE (i,j,k,ic,jc,kc)
492!$OMP DO
493    DO  ic = nxl_mg(l), nxr_mg(l)   
494       i = 2*ic 
495       DO  jc = nys_mg(l), nyn_mg(l) 
496          j = 2*jc
497          DO  kc = nzb+1, nzt_mg(l)
498             k = 2*kc-1
[114]499!
500!--          Use implicit Neumann BCs if the respective gridpoint is inside
501!--          the building
502             rkjim   = r(k,j,i-1)     + IBITS( flags(k,j,i-1), 6, 1 ) *     &
503                                        ( r(k,j,i) - r(k,j,i-1) )
504             rkjip   = r(k,j,i+1)     + IBITS( flags(k,j,i+1), 6, 1 ) *     &
505                                        ( r(k,j,i) - r(k,j,i+1) )
506             rkjpi   = r(k,j+1,i)     + IBITS( flags(k,j+1,i), 6, 1 ) *     &
507                                        ( r(k,j,i) - r(k,j+1,i) )
508             rkjmi   = r(k,j-1,i)     + IBITS( flags(k,j-1,i), 6, 1 ) *     &
509                                        ( r(k,j,i) - r(k,j-1,i) )
510             rkjmim  = r(k,j-1,i-1)   + IBITS( flags(k,j-1,i-1), 6, 1 ) *   &
511                                        ( r(k,j,i) - r(k,j-1,i-1) )
512             rkjpim  = r(k,j+1,i-1)   + IBITS( flags(k,j+1,i-1), 6, 1 ) *   &
513                                        ( r(k,j,i) - r(k,j+1,i-1) )
514             rkjmip  = r(k,j-1,i+1)   + IBITS( flags(k,j-1,i+1), 6, 1 ) *   &
515                                        ( r(k,j,i) - r(k,j-1,i+1) )
516             rkjpip  = r(k,j+1,i+1)   + IBITS( flags(k,j+1,i+1), 6, 1 ) *   &
517                                        ( r(k,j,i) - r(k,j+1,i+1) )
518             rkmji   = r(k-1,j,i)     + IBITS( flags(k-1,j,i), 6, 1 ) *     &
519                                        ( r(k,j,i) - r(k-1,j,i) )
520             rkmjim  = r(k-1,j,i-1)   + IBITS( flags(k-1,j,i-1), 6, 1 ) *   &
521                                        ( r(k,j,i) - r(k-1,j,i-1) )
522             rkmjip  = r(k-1,j,i+1)   + IBITS( flags(k-1,j,i+1), 6, 1 ) *   &
523                                        ( r(k,j,i) - r(k-1,j,i+1) )
524             rkmjpi  = r(k-1,j+1,i)   + IBITS( flags(k-1,j+1,i), 6, 1 ) *   &
525                                        ( r(k,j,i) - r(k-1,j+1,i) )
526             rkmjmi  = r(k-1,j-1,i)   + IBITS( flags(k-1,j-1,i), 6, 1 ) *   &
527                                        ( r(k,j,i) - r(k-1,j-1,i) )
528             rkmjmim = r(k-1,j-1,i-1) + IBITS( flags(k-1,j-1,i-1), 6, 1 ) * &
529                                        ( r(k,j,i) - r(k-1,j-1,i-1) )
530             rkmjpim = r(k-1,j+1,i-1) + IBITS( flags(k-1,j+1,i-1), 6, 1 ) * &
531                                        ( r(k,j,i) - r(k-1,j+1,i-1) )
532             rkmjmip = r(k-1,j-1,i+1) + IBITS( flags(k-1,j-1,i+1), 6, 1 ) * &
533                                        ( r(k,j,i) - r(k-1,j-1,i+1) )
534             rkmjpip = r(k-1,j+1,i+1) + IBITS( flags(k-1,j+1,i+1), 6, 1 ) * &
535                                        ( r(k,j,i) - r(k-1,j+1,i+1) )
536
[1353]537             f_mg(kc,jc,ic) = 1.0_wp / 64.0_wp * (                         &
538                              8.0_wp * r(k,j,i)                            &
539                            + 4.0_wp * ( rkjim   + rkjip   +               &
540                                         rkjpi   + rkjmi   )               &
541                            + 2.0_wp * ( rkjmim  + rkjpim  +               &
542                                         rkjmip  + rkjpip  )               &
543                            + 4.0_wp * rkmji                               &
544                            + 2.0_wp * ( rkmjim  + rkmjim  +               &
545                                         rkmjpi  + rkmjmi  )               &
546                            +          ( rkmjmim + rkmjpim +               &
547                                         rkmjmip + rkmjpip )               &
548                            + 4.0_wp * r(k+1,j,i)                          &
549                            + 2.0_wp * ( r(k+1,j,i-1)   + r(k+1,j,i+1)   + &
550                                         r(k+1,j+1,i)   + r(k+1,j-1,i)   ) &
551                            +          ( r(k+1,j-1,i-1) + r(k+1,j+1,i-1) + &
552                                         r(k+1,j-1,i+1) + r(k+1,j+1,i+1) ) &
553                                                 )
[114]554
[1353]555!             f_mg(kc,jc,ic) = 1.0_wp / 64.0_wp * (                         &
556!                              8.0_wp * r(k,j,i)                            &
557!                            + 4.0_wp * ( r(k,j,i-1)     + r(k,j,i+1)     + &
558!                                         r(k,j+1,i)     + r(k,j-1,i)     ) &
559!                            + 2.0_wp * ( r(k,j-1,i-1)   + r(k,j+1,i-1)   + &
560!                                         r(k,j-1,i+1)   + r(k,j+1,i+1)   ) &
561!                            + 4.0_wp * r(k-1,j,i)                          &
562!                            + 2.0_wp * ( r(k-1,j,i-1)   + r(k-1,j,i+1)   + &
563!                                         r(k-1,j+1,i)   + r(k-1,j-1,i)   ) &
564!                            +          ( r(k-1,j-1,i-1) + r(k-1,j+1,i-1) + &
565!                                         r(k-1,j-1,i+1) + r(k-1,j+1,i+1) ) &
566!                            + 4.0_wp * r(k+1,j,i)                          &
567!                            + 2.0_wp * ( r(k+1,j,i-1)   + r(k+1,j,i+1)   + &
568!                                         r(k+1,j+1,i)   + r(k+1,j-1,i)   ) &
569!                            +          ( r(k+1,j-1,i-1) + r(k+1,j+1,i-1) + &
570!                                         r(k+1,j-1,i+1) + r(k+1,j+1,i+1) ) &
571!                                                )
[1]572          ENDDO
573       ENDDO
574    ENDDO
575!$OMP END PARALLEL
576
577!
578!-- Horizontal boundary conditions
[667]579    CALL exchange_horiz( f_mg, 1)
[1]580
[707]581    IF ( .NOT. bc_lr_cyc )  THEN
[1762]582       IF ( inflow_l .OR. outflow_l .OR. nest_bound_l )  THEN
583          f_mg(:,:,nxl_mg(l)-1) = f_mg(:,:,nxl_mg(l))
584       ENDIF
585       IF ( inflow_r .OR. outflow_r .OR. nest_bound_r )  THEN
586          f_mg(:,:,nxr_mg(l)+1) = f_mg(:,:,nxr_mg(l))
587       ENDIF
[1]588    ENDIF
589
[707]590    IF ( .NOT. bc_ns_cyc )  THEN
[1762]591       IF ( inflow_n .OR. outflow_n .OR. nest_bound_n )  THEN
592          f_mg(:,nyn_mg(l)+1,:) = f_mg(:,nyn_mg(l),:)
593       ENDIF
594       IF ( inflow_s .OR. outflow_s .OR. nest_bound_s )  THEN
595          f_mg(:,nys_mg(l)-1,:) = f_mg(:,nys_mg(l),:)
596       ENDIF
[1]597    ENDIF
598
599!
[707]600!-- Boundary conditions at bottom and top of the domain.
601!-- These points are not handled by the above loop. Points may be within
602!-- buildings, but that doesn't matter.
603    IF ( ibc_p_b == 1 )  THEN
604       f_mg(nzb,:,: ) = f_mg(nzb+1,:,:)
605    ELSE
[1353]606       f_mg(nzb,:,: ) = 0.0_wp
[707]607    ENDIF
[1]608
[707]609    IF ( ibc_p_t == 1 )  THEN
610       f_mg(nzt_mg(l)+1,:,: ) = f_mg(nzt_mg(l),:,:)
611    ELSE
[1353]612       f_mg(nzt_mg(l)+1,:,: ) = 0.0_wp
[707]613    ENDIF
[1]614
[707]615
[1931]616END SUBROUTINE restrict_noopt
[1]617
618
619!------------------------------------------------------------------------------!
620! Description:
621! ------------
[1682]622!> Interpolates the correction of the perturbation pressure
623!> to the next finer grid.
[1]624!------------------------------------------------------------------------------!
[1931]625 SUBROUTINE prolong_noopt( p, temp )
[1]626
[1682]627
[1320]628    USE control_parameters,                                                    &
629        ONLY:  bc_lr_cyc, bc_ns_cyc, grid_level, ibc_p_b, ibc_p_t, inflow_l,   &
[1762]630               inflow_n, inflow_r, inflow_s, nest_bound_l, nest_bound_n,       &
631               nest_bound_r, nest_bound_s, outflow_l, outflow_n, outflow_r,    &
[1320]632               outflow_s
[1]633
[1320]634    USE indices,                                                               &
635        ONLY:  nxl_mg, nxr_mg, nys_mg, nyn_mg, nzb, nzt_mg
636
637    USE kinds
638
[1]639    IMPLICIT NONE
640
[1682]641    INTEGER(iwp) ::  i  !<
642    INTEGER(iwp) ::  j  !<
643    INTEGER(iwp) ::  k  !<
644    INTEGER(iwp) ::  l  !<
[1]645
[1320]646    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level-1)+1,                           &
647                        nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,        &
[1682]648                        nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1 ) ::  p  !<
[1]649
[1320]650    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                           &
651                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,          &
[1682]652                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  temp  !<
[1]653
654
655!
656!-- First, store elements of the coarser grid on the next finer grid
657    l = grid_level
658
659!$OMP PARALLEL PRIVATE (i,j,k)
660!$OMP DO
661    DO  i = nxl_mg(l-1), nxr_mg(l-1)
662       DO  j = nys_mg(l-1), nyn_mg(l-1)
663!CDIR NODEP
664          DO  k = nzb+1, nzt_mg(l-1)
665!
666!--          Points of the coarse grid are directly stored on the next finer
667!--          grid
668             temp(2*k-1,2*j,2*i) = p(k,j,i) 
669!
670!--          Points between two coarse-grid points
[1353]671             temp(2*k-1,2*j,2*i+1) = 0.5_wp * ( p(k,j,i) + p(k,j,i+1) )
672             temp(2*k-1,2*j+1,2*i) = 0.5_wp * ( p(k,j,i) + p(k,j+1,i) )
673             temp(2*k,2*j,2*i)     = 0.5_wp * ( p(k,j,i) + p(k+1,j,i) )
[1]674!
675!--          Points in the center of the planes stretched by four points
676!--          of the coarse grid cube
[1353]677             temp(2*k-1,2*j+1,2*i+1) = 0.25_wp * ( p(k,j,i)   + p(k,j,i+1) + &
678                                                   p(k,j+1,i) + p(k,j+1,i+1) )
679             temp(2*k,2*j,2*i+1)     = 0.25_wp * ( p(k,j,i)   + p(k,j,i+1) + &
680                                                   p(k+1,j,i) + p(k+1,j,i+1) )
681             temp(2*k,2*j+1,2*i)     = 0.25_wp * ( p(k,j,i)   + p(k,j+1,i) + &
682                                                   p(k+1,j,i) + p(k+1,j+1,i) )
[1]683!
684!--          Points in the middle of coarse grid cube
[1353]685             temp(2*k,2*j+1,2*i+1) = 0.125_wp * ( p(k,j,i)     + p(k,j,i+1)   + &
686                                                  p(k,j+1,i)   + p(k,j+1,i+1) + &
687                                                  p(k+1,j,i)   + p(k+1,j,i+1) + &
688                                                  p(k+1,j+1,i) + p(k+1,j+1,i+1) )
[1]689          ENDDO
690       ENDDO
691    ENDDO
692!$OMP END PARALLEL
693                         
694!
695!-- Horizontal boundary conditions
[667]696    CALL exchange_horiz( temp, 1)
[1]697
[707]698    IF ( .NOT. bc_lr_cyc )  THEN
[1762]699       IF ( inflow_l .OR. outflow_l .OR. nest_bound_l )  THEN
700          temp(:,:,nxl_mg(l)-1) = temp(:,:,nxl_mg(l))
701       ENDIF
702       IF ( inflow_r .OR. outflow_r .OR. nest_bound_r )  THEN
703          temp(:,:,nxr_mg(l)+1) = temp(:,:,nxr_mg(l))
704       ENDIF
[1]705    ENDIF
706
[707]707    IF ( .NOT. bc_ns_cyc )  THEN
[1762]708       IF ( inflow_n .OR. outflow_n .OR. nest_bound_n )  THEN
709          temp(:,nyn_mg(l)+1,:) = temp(:,nyn_mg(l),:)
710       ENDIF
711       IF ( inflow_s .OR. outflow_s .OR. nest_bound_s )  THEN
712          temp(:,nys_mg(l)-1,:) = temp(:,nys_mg(l),:)
713       ENDIF
[1]714    ENDIF
715
716!
717!-- Bottom and top boundary conditions
718    IF ( ibc_p_b == 1 )  THEN
719       temp(nzb,:,: ) = temp(nzb+1,:,:)
720    ELSE
[1353]721       temp(nzb,:,: ) = 0.0_wp
[1]722    ENDIF
723
724    IF ( ibc_p_t == 1 )  THEN
725       temp(nzt_mg(l)+1,:,: ) = temp(nzt_mg(l),:,:)
726    ELSE
[1353]727       temp(nzt_mg(l)+1,:,: ) = 0.0_wp
[1]728    ENDIF
729
730 
[1931]731 END SUBROUTINE prolong_noopt
[1]732
733
734!------------------------------------------------------------------------------!
735! Description:
736! ------------
[1682]737!> Relaxation method for the multigrid scheme. A Gauss-Seidel iteration with
738!> 3D-Red-Black decomposition (GS-RB) is used.
[1]739!------------------------------------------------------------------------------!
[1931]740 SUBROUTINE redblack_noopt( f_mg, p_mg )
[1]741
[1682]742
[1320]743    USE arrays_3d,                                                             &
744        ONLY:  f1_mg, f2_mg, f3_mg
[1]745
[1320]746    USE control_parameters,                                                    &
747        ONLY:  bc_lr_cyc, bc_ns_cyc, grid_level, ibc_p_b, ibc_p_t, inflow_l,   &
[1762]748               inflow_n, inflow_r, inflow_s, ngsrb, nest_bound_l,              &
749               nest_bound_n, nest_bound_r, nest_bound_s, outflow_l, outflow_n, &
[1320]750               outflow_r, outflow_s
751
752    USE cpulog,                                                                &
753        ONLY:  cpu_log, log_point_s
754
755    USE grid_variables,                                                        &
756        ONLY:  ddx2_mg, ddy2_mg
757
758    USE indices,                                                               &
759        ONLY:  flags, wall_flags_1, wall_flags_2, wall_flags_3, wall_flags_4,  &
760               wall_flags_5, wall_flags_6, wall_flags_7, wall_flags_8,         &
761               wall_flags_9, wall_flags_10, nxl_mg, nxr_mg, nys_mg, nyn_mg,    &
762               nzb, nzt_mg
763
764    USE kinds
765
[1]766    IMPLICIT NONE
767
[1682]768    INTEGER(iwp) :: color    !<
769    INTEGER(iwp) :: i        !<
770    INTEGER(iwp) :: ic       !<
771    INTEGER(iwp) :: j        !<
772    INTEGER(iwp) :: jc       !<
773    INTEGER(iwp) :: jj       !<
774    INTEGER(iwp) :: k        !<
775    INTEGER(iwp) :: l        !<
776    INTEGER(iwp) :: n        !<
[1]777
[1682]778    LOGICAL :: unroll        !<
[1]779
[1682]780    REAL(wp) ::  wall_left   !<
781    REAL(wp) ::  wall_north  !<
782    REAL(wp) ::  wall_right  !<
783    REAL(wp) ::  wall_south  !<
784    REAL(wp) ::  wall_total  !<
785    REAL(wp) ::  wall_top    !<
[114]786
[1320]787    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
788                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
[1682]789                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg  !<
[1320]790    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
791                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
[1682]792                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  p_mg  !<
[1]793
794    l = grid_level
795
[114]796!
797!-- Choose flag array of this level
798    SELECT CASE ( l )
799       CASE ( 1 )
800          flags => wall_flags_1
801       CASE ( 2 )
802          flags => wall_flags_2
803       CASE ( 3 )
804          flags => wall_flags_3
805       CASE ( 4 )
806          flags => wall_flags_4
807       CASE ( 5 )
808          flags => wall_flags_5
809       CASE ( 6 )
810          flags => wall_flags_6
811       CASE ( 7 )
812          flags => wall_flags_7
813       CASE ( 8 )
814          flags => wall_flags_8
815       CASE ( 9 )
816          flags => wall_flags_9
817       CASE ( 10 )
818          flags => wall_flags_10
819    END SELECT
820
[1]821    unroll = ( MOD( nyn_mg(l)-nys_mg(l)+1, 4 ) == 0  .AND. &
822               MOD( nxr_mg(l)-nxl_mg(l)+1, 2 ) == 0 )
823
824    DO  n = 1, ngsrb
825       
[1320]826       DO  color = 1, 2
[1]827
828          IF ( .NOT. unroll )  THEN
[778]829
[1931]830             CALL cpu_log( log_point_s(36), 'redblack_no_unroll_noopt', 'start' )
[1]831
832!
833!--          Without unrolling of loops, no cache optimization
834             DO  i = nxl_mg(l), nxr_mg(l), 2
[1320]835                DO  j = nys_mg(l) + 2 - color, nyn_mg(l), 2 
[1]836                   DO  k = nzb+1, nzt_mg(l), 2
[1353]837!                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]838!                                ddx2_mg(l) * ( p_mg(k,j,i+1) + p_mg(k,j,i-1) ) &
839!                              + ddy2_mg(l) * ( p_mg(k,j+1,i) + p_mg(k,j-1,i) ) &
840!                              + f2_mg(k,l) * p_mg(k+1,j,i)                     &
841!                              + f3_mg(k,l) * p_mg(k-1,j,i) - f_mg(k,j,i)       &
842!                                                       )
843
[1353]844                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]845                             ddx2_mg(l) *                                      &
846                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
847                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
848                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
849                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
850                           + ddy2_mg(l) *                                      &
851                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
852                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
853                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
854                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
855                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
856                           + f3_mg(k,l) *                                      &
857                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
858                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
859                           - f_mg(k,j,i)               )
[1]860                   ENDDO
861                ENDDO
862             ENDDO
863   
864             DO  i = nxl_mg(l)+1, nxr_mg(l), 2
[1320]865                DO  j = nys_mg(l) + (color-1), nyn_mg(l), 2
[1]866                   DO  k = nzb+1, nzt_mg(l), 2 
[1353]867                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]868                             ddx2_mg(l) *                                      &
869                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
870                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
871                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
872                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
873                           + ddy2_mg(l) *                                      &
874                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
875                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
876                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
877                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
878                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
879                           + f3_mg(k,l) *                                      &
880                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
881                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
882                           - f_mg(k,j,i)               )
[1]883                   ENDDO
884                ENDDO
885             ENDDO
886 
887             DO  i = nxl_mg(l), nxr_mg(l), 2
[1320]888                DO  j = nys_mg(l) + (color-1), nyn_mg(l), 2
[1]889                   DO  k = nzb+2, nzt_mg(l), 2
[1353]890                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]891                             ddx2_mg(l) *                                      &
892                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
893                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
894                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
895                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
896                           + ddy2_mg(l) *                                      &
897                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
898                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
899                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
900                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
901                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
902                           + f3_mg(k,l) *                                      &
903                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
904                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
905                           - f_mg(k,j,i)               )
[1]906                   ENDDO
907                ENDDO
908             ENDDO
909
910             DO  i = nxl_mg(l)+1, nxr_mg(l), 2
[1320]911                DO  j = nys_mg(l) + 2 - color, nyn_mg(l), 2
[1]912                   DO  k = nzb+2, nzt_mg(l), 2
[1353]913                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]914                             ddx2_mg(l) *                                      &
915                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
916                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
917                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
918                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
919                           + ddy2_mg(l) *                                      &
920                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
921                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
922                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
923                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
924                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
925                           + f3_mg(k,l) *                                      &
926                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
927                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
928                           - f_mg(k,j,i)               )
[1]929                   ENDDO
930                ENDDO
931             ENDDO
[1931]932             CALL cpu_log( log_point_s(36), 'redblack_no_unroll_noopt', 'stop' )
[1]933
934          ELSE
935
936!
937!--          Loop unrolling along y, only one i loop for better cache use
[1931]938             CALL cpu_log( log_point_s(38), 'redblack_unroll_noopt', 'start' )
[1]939             DO  ic = nxl_mg(l), nxr_mg(l), 2
940                DO  jc = nys_mg(l), nyn_mg(l), 4
941                   i  = ic
[1320]942                   jj = jc+2-color
[1]943                   DO  k = nzb+1, nzt_mg(l), 2
944                      j = jj
[1353]945                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]946                             ddx2_mg(l) *                                      &
947                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
948                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
949                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
950                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
951                           + ddy2_mg(l) *                                      &
952                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
953                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
954                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
955                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
956                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
957                           + f3_mg(k,l) *                                      &
958                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
959                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
960                           - f_mg(k,j,i)               )
[1]961                      j = jj+2
[1353]962                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]963                             ddx2_mg(l) *                                      &
964                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
965                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
966                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
967                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
968                           + ddy2_mg(l) *                                      &
969                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
970                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
971                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
972                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
973                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
974                           + f3_mg(k,l) *                                      &
975                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
976                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
977                           - f_mg(k,j,i)               )
[1]978                   ENDDO
979   
980                   i  = ic+1
[1320]981                   jj = jc+color-1
[1]982                   DO  k = nzb+1, nzt_mg(l), 2 
983                      j =jj
[1353]984                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]985                             ddx2_mg(l) *                                      &
986                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
987                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
988                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
989                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
990                           + ddy2_mg(l) *                                      &
991                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
992                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
993                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
994                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
995                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
996                           + f3_mg(k,l) *                                      &
997                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
998                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
999                           - f_mg(k,j,i)               )
[1]1000                      j = jj+2
[1353]1001                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]1002                             ddx2_mg(l) *                                      &
1003                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
1004                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
1005                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
1006                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
1007                           + ddy2_mg(l) *                                      &
1008                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
1009                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
1010                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
1011                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
1012                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
1013                           + f3_mg(k,l) *                                      &
1014                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
1015                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
1016                           - f_mg(k,j,i)               )
[1]1017                   ENDDO
1018
1019                   i  = ic
[1320]1020                   jj = jc+color-1
[1]1021                   DO  k = nzb+2, nzt_mg(l), 2
1022                      j =jj
[1353]1023                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]1024                             ddx2_mg(l) *                                      &
1025                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
1026                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
1027                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
1028                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
1029                           + ddy2_mg(l) *                                      &
1030                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
1031                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
1032                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
1033                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
1034                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
1035                           + f3_mg(k,l) *                                      &
1036                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
1037                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
1038                           - f_mg(k,j,i)               )
[1]1039                      j = jj+2
[1353]1040                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]1041                             ddx2_mg(l) *                                      &
1042                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
1043                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
1044                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
1045                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
1046                           + ddy2_mg(l) *                                      &
1047                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
1048                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
1049                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
1050                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
1051                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
1052                           + f3_mg(k,l) *                                      &
1053                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
1054                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
1055                           - f_mg(k,j,i)               )
[1]1056                   ENDDO
1057
1058                   i  = ic+1
[1320]1059                   jj = jc+2-color
[1]1060                   DO  k = nzb+2, nzt_mg(l), 2
1061                      j =jj
[1353]1062                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]1063                             ddx2_mg(l) *                                      &
1064                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
1065                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
1066                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
1067                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
1068                           + ddy2_mg(l) *                                      &
1069                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
1070                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
1071                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
1072                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
1073                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
1074                           + f3_mg(k,l) *                                      &
1075                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
1076                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
1077                           - f_mg(k,j,i)               )
[1]1078                      j = jj+2
[1353]1079                      p_mg(k,j,i) = 1.0_wp / f1_mg(k,l) * (                    &
[114]1080                             ddx2_mg(l) *                                      &
1081                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
1082                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
1083                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
1084                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
1085                           + ddy2_mg(l) *                                      &
1086                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
1087                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
1088                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
1089                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
1090                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
1091                           + f3_mg(k,l) *                                      &
1092                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
1093                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
1094                           - f_mg(k,j,i)               )
[1]1095                   ENDDO
1096
1097                ENDDO
1098             ENDDO
[1931]1099             CALL cpu_log( log_point_s(38), 'redblack_unroll_noopt', 'stop' )
[1]1100
1101          ENDIF
1102
1103!
1104!--       Horizontal boundary conditions
[667]1105          CALL exchange_horiz( p_mg, 1 )
[1]1106
[707]1107          IF ( .NOT. bc_lr_cyc )  THEN
[1762]1108             IF ( inflow_l .OR. outflow_l .OR. nest_bound_l )  THEN
[1]1109                p_mg(:,:,nxl_mg(l)-1) = p_mg(:,:,nxl_mg(l))
1110             ENDIF
[1762]1111             IF ( inflow_r .OR. outflow_r .OR. nest_bound_r )  THEN
[1]1112                p_mg(:,:,nxr_mg(l)+1) = p_mg(:,:,nxr_mg(l))
1113             ENDIF
1114          ENDIF
1115
[707]1116          IF ( .NOT. bc_ns_cyc )  THEN
[1762]1117             IF ( inflow_n .OR. outflow_n .OR. nest_bound_n )  THEN
[1]1118                p_mg(:,nyn_mg(l)+1,:) = p_mg(:,nyn_mg(l),:)
1119             ENDIF
[1762]1120             IF ( inflow_s .OR. outflow_s .OR. nest_bound_s )  THEN
[1]1121                p_mg(:,nys_mg(l)-1,:) = p_mg(:,nys_mg(l),:)
1122             ENDIF
1123          ENDIF
1124
1125!
1126!--       Bottom and top boundary conditions
1127          IF ( ibc_p_b == 1 )  THEN
1128             p_mg(nzb,:,: ) = p_mg(nzb+1,:,:)
1129          ELSE
[1353]1130             p_mg(nzb,:,: ) = 0.0_wp
[1]1131          ENDIF
1132
1133          IF ( ibc_p_t == 1 )  THEN
1134             p_mg(nzt_mg(l)+1,:,: ) = p_mg(nzt_mg(l),:,:)
1135          ELSE
[1353]1136             p_mg(nzt_mg(l)+1,:,: ) = 0.0_wp
[1]1137          ENDIF
1138
1139       ENDDO
1140
1141    ENDDO
1142
[114]1143!
1144!-- Set pressure within topography and at the topography surfaces
1145!$OMP PARALLEL PRIVATE (i,j,k,wall_left,wall_north,wall_right,wall_south,wall_top,wall_total)
1146!$OMP DO
1147    DO  i = nxl_mg(l), nxr_mg(l)
1148       DO  j = nys_mg(l), nyn_mg(l) 
1149          DO  k = nzb, nzt_mg(l)
1150!
1151!--          First, set pressure inside topography to zero
[1353]1152             p_mg(k,j,i) = p_mg(k,j,i) * ( 1.0_wp - IBITS( flags(k,j,i), 6, 1 ) )
[114]1153!
1154!--          Second, determine if the gridpoint inside topography is adjacent
1155!--          to a wall and set its value to a value given by the average of
1156!--          those values obtained from Neumann boundary condition
1157             wall_left  = IBITS( flags(k,j,i-1), 5, 1 )
1158             wall_right = IBITS( flags(k,j,i+1), 4, 1 )
1159             wall_south = IBITS( flags(k,j-1,i), 3, 1 )
1160             wall_north = IBITS( flags(k,j+1,i), 2, 1 )
1161             wall_top   = IBITS( flags(k+1,j,i), 0, 1 )
1162             wall_total = wall_left + wall_right + wall_south + wall_north + &
1163                          wall_top
[1]1164
[1353]1165             IF ( wall_total > 0.0_wp )  THEN
1166                p_mg(k,j,i) = 1.0_wp / wall_total *                 &
1167                                     ( wall_left  * p_mg(k,j,i-1) + &
1168                                       wall_right * p_mg(k,j,i+1) + &
1169                                       wall_south * p_mg(k,j-1,i) + &
1170                                       wall_north * p_mg(k,j+1,i) + &
1171                                       wall_top   * p_mg(k+1,j,i) )
[114]1172             ENDIF
1173          ENDDO
1174       ENDDO
1175    ENDDO
[1056]1176!$OMP END PARALLEL
[114]1177
1178!
1179!-- One more time horizontal boundary conditions
[667]1180    CALL exchange_horiz( p_mg, 1)
[114]1181
[778]1182
[1931]1183 END SUBROUTINE redblack_noopt
[1]1184
1185
1186
[1682]1187!------------------------------------------------------------------------------!
1188! Description:
1189! ------------
1190!> Gather subdomain data from all PEs.
1191!------------------------------------------------------------------------------!
[1931]1192 SUBROUTINE mg_gather_noopt( f2, f2_sub )
[1]1193
[1320]1194    USE control_parameters,                                                    &
1195        ONLY:  grid_level
1196
1197    USE cpulog,                                                                &
1198        ONLY:  cpu_log, log_point_s
1199
1200    USE indices,                                                               &
1201        ONLY:  mg_loc_ind, nxl_mg, nxr_mg, nys_mg, nyn_mg, nzb, nzt_mg
1202
1203    USE kinds
1204
[1]1205    USE pegrid
1206
1207    IMPLICIT NONE
1208
[1682]1209    INTEGER(iwp) ::  i       !<
1210    INTEGER(iwp) ::  il      !<
1211    INTEGER(iwp) ::  ir      !<
1212    INTEGER(iwp) ::  j       !<
1213    INTEGER(iwp) ::  jn      !<
1214    INTEGER(iwp) ::  js      !<
1215    INTEGER(iwp) ::  k       !<
1216    INTEGER(iwp) ::  nwords  !<
[1]1217
[1320]1218    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1219                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
[1682]1220                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f2    !<
[1320]1221    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1222                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
[1682]1223                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f2_l  !<
[1]1224
[1320]1225    REAL(wp), DIMENSION(nzb:mg_loc_ind(5,myid)+1,                              &
1226                        mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,             &
[1682]1227                        mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) ::  f2_sub  !<
[1]1228
1229
1230#if defined( __parallel )
[1931]1231    CALL cpu_log( log_point_s(34), 'mg_gather_noopt', 'start' )
[1]1232
[1353]1233    f2_l = 0.0_wp
[1]1234
1235!
[707]1236!-- Store the local subdomain array on the total array
1237    js = mg_loc_ind(3,myid)
1238    IF ( south_border_pe )  js = js - 1
1239    jn = mg_loc_ind(4,myid)
1240    IF ( north_border_pe )  jn = jn + 1
1241    il = mg_loc_ind(1,myid)
1242    IF ( left_border_pe )   il = il - 1
1243    ir = mg_loc_ind(2,myid)
1244    IF ( right_border_pe )  ir = ir + 1
1245    DO  i = il, ir
1246       DO  j = js, jn
1247          DO  k = nzb, nzt_mg(grid_level)+1
1248             f2_l(k,j,i) = f2_sub(k,j,i)
1249          ENDDO
[1]1250       ENDDO
[707]1251    ENDDO
[1]1252
1253!
[707]1254!-- Find out the number of array elements of the total array
1255    nwords = SIZE( f2 )
[1]1256
[707]1257!
1258!-- Gather subdomain data from all PEs
1259    IF ( collective_wait )  CALL MPI_BARRIER( comm2d, ierr )
1260    CALL MPI_ALLREDUCE( f2_l(nzb,nys_mg(grid_level)-1,nxl_mg(grid_level)-1), &
1261                        f2(nzb,nys_mg(grid_level)-1,nxl_mg(grid_level)-1),   &
1262                        nwords, MPI_REAL, MPI_SUM, comm2d, ierr )
1263
[1931]1264    CALL cpu_log( log_point_s(34), 'mg_gather_noopt', 'stop' )
[1]1265#endif
1266   
[1931]1267 END SUBROUTINE mg_gather_noopt
[1]1268
1269
1270
[1682]1271!------------------------------------------------------------------------------!
1272! Description:
1273! ------------
1274!> @todo It may be possible to improve the speed of this routine by using
1275!>       non-blocking communication
1276!------------------------------------------------------------------------------!
[1931]1277 SUBROUTINE mg_scatter_noopt( p2, p2_sub )
[1]1278
[1320]1279    USE control_parameters,                                                    &
1280        ONLY:  grid_level
1281
1282    USE cpulog,                                                                &
1283        ONLY:  cpu_log, log_point_s
1284
1285    USE indices,                                                               &
1286        ONLY:  mg_loc_ind, nxl_mg, nxr_mg, nys_mg, nyn_mg, nzb, nzt_mg
1287
1288    USE kinds
1289
[1]1290    USE pegrid
1291
1292    IMPLICIT NONE
1293
[1682]1294    INTEGER(iwp) ::  nwords  !<
[1]1295
[1320]1296    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level-1)+1,                            &
1297                        nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,         &
[1682]1298                        nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1) ::  p2  !<
[1]1299
[1320]1300    REAL(wp), DIMENSION(nzb:mg_loc_ind(5,myid)+1,                              &
1301                        mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,             &
[1682]1302                        mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) ::  p2_sub  !<
[1]1303
1304!
1305!-- Find out the number of array elements of the subdomain array
1306    nwords = SIZE( p2_sub )
1307
1308#if defined( __parallel )
[1931]1309    CALL cpu_log( log_point_s(35), 'mg_scatter_noopt', 'start' )
[1]1310
[707]1311    p2_sub = p2(:,mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1, &
1312                  mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1)
[1]1313
[1931]1314    CALL cpu_log( log_point_s(35), 'mg_scatter_noopt', 'stop' )
[1]1315#endif
1316   
[1931]1317 END SUBROUTINE mg_scatter_noopt
[1]1318
1319
1320!------------------------------------------------------------------------------!
1321! Description:
1322! ------------
[1682]1323!> This is where the multigrid technique takes place. V- and W- Cycle are
1324!> implemented and steered by the parameter "gamma". Parameter "nue" determines
1325!> the convergence of the multigrid iterative solution. There are nue times
1326!> RB-GS iterations. It should be set to "1" or "2", considering the time effort
1327!> one would like to invest. Last choice shows a very good converging factor,
1328!> but leads to an increase in computing time.
[1]1329!------------------------------------------------------------------------------!
[1931]1330 RECURSIVE SUBROUTINE next_mg_level_noopt( f_mg, p_mg, p3, r )
[1]1331
[1320]1332    USE control_parameters,                                                    &
1333        ONLY:  bc_lr_dirrad, bc_lr_raddir, bc_ns_dirrad, bc_ns_raddir,         &
1334               gamma_mg, grid_level, grid_level_count, ibc_p_b, ibc_p_t,       &
1335               inflow_l, inflow_n, inflow_r, inflow_s, maximum_grid_level,     &
[1762]1336               mg_switch_to_pe0_level, mg_switch_to_pe0, nest_domain,          &
1337               nest_bound_l, nest_bound_n, nest_bound_r, nest_bound_s, ngsrb,  &
1338               outflow_l, outflow_n, outflow_r, outflow_s
[1320]1339
1340
1341    USE indices,                                                               &
1342        ONLY:  mg_loc_ind, nxl, nxl_mg, nxr, nxr_mg, nys, nys_mg, nyn,         &
1343               nyn_mg, nzb, nzt, nzt_mg
1344
1345    USE kinds
1346
[1]1347    USE pegrid
1348
1349    IMPLICIT NONE
1350
[1682]1351    INTEGER(iwp) ::  i            !<
1352    INTEGER(iwp) ::  j            !<
1353    INTEGER(iwp) ::  k            !<
1354    INTEGER(iwp) ::  nxl_mg_save  !<
1355    INTEGER(iwp) ::  nxr_mg_save  !<
1356    INTEGER(iwp) ::  nyn_mg_save  !<
1357    INTEGER(iwp) ::  nys_mg_save  !<
1358    INTEGER(iwp) ::  nzt_mg_save  !<
[1]1359
[1320]1360    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1361                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
[1682]1362                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: f_mg  !<
[1320]1363    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1364                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
[1682]1365                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: p_mg  !<
[1320]1366    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1367                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
[1682]1368                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: p3    !<
[1320]1369    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level)+1,                              &
1370                        nys_mg(grid_level)-1:nyn_mg(grid_level)+1,             &
[1682]1371                        nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: r     !<
[1]1372
[1320]1373    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level-1)+1,                            &
1374                        nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,         &
[1682]1375                        nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1) ::  f2  !<
[1320]1376    REAL(wp), DIMENSION(nzb:nzt_mg(grid_level-1)+1,                            &
1377                        nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,         &
[1682]1378                        nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1) ::  p2  !<
[1]1379
[1682]1380    REAL(wp), DIMENSION(:,:,:), ALLOCATABLE ::  f2_sub  !<
1381    REAL(wp), DIMENSION(:,:,:), ALLOCATABLE ::  p2_sub  !<
[778]1382
[1]1383!
1384!-- Restriction to the coarsest grid
1385 10 IF ( grid_level == 1 )  THEN
1386
1387!
1388!--    Solution on the coarsest grid. Double the number of Gauss-Seidel
1389!--    iterations in order to get a more accurate solution.
1390       ngsrb = 2 * ngsrb
[778]1391
[1931]1392       CALL redblack_noopt( f_mg, p_mg )
[778]1393
[1]1394       ngsrb = ngsrb / 2
1395
[778]1396
[1]1397    ELSEIF ( grid_level /= 1 )  THEN
1398
1399       grid_level_count(grid_level) = grid_level_count(grid_level) + 1
1400
1401!
1402!--    Solution on the actual grid level
[1931]1403       CALL redblack_noopt( f_mg, p_mg )
[1]1404
1405!
1406!--    Determination of the actual residual
[1931]1407       CALL resid_noopt( f_mg, p_mg, r )
[1]1408
1409!
1410!--    Restriction of the residual (finer grid values!) to the next coarser
1411!--    grid. Therefore, the grid level has to be decremented now. nxl..nzt have
1412!--    to be set to the coarse grid values, because these variables are needed
1413!--    for the exchange of ghost points in routine exchange_horiz
1414       grid_level = grid_level - 1
1415       nxl = nxl_mg(grid_level)
[778]1416       nys = nys_mg(grid_level)
[1]1417       nxr = nxr_mg(grid_level)
1418       nyn = nyn_mg(grid_level)
1419       nzt = nzt_mg(grid_level)
1420
1421       IF ( grid_level == mg_switch_to_pe0_level )  THEN
[778]1422
[1]1423!
1424!--       From this level on, calculations are done on PE0 only.
1425!--       First, carry out restriction on the subdomain.
1426!--       Therefore, indices of the level have to be changed to subdomain values
1427!--       in between (otherwise, the restrict routine would expect
1428!--       the gathered array)
[778]1429
[1]1430          nxl_mg_save = nxl_mg(grid_level)
1431          nxr_mg_save = nxr_mg(grid_level)
1432          nys_mg_save = nys_mg(grid_level)
1433          nyn_mg_save = nyn_mg(grid_level)
1434          nzt_mg_save = nzt_mg(grid_level)
1435          nxl_mg(grid_level) = mg_loc_ind(1,myid)
1436          nxr_mg(grid_level) = mg_loc_ind(2,myid)
1437          nys_mg(grid_level) = mg_loc_ind(3,myid)
1438          nyn_mg(grid_level) = mg_loc_ind(4,myid)
1439          nzt_mg(grid_level) = mg_loc_ind(5,myid)
1440          nxl = mg_loc_ind(1,myid)
1441          nxr = mg_loc_ind(2,myid)
1442          nys = mg_loc_ind(3,myid)
1443          nyn = mg_loc_ind(4,myid)
1444          nzt = mg_loc_ind(5,myid)
1445
1446          ALLOCATE( f2_sub(nzb:nzt_mg(grid_level)+1,                    &
1447                           nys_mg(grid_level)-1:nyn_mg(grid_level)+1,   &
1448                           nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) )
1449
[1931]1450          CALL restrict_noopt( f2_sub, r )
[1]1451
1452!
1453!--       Restore the correct indices of this level
1454          nxl_mg(grid_level) = nxl_mg_save
1455          nxr_mg(grid_level) = nxr_mg_save
1456          nys_mg(grid_level) = nys_mg_save
1457          nyn_mg(grid_level) = nyn_mg_save
1458          nzt_mg(grid_level) = nzt_mg_save
1459          nxl = nxl_mg(grid_level)
1460          nxr = nxr_mg(grid_level)
1461          nys = nys_mg(grid_level)
1462          nyn = nyn_mg(grid_level)
1463          nzt = nzt_mg(grid_level)
1464!
1465!--       Gather all arrays from the subdomains on PE0
[1931]1466          CALL mg_gather_noopt( f2, f2_sub )
[1]1467
1468!
1469!--       Set switch for routine exchange_horiz, that no ghostpoint exchange
1470!--       has to be carried out from now on
1471          mg_switch_to_pe0 = .TRUE.
1472
1473!
1474!--       In case of non-cyclic lateral boundary conditions, both in- and
[707]1475!--       outflow conditions have to be used on all PEs after the switch,
1476!--       because then they have the total domain.
[1159]1477          IF ( bc_lr_dirrad )  THEN
[707]1478             inflow_l  = .TRUE.
1479             inflow_r  = .FALSE.
1480             outflow_l = .FALSE.
1481             outflow_r = .TRUE.
[1159]1482          ELSEIF ( bc_lr_raddir )  THEN
[707]1483             inflow_l  = .FALSE.
1484             inflow_r  = .TRUE.
1485             outflow_l = .TRUE.
1486             outflow_r = .FALSE.
[1762]1487          ELSEIF ( nest_domain )  THEN
1488             nest_bound_l = .TRUE.
1489             nest_bound_r = .TRUE.
[1]1490          ENDIF
1491
[1159]1492          IF ( bc_ns_dirrad )  THEN
[707]1493             inflow_n  = .TRUE.
1494             inflow_s  = .FALSE.
1495             outflow_n = .FALSE.
1496             outflow_s = .TRUE.
[1159]1497          ELSEIF ( bc_ns_raddir )  THEN
[707]1498             inflow_n  = .FALSE.
1499             inflow_s  = .TRUE.
1500             outflow_n = .TRUE.
1501             outflow_s = .FALSE.
[1762]1502          ELSEIF ( nest_domain )  THEN
1503             nest_bound_s = .TRUE.
1504             nest_bound_n = .TRUE.
[707]1505          ENDIF
1506
[1]1507          DEALLOCATE( f2_sub )
1508
1509       ELSE
[1056]1510
[1931]1511          CALL restrict_noopt( f2, r )
[1]1512
1513       ENDIF
[707]1514
[1353]1515       p2 = 0.0_wp
[1]1516
1517!
1518!--    Repeat the same procedure till the coarsest grid is reached
[1931]1519       CALL next_mg_level_noopt( f2, p2, p3, r )
[1]1520
1521    ENDIF
1522
1523!
1524!-- Now follows the prolongation
1525    IF ( grid_level >= 2 )  THEN
1526
1527!
1528!--    Prolongation of the new residual. The values are transferred
1529!--    from the coarse to the next finer grid.
1530       IF ( grid_level == mg_switch_to_pe0_level+1 )  THEN
[879]1531
1532#if defined( __parallel )
[1]1533!
1534!--       At this level, the new residual first has to be scattered from
1535!--       PE0 to the other PEs
1536          ALLOCATE( p2_sub(nzb:mg_loc_ind(5,myid)+1,             &
1537                    mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,   &
1538                    mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) )
1539
[1931]1540          CALL mg_scatter_noopt( p2, p2_sub )
[1]1541
1542!
1543!--       Therefore, indices of the previous level have to be changed to
1544!--       subdomain values in between (otherwise, the prolong routine would
1545!--       expect the gathered array)
1546          nxl_mg_save = nxl_mg(grid_level-1)
1547          nxr_mg_save = nxr_mg(grid_level-1)
1548          nys_mg_save = nys_mg(grid_level-1)
1549          nyn_mg_save = nyn_mg(grid_level-1)
1550          nzt_mg_save = nzt_mg(grid_level-1)
1551          nxl_mg(grid_level-1) = mg_loc_ind(1,myid)
1552          nxr_mg(grid_level-1) = mg_loc_ind(2,myid)
1553          nys_mg(grid_level-1) = mg_loc_ind(3,myid)
1554          nyn_mg(grid_level-1) = mg_loc_ind(4,myid)
1555          nzt_mg(grid_level-1) = mg_loc_ind(5,myid)
1556
1557!
1558!--       Set switch for routine exchange_horiz, that ghostpoint exchange
1559!--       has to be carried again out from now on
1560          mg_switch_to_pe0 = .FALSE.
1561
1562!
[707]1563!--       For non-cyclic lateral boundary conditions, restore the
1564!--       in-/outflow conditions
1565          inflow_l  = .FALSE.;  inflow_r  = .FALSE.
1566          inflow_n  = .FALSE.;  inflow_s  = .FALSE.
1567          outflow_l = .FALSE.;  outflow_r = .FALSE.
1568          outflow_n = .FALSE.;  outflow_s = .FALSE.
1569
1570          IF ( pleft == MPI_PROC_NULL )  THEN
[1159]1571             IF ( bc_lr_dirrad )  THEN
[707]1572                inflow_l  = .TRUE.
[1159]1573             ELSEIF ( bc_lr_raddir )  THEN
[707]1574                outflow_l = .TRUE.
[1762]1575             ELSEIF ( nest_domain )  THEN
1576                nest_bound_l = .TRUE.
[1]1577             ENDIF
[707]1578          ENDIF
1579
1580          IF ( pright == MPI_PROC_NULL )  THEN
[1159]1581             IF ( bc_lr_dirrad )  THEN
[707]1582                outflow_r = .TRUE.
[1159]1583             ELSEIF ( bc_lr_raddir )  THEN
[707]1584                inflow_r  = .TRUE.
[1762]1585             ELSEIF ( nest_domain )  THEN
1586                nest_bound_r = .TRUE.
[1]1587             ENDIF
1588          ENDIF
1589
[707]1590          IF ( psouth == MPI_PROC_NULL )  THEN
[1159]1591             IF ( bc_ns_dirrad )  THEN
[707]1592                outflow_s = .TRUE.
[1159]1593             ELSEIF ( bc_ns_raddir )  THEN
[707]1594                inflow_s  = .TRUE.
[1762]1595             ELSEIF ( nest_domain )  THEN
1596                nest_bound_s = .TRUE.
[707]1597             ENDIF
1598          ENDIF
1599
1600          IF ( pnorth == MPI_PROC_NULL )  THEN
[1159]1601             IF ( bc_ns_dirrad )  THEN
[707]1602                inflow_n  = .TRUE.
[1159]1603             ELSEIF ( bc_ns_raddir )  THEN
[707]1604                outflow_n = .TRUE.
[1762]1605             ELSEIF ( nest_domain )  THEN
1606                nest_bound_n = .TRUE.
[707]1607             ENDIF
1608          ENDIF
1609
[1931]1610          CALL prolong_noopt( p2_sub, p3 )
[1]1611
1612!
1613!--       Restore the correct indices of the previous level
1614          nxl_mg(grid_level-1) = nxl_mg_save
1615          nxr_mg(grid_level-1) = nxr_mg_save
1616          nys_mg(grid_level-1) = nys_mg_save
1617          nyn_mg(grid_level-1) = nyn_mg_save
1618          nzt_mg(grid_level-1) = nzt_mg_save
1619
1620          DEALLOCATE( p2_sub )
[879]1621#endif
[1]1622
1623       ELSE
[879]1624
[1931]1625          CALL prolong_noopt( p2, p3 )
[1]1626
1627       ENDIF
1628
1629!
1630!--    Computation of the new pressure correction. Therefore,
1631!--    values from prior grids are added up automatically stage by stage.
1632       DO  i = nxl_mg(grid_level)-1, nxr_mg(grid_level)+1
1633          DO  j = nys_mg(grid_level)-1, nyn_mg(grid_level)+1
1634             DO  k = nzb, nzt_mg(grid_level)+1 
1635                p_mg(k,j,i) = p_mg(k,j,i) + p3(k,j,i)
1636             ENDDO
1637          ENDDO
1638       ENDDO
1639
1640!
1641!--    Relaxation of the new solution
[1931]1642       CALL redblack_noopt( f_mg, p_mg )
[1]1643
1644    ENDIF
1645
[778]1646
[1]1647!
1648!-- The following few lines serve the steering of the multigrid scheme
1649    IF ( grid_level == maximum_grid_level )  THEN
1650
1651       GOTO 20
1652
1653    ELSEIF ( grid_level /= maximum_grid_level  .AND.  grid_level /= 1  .AND. &
1654             grid_level_count(grid_level) /= gamma_mg )  THEN
1655
1656       GOTO 10
1657
1658    ENDIF
1659
1660!
[1931]1661!-- Reset counter for the next call of poismg_noopt
[1]1662    grid_level_count(grid_level) = 0
1663
1664!
1665!-- Continue with the next finer level. nxl..nzt have to be
1666!-- set to the finer grid values, because these variables are needed for the
1667!-- exchange of ghost points in routine exchange_horiz
1668    grid_level = grid_level + 1
1669    nxl = nxl_mg(grid_level)
1670    nxr = nxr_mg(grid_level)
1671    nys = nys_mg(grid_level)
1672    nyn = nyn_mg(grid_level)
1673    nzt = nzt_mg(grid_level)
1674
1675 20 CONTINUE
1676
[1931]1677 END SUBROUTINE next_mg_level_noopt
Note: See TracBrowser for help on using the repository browser.