source: palm/trunk/SOURCE/poismg.f90 @ 210

Last change on this file since 210 was 198, checked in by raasch, 16 years ago

file headers updated for the next release 3.5

  • Property svn:keywords set to Id
File size: 54.2 KB
RevLine 
[1]1 SUBROUTINE poismg( r )
2
3!------------------------------------------------------------------------------!
4! Attention: Loop unrolling and cache optimization in SOR-Red/Black method
5!            still does not bring the expected speedup on ibm! Further work
6!            is required.
7!
8! Actual revisions:
9! -----------------
[198]10!
[1]11!
12! Former revisions:
13! -----------------
[3]14! $Id: poismg.f90 198 2008-09-17 08:55:28Z raasch $
[77]15!
[198]16! 181 2008-07-30 07:07:47Z raasch
17! Bugfix: grid_level+1 has to be used in restrict for flags-array
18!
[139]19! 114 2007-10-10 00:03:15Z raasch
20! Boundary conditions at walls are implicitly set using flag arrays. Only
21! Neumann BC is allowed. Upper walls are still not realized.
22! Bottom and top BCs for array f_mg in restrict removed because boundary
23! values are not needed (right hand side of SOR iteration).
24!
[77]25! 75 2007-03-22 09:54:05Z raasch
26! 2nd+3rd argument removed from exchange horiz
27!
[3]28! RCS Log replace by Id keyword, revision history cleaned up
29!
[1]30! Revision 1.6  2005/03/26 20:55:54  raasch
31! Implementation of non-cyclic (Neumann) horizontal boundary conditions,
32! routine prolong simplified (one call of exchange_horiz spared)
33!
34! Revision 1.1  2001/07/20 13:10:51  raasch
35! Initial revision
36!
37!
38! Description:
39! ------------
40! Solves the Poisson equation for the perturbation pressure with a multigrid
41! V- or W-Cycle scheme.
42!
43! This multigrid method was originally developed for PALM by Joerg Uhlenbrock,
44! September 2000 - July 2001.
45!------------------------------------------------------------------------------!
46
47    USE arrays_3d
48    USE control_parameters
49    USE cpulog   
50    USE grid_variables
51    USE indices
52    USE interfaces
53    USE pegrid
54
55    IMPLICIT NONE
56
57    REAL    ::  maxerror, maximum_mgcycles, residual_norm
58
59    REAL, DIMENSION(nzb:nzt+1,nys-1:nyn+1,nxl-1:nxr+1) ::  r
60
61    REAL, DIMENSION(:,:,:), ALLOCATABLE ::  p3
62
63
64    CALL cpu_log( log_point_s(29), 'poismg', 'start' )
65
66
67!
68!-- Initialize arrays and variables used in this subroutine
69    ALLOCATE ( p3(nzb:nzt+1,nys-1:nyn+1,nxl-1:nxr+1) )
70
71
72!
73!-- Some boundaries have to be added to divergence array
[75]74    CALL exchange_horiz( d )
[1]75    d(nzb,:,:) = d(nzb+1,:,:)
76
77!
78!-- Initiation of the multigrid scheme. Does n cycles until the
79!-- residual is smaller than the given limit. The accuracy of the solution
80!-- of the poisson equation will increase with the number of cycles.
81!-- If the number of cycles is preset by the user, this number will be
82!-- carried out regardless of the accuracy.
83    grid_level_count =   0
84    mgcycles         =   0
85    IF ( mg_cycles == -1 )  THEN
86       maximum_mgcycles = 0
87       residual_norm    = 1.0 
88    ELSE
89       maximum_mgcycles = mg_cycles
90       residual_norm    = 0.0
91    ENDIF
92
93    DO WHILE ( residual_norm > residual_limit  .OR. &
94               mgcycles < maximum_mgcycles )
95
96       CALL next_mg_level( d, p, p3, r)
97       
98!
99!--    Calculate the residual if the user has not preset the number of
100!--    cycles to be performed
101       IF ( maximum_mgcycles == 0 )  THEN
102          CALL resid( d, p, r )
103          maxerror = SUM( r(nzb+1:nzt,nys:nyn,nxl:nxr)**2 )
104#if defined( __parallel )
105          CALL MPI_ALLREDUCE( maxerror, residual_norm, 1, MPI_REAL, MPI_SUM, &
106                              comm2d, ierr)
107#else
108          residual_norm = maxerror
109#endif
110          residual_norm = SQRT( residual_norm )
111       ENDIF
112
113       mgcycles = mgcycles + 1
114
115!
116!--    If the user has not limited the number of cycles, stop the run in case
117!--    of insufficient convergence
118       IF ( mgcycles > 1000  .AND.  mg_cycles == -1 )  THEN
119          IF ( myid == 0 )  THEN
120             PRINT*, '+++ poismg: no sufficient convergence within 1000 cycles'
121          ENDIF
122          CALL local_stop 
123       ENDIF
124
125    ENDDO
126
127    DEALLOCATE( p3 )
128
129    CALL cpu_log( log_point_s(29), 'poismg', 'stop' )
130
131 END SUBROUTINE poismg
132
133
134
135 SUBROUTINE resid( f_mg, p_mg, r )
136
137!------------------------------------------------------------------------------!
138! Description:
139! ------------
140! Computes the residual of the perturbation pressure.
141!------------------------------------------------------------------------------!
142
143    USE arrays_3d
144    USE control_parameters
145    USE grid_variables
146    USE indices
147    USE pegrid
148
149    IMPLICIT NONE
150
151    INTEGER ::  i, j, k, l
152
153    REAL, DIMENSION(nzb:nzt_mg(grid_level)+1,                                  &
154                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                 &
155                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg, p_mg, r
156
157!
158!-- Calculate the residual
159    l = grid_level
160
[114]161!
162!-- Choose flag array of this level
163    SELECT CASE ( l )
164       CASE ( 1 )
165          flags => wall_flags_1
166       CASE ( 2 )
167          flags => wall_flags_2
168       CASE ( 3 )
169          flags => wall_flags_3
170       CASE ( 4 )
171          flags => wall_flags_4
172       CASE ( 5 )
173          flags => wall_flags_5
174       CASE ( 6 )
175          flags => wall_flags_6
176       CASE ( 7 )
177          flags => wall_flags_7
178       CASE ( 8 )
179          flags => wall_flags_8
180       CASE ( 9 )
181          flags => wall_flags_9
182       CASE ( 10 )
183          flags => wall_flags_10
184    END SELECT
185
[1]186!$OMP PARALLEL PRIVATE (i,j,k)
187!$OMP DO
188    DO  i = nxl_mg(l), nxr_mg(l)
189       DO  j = nys_mg(l), nyn_mg(l) 
190          DO  k = nzb+1, nzt_mg(l)
[114]191             r(k,j,i) = f_mg(k,j,i)                                         &
192                        - ddx2_mg(l) *                                      &
193                            ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
194                                          ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
195                              p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
196                                          ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
197                        - ddy2_mg(l) *                                      &
198                            ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
199                                          ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
200                              p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
201                                          ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
202                        - f2_mg(k,l) * p_mg(k+1,j,i)                        &
203                        - f3_mg(k,l) *                                      &
204                            ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
205                                          ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
[1]206                        + f1_mg(k,l) * p_mg(k,j,i)
[114]207!
208!--          Residual within topography should be zero
209             r(k,j,i) = r(k,j,i) * ( 1.0 - IBITS( flags(k,j,i), 6, 1 ) )
[1]210          ENDDO
211       ENDDO
212    ENDDO
213!$OMP END PARALLEL
214
215!
216!-- Horizontal boundary conditions
[75]217    CALL exchange_horiz( r )
[1]218
219    IF ( bc_lr /= 'cyclic' )  THEN
220       IF ( inflow_l .OR. outflow_l )  r(:,:,nxl_mg(l)-1) = r(:,:,nxl_mg(l))
221       IF ( inflow_r .OR. outflow_r )  r(:,:,nxr_mg(l)+1) = r(:,:,nxr_mg(l))
222    ENDIF
223
224    IF ( bc_ns /= 'cyclic' )  THEN
225       IF ( inflow_n .OR. outflow_n )  r(:,nyn_mg(l)+1,:) = r(:,nyn_mg(l),:)
226       IF ( inflow_s .OR. outflow_s )  r(:,nys_mg(l)-1,:) = r(:,nys_mg(l),:)
227    ENDIF
228
229!
[114]230!-- Top boundary condition
231!-- A Neumann boundary condition for r is implicitly set in routine restrict
[1]232    IF ( ibc_p_t == 1 )  THEN
233       r(nzt_mg(l)+1,:,: ) = r(nzt_mg(l),:,:)
234    ELSE
235       r(nzt_mg(l)+1,:,: ) = 0.0
236    ENDIF
237
238
239 END SUBROUTINE resid
240
241
242
243 SUBROUTINE restrict( f_mg, r )
244
245!------------------------------------------------------------------------------!
246! Description:
247! ------------
248! Interpolates the residual on the next coarser grid with "full weighting"
249! scheme
250!------------------------------------------------------------------------------!
251
252    USE control_parameters
253    USE grid_variables
254    USE indices
255    USE pegrid
256
257    IMPLICIT NONE
258
259    INTEGER ::  i, ic, j, jc, k, kc, l
260
[114]261    REAL ::  rkjim, rkjip, rkjmi, rkjmim, rkjmip, rkjpi, rkjpim, rkjpip,       &
262             rkmji, rkmjim, rkmjip, rkmjmi, rkmjmim, rkmjmip, rkmjpi, rkmjpim, &
263             rkmjpip
264
[1]265    REAL, DIMENSION(nzb:nzt_mg(grid_level)+1,                            &
266                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,           &
267                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg
268
269    REAL, DIMENSION(nzb:nzt_mg(grid_level+1)+1,                          &
270                    nys_mg(grid_level+1)-1:nyn_mg(grid_level+1)+1,       &
271                    nxl_mg(grid_level+1)-1:nxr_mg(grid_level+1)+1) ::  r
272
273!
274!-- Interpolate the residual
275    l = grid_level
276
[114]277!
278!-- Choose flag array of the upper level
[181]279    SELECT CASE ( l+1 )
[114]280       CASE ( 1 )
281          flags => wall_flags_1
282       CASE ( 2 )
283          flags => wall_flags_2
284       CASE ( 3 )
285          flags => wall_flags_3
286       CASE ( 4 )
287          flags => wall_flags_4
288       CASE ( 5 )
289          flags => wall_flags_5
290       CASE ( 6 )
291          flags => wall_flags_6
292       CASE ( 7 )
293          flags => wall_flags_7
294       CASE ( 8 )
295          flags => wall_flags_8
296       CASE ( 9 )
297          flags => wall_flags_9
298       CASE ( 10 )
299          flags => wall_flags_10
300    END SELECT
301   
[1]302!$OMP PARALLEL PRIVATE (i,j,k,ic,jc,kc)
303!$OMP DO
304    DO  ic = nxl_mg(l), nxr_mg(l)   
305       i = 2*ic 
306       DO  jc = nys_mg(l), nyn_mg(l) 
307          j = 2*jc
308          DO  kc = nzb+1, nzt_mg(l)
309             k = 2*kc-1
[114]310!
311!--          Use implicit Neumann BCs if the respective gridpoint is inside
312!--          the building
313             rkjim   = r(k,j,i-1)     + IBITS( flags(k,j,i-1), 6, 1 ) *     &
314                                        ( r(k,j,i) - r(k,j,i-1) )
315             rkjip   = r(k,j,i+1)     + IBITS( flags(k,j,i+1), 6, 1 ) *     &
316                                        ( r(k,j,i) - r(k,j,i+1) )
317             rkjpi   = r(k,j+1,i)     + IBITS( flags(k,j+1,i), 6, 1 ) *     &
318                                        ( r(k,j,i) - r(k,j+1,i) )
319             rkjmi   = r(k,j-1,i)     + IBITS( flags(k,j-1,i), 6, 1 ) *     &
320                                        ( r(k,j,i) - r(k,j-1,i) )
321             rkjmim  = r(k,j-1,i-1)   + IBITS( flags(k,j-1,i-1), 6, 1 ) *   &
322                                        ( r(k,j,i) - r(k,j-1,i-1) )
323             rkjpim  = r(k,j+1,i-1)   + IBITS( flags(k,j+1,i-1), 6, 1 ) *   &
324                                        ( r(k,j,i) - r(k,j+1,i-1) )
325             rkjmip  = r(k,j-1,i+1)   + IBITS( flags(k,j-1,i+1), 6, 1 ) *   &
326                                        ( r(k,j,i) - r(k,j-1,i+1) )
327             rkjpip  = r(k,j+1,i+1)   + IBITS( flags(k,j+1,i+1), 6, 1 ) *   &
328                                        ( r(k,j,i) - r(k,j+1,i+1) )
329             rkmji   = r(k-1,j,i)     + IBITS( flags(k-1,j,i), 6, 1 ) *     &
330                                        ( r(k,j,i) - r(k-1,j,i) )
331             rkmjim  = r(k-1,j,i-1)   + IBITS( flags(k-1,j,i-1), 6, 1 ) *   &
332                                        ( r(k,j,i) - r(k-1,j,i-1) )
333             rkmjip  = r(k-1,j,i+1)   + IBITS( flags(k-1,j,i+1), 6, 1 ) *   &
334                                        ( r(k,j,i) - r(k-1,j,i+1) )
335             rkmjpi  = r(k-1,j+1,i)   + IBITS( flags(k-1,j+1,i), 6, 1 ) *   &
336                                        ( r(k,j,i) - r(k-1,j+1,i) )
337             rkmjmi  = r(k-1,j-1,i)   + IBITS( flags(k-1,j-1,i), 6, 1 ) *   &
338                                        ( r(k,j,i) - r(k-1,j-1,i) )
339             rkmjmim = r(k-1,j-1,i-1) + IBITS( flags(k-1,j-1,i-1), 6, 1 ) * &
340                                        ( r(k,j,i) - r(k-1,j-1,i-1) )
341             rkmjpim = r(k-1,j+1,i-1) + IBITS( flags(k-1,j+1,i-1), 6, 1 ) * &
342                                        ( r(k,j,i) - r(k-1,j+1,i-1) )
343             rkmjmip = r(k-1,j-1,i+1) + IBITS( flags(k-1,j-1,i+1), 6, 1 ) * &
344                                        ( r(k,j,i) - r(k-1,j-1,i+1) )
345             rkmjpip = r(k-1,j+1,i+1) + IBITS( flags(k-1,j+1,i+1), 6, 1 ) * &
346                                        ( r(k,j,i) - r(k-1,j+1,i+1) )
347
[1]348             f_mg(kc,jc,ic) = 1.0 / 64.0 * (                            &
349                              8.0 * r(k,j,i)                            &
[114]350                            + 4.0 * ( rkjim   + rkjip   +               &
351                                      rkjpi   + rkjmi   )               &
352                            + 2.0 * ( rkjmim  + rkjpim  +               &
353                                      rkjmip  + rkjpip  )               &
354                            + 4.0 * rkmji                               &
355                            + 2.0 * ( rkmjim  + rkmjim  +               &
356                                      rkmjpi  + rkmjmi  )               &
357                            +       ( rkmjmim + rkmjpim +               &
358                                      rkmjmip + rkmjpip )               &
[1]359                            + 4.0 * r(k+1,j,i)                          &
360                            + 2.0 * ( r(k+1,j,i-1)   + r(k+1,j,i+1)   + &
361                                      r(k+1,j+1,i)   + r(k+1,j-1,i)   ) &
362                            +       ( r(k+1,j-1,i-1) + r(k+1,j+1,i-1) + &
363                                      r(k+1,j-1,i+1) + r(k+1,j+1,i+1) ) &
364                                           ) 
[114]365
366!             f_mg(kc,jc,ic) = 1.0 / 64.0 * (                            &
367!                              8.0 * r(k,j,i)                            &
368!                            + 4.0 * ( r(k,j,i-1)     + r(k,j,i+1)     + &
369!                                      r(k,j+1,i)     + r(k,j-1,i)     ) &
370!                            + 2.0 * ( r(k,j-1,i-1)   + r(k,j+1,i-1)   + &
371!                                      r(k,j-1,i+1)   + r(k,j+1,i+1)   ) &
372!                            + 4.0 * r(k-1,j,i)                          &
373!                            + 2.0 * ( r(k-1,j,i-1)   + r(k-1,j,i+1)   + &
374!                                      r(k-1,j+1,i)   + r(k-1,j-1,i)   ) &
375!                            +       ( r(k-1,j-1,i-1) + r(k-1,j+1,i-1) + &
376!                                      r(k-1,j-1,i+1) + r(k-1,j+1,i+1) ) &
377!                            + 4.0 * r(k+1,j,i)                          &
378!                            + 2.0 * ( r(k+1,j,i-1)   + r(k+1,j,i+1)   + &
379!                                      r(k+1,j+1,i)   + r(k+1,j-1,i)   ) &
380!                            +       ( r(k+1,j-1,i-1) + r(k+1,j+1,i-1) + &
381!                                      r(k+1,j-1,i+1) + r(k+1,j+1,i+1) ) &
382!                                           )
[1]383          ENDDO
384       ENDDO
385    ENDDO
386!$OMP END PARALLEL
387
388!
389!-- Horizontal boundary conditions
[75]390    CALL exchange_horiz( f_mg )
[1]391
392    IF ( bc_lr /= 'cyclic' )  THEN
393       IF (inflow_l .OR. outflow_l)  f_mg(:,:,nxl_mg(l)-1) = f_mg(:,:,nxl_mg(l))
394       IF (inflow_r .OR. outflow_r)  f_mg(:,:,nxr_mg(l)+1) = f_mg(:,:,nxr_mg(l))
395    ENDIF
396
397    IF ( bc_ns /= 'cyclic' )  THEN
398       IF (inflow_n .OR. outflow_n)  f_mg(:,nyn_mg(l)+1,:) = f_mg(:,nyn_mg(l),:)
399       IF (inflow_s .OR. outflow_s)  f_mg(:,nys_mg(l)-1,:) = f_mg(:,nys_mg(l),:)
400    ENDIF
401
402!
403!-- Bottom and top boundary conditions
[114]404!    IF ( ibc_p_b == 1 )  THEN
405!       f_mg(nzb,:,: ) = f_mg(nzb+1,:,:)
406!    ELSE
407!       f_mg(nzb,:,: ) = 0.0
408!    ENDIF
409!
410!    IF ( ibc_p_t == 1 )  THEN
411!       f_mg(nzt_mg(l)+1,:,: ) = f_mg(nzt_mg(l),:,:)
412!    ELSE
413!       f_mg(nzt_mg(l)+1,:,: ) = 0.0
414!    ENDIF
[1]415
416
417END SUBROUTINE restrict
418
419
420
421 SUBROUTINE prolong( p, temp )
422
423!------------------------------------------------------------------------------!
424! Description:
425! ------------
426! Interpolates the correction of the perturbation pressure
427! to the next finer grid.
428!------------------------------------------------------------------------------!
429
430    USE control_parameters
431    USE pegrid
432    USE indices
433
434    IMPLICIT NONE
435
436    INTEGER ::  i, j, k, l
437
438    REAL, DIMENSION(nzb:nzt_mg(grid_level-1)+1,                           &
439                    nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,        &
440                    nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1 ) ::  p
441
442    REAL, DIMENSION(nzb:nzt_mg(grid_level)+1,                           &
443                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,          &
444                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  temp
445
446
447!
448!-- First, store elements of the coarser grid on the next finer grid
449    l = grid_level
450
451!$OMP PARALLEL PRIVATE (i,j,k)
452!$OMP DO
453    DO  i = nxl_mg(l-1), nxr_mg(l-1)
454       DO  j = nys_mg(l-1), nyn_mg(l-1)
455!CDIR NODEP
456          DO  k = nzb+1, nzt_mg(l-1)
457!
458!--          Points of the coarse grid are directly stored on the next finer
459!--          grid
460             temp(2*k-1,2*j,2*i) = p(k,j,i) 
461!
462!--          Points between two coarse-grid points
463             temp(2*k-1,2*j,2*i+1) = 0.5 * ( p(k,j,i) + p(k,j,i+1) )
464             temp(2*k-1,2*j+1,2*i) = 0.5 * ( p(k,j,i) + p(k,j+1,i) )
465             temp(2*k,2*j,2*i)     = 0.5 * ( p(k,j,i) + p(k+1,j,i) )
466!
467!--          Points in the center of the planes stretched by four points
468!--          of the coarse grid cube
469             temp(2*k-1,2*j+1,2*i+1) = 0.25 * ( p(k,j,i)   + p(k,j,i+1) + &
470                                                p(k,j+1,i) + p(k,j+1,i+1) )
471             temp(2*k,2*j,2*i+1)     = 0.25 * ( p(k,j,i)   + p(k,j,i+1) + &
472                                                p(k+1,j,i) + p(k+1,j,i+1) )
473             temp(2*k,2*j+1,2*i)     = 0.25 * ( p(k,j,i)   + p(k,j+1,i) + &
474                                                p(k+1,j,i) + p(k+1,j+1,i) )
475!
476!--          Points in the middle of coarse grid cube
477             temp(2*k,2*j+1,2*i+1) = 0.125 * ( p(k,j,i)     + p(k,j,i+1)   + &
478                                               p(k,j+1,i)   + p(k,j+1,i+1) + &
479                                               p(k+1,j,i)   + p(k+1,j,i+1) + &
480                                               p(k+1,j+1,i) + p(k+1,j+1,i+1) )
481          ENDDO
482       ENDDO
483    ENDDO
484!$OMP END PARALLEL
485                         
486!
487!-- Horizontal boundary conditions
[75]488    CALL exchange_horiz( temp )
[1]489
490    IF ( bc_lr /= 'cyclic' )  THEN
491       IF (inflow_l .OR. outflow_l)  temp(:,:,nxl_mg(l)-1) = temp(:,:,nxl_mg(l))
492       IF (inflow_r .OR. outflow_r)  temp(:,:,nxr_mg(l)+1) = temp(:,:,nxr_mg(l))
493    ENDIF
494
495    IF ( bc_ns /= 'cyclic' )  THEN
496       IF (inflow_n .OR. outflow_n)  temp(:,nyn_mg(l)+1,:) = temp(:,nyn_mg(l),:)
497       IF (inflow_s .OR. outflow_s)  temp(:,nys_mg(l)-1,:) = temp(:,nys_mg(l),:)
498    ENDIF
499
500!
501!-- Bottom and top boundary conditions
502    IF ( ibc_p_b == 1 )  THEN
503       temp(nzb,:,: ) = temp(nzb+1,:,:)
504    ELSE
505       temp(nzb,:,: ) = 0.0
506    ENDIF
507
508    IF ( ibc_p_t == 1 )  THEN
509       temp(nzt_mg(l)+1,:,: ) = temp(nzt_mg(l),:,:)
510    ELSE
511       temp(nzt_mg(l)+1,:,: ) = 0.0
512    ENDIF
513
514 
515 END SUBROUTINE prolong
516
517
518 SUBROUTINE redblack( f_mg, p_mg )
519
520!------------------------------------------------------------------------------!
521! Description:
522! ------------
523! Relaxation method for the multigrid scheme. A Gauss-Seidel iteration with
524! 3D-Red-Black decomposition (GS-RB) is used.
525!------------------------------------------------------------------------------!
526
527    USE arrays_3d
528    USE control_parameters
529    USE cpulog
530    USE grid_variables
531    USE indices
532    USE interfaces
533    USE pegrid
534
535    IMPLICIT NONE
536
537    INTEGER :: colour, i, ic, j, jc, jj, k, l, n
538
539    LOGICAL :: unroll
540
[114]541    REAL ::  wall_left, wall_north, wall_right, wall_south, wall_total, wall_top
542
[1]543    REAL, DIMENSION(nzb:nzt_mg(grid_level)+1,                                 &
544                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                &
545                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f_mg, p_mg
546
547
548    l = grid_level
549
[114]550!
551!-- Choose flag array of this level
552    SELECT CASE ( l )
553       CASE ( 1 )
554          flags => wall_flags_1
555       CASE ( 2 )
556          flags => wall_flags_2
557       CASE ( 3 )
558          flags => wall_flags_3
559       CASE ( 4 )
560          flags => wall_flags_4
561       CASE ( 5 )
562          flags => wall_flags_5
563       CASE ( 6 )
564          flags => wall_flags_6
565       CASE ( 7 )
566          flags => wall_flags_7
567       CASE ( 8 )
568          flags => wall_flags_8
569       CASE ( 9 )
570          flags => wall_flags_9
571       CASE ( 10 )
572          flags => wall_flags_10
573    END SELECT
574
[1]575    unroll = ( MOD( nyn_mg(l)-nys_mg(l)+1, 4 ) == 0  .AND. &
576               MOD( nxr_mg(l)-nxl_mg(l)+1, 2 ) == 0 )
577
578    DO  n = 1, ngsrb
579       
580       DO  colour = 1, 2
581
582          IF ( .NOT. unroll )  THEN
583             CALL cpu_log( log_point_s(36), 'redblack_no_unroll', 'start' )
584
585!
586!--          Without unrolling of loops, no cache optimization
587             DO  i = nxl_mg(l), nxr_mg(l), 2
588                DO  j = nys_mg(l) + 2 - colour, nyn_mg(l), 2 
589                   DO  k = nzb+1, nzt_mg(l), 2
[114]590!                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
591!                                ddx2_mg(l) * ( p_mg(k,j,i+1) + p_mg(k,j,i-1) ) &
592!                              + ddy2_mg(l) * ( p_mg(k,j+1,i) + p_mg(k,j-1,i) ) &
593!                              + f2_mg(k,l) * p_mg(k+1,j,i)                     &
594!                              + f3_mg(k,l) * p_mg(k-1,j,i) - f_mg(k,j,i)       &
595!                                                       )
596
[1]597                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]598                             ddx2_mg(l) *                                      &
599                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
600                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
601                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
602                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
603                           + ddy2_mg(l) *                                      &
604                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
605                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
606                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
607                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
608                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
609                           + f3_mg(k,l) *                                      &
610                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
611                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
612                           - f_mg(k,j,i)               )
[1]613                   ENDDO
614                ENDDO
615             ENDDO
616   
617             DO  i = nxl_mg(l)+1, nxr_mg(l), 2
618                DO  j = nys_mg(l) + (colour-1), nyn_mg(l), 2
619                   DO  k = nzb+1, nzt_mg(l), 2 
620                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]621                             ddx2_mg(l) *                                      &
622                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
623                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
624                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
625                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
626                           + ddy2_mg(l) *                                      &
627                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
628                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
629                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
630                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
631                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
632                           + f3_mg(k,l) *                                      &
633                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
634                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
635                           - f_mg(k,j,i)               )
[1]636                   ENDDO
637                ENDDO
638             ENDDO
639 
640             DO  i = nxl_mg(l), nxr_mg(l), 2
641                DO  j = nys_mg(l) + (colour-1), nyn_mg(l), 2
642                   DO  k = nzb+2, nzt_mg(l), 2
643                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]644                             ddx2_mg(l) *                                      &
645                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
646                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
647                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
648                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
649                           + ddy2_mg(l) *                                      &
650                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
651                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
652                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
653                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
654                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
655                           + f3_mg(k,l) *                                      &
656                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
657                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
658                           - f_mg(k,j,i)               )
[1]659                   ENDDO
660                ENDDO
661             ENDDO
662
663             DO  i = nxl_mg(l)+1, nxr_mg(l), 2
664                DO  j = nys_mg(l) + 2 - colour, nyn_mg(l), 2
665                   DO  k = nzb+2, nzt_mg(l), 2
666                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]667                             ddx2_mg(l) *                                      &
668                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
669                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
670                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
671                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
672                           + ddy2_mg(l) *                                      &
673                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
674                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
675                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
676                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
677                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
678                           + f3_mg(k,l) *                                      &
679                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
680                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
681                           - f_mg(k,j,i)               )
[1]682                   ENDDO
683                ENDDO
684             ENDDO
685             CALL cpu_log( log_point_s(36), 'redblack_no_unroll', 'stop' )
686
687          ELSE
688
689!
690!--          Loop unrolling along y, only one i loop for better cache use
691             CALL cpu_log( log_point_s(38), 'redblack_unroll', 'start' )
692             DO  ic = nxl_mg(l), nxr_mg(l), 2
693                DO  jc = nys_mg(l), nyn_mg(l), 4
694                   i  = ic
695                   jj = jc+2-colour
696                   DO  k = nzb+1, nzt_mg(l), 2
697                      j = jj
698                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]699                             ddx2_mg(l) *                                      &
700                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
701                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
702                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
703                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
704                           + ddy2_mg(l) *                                      &
705                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
706                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
707                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
708                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
709                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
710                           + f3_mg(k,l) *                                      &
711                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
712                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
713                           - f_mg(k,j,i)               )
[1]714                      j = jj+2
715                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]716                             ddx2_mg(l) *                                      &
717                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
718                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
719                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
720                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
721                           + ddy2_mg(l) *                                      &
722                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
723                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
724                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
725                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
726                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
727                           + f3_mg(k,l) *                                      &
728                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
729                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
730                           - f_mg(k,j,i)               )
[1]731                   ENDDO
732   
733                   i  = ic+1
734                   jj = jc+colour-1
735                   DO  k = nzb+1, nzt_mg(l), 2 
736                      j =jj
737                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]738                             ddx2_mg(l) *                                      &
739                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
740                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
741                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
742                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
743                           + ddy2_mg(l) *                                      &
744                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
745                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
746                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
747                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
748                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
749                           + f3_mg(k,l) *                                      &
750                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
751                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
752                           - f_mg(k,j,i)               )
[1]753                      j = jj+2
754                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]755                             ddx2_mg(l) *                                      &
756                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
757                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
758                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
759                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
760                           + ddy2_mg(l) *                                      &
761                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
762                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
763                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
764                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
765                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
766                           + f3_mg(k,l) *                                      &
767                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
768                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
769                           - f_mg(k,j,i)               )
[1]770                   ENDDO
771
772                   i  = ic
773                   jj = jc+colour-1
774                   DO  k = nzb+2, nzt_mg(l), 2
775                      j =jj
776                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]777                             ddx2_mg(l) *                                      &
778                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
779                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
780                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
781                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
782                           + ddy2_mg(l) *                                      &
783                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
784                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
785                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
786                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
787                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
788                           + f3_mg(k,l) *                                      &
789                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
790                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
791                           - f_mg(k,j,i)               )
[1]792                      j = jj+2
793                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]794                             ddx2_mg(l) *                                      &
795                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
796                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
797                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
798                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
799                           + ddy2_mg(l) *                                      &
800                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
801                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
802                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
803                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
804                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
805                           + f3_mg(k,l) *                                      &
806                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
807                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
808                           - f_mg(k,j,i)               )
[1]809                   ENDDO
810
811                   i  = ic+1
812                   jj = jc+2-colour
813                   DO  k = nzb+2, nzt_mg(l), 2
814                      j =jj
815                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]816                             ddx2_mg(l) *                                      &
817                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
818                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
819                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
820                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
821                           + ddy2_mg(l) *                                      &
822                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
823                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
824                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
825                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
826                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
827                           + f3_mg(k,l) *                                      &
828                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
829                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
830                           - f_mg(k,j,i)               )
[1]831                      j = jj+2
832                      p_mg(k,j,i) = 1.0 / f1_mg(k,l) * (                       &
[114]833                             ddx2_mg(l) *                                      &
834                               ( p_mg(k,j,i+1) + IBITS( flags(k,j,i), 5, 1 ) * &
835                                             ( p_mg(k,j,i) - p_mg(k,j,i+1) ) + &
836                                 p_mg(k,j,i-1) + IBITS( flags(k,j,i), 4, 1 ) * &
837                                             ( p_mg(k,j,i) - p_mg(k,j,i-1) ) ) &
838                           + ddy2_mg(l) *                                      &
839                               ( p_mg(k,j+1,i) + IBITS( flags(k,j,i), 3, 1 ) * &
840                                             ( p_mg(k,j,i) - p_mg(k,j+1,i) ) + &
841                                 p_mg(k,j-1,i) + IBITS( flags(k,j,i), 2, 1 ) * &
842                                             ( p_mg(k,j,i) - p_mg(k,j-1,i) ) ) &
843                           + f2_mg(k,l) * p_mg(k+1,j,i)                        &
844                           + f3_mg(k,l) *                                      &
845                               ( p_mg(k-1,j,i) + IBITS( flags(k,j,i), 0, 1 ) * &
846                                             ( p_mg(k,j,i) - p_mg(k-1,j,i) ) ) &
847                           - f_mg(k,j,i)               )
[1]848                   ENDDO
849
850                ENDDO
851             ENDDO
852             CALL cpu_log( log_point_s(38), 'redblack_unroll', 'stop' )
853
854          ENDIF
855
856!
857!--       Horizontal boundary conditions
[75]858          CALL exchange_horiz( p_mg )
[1]859
860          IF ( bc_lr /= 'cyclic' )  THEN
861             IF ( inflow_l .OR. outflow_l )  THEN
862                p_mg(:,:,nxl_mg(l)-1) = p_mg(:,:,nxl_mg(l))
863             ENDIF
864             IF ( inflow_r .OR. outflow_r )  THEN
865                p_mg(:,:,nxr_mg(l)+1) = p_mg(:,:,nxr_mg(l))
866             ENDIF
867          ENDIF
868
869          IF ( bc_ns /= 'cyclic' )  THEN
870             IF ( inflow_n .OR. outflow_n )  THEN
871                p_mg(:,nyn_mg(l)+1,:) = p_mg(:,nyn_mg(l),:)
872             ENDIF
873             IF ( inflow_s .OR. outflow_s )  THEN
874                p_mg(:,nys_mg(l)-1,:) = p_mg(:,nys_mg(l),:)
875             ENDIF
876          ENDIF
877
878!
879!--       Bottom and top boundary conditions
880          IF ( ibc_p_b == 1 )  THEN
881             p_mg(nzb,:,: ) = p_mg(nzb+1,:,:)
882          ELSE
883             p_mg(nzb,:,: ) = 0.0
884          ENDIF
885
886          IF ( ibc_p_t == 1 )  THEN
887             p_mg(nzt_mg(l)+1,:,: ) = p_mg(nzt_mg(l),:,:)
888          ELSE
889             p_mg(nzt_mg(l)+1,:,: ) = 0.0
890          ENDIF
891
892       ENDDO
893
894    ENDDO
895
[114]896!
897!-- Set pressure within topography and at the topography surfaces
898!$OMP PARALLEL PRIVATE (i,j,k,wall_left,wall_north,wall_right,wall_south,wall_top,wall_total)
899!$OMP DO
900    DO  i = nxl_mg(l), nxr_mg(l)
901       DO  j = nys_mg(l), nyn_mg(l) 
902          DO  k = nzb, nzt_mg(l)
903!
904!--          First, set pressure inside topography to zero
905             p_mg(k,j,i) = p_mg(k,j,i) * ( 1.0 - IBITS( flags(k,j,i), 6, 1 ) )
906!
907!--          Second, determine if the gridpoint inside topography is adjacent
908!--          to a wall and set its value to a value given by the average of
909!--          those values obtained from Neumann boundary condition
910             wall_left  = IBITS( flags(k,j,i-1), 5, 1 )
911             wall_right = IBITS( flags(k,j,i+1), 4, 1 )
912             wall_south = IBITS( flags(k,j-1,i), 3, 1 )
913             wall_north = IBITS( flags(k,j+1,i), 2, 1 )
914             wall_top   = IBITS( flags(k+1,j,i), 0, 1 )
915             wall_total = wall_left + wall_right + wall_south + wall_north + &
916                          wall_top
[1]917
[114]918             IF ( wall_total > 0.0 )  THEN
919                p_mg(k,j,i) = 1.0 / wall_total *                 &
920                                  ( wall_left  * p_mg(k,j,i-1) + &
921                                    wall_right * p_mg(k,j,i+1) + &
922                                    wall_south * p_mg(k,j-1,i) + &
923                                    wall_north * p_mg(k,j+1,i) + &
924                                    wall_top   * p_mg(k+1,j,i) )
925             ENDIF
926          ENDDO
927       ENDDO
928    ENDDO
929!$OMP END PARALLEL
930
931!
932!-- One more time horizontal boundary conditions
933    CALL exchange_horiz( p_mg )
934
[1]935 END SUBROUTINE redblack
936
937
938
939 SUBROUTINE mg_gather( f2, f2_sub )
940
941    USE control_parameters
942    USE cpulog
943    USE indices
944    USE interfaces
945    USE pegrid
946
947    IMPLICIT NONE
948
949    INTEGER ::  n, nwords, sender
950
951    REAL, DIMENSION(nzb:nzt_mg(grid_level)+1,                            &
952                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,           &
953                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) ::  f2
954
955    REAL, DIMENSION(nzb:mg_loc_ind(5,myid)+1,                            &
956                    mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,           &
957                    mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) ::  f2_sub
958
959!
960!-- Find out the number of array elements of the subdomain array
961    nwords = SIZE( f2_sub )
962
963#if defined( __parallel )
964    CALL cpu_log( log_point_s(34), 'mg_gather', 'start' )
965
966    IF ( myid == 0 )  THEN
967!
968!--    Store the local subdomain array on the total array
969       f2(:,mg_loc_ind(3,0)-1:mg_loc_ind(4,0)+1, &
970            mg_loc_ind(1,0)-1:mg_loc_ind(2,0)+1) = f2_sub
971
972!
973!--    Receive the subdomain arrays from all other PEs and store them on the
974!--    total array
975       DO  n = 1, numprocs-1
976!
977!--       Receive the arrays in arbitrary order from the PEs.
978          CALL MPI_RECV( f2_sub(nzb,mg_loc_ind(3,0)-1,mg_loc_ind(1,0)-1),     &
979                         nwords, MPI_REAL, MPI_ANY_SOURCE, 1, comm2d, status, &
980                         ierr )
981          sender = status(MPI_SOURCE)
982          f2(:,mg_loc_ind(3,sender)-1:mg_loc_ind(4,sender)+1, &
983               mg_loc_ind(1,sender)-1:mg_loc_ind(2,sender)+1) = f2_sub
984       ENDDO
985
986    ELSE
987!
988!--    Send subdomain array to PE0
989       CALL MPI_SEND( f2_sub(nzb,mg_loc_ind(3,myid)-1,mg_loc_ind(1,myid)-1), &
990                      nwords, MPI_REAL, 0, 1, comm2d, ierr )
991    ENDIF
992
993    CALL cpu_log( log_point_s(34), 'mg_gather', 'stop' )
994#endif
995   
996 END SUBROUTINE mg_gather
997
998
999
1000 SUBROUTINE mg_scatter( p2, p2_sub )
1001!
1002!-- TODO: It may be possible to improve the speed of this routine by using
1003!-- non-blocking communication
1004
1005    USE control_parameters
1006    USE cpulog
1007    USE indices
1008    USE interfaces
1009    USE pegrid
1010
1011    IMPLICIT NONE
1012
1013    INTEGER ::  n, nwords, sender
1014
1015    REAL, DIMENSION(nzb:nzt_mg(grid_level-1)+1,                            &
1016                    nys_mg(grid_level-1)-1:nyn_mg(grid_level-1)+1,         &
1017                    nxl_mg(grid_level-1)-1:nxr_mg(grid_level-1)+1) ::  p2
1018
1019    REAL, DIMENSION(nzb:mg_loc_ind(5,myid)+1,                              &
1020                    mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,             &
1021                    mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) ::  p2_sub
1022
1023!
1024!-- Find out the number of array elements of the subdomain array
1025    nwords = SIZE( p2_sub )
1026
1027#if defined( __parallel )
1028    CALL cpu_log( log_point_s(35), 'mg_scatter', 'start' )
1029
1030    IF ( myid == 0 )  THEN
1031!
1032!--    Scatter the subdomain arrays to the other PEs by blocking
1033!--    communication
1034       DO  n = 1, numprocs-1
1035
1036          p2_sub = p2(:,mg_loc_ind(3,n)-1:mg_loc_ind(4,n)+1, &
1037                        mg_loc_ind(1,n)-1:mg_loc_ind(2,n)+1)
1038
1039          CALL MPI_SEND( p2_sub(nzb,mg_loc_ind(3,0)-1,mg_loc_ind(1,0)-1), &
1040                         nwords, MPI_REAL, n, 1, comm2d, ierr )
1041
1042       ENDDO
1043
1044!
1045!--    Store data from the total array to the local subdomain array
1046       p2_sub = p2(:,mg_loc_ind(3,0)-1:mg_loc_ind(4,0)+1, &
1047                     mg_loc_ind(1,0)-1:mg_loc_ind(2,0)+1)
1048
1049    ELSE
1050!
1051!--    Receive subdomain array from PE0
1052       CALL MPI_RECV( p2_sub(nzb,mg_loc_ind(3,myid)-1,mg_loc_ind(1,myid)-1), &
1053                      nwords, MPI_REAL, 0, 1, comm2d, status, ierr )
1054
1055    ENDIF
1056
1057    CALL cpu_log( log_point_s(35), 'mg_scatter', 'stop' )
1058#endif
1059   
1060 END SUBROUTINE mg_scatter
1061
1062
1063
1064 RECURSIVE SUBROUTINE next_mg_level( f_mg, p_mg, p3, r )
1065
1066!------------------------------------------------------------------------------!
1067! Description:
1068! ------------
1069! This is where the multigrid technique takes place. V- and W- Cycle are
1070! implemented and steered by the parameter "gamma". Parameter "nue" determines
1071! the convergence of the multigrid iterative solution. There are nue times
1072! RB-GS iterations. It should be set to "1" or "2", considering the time effort
1073! one would like to invest. Last choice shows a very good converging factor,
1074! but leads to an increase in computing time.
1075!------------------------------------------------------------------------------!
1076
1077    USE arrays_3d
1078    USE control_parameters
1079    USE grid_variables
1080    USE indices
1081    USE pegrid
1082
1083    IMPLICIT NONE
1084
1085    INTEGER ::  i, j, k, nxl_mg_save, nxr_mg_save, nyn_mg_save, nys_mg_save, &
1086                nzt_mg_save
1087
1088    LOGICAL ::  restore_boundary_lr_on_pe0, restore_boundary_ns_on_pe0
1089
1090    REAL, DIMENSION(nzb:nzt_mg(grid_level)+1,                                  &
1091                 nys_mg(grid_level)-1:nyn_mg(grid_level)+1,                    &
1092                 nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) :: f_mg, p_mg, p3, r
1093
1094    REAL, DIMENSION(:,:,:), ALLOCATABLE ::  f2, f2_sub, p2, p2_sub
1095
1096!
1097!-- Restriction to the coarsest grid
1098 10 IF ( grid_level == 1 )  THEN
1099
1100!
1101!--    Solution on the coarsest grid. Double the number of Gauss-Seidel
1102!--    iterations in order to get a more accurate solution.
1103       ngsrb = 2 * ngsrb
1104       CALL redblack( f_mg, p_mg )
1105       ngsrb = ngsrb / 2
1106
1107    ELSEIF ( grid_level /= 1 )  THEN
1108
1109       grid_level_count(grid_level) = grid_level_count(grid_level) + 1
1110
1111!
1112!--    Solution on the actual grid level
1113       CALL redblack( f_mg, p_mg )
1114
1115!
1116!--    Determination of the actual residual
1117       CALL resid( f_mg, p_mg, r )
1118
1119!
1120!--    Restriction of the residual (finer grid values!) to the next coarser
1121!--    grid. Therefore, the grid level has to be decremented now. nxl..nzt have
1122!--    to be set to the coarse grid values, because these variables are needed
1123!--    for the exchange of ghost points in routine exchange_horiz
1124       grid_level = grid_level - 1
1125       nxl = nxl_mg(grid_level)
1126       nxr = nxr_mg(grid_level)
1127       nys = nys_mg(grid_level)
1128       nyn = nyn_mg(grid_level)
1129       nzt = nzt_mg(grid_level)
1130
1131       ALLOCATE( f2(nzb:nzt_mg(grid_level)+1,                    &
1132                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,   &
1133                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1),  &
1134                 p2(nzb:nzt_mg(grid_level)+1,                    &
1135                    nys_mg(grid_level)-1:nyn_mg(grid_level)+1,   &
1136                    nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) )
1137
1138       IF ( grid_level == mg_switch_to_pe0_level )  THEN
1139!          print*, 'myid=',myid, ' restrict and switch to PE0. level=', grid_level
1140!
1141!--       From this level on, calculations are done on PE0 only.
1142!--       First, carry out restriction on the subdomain.
1143!--       Therefore, indices of the level have to be changed to subdomain values
1144!--       in between (otherwise, the restrict routine would expect
1145!--       the gathered array)
1146          nxl_mg_save = nxl_mg(grid_level)
1147          nxr_mg_save = nxr_mg(grid_level)
1148          nys_mg_save = nys_mg(grid_level)
1149          nyn_mg_save = nyn_mg(grid_level)
1150          nzt_mg_save = nzt_mg(grid_level)
1151          nxl_mg(grid_level) = mg_loc_ind(1,myid)
1152          nxr_mg(grid_level) = mg_loc_ind(2,myid)
1153          nys_mg(grid_level) = mg_loc_ind(3,myid)
1154          nyn_mg(grid_level) = mg_loc_ind(4,myid)
1155          nzt_mg(grid_level) = mg_loc_ind(5,myid)
1156          nxl = mg_loc_ind(1,myid)
1157          nxr = mg_loc_ind(2,myid)
1158          nys = mg_loc_ind(3,myid)
1159          nyn = mg_loc_ind(4,myid)
1160          nzt = mg_loc_ind(5,myid)
1161
1162          ALLOCATE( f2_sub(nzb:nzt_mg(grid_level)+1,                    &
1163                           nys_mg(grid_level)-1:nyn_mg(grid_level)+1,   &
1164                           nxl_mg(grid_level)-1:nxr_mg(grid_level)+1) )
1165
1166          CALL restrict( f2_sub, r )
1167
1168!
1169!--       Restore the correct indices of this level
1170          nxl_mg(grid_level) = nxl_mg_save
1171          nxr_mg(grid_level) = nxr_mg_save
1172          nys_mg(grid_level) = nys_mg_save
1173          nyn_mg(grid_level) = nyn_mg_save
1174          nzt_mg(grid_level) = nzt_mg_save
1175          nxl = nxl_mg(grid_level)
1176          nxr = nxr_mg(grid_level)
1177          nys = nys_mg(grid_level)
1178          nyn = nyn_mg(grid_level)
1179          nzt = nzt_mg(grid_level)
1180
1181!
1182!--       Gather all arrays from the subdomains on PE0
1183          CALL mg_gather( f2, f2_sub )
1184
1185!
1186!--       Set switch for routine exchange_horiz, that no ghostpoint exchange
1187!--       has to be carried out from now on
1188          mg_switch_to_pe0 = .TRUE.
1189
1190!
1191!--       In case of non-cyclic lateral boundary conditions, both in- and
1192!--       outflow conditions have to be used on PE0 after the switch, because
1193!--       it then contains the total domain. Due to the virtual processor
1194!--       grid, before the switch, PE0 can have in-/outflow at the left
1195!--       and south wall only (or on opposite walls in case of a 1d
1196!--       decomposition).
1197          restore_boundary_lr_on_pe0 = .FALSE.
1198          restore_boundary_ns_on_pe0 = .FALSE.
1199          IF ( myid == 0 )  THEN
1200             IF ( inflow_l  .AND.  .NOT. outflow_r )  THEN
1201                outflow_r = .TRUE.
1202                restore_boundary_lr_on_pe0 = .TRUE.
1203             ENDIF
1204             IF ( outflow_l  .AND.  .NOT. inflow_r )  THEN
1205                inflow_r  = .TRUE.
1206                restore_boundary_lr_on_pe0 = .TRUE.
1207             ENDIF
1208             IF ( inflow_s  .AND.  .NOT. outflow_n )  THEN
1209                outflow_n = .TRUE.
1210                restore_boundary_ns_on_pe0 = .TRUE.
1211             ENDIF
1212             IF ( outflow_s  .AND.  .NOT. inflow_n )  THEN
1213                inflow_n  = .TRUE.
1214                restore_boundary_ns_on_pe0 = .TRUE.
1215             ENDIF
1216          ENDIF
1217
1218          DEALLOCATE( f2_sub )
1219
1220       ELSE
1221
1222          CALL restrict( f2, r )
1223
1224       ENDIF
1225       p2 = 0.0
1226
1227!
1228!--    Repeat the same procedure till the coarsest grid is reached
1229       IF ( myid == 0  .OR.  grid_level > mg_switch_to_pe0_level )  THEN
1230          CALL next_mg_level( f2, p2, p3, r )
1231       ENDIF
1232
1233    ENDIF
1234
1235!
1236!-- Now follows the prolongation
1237    IF ( grid_level >= 2 )  THEN
1238
1239!
1240!--    Grid level has to be incremented on the PEs where next_mg_level
1241!--    has not been called before (normally it is incremented at the end
1242!--    of next_mg_level)
1243       IF ( myid /= 0  .AND.  grid_level == mg_switch_to_pe0_level )  THEN
1244          grid_level = grid_level + 1
1245          nxl = nxl_mg(grid_level)
1246          nxr = nxr_mg(grid_level)
1247          nys = nys_mg(grid_level)
1248          nyn = nyn_mg(grid_level)
1249          nzt = nzt_mg(grid_level)
1250       ENDIF
1251
1252!
1253!--    Prolongation of the new residual. The values are transferred
1254!--    from the coarse to the next finer grid.
1255       IF ( grid_level == mg_switch_to_pe0_level+1 )  THEN
1256!
1257!--       At this level, the new residual first has to be scattered from
1258!--       PE0 to the other PEs
1259          ALLOCATE( p2_sub(nzb:mg_loc_ind(5,myid)+1,             &
1260                    mg_loc_ind(3,myid)-1:mg_loc_ind(4,myid)+1,   &
1261                    mg_loc_ind(1,myid)-1:mg_loc_ind(2,myid)+1) )
1262
1263          CALL mg_scatter( p2, p2_sub )
1264
1265!
1266!--       Therefore, indices of the previous level have to be changed to
1267!--       subdomain values in between (otherwise, the prolong routine would
1268!--       expect the gathered array)
1269          nxl_mg_save = nxl_mg(grid_level-1)
1270          nxr_mg_save = nxr_mg(grid_level-1)
1271          nys_mg_save = nys_mg(grid_level-1)
1272          nyn_mg_save = nyn_mg(grid_level-1)
1273          nzt_mg_save = nzt_mg(grid_level-1)
1274          nxl_mg(grid_level-1) = mg_loc_ind(1,myid)
1275          nxr_mg(grid_level-1) = mg_loc_ind(2,myid)
1276          nys_mg(grid_level-1) = mg_loc_ind(3,myid)
1277          nyn_mg(grid_level-1) = mg_loc_ind(4,myid)
1278          nzt_mg(grid_level-1) = mg_loc_ind(5,myid)
1279
1280!
1281!--       Set switch for routine exchange_horiz, that ghostpoint exchange
1282!--       has to be carried again out from now on
1283          mg_switch_to_pe0 = .FALSE.
1284
1285!
1286!--       In case of non-cyclic lateral boundary conditions, restore the
1287!--       in-/outflow conditions on PE0
1288          IF ( myid == 0 )  THEN
1289             IF ( restore_boundary_lr_on_pe0 )  THEN
1290                IF ( inflow_l  )  outflow_r = .FALSE.
1291                IF ( outflow_l )  inflow_r  = .FALSE.
1292             ENDIF
1293             IF ( restore_boundary_ns_on_pe0 )  THEN
1294                IF ( inflow_s  )  outflow_n = .FALSE.
1295                IF ( outflow_s )  inflow_n  = .FALSE.
1296             ENDIF
1297          ENDIF
1298
1299          CALL prolong( p2_sub, p3 )
1300
1301!
1302!--       Restore the correct indices of the previous level
1303          nxl_mg(grid_level-1) = nxl_mg_save
1304          nxr_mg(grid_level-1) = nxr_mg_save
1305          nys_mg(grid_level-1) = nys_mg_save
1306          nyn_mg(grid_level-1) = nyn_mg_save
1307          nzt_mg(grid_level-1) = nzt_mg_save
1308
1309          DEALLOCATE( p2_sub )
1310
1311       ELSE
1312
1313          CALL prolong( p2, p3 )
1314
1315       ENDIF
1316
1317!
1318!--    Temporary arrays for the actual grid are not needed any more
1319       DEALLOCATE( p2, f2 )
1320
1321!
1322!--    Computation of the new pressure correction. Therefore,
1323!--    values from prior grids are added up automatically stage by stage.
1324       DO  i = nxl_mg(grid_level)-1, nxr_mg(grid_level)+1
1325          DO  j = nys_mg(grid_level)-1, nyn_mg(grid_level)+1
1326             DO  k = nzb, nzt_mg(grid_level)+1 
1327                p_mg(k,j,i) = p_mg(k,j,i) + p3(k,j,i)
1328             ENDDO
1329          ENDDO
1330       ENDDO
1331
1332!
1333!--    Relaxation of the new solution
1334       CALL redblack( f_mg, p_mg )
1335
1336    ENDIF
1337
1338!
1339!-- The following few lines serve the steering of the multigrid scheme
1340    IF ( grid_level == maximum_grid_level )  THEN
1341
1342       GOTO 20
1343
1344    ELSEIF ( grid_level /= maximum_grid_level  .AND.  grid_level /= 1  .AND. &
1345             grid_level_count(grid_level) /= gamma_mg )  THEN
1346
1347       GOTO 10
1348
1349    ENDIF
1350
1351!
1352!-- Reset counter for the next call of poismg
1353    grid_level_count(grid_level) = 0
1354
1355!
1356!-- Continue with the next finer level. nxl..nzt have to be
1357!-- set to the finer grid values, because these variables are needed for the
1358!-- exchange of ghost points in routine exchange_horiz
1359    grid_level = grid_level + 1
1360    nxl = nxl_mg(grid_level)
1361    nxr = nxr_mg(grid_level)
1362    nys = nys_mg(grid_level)
1363    nyn = nyn_mg(grid_level)
1364    nzt = nzt_mg(grid_level)
1365
1366 20 CONTINUE
1367
1368 END SUBROUTINE next_mg_level
Note: See TracBrowser for help on using the repository browser.