source: palm/trunk/SOURCE/cpulog_mod.f90 @ 4845

Last change on this file since 4845 was 4835, checked in by raasch, 4 years ago

openmp bugfix (some private statements were missing); output format for cpu measures slightly changed

  • Property svn:keywords set to Id
File size: 23.3 KB
Line 
1!> @file cpulog_mod.f90
2!--------------------------------------------------------------------------------------------------!
3! This file is part of the PALM model system.
4!
5! PALM is free software: you can redistribute it and/or modify it under the terms of the GNU General
6! Public License as published by the Free Software Foundation, either version 3 of the License, or
7! (at your option) any later version.
8!
9! PALM is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the
10! implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General
11! Public License for more details.
12!
13! You should have received a copy of the GNU General Public License along with PALM. If not, see
14! <http://www.gnu.org/licenses/>.
15!
16! Copyright 1997-2021 Leibniz Universitaet Hannover
17!------------------------------------------------------------------------------!
18!
19! Current revisions:
20! -----------------
21!
22!
23! Former revisions:
24! -----------------
25! $Id: cpulog_mod.f90 4835 2021-01-07 13:16:02Z raasch $
26! Format descriptor 102 changed again to limit line length to 80 characters
27!
28! 4828 2021-01-05 11:21:41Z Giersch
29! Format descriptor 102 slightly modified.
30!
31! 4577 2020-06-25 09:53:58Z raasch
32! further re-formatting concerning Fortran parameter variables
33!
34! 4559 2020-06-11 08:51:48Z raasch
35! file re-formatted to follow the PALM coding standard
36!
37! 4549 2020-05-29 09:27:29Z raasch
38! bugfix for r4539: values for min/max/rms stored in separate arrays
39!
40! 4539 2020-05-18 14:05:17Z raasch
41! code re-structured,
42! cpu time per grid point and timestep does not included initialization and spinup any more
43!
44! 4536 2020-05-17 17:24:13Z raasch
45! restart I/O transfer speed added
46!
47! 4429 2020-02-27 15:24:30Z raasch
48! bugfix: cpp-directives added for serial mode
49!
50! 4378 2020-01-16 13:22:48Z Giersch
51! Format of rms output changed to allow values >= 100
52!
53! 4360 2020-01-07 11:25:50Z suehring
54! Corrected "Former revisions" section
55!
56! 4015 2019-06-05 13:25:35Z raasch
57! all reals changed to double precision in order to work with 32-bit working precision, otherwise
58! calculated time intervals would mostly give zero
59!
60! 3885 2019-04-11 11:29:34Z kanani
61! Changes related to global restructuring of location messages and introduction of additional debug
62! messages
63!
64! 3655 2019-01-07 16:51:22Z knoop
65! output format limited to a maximum line length of 80
66!
67! Revision 1.1  1997/07/24 11:12:29  raasch
68! Initial revision
69!
70!
71! Description:
72! ------------
73!> CPU-time measurements for any program part whatever. Results of the measurements are output at
74!> the end of the run in local file CPU_MEASURES.
75!>
76!> To measure the CPU-time (better to say the wallclock time) of a specific code segment, two calls
77!> of cpu_log have to be used as brackets in front and at the end of the segment:
78!>
79!>     CALL cpu_log( log_point(n), 'any identifier', 'start' )
80!>       ... code segment ...
81!>     CALL cpu_log( log_point(n), 'any identifier', 'stop' )
82!>
83!> Parts of the code segment can be excluded from the measurement by additional call of cpu_log:
84!>
85!>       ... first segment to be measured
86!>     CALL cpu_log( log_point(n), 'any identifier', 'pause' )
87!>       ... oart of segment to be excluded from measurement
88!>     CALL cpu_log( log_point(n), 'any identifier', 'continue' )
89!>       ... second segment to be mesasured
90!>
91!> n is an INTEGER within the interval [1,100] defining the id of the specific code segment,
92!> 'any identifier' is a string describing the code segment to be measured. It can be freely chosen
93!> and results will appear under this name in file CPU_MEASURES. ids can only be used once. If you
94!> like to do a measurement of a new part of the code, please look for an id which is unused so far.
95!>
96!> runtime_parameters-parameter cpu_log_barrierwait can be used to set an MPI barrier at the
97!> beginning of the measurement (modus 'start' or 'continue'), to avoid that idle times (due to MPI
98!> calls in the code segment, which are waiting for other processes to be finished) affect the
99!> measurements.
100!> If barriers shall not be used at all, a fourth, optional parameter has to be
101!> given:
102!>
103!>     CALL cpu_log( ..., ..., 'start', cpu_log_nowait )
104!>
105!> Variable log_point should be used for non-overlapping code segments, and they should sum up to
106!> the total cpu-time required by the complete run.
107!> Variable log_point_s can be used for any other special (s) measurements.
108!--------------------------------------------------------------------------------------------------!
109 MODULE cpulog
110
111
112    USE control_parameters,                                                                        &
113        ONLY: message_string, nr_timesteps_this_run, restart_data_format_output,                   &
114              restart_file_size, run_description_header, synchronous_exchange, write_binary
115
116    USE indices,                                                                                   &
117        ONLY: ngp_3d, nx, ny, nz
118
119    USE kinds
120
121    USE pegrid
122
123    IMPLICIT NONE
124
125    PRIVATE
126    PUBLIC   cpu_log, cpu_log_barrierwait, cpu_log_nowait, cpu_statistics, initial_wallclock_time, &
127             log_point, log_point_s
128
129    INTERFACE cpu_log
130       MODULE PROCEDURE cpu_log
131    END INTERFACE cpu_log
132
133    INTERFACE cpu_statistics
134       MODULE PROCEDURE cpu_statistics
135    END INTERFACE cpu_statistics
136
137    INTEGER(iwp), PARAMETER ::  cpu_log_continue = 0  !<
138    INTEGER(iwp), PARAMETER ::  cpu_log_pause = 1     !<
139    INTEGER(iwp), PARAMETER ::  cpu_log_start = 2     !<
140    INTEGER(iwp), PARAMETER ::  cpu_log_stop = 3      !<
141
142    LOGICAL, PARAMETER ::  cpu_log_nowait = .FALSE.       !<
143
144    LOGICAL            ::  cpu_log_barrierwait = .FALSE.  !<
145
146    REAL(dp) ::  initial_wallclock_time  !<
147
148    TYPE logpoint
149       REAL(dp)           ::  isum       !<
150       REAL(dp)           ::  ivect      !<
151       REAL(dp)           ::  mean       !<
152       REAL(dp)           ::  mtime      !<
153       REAL(dp)           ::  mtimevec   !<
154       REAL(dp)           ::  sum        !<
155       REAL(dp)           ::  vector     !<
156       INTEGER(iwp)       ::  counts     !<
157       CHARACTER (LEN=25) ::  place      !<
158    END TYPE logpoint
159
160    TYPE(logpoint), DIMENSION(100) ::  log_point = logpoint( 0.0_dp, 0.0_dp, 0.0_dp, 0.0_dp,       &
161                                                             0.0_dp, 0.0_dp, 0.0_dp, 0, ' ' )
162    TYPE(logpoint), DIMENSION(100) ::  log_point_s = logpoint( 0.0_dp, 0.0_dp, 0.0_dp, 0.0_dp,     &
163                                                               0.0_dp, 0.0_dp, 0.0_dp, 0, ' ' )
164
165    SAVE
166
167 CONTAINS
168
169!------------------------------------------------------------------------------!
170! Description:
171! ------------
172!> @todo Missing subroutine description.
173!------------------------------------------------------------------------------!
174    SUBROUTINE cpu_log( log_event, place, modus, barrierwait )
175
176       IMPLICIT NONE
177
178       CHARACTER (LEN=*) ::  modus              !<
179       CHARACTER (LEN=*) ::  place              !<
180
181       LOGICAL           ::  wait_allowed       !<
182       LOGICAL, OPTIONAL ::  barrierwait        !<
183       LOGICAL, SAVE     ::  first = .TRUE.     !<
184
185       REAL(dp)          ::  mtime = 0.0_dp     !<
186       REAL(dp)          ::  mtimevec = 0.0_dp  !<
187       TYPE(logpoint)    ::  log_event          !<
188
189       INTEGER(idp)     ::  count        !<
190       INTEGER(idp)     ::  count_rate   !<
191
192
193!
194!--    Initialize and check, respectively, point of measurement
195       IF ( log_event%place == ' ' )  THEN
196          log_event%place = place
197       ELSEIF ( log_event%place /= place )  THEN
198          WRITE( message_string, * ) 'wrong argument expected: ',                                  &
199                                     TRIM(log_event%place), ' given: ',  TRIM( place )
200          CALL message( 'cpu_log', 'PA0174', 1, 2, 0, 6, 0 )
201       ENDIF
202
203!
204!--    Determine, if barriers are allowed to set
205       IF ( PRESENT( barrierwait ) )  THEN
206          wait_allowed = barrierwait
207       ELSE
208          wait_allowed = .TRUE.
209       ENDIF
210
211!
212!--    MPI barrier, if requested, in order to avoid measuring wait times
213!--    caused by MPI routines waiting for other MPI routines of other
214!--    PEs that have not yet finished
215#if defined( __parallel )
216       IF ( cpu_log_barrierwait  .AND.  wait_allowed  .AND.                                        &
217            ( modus == 'start'  .OR.  modus == 'continue' ) )  THEN
218          CALL MPI_BARRIER( comm2d, ierr )
219       ENDIF
220#endif
221
222!
223!--    Take current time
224       CALL SYSTEM_CLOCK( count, count_rate )
225       mtime = REAL( count, KIND=dp ) / REAL( count_rate, KIND=dp )
226
227!
228!--    Start, stop or pause measurement
229       IF ( modus == 'start'  .OR.  modus == 'continue' )  THEN
230          log_event%mtime    = mtime
231          log_event%mtimevec = mtimevec
232       ELSEIF ( modus == 'pause' )  THEN
233          IF ( ( mtime - log_event%mtime ) < 0.0  .AND.  first )  THEN
234             WRITE( message_string, * ) 'negative time interval occured',                          &
235                                        '&PE',myid,' L=PAUSE "',TRIM(log_event%place),             &
236                                        '" new=', mtime,' last=',log_event%mtime
237             CALL message( 'cpu_log', 'PA0176', 0, 1, -1, 6, 0 )
238             first = .FALSE.
239          ENDIF
240          log_event%isum     = log_event%isum + mtime - log_event%mtime
241          log_event%ivect    = log_event%ivect  + mtimevec - log_event%mtimevec
242       ELSEIF ( modus == 'stop' )  THEN
243          IF ( ( mtime - log_event%mtime + log_event%isum ) < 0.0  .AND. first )  THEN
244             WRITE( message_string, * ) 'negative time interval occured',                          &
245                                        '&PE',myid,' L=STOP "',TRIM(log_event%place),'" new=',     &
246                                        mtime,' last=',log_event%mtime,' isum=',log_event%isum
247             CALL message( 'cpu_log', 'PA0177', 0, 1, -1, 6, 0 )
248             first = .FALSE.
249          ENDIF
250          log_event%mtime    = mtime    - log_event%mtime    + log_event%isum
251          log_event%mtimevec = mtimevec - log_event%mtimevec + log_event%ivect
252          log_event%sum      = log_event%sum  + log_event%mtime
253          IF ( log_event%sum < 0.0  .AND.  first )  THEN
254             WRITE( message_string, * ) 'negative time interval occured',                          &
255                                        '&PE',myid,' L=STOP "',TRIM(log_event%place),'" sum=',     &
256                                        log_event%sum,' mtime=',log_event%mtime
257             CALL message( 'cpu_log', 'PA0178', 0, 1, -1, 6, 0 )
258             first = .FALSE.
259          ENDIF
260          log_event%vector   = log_event%vector + log_event%mtimevec
261          log_event%counts   = log_event%counts + 1
262          log_event%isum     = 0.0_dp
263          log_event%ivect    = 0.0_dp
264       ELSE
265          message_string = 'unknown modus of time measurement: ' // TRIM( modus )
266          CALL message( 'cpu_log', 'PA0179', 0, 1, -1, 6, 0 )
267       ENDIF
268
269    END SUBROUTINE cpu_log
270
271
272!------------------------------------------------------------------------------!
273! Description:
274! ------------
275!> Analysis and output of the cpu-times measured. All PE results are collected
276!> on PE0 in order to calculate the mean cpu-time over all PEs and other
277!> statistics. The output is sorted according to the amount of cpu-time consumed
278!> and output on PE0.
279!------------------------------------------------------------------------------!
280
281    SUBROUTINE cpu_statistics
282
283       IMPLICIT NONE
284
285       INTEGER(iwp)    ::  i               !<
286       INTEGER(iwp)    ::  ii(1)           !<
287#if defined( __parallel )
288       INTEGER(iwp)    ::  iii             !<
289       INTEGER(iwp)    ::  sender          !<
290#endif
291       REAL(dp)       ::  average_cputime  !<
292       REAL(dp), SAVE ::  norm = 1.0_dp    !<
293       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  pe_max          !<
294       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  pe_max_s        !<
295       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  pe_min          !<
296       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  pe_min_s        !<
297       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  pe_rms          !<
298       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  pe_rms_s        !<
299       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  pe_tmp          !<
300       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  pe_tmp_s        !<
301       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  sum             !<
302       REAL(dp), DIMENSION(:),   ALLOCATABLE ::  sum_s           !<
303       REAL(dp), DIMENSION(:,:), ALLOCATABLE ::  pe_log_points   !<
304       REAL(dp), DIMENSION(:,:), ALLOCATABLE ::  pe_log_points_s !<
305
306
307       CALL location_message( 'calculating cpu statistics', 'start' )
308
309!
310!--    Compute CPU-times in seconds for the global non-overlapping measurements.
311       log_point%mtime  = log_point%mtime  / norm
312       log_point%sum    = log_point%sum    / norm
313       log_point%vector = log_point%vector / norm
314       WHERE ( log_point%counts /= 0 )
315          log_point%mean = log_point%sum / log_point%counts
316       END WHERE
317
318
319!
320!--    Collect CPU-times from all PEs and calculate statistics
321       IF ( myid == 0 )  THEN
322!
323!--       Allocate and initialize temporary arrays needed for statistics
324          ALLOCATE( pe_max( SIZE( log_point ) ), pe_min( SIZE( log_point ) ),                      &
325                    pe_rms( SIZE( log_point ) ), pe_tmp( SIZE( log_point ) ),                      &
326                    pe_log_points( SIZE( log_point ), 0:numprocs-1 ) )
327          pe_min = log_point%sum
328          pe_max = log_point%sum    ! need to be set in case of 1 PE
329          pe_rms = 0.0_dp
330          pe_tmp = 0.0_dp
331
332#if defined( __parallel )
333!
334!--       Receive data from all PEs
335          DO  i = 1, numprocs-1
336             CALL MPI_RECV( pe_tmp(1), SIZE( log_point ), MPI_DOUBLE_PRECISION, i, i, comm2d,      &
337                            status, ierr )
338             sender = status(MPI_SOURCE)
339             pe_log_points(:,sender) = pe_tmp
340          ENDDO
341          pe_log_points(:,0) = log_point%sum   ! Results from PE0
342!
343!--       Calculate mean of all PEs, store it on log_point%sum
344!--       and find minimum and maximum
345          DO  iii = 1, SIZE( log_point )
346             DO  i = 1, numprocs-1
347                log_point(iii)%sum = log_point(iii)%sum + pe_log_points(iii,i)
348                pe_min(iii) = MIN( pe_min(iii), pe_log_points(iii,i) )
349                pe_max(iii) = MAX( pe_max(iii), pe_log_points(iii,i) )
350             ENDDO
351             log_point(iii)%sum = log_point(iii)%sum / numprocs
352!
353!--          Calculate rms
354             DO  i = 0, numprocs-1
355                pe_rms(iii) = pe_rms(iii) + ( pe_log_points(iii,i) - log_point(iii)%sum )**2
356             ENDDO
357             pe_rms(iii) = SQRT( pe_rms(iii) / numprocs )
358          ENDDO
359       ELSE
360!
361!--       Send data to PE0 (pe_max is used as temporary storage to send
362!--       the data in order to avoid sending the data type log)
363          ALLOCATE( pe_max( SIZE( log_point ) ) )
364          pe_max = log_point%sum
365          CALL MPI_SEND( pe_max(1), SIZE( log_point ), MPI_DOUBLE_PRECISION, 0, myid, comm2d, ierr )
366#endif
367
368       ENDIF
369
370!
371!--    The same procedure again for the special measurements.
372!
373!--    Compute cpu-times in seconds
374       log_point_s%mtime  = log_point_s%mtime  / norm
375       log_point_s%sum    = log_point_s%sum    / norm
376       log_point_s%vector = log_point_s%vector / norm
377       WHERE ( log_point_s%counts /= 0 )
378          log_point_s%mean = log_point_s%sum / log_point_s%counts
379       END WHERE
380
381!
382!--    Collect CPU-times from all PEs and calculate statistics
383#if defined( __parallel )
384!
385!--    Set barrier in order to avoid that PE0 receives log_point_s-data
386!--    while still busy with receiving log_point-data (see above)
387       CALL MPI_BARRIER( comm2d, ierr )
388#endif
389       IF ( myid == 0 )  THEN
390!
391!--       Allocate and initialize temporary arrays needed for statistics
392          ALLOCATE( pe_max_s( SIZE( log_point_s ) ), pe_min_s( SIZE( log_point_s ) ),              &
393                    pe_rms_s( SIZE( log_point_s ) ), pe_tmp_s( SIZE( log_point_s ) ),              &
394                    pe_log_points_s( SIZE( log_point_s ), 0:numprocs-1 ) )
395          pe_min_s = log_point_s%sum
396          pe_max_s = log_point_s%sum    ! need to be set in case of 1 PE
397          pe_rms_s = 0.0_dp
398
399#if defined( __parallel )
400!
401!--       Receive data from all PEs
402          DO  i = 1, numprocs-1
403             CALL MPI_RECV( pe_tmp_s(1), SIZE( log_point_s ), MPI_DOUBLE_PRECISION,                &
404                            MPI_ANY_SOURCE, MPI_ANY_TAG, comm2d, status, ierr )
405             sender = status(MPI_SOURCE)
406             pe_log_points_s(:,sender) = pe_tmp_s
407          ENDDO
408          pe_log_points_s(:,0) = log_point_s%sum   ! Results from PE0
409!
410!--       Calculate mean of all PEs, store it on log_point_s%sum
411!--       and find minimum and maximum
412          DO  iii = 1, SIZE( log_point_s )
413             DO  i = 1, numprocs-1
414                log_point_s(iii)%sum = log_point_s(iii)%sum + pe_log_points_s(iii,i)
415                pe_min_s(iii) = MIN( pe_min_s(iii), pe_log_points_s(iii,i) )
416                pe_max_s(iii) = MAX( pe_max_s(iii), pe_log_points_s(iii,i) )
417             ENDDO
418             log_point_s(iii)%sum = log_point_s(iii)%sum / numprocs
419!
420!--          Calculate rms
421             DO  i = 0, numprocs-1
422                pe_rms_s(iii) = pe_rms_s(iii) + ( pe_log_points_s(iii,i) - log_point_s(iii)%sum )**2
423             ENDDO
424             pe_rms_s(iii) = SQRT( pe_rms_s(iii) / numprocs )
425          ENDDO
426       ELSE
427!
428!--       Send data to PE0 (pe_max is used as temporary storage to send
429!--       the data in order to avoid sending the data type log)
430          ALLOCATE( pe_max_s( SIZE( log_point_s ) ) )
431          pe_max_s = log_point_s%sum
432          CALL MPI_SEND( pe_max_s(1), SIZE( log_point_s ), MPI_DOUBLE_PRECISION, 0, 0, comm2d,     &
433                         ierr )
434#endif
435
436       ENDIF
437!
438!--    Write CPU-times for the non-overlapping measurements.
439       IF ( myid == 0 )  THEN
440!
441!--       Re-store sums
442          ALLOCATE( sum( SIZE( log_point ) ) )
443          WHERE ( log_point%counts /= 0 )
444             sum = log_point%sum
445          ELSEWHERE
446             sum = -1.0_dp
447          ENDWHERE
448
449!
450!--       Get total time in order to calculate CPU-time per gridpoint and timestep.
451!--       Time for initialization (2) and spinup (41) are not included here!
452          IF ( nr_timesteps_this_run /= 0 )  THEN
453             average_cputime = log_point_s(10)%sum / REAL( ngp_3d(0), KIND=dp ) /                  &
454                               REAL( nr_timesteps_this_run, KIND=dp ) * 1E6_dp     ! in micro-sec
455          ELSE
456             average_cputime = -1.0_dp
457          ENDIF
458
459!
460!--       Write cpu-times sorted by size
461          CALL check_open( 18 )
462#if defined( __parallel )
463          WRITE ( 18, 100 )  TRIM( run_description_header ), numprocs * threads_per_task,          &
464                             pdims(1), pdims(2), threads_per_task, nx+1, ny+1, nz,                 &
465                             nr_timesteps_this_run, average_cputime
466
467          WRITE ( 18, 110 )
468#else
469          WRITE ( 18, 100 )  TRIM( run_description_header ), numprocs * threads_per_task, 1, 1,    &
470                             threads_per_task, nx+1, ny+1, nz, nr_timesteps_this_run,              &
471                             average_cputime
472
473          WRITE ( 18, 110 )
474#endif
475          DO
476             ii = MAXLOC( sum )
477             i = ii(1)
478             IF ( sum(i) /= -1.0_dp )  THEN
479                WRITE ( 18, 102 )  log_point(i)%place, log_point(i)%sum,                           &
480                                   log_point(i)%sum / log_point(1)%sum * 100.0_dp,                 &
481                                   log_point(i)%counts, pe_min(i), pe_max(i), pe_rms(i)
482                sum(i) = -1.0_dp
483             ELSE
484                EXIT
485             ENDIF
486          ENDDO
487       ENDIF
488
489!
490!--    Write CPU-times for special measurements.
491       IF ( myid == 0 )  THEN
492!
493!--       Re-store sums
494          ALLOCATE( sum_s( SIZE( log_point_s ) ) )
495          WHERE ( log_point_s%counts /= 0 )
496             sum_s = log_point_s%sum
497          ELSEWHERE
498             sum_s = -1.0_dp
499          ENDWHERE
500
501!
502!--       Write cpu-times sorted by size
503          WRITE ( 18, 101 )
504          DO
505             ii = MAXLOC( sum_s )
506             i = ii(1)
507             IF ( sum_s(i) /= -1.0_dp )  THEN
508                WRITE ( 18, 102 )  log_point_s(i)%place, log_point_s(i)%sum,                       &
509                                   log_point_s(i)%sum / log_point(1)%sum * 100.0_dp,               &
510                                   log_point_s(i)%counts, pe_min_s(i), pe_max_s(i), pe_rms_s(i)
511                sum_s(i) = -1.0_dp
512             ELSE
513                EXIT
514             ENDIF
515          ENDDO
516
517!
518!--       Output of handling of MPI operations
519          IF ( collective_wait )  THEN
520             WRITE ( 18, 103 )
521          ELSE
522             WRITE ( 18, 104 )
523          ENDIF
524          IF ( cpu_log_barrierwait )  WRITE ( 18, 111 )
525          IF ( synchronous_exchange )  THEN
526             WRITE ( 18, 105 )
527          ELSE
528             WRITE ( 18, 106 )
529          ENDIF
530!
531!--       Output of restart data transfer speed
532          IF ( write_binary  .AND.  restart_data_format_output(1:3) == 'mpi' )  THEN
533             WRITE ( 18, 107 )  restart_file_size, restart_file_size / log_point(22)%sum
534          ENDIF
535!
536!--       Empty lines in order to create a gap to the results from the next restart run
537          WRITE ( 18, 108 )
538
539!
540!--       Unit 18 is not needed anymore
541          CALL close_file( 18 )
542
543       ENDIF
544
545       CALL location_message( 'calculating cpu statistics', 'finished' )
546
547
548   100 FORMAT (A/11('-')//'CPU measures for ',I5,' PEs (',I5,'(x) * ',I5,'(y',                     &
549               &') tasks *',I5,' threads):'//                                                      &
550               'gridpoints (x/y/z): ',20X,I5,' * ',I5,' * ',I5/                                    &
551               'nr of timesteps: ',22X,I6/                                                         &
552               'cpu time per grid point and timestep: ',5X,F8.5,' * 10**-6 s')
553
554   101 FORMAT (/'special measures:'/ &
555               &'-----------------------------------------------------------',                     &
556               &'---------------------')
557
558   102 FORMAT (A25,1X,F10.3,2X,F7.2,1X,I7,2(1X,F9.2),1X,F6.2)
559   103 FORMAT (/'Barriers are set in front of collective operations')
560   104 FORMAT (/'No barriers are set in front of collective operations')
561   105 FORMAT (/'Exchange of ghostpoints via MPI_SENDRCV')
562   106 FORMAT (/'Exchange of ghostpoints via MPI_ISEND/MPI_IRECV')
563   107 FORMAT (/'Restart file size:   ',F12.1,' MByte'/                                            &
564               &'I/O transfer speed:  ',F12.1,' MByte / sec')
565   108 FORMAT (//)
566   110 FORMAT ('------------------------------------------------------------',                     &
567               &'----------'//                                                                     &
568               &'place:                              mean        counts     ',                     &
569               &' min       max    rms'/                                                           &
570               &'                                sec.      %                ',                     &
571               &'sec.      sec.   sec.'/                                                           &
572               &'-----------------------------------------------------------',                     &
573               &'---------------------')
574   111 FORMAT (/'Barriers are set at beginning (start/continue) of measurements')
575
576    END SUBROUTINE cpu_statistics
577
578 END MODULE cpulog
Note: See TracBrowser for help on using the repository browser.