Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
5a0e491d71851008e3460b1069e41e90b950cf76
[simgrid.git] / src / smpi / smpi_bench.c
1 /* Copyright (c) 2007, 2009, 2010. The SimGrid Team.
2  * All rights reserved.                                                     */
3
4 /* This program is free software; you can redistribute it and/or modify it
5   * under the terms of the license (GNU LGPL) which comes with this package. */
6
7 #include <math.h> // sqrt
8 #include "private.h"
9 #include "xbt/dict.h"
10 #include "xbt/sysdep.h"
11 #include "xbt/ex.h"
12 #include "surf/surf.h"
13
14 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(smpi_bench, smpi,
15                                 "Logging specific to SMPI (benchmarking)");
16
17 xbt_dict_t allocs = NULL;       /* Allocated on first use */
18 xbt_dict_t samples = NULL;      /* Allocated on first use */
19 xbt_dict_t calls = NULL;        /* Allocated on first use */
20
21 typedef struct {
22   int count;
23   char data[];
24 } shared_data_t;
25
26 typedef struct {
27   int count;
28   double sum;
29   double sum_pow2;
30   double mean;
31   double relstderr;
32   int iters;
33   double threshold;
34   int started;
35 } local_data_t;
36
37 void smpi_bench_destroy(void)
38 {
39   if (allocs) {
40     xbt_dict_free(&allocs);
41   }
42   if (samples) {
43     xbt_dict_free(&samples);
44   }
45   if(calls) {
46     xbt_dict_free(&calls);
47   }
48 }
49
50 static void smpi_execute_flops(double flops)
51 {
52   smx_action_t action;
53   smx_host_t host;
54   host = SIMIX_host_self();
55
56   XBT_DEBUG("Handle real computation time: %f flops", flops);
57   action = SIMIX_req_host_execute("computation", host, flops, 1);
58 #ifdef HAVE_TRACING
59   SIMIX_req_set_category (action, TRACE_internal_smpi_get_category());
60 #endif
61   SIMIX_req_host_execution_wait(action);
62 }
63
64 static void smpi_execute(double duration)
65 {
66   if (duration >= xbt_cfg_get_double(_surf_cfg_set, "smpi/cpu_threshold")) {
67     XBT_DEBUG("Sleep for %f to handle real computation time", duration);
68     smpi_execute_flops(duration *
69                        xbt_cfg_get_double(_surf_cfg_set,
70                                           "smpi/running_power"));
71   }
72 }
73
74 void smpi_bench_begin(void)
75 {
76   xbt_os_timer_start(smpi_process_timer());
77 }
78
79 void smpi_bench_end(void)
80 {
81   xbt_os_timer_t timer = smpi_process_timer();
82
83   xbt_os_timer_stop(timer);
84   smpi_execute(xbt_os_timer_elapsed(timer));
85 }
86
87 unsigned int smpi_sleep(unsigned int secs)
88 {
89   smpi_execute((double) secs);
90   return secs;
91 }
92
93 int smpi_gettimeofday(struct timeval *tv, struct timezone *tz)
94 {
95   double now = SIMIX_get_clock();
96
97   if (tv) {
98     tv->tv_sec = (time_t) now;
99     tv->tv_usec = (suseconds_t) (now * 1e6);
100   }
101   return 0;
102 }
103
104 static char *sample_location(int global, const char *file, int line)
105 {
106   if (global) {
107     return bprintf("%s:%d", file, line);
108   } else {
109     return bprintf("%s:%d:%d", file, line, smpi_process_index());
110   }
111 }
112
113 int smpi_sample_1(int global, const char *file, int line, int iters, double threshold)
114 {
115   char *loc = sample_location(global, file, line);
116   local_data_t *data;
117
118   smpi_bench_end();     /* Take time from previous MPI call into account */
119   if (!samples) {
120     samples = xbt_dict_new();
121   }
122   data = xbt_dict_get_or_null(samples, loc);
123   if (!data) {
124     data = (local_data_t *) xbt_new(local_data_t, 1);
125     data->count = 0;
126     data->sum = 0.0;
127     data->sum_pow2 = 0.0;
128     data->iters = iters;
129     data->threshold = threshold;
130     data->started = 0;
131     xbt_dict_set(samples, loc, data, &free);
132     return 0;
133   }
134   free(loc);
135   return 1;
136 }
137
138 int smpi_sample_2(int global, const char *file, int line)
139 {
140   char *loc = sample_location(global, file, line);
141   local_data_t *data;
142
143   xbt_assert(samples, "You did something very inconsistent, didn't you?");
144   data = xbt_dict_get_or_null(samples, loc);
145   if (!data) {
146     xbt_assert(data, "Please, do thing in order");
147   }
148   if (!data->started) {
149     if ((data->iters > 0 && data->count >= data->iters)
150         || (data->count > 1 && data->threshold > 0.0 && data->relstderr <= data->threshold)) {
151       XBT_DEBUG("Perform some wait of %f", data->mean);
152       smpi_execute(data->mean);
153     } else {
154       data->started = 1;
155       data->count++;
156     }
157   } else {
158     data->started = 0;
159   }
160   free(loc);
161   smpi_bench_begin();
162   smpi_process_simulated_start();
163   return data->started;
164 }
165
166 void smpi_sample_3(int global, const char *file, int line)
167 {
168   char *loc = sample_location(global, file, line);
169   local_data_t *data;
170   double sample, n;
171
172   xbt_assert(samples, "You did something very inconsistent, didn't you?");
173   data = xbt_dict_get_or_null(samples, loc);
174   smpi_bench_end();
175   if(data && data->started && data->count < data->iters) {
176     sample = smpi_process_simulated_elapsed();
177     data->sum += sample;
178     data->sum_pow2 += sample * sample;
179     n = (double)data->count;
180     data->mean = data->sum / n;
181     data->relstderr = sqrt((data->sum_pow2 / n - data->mean * data->mean) / n) / data->mean;
182     XBT_DEBUG("Average mean after %d steps is %f, relative standard error is %f (sample was %f)", data->count,
183            data->mean, data->relstderr, sample);
184   }
185   free(loc);
186 }
187
188 void smpi_sample_flops(double flops)
189 {
190   smpi_execute_flops(flops);
191 }
192
193 void *smpi_shared_malloc(size_t size, const char *file, int line)
194 {
195   char *loc = bprintf("%s:%d:%zu", file, line, size);
196   shared_data_t *data;
197
198   if (!allocs) {
199     allocs = xbt_dict_new();
200   }
201   data = xbt_dict_get_or_null(allocs, loc);
202   if (!data) {
203     data = (shared_data_t *) xbt_malloc0(sizeof(int) + size);
204     data->count = 1;
205     xbt_dict_set(allocs, loc, data, &free);
206   } else {
207     data->count++;
208   }
209   free(loc);
210   return data->data;
211 }
212
213 void smpi_shared_free(void *ptr)
214 {
215   shared_data_t *data = (shared_data_t *) ((int *) ptr - 1);
216   char *loc;
217
218   if (!allocs) {
219     XBT_WARN("Cannot free: nothing was allocated");
220     return;
221   }
222   loc = xbt_dict_get_key(allocs, data);
223   if (!loc) {
224     XBT_WARN("Cannot free: %p was not shared-allocated by SMPI", ptr);
225     return;
226   }
227   data->count--;
228   if (data->count <= 0) {
229     xbt_dict_remove(allocs, loc);
230   }
231 }
232
233 int smpi_shared_known_call(const char* func, const char* input) {
234    char* loc = bprintf("%s:%s", func, input);
235    xbt_ex_t ex;
236    int known;
237
238    if(!calls) {
239       calls = xbt_dict_new();
240    }
241    TRY {
242       xbt_dict_get(calls, loc); /* Succeed or throw */
243       known = 1;
244    }
245    CATCH(ex) {
246       if(ex.category == not_found_error) {
247          known = 0;
248          xbt_ex_free(ex);
249       } else {
250          RETHROW;
251       }
252    }
253    free(loc);
254    return known;
255 }
256
257 void* smpi_shared_get_call(const char* func, const char* input) {
258    char* loc = bprintf("%s:%s", func, input);
259    void* data;
260
261    if(!calls) {
262       calls = xbt_dict_new();
263    }
264    data = xbt_dict_get(calls, loc);
265    free(loc);
266    return data;
267 }
268
269 void* smpi_shared_set_call(const char* func, const char* input, void* data) {
270    char* loc = bprintf("%s:%s", func, input);
271
272    if(!calls) {
273       calls = xbt_dict_new();
274    }
275    xbt_dict_set(calls, loc, data, NULL);
276    free(loc);
277    return data;
278 }