Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
[SMPI] Introduce variable computation speeds.
[simgrid.git] / src / instr / instr_TI_trace.cpp
1 /* Copyright (c) 2010-2015. The SimGrid Team.
2  * All rights reserved.                                                     */
3
4 /* This program is free software; you can redistribute it and/or modify it
5  * under the terms of the license (GNU LGPL) which comes with this package. */
6
7 #include "src/instr/instr_private.h"
8 #include "xbt/virtu.h" /* sg_cmdline */
9 #include "xbt/xbt_os_time.h"
10 #include "simgrid/sg_config.h"
11
12 #include <errno.h>
13 #include <string.h>
14 #include <sys/stat.h>
15
16 #ifdef WIN32
17 #include <direct.h> // _mkdir
18 #endif
19
20 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(instr_TI_trace, instr_trace, "tracing event system");
21
22 extern FILE *tracing_file;
23 double prefix=0.0;
24
25 xbt_dict_t tracing_files = NULL;
26
27 extern s_instr_trace_writer_t active_writer;
28
29 void TRACE_TI_init(void)
30 {
31   active_writer.print_PushState = print_TIPushState;
32   active_writer.print_CreateContainer=print_TICreateContainer;
33   active_writer.print_DestroyContainer=print_TIDestroyContainer;
34 }
35
36 void TRACE_TI_start(void)
37 {
38   char *filename = TRACE_get_filename();
39   tracing_file = fopen(filename, "w");
40   if (tracing_file == NULL) {
41     THROWF(system_error, 1, "Tracefile %s could not be opened for writing.", filename);
42   }
43
44   XBT_DEBUG("Filename %s is open for writing", filename);
45
46   /* output one line comment */
47   dump_comment(TRACE_get_comment());
48
49   /* output comment file */
50   dump_comment_file(TRACE_get_comment_file());
51 }
52
53 void TRACE_TI_end(void)
54 {
55   xbt_dict_free(&tracing_files);
56   fclose(tracing_file);
57   char *filename = TRACE_get_filename();
58   XBT_DEBUG("Filename %s is closed", filename);
59 }
60
61 void print_TICreateContainer(paje_event_t event)
62 {
63   //if we are in the mode with only one file
64   static FILE *temp = NULL;
65
66   if (tracing_files == NULL) {
67     tracing_files = xbt_dict_new_homogeneous(NULL);
68     //generate unique run id with time
69     prefix = xbt_os_time();
70   }
71
72   if (!xbt_cfg_get_boolean("tracing/smpi/format/ti-one-file") || temp == NULL) {
73     char *folder_name = bprintf("%s_files", TRACE_get_filename());
74     char *filename = bprintf("%s/%f_%s.txt", folder_name, prefix, ((createContainer_t) event->data)->container->name);
75 #ifdef WIN32
76     _mkdir(folder_name);
77 #else
78     mkdir(folder_name, S_IRWXU | S_IRWXG | S_IRWXO);
79 #endif
80     temp = fopen(filename, "w");
81     xbt_assert(temp, "Tracefile %s could not be opened for writing: %s", filename, strerror(errno));
82     fprintf(tracing_file, "%s\n", filename);
83
84     xbt_free(folder_name);
85     xbt_free(filename);
86   }
87
88   xbt_dict_set(tracing_files, ((createContainer_t) event->data)->container->name, (void *) temp, NULL);
89 }
90
91 void print_TIDestroyContainer(paje_event_t event)
92 {
93   if (!xbt_cfg_get_boolean("tracing/smpi/format/ti-one-file")|| xbt_dict_length(tracing_files) == 1) {
94     FILE* f = (FILE*)xbt_dict_get_or_null(tracing_files, ((destroyContainer_t) event->data)->container->name);
95     fclose(f);
96   }
97   xbt_dict_remove(tracing_files, ((destroyContainer_t) event->data)->container->name);
98 }
99
100 void print_TIPushState(paje_event_t event)
101 {
102   int i;
103
104   //char* function=NULL;
105   if (((pushState_t) event->data)->extra == NULL)
106     return;
107   instr_extra_data extra = (instr_extra_data) (((pushState_t) event->data)->extra);
108
109   char *process_id = NULL;
110   //FIXME: dirty extract "rank-" from the name, as we want the bare process id here
111   if (strstr(((pushState_t) event->data)->container->name, "rank-") == NULL)
112     process_id = xbt_strdup(((pushState_t) event->data)->container->name);
113   else
114     process_id = xbt_strdup(((pushState_t) event->data)->container->name + 5);
115
116   FILE* trace_file =  (FILE* )xbt_dict_get(tracing_files, ((pushState_t) event->data)->container->name);
117
118   switch (extra->type) {
119   case TRACING_INIT:
120     fprintf(trace_file, "%s init\n", process_id);
121     break;
122   case TRACING_FINALIZE:
123     fprintf(trace_file, "%s finalize\n", process_id);
124     break;
125   case TRACING_SEND:
126     fprintf(trace_file, "%s send %d %d %s\n", process_id, extra->dst, extra->send_size, extra->datatype1);
127     break;
128   case TRACING_ISEND:
129     fprintf(trace_file, "%s isend %d %d %s\n", process_id, extra->dst, extra->send_size, extra->datatype1);
130     break;
131   case TRACING_RECV:
132     fprintf(trace_file, "%s recv %d %d %s\n", process_id, extra->src, extra->send_size, extra->datatype1);
133     break;
134   case TRACING_IRECV:
135     fprintf(trace_file, "%s irecv %d %d %s\n", process_id, extra->src, extra->send_size, extra->datatype1);
136     break;
137   case TRACING_TEST:
138     fprintf(trace_file, "%s test\n", process_id);
139     break;
140   case TRACING_WAIT:
141     fprintf(trace_file, "%s wait\n", process_id);
142     break;
143   case TRACING_WAITALL:
144     fprintf(trace_file, "%s waitall\n", process_id);
145     break;
146   case TRACING_BARRIER:
147     fprintf(trace_file, "%s barrier\n", process_id);
148     break;
149   case TRACING_BCAST:          // rank bcast size (root) (datatype)
150     fprintf(trace_file, "%s bcast %d ", process_id, extra->send_size);
151     if (extra->root != 0 || (extra->datatype1 && strcmp(extra->datatype1, "")))
152       fprintf(trace_file, "%d %s", extra->root, extra->datatype1);
153     fprintf(trace_file, "\n");
154     break;
155   case TRACING_REDUCE:         // rank reduce comm_size comp_size (root) (datatype)
156     fprintf(trace_file, "%s reduce %d %f ", process_id, extra->send_size, extra->comp_size);
157     if (extra->root != 0 || (extra->datatype1 && strcmp(extra->datatype1, "")))
158       fprintf(trace_file, "%d %s", extra->root, extra->datatype1);
159     fprintf(trace_file, "\n");
160     break;
161   case TRACING_ALLREDUCE:      // rank allreduce comm_size comp_size (datatype)
162     fprintf(trace_file, "%s allreduce %d %f %s\n", process_id, extra->send_size, extra->comp_size, extra->datatype1);
163     break;
164   case TRACING_ALLTOALL:       // rank alltoall send_size recv_size (sendtype) (recvtype)
165     fprintf(trace_file, "%s alltoall %d %d %s %s\n", process_id, extra->send_size, extra->recv_size, extra->datatype1,
166             extra->datatype2);
167     break;
168   case TRACING_ALLTOALLV:      // rank alltoallv send_size [sendcounts] recv_size [recvcounts] (sendtype) (recvtype)
169     fprintf(trace_file, "%s alltoallv %d ", process_id, extra->send_size);
170     for (i = 0; i < extra->num_processes; i++)
171       fprintf(trace_file, "%d ", extra->sendcounts[i]);
172     fprintf(trace_file, "%d ", extra->recv_size);
173     for (i = 0; i < extra->num_processes; i++)
174       fprintf(trace_file, "%d ", extra->recvcounts[i]);
175     fprintf(trace_file, "%s %s \n", extra->datatype1, extra->datatype2);
176     break;
177   case TRACING_GATHER:         // rank gather send_size recv_size root (sendtype) (recvtype)
178     fprintf(trace_file, "%s gather %d %d %d %s %s\n", process_id, extra->send_size, extra->recv_size, extra->root,
179             extra->datatype1, extra->datatype2);
180     break;
181   case TRACING_ALLGATHERV:     // rank allgatherv send_size [recvcounts] (sendtype) (recvtype)
182     fprintf(trace_file, "%s allgatherv %d ", process_id, extra->send_size);
183     for (i = 0; i < extra->num_processes; i++)
184       fprintf(trace_file, "%d ", extra->recvcounts[i]);
185     fprintf(trace_file, "%s %s \n", extra->datatype1, extra->datatype2);
186     break;
187   case TRACING_REDUCE_SCATTER: // rank reducescatter [recvcounts] comp_size (sendtype)
188     fprintf(trace_file, "%s reducescatter ", process_id);
189     for (i = 0; i < extra->num_processes; i++)
190       fprintf(trace_file, "%d ", extra->recvcounts[i]);
191     fprintf(trace_file, "%f %s\n", extra->comp_size, extra->datatype1);
192     break;
193   case TRACING_COMPUTING:
194     fprintf(trace_file, "%s compute %f\n", process_id, extra->comp_size);
195     break;
196   case TRACING_SLEEPING:
197     fprintf(trace_file, "%s sleep %f\n", process_id, extra->sleep_duration);
198     break;
199   case TRACING_GATHERV: // rank gatherv send_size [recvcounts] root (sendtype) (recvtype)
200     fprintf(trace_file, "%s gatherv %d ", process_id, extra->send_size);
201     for (i = 0; i < extra->num_processes; i++)
202       fprintf(trace_file, "%d ", extra->recvcounts[i]);
203     fprintf(trace_file, "%d %s %s\n", extra->root, extra->datatype1, extra->datatype2);
204     break;
205   case TRACING_WAITANY:
206   case TRACING_SENDRECV:
207   case TRACING_SCATTER:
208   case TRACING_SCATTERV:
209   case TRACING_ALLGATHER:
210   case TRACING_SCAN:
211   case TRACING_EXSCAN:
212   case TRACING_COMM_SIZE:
213   case TRACING_COMM_SPLIT:
214   case TRACING_COMM_DUP:
215   case TRACING_SSEND:
216   case TRACING_ISSEND:
217   default:
218     XBT_WARN ("Call from %s impossible to translate into replay command : Not implemented (yet)",
219          ((pushState_t) event->data)->value->name);
220     break;
221   }
222
223   if (extra->recvcounts != NULL)
224     xbt_free(extra->recvcounts);
225   if (extra->sendcounts != NULL)
226     xbt_free(extra->sendcounts);
227   xbt_free(process_id);
228   xbt_free(extra);
229 }