Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
45201cf7af9019deac2bed7414cfa726f972db51
[simgrid.git] / src / mc / mc_checkpoint.c
1 /* Copyright (c) 2008-2014. The SimGrid Team.
2  * All rights reserved.                                                     */
3
4 /* This program is free software; you can redistribute it and/or modify it
5  * under the terms of the license (GNU LGPL) which comes with this package. */
6
7 #define _GNU_SOURCE
8 #define UNW_LOCAL_ONLY
9
10 #include <unistd.h>
11
12 #include <string.h>
13 #include <link.h>
14 #include <dirent.h>
15
16 #include "internal_config.h"
17 #include "mc_memory_map.h"
18 #include "mc_private.h"
19 #include "xbt/module.h"
20 #include <xbt/mmalloc.h>
21 #include "../smpi/private.h"
22 #include <alloca.h>
23
24 #include "xbt/mmalloc/mmprivate.h"
25
26 #include "../simix/smx_private.h"
27
28 #define UNW_LOCAL_ONLY
29 #include <libunwind.h>
30 #include <libelf.h>
31
32 #include "mc_private.h"
33 #include <mc/mc.h>
34
35 #include "mc_snapshot.h"
36 #include "mc_object_info.h"
37 #include "mc_mmu.h"
38
39 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(mc_checkpoint, mc,
40                                 "Logging specific to mc_checkpoint");
41
42 /************************************  Free functions **************************************/
43 /*****************************************************************************************/
44
45 static void MC_snapshot_stack_free(mc_snapshot_stack_t s)
46 {
47   if (s) {
48     xbt_dynar_free(&(s->local_variables));
49     xbt_dynar_free(&(s->stack_frames));
50     xbt_free(s);
51   }
52 }
53
54 static void MC_snapshot_stack_free_voidp(void *s)
55 {
56   MC_snapshot_stack_free((mc_snapshot_stack_t) * (void **) s);
57 }
58
59 static void local_variable_free(local_variable_t v)
60 {
61   xbt_free(v->name);
62   xbt_free(v);
63 }
64
65 static void local_variable_free_voidp(void *v)
66 {
67   local_variable_free((local_variable_t) * (void **) v);
68 }
69
70 void MC_region_destroy(mc_mem_region_t region)
71 {
72   if (!region)
73     return;
74   switch(region->storage_type) {
75     case MC_REGION_STORAGE_TYPE_NONE:
76       break;
77     case MC_REGION_STORAGE_TYPE_FLAT:
78       xbt_free(region->flat.data);
79       break;
80     case MC_REGION_STORAGE_TYPE_CHUNKED:
81       mc_free_page_snapshot_region(region->chunked.page_numbers, mc_page_count(region->size));
82       xbt_free(region->chunked.page_numbers);
83       break;
84     case MC_REGION_STORAGE_TYPE_PRIVATIZED:
85       {
86         size_t regions_count = region->privatized.regions_count;
87         for (size_t i=0; i!=regions_count; ++i) {
88           MC_region_destroy(region->privatized.regions[i]);
89         }
90         free(region->privatized.regions);
91         break;
92       }
93   }
94   xbt_free(region);
95 }
96
97 void MC_free_snapshot(mc_snapshot_t snapshot)
98 {
99   for (size_t i = 0; i < snapshot->snapshot_regions_count; i++) {
100     MC_region_destroy(snapshot->snapshot_regions[i]);
101   }
102   xbt_free(snapshot->snapshot_regions);
103   xbt_free(snapshot->stack_sizes);
104   xbt_dynar_free(&(snapshot->stacks));
105   xbt_dynar_free(&(snapshot->to_ignore));
106   xbt_dynar_free(&snapshot->ignored_data);
107   xbt_free(snapshot);
108 }
109
110 /*******************************  Snapshot regions ********************************/
111 /*********************************************************************************/
112
113 static mc_mem_region_t mc_region_new_dense(
114   mc_region_type_t region_type,
115   void *start_addr, void* permanent_addr, size_t size, mc_mem_region_t ref_reg)
116 {
117   mc_mem_region_t region = xbt_new(s_mc_mem_region_t, 1);
118   region->region_type = region_type;
119   region->storage_type = MC_REGION_STORAGE_TYPE_FLAT;
120   region->start_addr = start_addr;
121   region->permanent_addr = permanent_addr;
122   region->size = size;
123   region->flat.data = xbt_malloc(size);
124   MC_process_read(&mc_model_checker->process, region->flat.data, permanent_addr, size);
125   XBT_DEBUG("New region : type : %d, data : %p (real addr %p), size : %zu",
126             region_type, region->flat.data, permanent_addr, size);
127   return region;
128 }
129
130 /** @brief Take a snapshot of a given region
131  *
132  * @param type
133  * @param start_addr   Address of the region in the simulated process
134  * @param permanent_addr Permanent address of this data (for privatized variables, this is the virtual address of the privatized mapping)
135  * @param size         Size of the data*
136  * @param ref_reg      Reference corresponding region
137  */
138 static mc_mem_region_t MC_region_new(mc_region_type_t type, void *start_addr, void* permanent_addr, size_t size, mc_mem_region_t ref_reg)
139 {
140   if (_sg_mc_sparse_checkpoint) {
141     return mc_region_new_sparse(type, start_addr, permanent_addr, size, ref_reg);
142   } else  {
143     return mc_region_new_dense(type, start_addr, permanent_addr, size, ref_reg);
144   }
145 }
146
147 /** @brief Restore a region from a snapshot
148  *
149  *  If we are using per page snapshots, it is possible to use the reference
150  *  region in order to do an incremental restoration of the region: the
151  *  softclean pages which are shared between the two snapshots do not need
152  *  to be restored.
153  *
154  *  @param reg     Target region
155  *  @param reg_reg Current region (if not NULL), used for lazy per page restoration
156  */
157 static void MC_region_restore(mc_mem_region_t region, mc_mem_region_t ref_region)
158 {
159   switch(region->storage_type) {
160   case MC_REGION_STORAGE_TYPE_NONE:
161   default:
162     xbt_die("Storage type not supported");
163     break;
164
165   case MC_REGION_STORAGE_TYPE_FLAT:
166     MC_process_write(&mc_model_checker->process, region->flat.data,
167       region->permanent_addr, region->size);
168     break;
169
170   case MC_REGION_STORAGE_TYPE_CHUNKED:
171     mc_region_restore_sparse(&mc_model_checker->process, region, ref_region);
172     break;
173
174   case MC_REGION_STORAGE_TYPE_PRIVATIZED:
175     {
176       bool has_ref_regions = ref_region &&
177         ref_region->storage_type == MC_REGION_STORAGE_TYPE_PRIVATIZED;
178       size_t process_count = region->privatized.regions_count;
179       for (size_t i = 0; i < process_count; i++) {
180         MC_region_restore(region->privatized.regions[i],
181           has_ref_regions ? ref_region->privatized.regions[i] : NULL);
182       }
183       break;
184     }
185   }
186 }
187
188 static inline
189 void* MC_privatization_address(mc_process_t process, int process_index)
190 {
191   xbt_assert(process_index >= 0);
192   return smpi_privatisation_regions[process_index].address;
193 }
194
195 static mc_mem_region_t MC_region_new_privatized(
196     mc_region_type_t region_type, void *start_addr, void* permanent_addr, size_t size,
197     mc_mem_region_t ref_reg)
198 {
199   size_t process_count = smpi_process_count();
200   mc_mem_region_t region = xbt_new(s_mc_mem_region_t, 1);
201   region->region_type = region_type;
202   region->storage_type = MC_REGION_STORAGE_TYPE_PRIVATIZED;
203   region->start_addr = start_addr;
204   region->permanent_addr = permanent_addr;
205   region->size = size;
206   region->privatized.regions_count = process_count;
207   region->privatized.regions = xbt_new(mc_mem_region_t, process_count);
208
209   for (size_t i = 0; i < process_count; i++) {
210     mc_mem_region_t ref_subreg = NULL;
211     if (ref_reg && ref_reg->storage_type == MC_REGION_STORAGE_TYPE_PRIVATIZED)
212       ref_subreg = ref_reg->privatized.regions[i];
213     region->privatized.regions[i] =
214       MC_region_new(region_type, start_addr,
215         MC_privatization_address(&mc_model_checker->process, i), size,
216         ref_subreg);
217   }
218
219   return region;
220 }
221
222 static void MC_snapshot_add_region(int index, mc_snapshot_t snapshot, mc_region_type_t type,
223                                   mc_object_info_t object_info,
224                                   void *start_addr, void* permanent_addr, size_t size)
225 {
226   if (type == MC_REGION_TYPE_DATA)
227     xbt_assert(object_info, "Missing object info for object.");
228   else if (type == MC_REGION_TYPE_HEAP)
229     xbt_assert(!object_info, "Unexpected object info for heap region.");
230
231   mc_mem_region_t ref_reg = NULL;
232   if (mc_model_checker->parent_snapshot)
233     ref_reg = mc_model_checker->parent_snapshot->snapshot_regions[index];
234
235   mc_mem_region_t region;
236   const bool privatization_aware = object_info && MC_object_info_executable(object_info);
237   if (privatization_aware && smpi_privatize_global_variables && smpi_process_count())
238     region = MC_region_new_privatized(type, start_addr, permanent_addr, size, ref_reg);
239   else
240     region = MC_region_new(type, start_addr, permanent_addr, size, ref_reg);
241
242   region->object_info = object_info;
243   snapshot->snapshot_regions[index] = region;
244   return;
245 }
246
247 static void MC_get_memory_regions(mc_snapshot_t snapshot)
248 {
249   const mc_process_t process = &mc_model_checker->process;
250   const size_t n = process->object_infos_size;
251   snapshot->snapshot_regions_count = n + 1;
252   snapshot->snapshot_regions = xbt_new0(mc_mem_region_t, n + 1);
253
254   for (size_t i = 0; i!=n; ++i) {
255     mc_object_info_t object_info = mc_model_checker->process.object_infos[i];
256     MC_snapshot_add_region(i, snapshot, MC_REGION_TYPE_DATA, object_info,
257       object_info->start_rw, object_info->start_rw,
258       object_info->end_rw - object_info->start_rw);
259   }
260
261   void *start_heap = std_heap->base;
262   void *end_heap = std_heap->breakval;
263   MC_snapshot_add_region(n, snapshot, MC_REGION_TYPE_HEAP, NULL,
264                         start_heap, start_heap,
265                         (char *) end_heap - (char *) start_heap);
266   snapshot->heap_bytes_used = mmalloc_get_bytes_used(std_heap);
267
268 #ifdef HAVE_SMPI
269   if (smpi_privatize_global_variables && smpi_process_count()) {
270     snapshot->privatization_index = smpi_loaded_page;
271   } else
272 #endif
273   {
274     snapshot->privatization_index = MC_NO_PROCESS_INDEX;
275   }
276 }
277
278 /** \brief Fills the position of the segments (executable, read-only, read/write).
279  *
280  * TODO, use dl_iterate_phdr to be more robust
281  * */
282 void MC_find_object_address(memory_map_t maps, mc_object_info_t result)
283 {
284   unsigned int i = 0;
285   s_map_region_t reg;
286   const char *name = basename(result->file_name);
287   while (i < maps->mapsize) {
288     reg = maps->regions[i];
289     if (maps->regions[i].pathname == NULL
290         || strcmp(basename(maps->regions[i].pathname), name)) {
291       // Nothing to do
292     } else if ((reg.prot & PROT_WRITE)) {
293       xbt_assert(!result->start_rw,
294                  "Multiple read-write segments for %s, not supported",
295                  maps->regions[i].pathname);
296       result->start_rw = reg.start_addr;
297       result->end_rw = reg.end_addr;
298       // .bss is usually after the .data:
299       s_map_region_t *next = &(maps->regions[i + 1]);
300       if (next->pathname == NULL && (next->prot & PROT_WRITE)
301           && next->start_addr == reg.end_addr) {
302         result->end_rw = maps->regions[i + 1].end_addr;
303       }
304     } else if ((reg.prot & PROT_READ) && (reg.prot & PROT_EXEC)) {
305       xbt_assert(!result->start_exec,
306                  "Multiple executable segments for %s, not supported",
307                  maps->regions[i].pathname);
308       result->start_exec = reg.start_addr;
309       result->end_exec = reg.end_addr;
310     } else if ((reg.prot & PROT_READ) && !(reg.prot & PROT_EXEC)) {
311       xbt_assert(!result->start_ro,
312                  "Multiple read only segments for %s, not supported",
313                  maps->regions[i].pathname);
314       result->start_ro = reg.start_addr;
315       result->end_ro = reg.end_addr;
316     }
317     i++;
318   }
319
320   xbt_assert(result->file_name);
321   xbt_assert(result->start_rw);
322   xbt_assert(result->start_exec);
323 }
324
325 /************************************* Take Snapshot ************************************/
326 /****************************************************************************************/
327
328 /** \brief Checks whether the variable is in scope for a given IP.
329  *
330  *  A variable may be defined only from a given value of IP.
331  *
332  *  \param var   Variable description
333  *  \param frame Scope description
334  *  \param ip    Instruction pointer
335  *  \return      true if the variable is valid
336  * */
337 static bool mc_valid_variable(dw_variable_t var, dw_frame_t scope,
338                               const void *ip)
339 {
340   // The variable is not yet valid:
341   if ((const void *) ((const char *) scope->low_pc + var->start_scope) > ip)
342     return false;
343   else
344     return true;
345 }
346
347 static void mc_fill_local_variables_values(mc_stack_frame_t stack_frame,
348                                            dw_frame_t scope, int process_index, xbt_dynar_t result)
349 {
350   mc_process_t process = &mc_model_checker->process;
351
352   void *ip = (void *) stack_frame->ip;
353   if (ip < scope->low_pc || ip >= scope->high_pc)
354     return;
355
356   unsigned cursor = 0;
357   dw_variable_t current_variable;
358   xbt_dynar_foreach(scope->variables, cursor, current_variable) {
359
360     if (!mc_valid_variable(current_variable, scope, (void *) stack_frame->ip))
361       continue;
362
363     int region_type;
364     if ((long) stack_frame->ip > (long) process->libsimgrid_info->start_exec)
365       region_type = 1;
366     else
367       region_type = 2;
368
369     local_variable_t new_var = xbt_new0(s_local_variable_t, 1);
370     new_var->subprogram = stack_frame->frame;
371     new_var->ip = stack_frame->ip;
372     new_var->name = xbt_strdup(current_variable->name);
373     new_var->type = current_variable->type;
374     new_var->region = region_type;
375
376     if (current_variable->address != NULL) {
377       new_var->address = current_variable->address;
378     } else if (current_variable->locations.size != 0) {
379       s_mc_location_t location;
380       mc_dwarf_resolve_locations(&location, &current_variable->locations,
381                                               current_variable->object_info,
382                                               &(stack_frame->unw_cursor),
383                                               (void *) stack_frame->frame_base,
384                                               NULL, process_index);
385
386       switch(mc_get_location_type(&location)) {
387       case MC_LOCATION_TYPE_ADDRESS:
388         new_var->address = location.memory_location;
389         break;
390       case MC_LOCATION_TYPE_REGISTER:
391       default:
392         xbt_die("Cannot handle non-address variable");
393       }
394
395     } else {
396       xbt_die("No address");
397     }
398
399     xbt_dynar_push(result, &new_var);
400   }
401
402   // Recursive processing of nested scopes:
403   dw_frame_t nested_scope = NULL;
404   xbt_dynar_foreach(scope->scopes, cursor, nested_scope) {
405     mc_fill_local_variables_values(stack_frame, nested_scope, process_index, result);
406   }
407 }
408
409 static xbt_dynar_t MC_get_local_variables_values(xbt_dynar_t stack_frames, int process_index)
410 {
411
412   unsigned cursor1 = 0;
413   mc_stack_frame_t stack_frame;
414   xbt_dynar_t variables =
415       xbt_dynar_new(sizeof(local_variable_t), local_variable_free_voidp);
416
417   xbt_dynar_foreach(stack_frames, cursor1, stack_frame) {
418     mc_fill_local_variables_values(stack_frame, stack_frame->frame, process_index, variables);
419   }
420
421   return variables;
422 }
423
424 static void MC_stack_frame_free_voipd(void *s)
425 {
426   mc_stack_frame_t stack_frame = *(mc_stack_frame_t *) s;
427   if (stack_frame) {
428     xbt_free(stack_frame->frame_name);
429     xbt_free(stack_frame);
430   }
431 }
432
433 static xbt_dynar_t MC_unwind_stack_frames(void *stack_context)
434 {
435   mc_process_t process = &mc_model_checker->process;
436   xbt_dynar_t result =
437       xbt_dynar_new(sizeof(mc_stack_frame_t), MC_stack_frame_free_voipd);
438
439   unw_cursor_t c;
440
441   // TODO, check condition check (unw_init_local==0 means end of frame)
442   if (unw_init_local(&c, (unw_context_t *) stack_context) != 0) {
443
444     xbt_die("Could not initialize stack unwinding");
445
446   } else
447     while (1) {
448
449       mc_stack_frame_t stack_frame = xbt_new(s_mc_stack_frame_t, 1);
450       xbt_dynar_push(result, &stack_frame);
451
452       stack_frame->unw_cursor = c;
453
454       unw_word_t ip, sp;
455
456       unw_get_reg(&c, UNW_REG_IP, &ip);
457       unw_get_reg(&c, UNW_REG_SP, &sp);
458
459       stack_frame->ip = ip;
460       stack_frame->sp = sp;
461
462       // TODO, use real addresses in frame_t instead of fixing it here
463
464       dw_frame_t frame = MC_process_find_function(process, (void *) ip);
465       stack_frame->frame = frame;
466
467       if (frame) {
468         stack_frame->frame_name = xbt_strdup(frame->name);
469         stack_frame->frame_base =
470             (unw_word_t) mc_find_frame_base(frame, frame->object_info, &c);
471       } else {
472         stack_frame->frame_base = 0;
473         stack_frame->frame_name = NULL;
474       }
475
476       /* Stop before context switch with maestro */
477       if (frame != NULL && frame->name != NULL
478           && !strcmp(frame->name, "smx_ctx_sysv_wrapper"))
479         break;
480
481       int ret = ret = unw_step(&c);
482       if (ret == 0) {
483         xbt_die("Unexpected end of stack.");
484       } else if (ret < 0) {
485         xbt_die("Error while unwinding stack.");
486       }
487     }
488
489   if (xbt_dynar_length(result) == 0) {
490     XBT_INFO("unw_init_local failed");
491     xbt_abort();
492   }
493
494   return result;
495 };
496
497 static xbt_dynar_t MC_take_snapshot_stacks(mc_snapshot_t * snapshot)
498 {
499
500   xbt_dynar_t res =
501       xbt_dynar_new(sizeof(s_mc_snapshot_stack_t),
502                     MC_snapshot_stack_free_voidp);
503
504   unsigned int cursor = 0;
505   stack_region_t current_stack;
506
507   xbt_dynar_foreach(stacks_areas, cursor, current_stack) {
508     mc_snapshot_stack_t st = xbt_new(s_mc_snapshot_stack_t, 1);
509     st->stack_frames = MC_unwind_stack_frames(current_stack->context);
510     st->local_variables = MC_get_local_variables_values(st->stack_frames, current_stack->process_index);
511     st->process_index = current_stack->process_index;
512
513     unw_word_t sp = xbt_dynar_get_as(st->stack_frames, 0, mc_stack_frame_t)->sp;
514
515     xbt_dynar_push(res, &st);
516     (*snapshot)->stack_sizes =
517         xbt_realloc((*snapshot)->stack_sizes, (cursor + 1) * sizeof(size_t));
518     (*snapshot)->stack_sizes[cursor] =
519       (char*) current_stack->address + current_stack->size - (char*) sp;
520   }
521
522   return res;
523
524 }
525
526 static xbt_dynar_t MC_take_snapshot_ignore()
527 {
528
529   if (mc_heap_comparison_ignore == NULL)
530     return NULL;
531
532   xbt_dynar_t cpy =
533       xbt_dynar_new(sizeof(mc_heap_ignore_region_t),
534                     heap_ignore_region_free_voidp);
535
536   unsigned int cursor = 0;
537   mc_heap_ignore_region_t current_region;
538
539   xbt_dynar_foreach(mc_heap_comparison_ignore, cursor, current_region) {
540     mc_heap_ignore_region_t new_region = NULL;
541     new_region = xbt_new0(s_mc_heap_ignore_region_t, 1);
542     new_region->address = current_region->address;
543     new_region->size = current_region->size;
544     new_region->block = current_region->block;
545     new_region->fragment = current_region->fragment;
546     xbt_dynar_push(cpy, &new_region);
547   }
548
549   return cpy;
550
551 }
552
553 static void mc_free_snapshot_ignored_data_pvoid(void* data) {
554   mc_snapshot_ignored_data_t ignored_data = (mc_snapshot_ignored_data_t) data;
555   free(ignored_data->data);
556 }
557
558 static void MC_snapshot_handle_ignore(mc_snapshot_t snapshot)
559 {
560   snapshot->ignored_data = xbt_dynar_new(sizeof(s_mc_snapshot_ignored_data_t), mc_free_snapshot_ignored_data_pvoid);
561
562   // Copy the memory:
563   unsigned int cursor = 0;
564   mc_checkpoint_ignore_region_t region;
565   xbt_dynar_foreach (mc_checkpoint_ignore, cursor, region) {
566     s_mc_snapshot_ignored_data_t ignored_data;
567     ignored_data.start = region->addr;
568     ignored_data.size = region->size;
569     ignored_data.data = malloc(region->size);
570     memcpy(ignored_data.data, region->addr, region->size);
571     xbt_dynar_push(snapshot->ignored_data, &ignored_data);
572   }
573
574   // Zero the memory:
575   xbt_dynar_foreach (mc_checkpoint_ignore, cursor, region) {
576     memset(region->addr, 0, region->size);
577   }
578
579 }
580
581 static void MC_snapshot_ignore_restore(mc_snapshot_t snapshot)
582 {
583   unsigned int cursor = 0;
584   s_mc_snapshot_ignored_data_t ignored_data;
585   xbt_dynar_foreach (snapshot->ignored_data, cursor, ignored_data) {
586     memcpy(ignored_data.start, ignored_data.data, ignored_data.size);
587   }
588 }
589
590 /** @brief Can we remove this snapshot?
591  *
592  * Some snapshots cannot be removed (yet) because we need them
593  * at this point.
594  *
595  * @param snapshot
596  */
597 int mc_important_snapshot(mc_snapshot_t snapshot)
598 {
599   // We need this snapshot in order to know which
600   // pages needs to be stored in the next snapshot.
601   // This field is only non-NULL when using soft-dirty
602   // page tracking.
603   if (snapshot == mc_model_checker->parent_snapshot)
604     return true;
605
606   return false;
607 }
608
609 static void MC_get_current_fd(mc_snapshot_t snapshot){
610
611   snapshot->total_fd = 0;
612
613   const size_t fd_dir_path_size = 20;
614   char fd_dir_path[fd_dir_path_size];
615   if (snprintf(fd_dir_path, fd_dir_path_size,
616     "/proc/%lli/fd", (long long int) getpid()) > fd_dir_path_size)
617     xbt_die("Unexpected buffer is too small for fd_dir_path");
618
619   DIR* fd_dir = opendir (fd_dir_path);
620   if (fd_dir == NULL)
621     xbt_die("Cannot open directory '/proc/self/fd'\n");
622
623   size_t total_fd = 0;
624   struct dirent* fd_number;
625   while ((fd_number = readdir(fd_dir))) {
626
627     int fd_value = atoi(fd_number->d_name);
628
629     if(fd_value < 3)
630       continue;
631
632     const size_t source_size = 25;
633     char source[25];
634     if (snprintf(source, source_size, "/proc/self/fd/%s", fd_number->d_name) > source_size)
635       xbt_die("Unexpected buffer is too small for fd %s", fd_number->d_name);
636
637     const size_t link_size = 200;
638     char link[200];
639     int res = readlink(source, link, link_size);
640     if (res<0) {
641       xbt_die("Could not read link for %s", source);
642     }
643     if (res==200) {
644       xbt_die("Buffer to small for link of %s", source);
645     }
646     link[res] = '\0';
647
648     if(smpi_is_privatisation_file(link))
649       continue;
650
651     // This is (probably) the DIR* we are reading:
652     // TODO, read all the file entries at once and close the DIR.*
653     if(strcmp(fd_dir_path, link) == 0)
654       continue;
655
656     // We don't handle them.
657     // It does not mean we should silently ignore them however.
658     if (strncmp(link, "pipe:", 5) == 0 || strncmp(link, "socket:", 7) == 0)
659       continue;
660
661     // This is probably a shared memory used by lttng-ust:
662     if(strncmp("/dev/shm/ust-shm-tmp-", link, 21)==0)
663       continue;
664
665     // Add an entry for this FD in the snapshot:
666     fd_infos_t fd = xbt_new0(s_fd_infos_t, 1);
667     fd->filename = strdup(link);
668     fd->number = fd_value;
669     fd->flags = fcntl(fd_value, F_GETFL) | fcntl(fd_value, F_GETFD) ;
670     fd->current_position = lseek(fd_value, 0, SEEK_CUR);
671     snapshot->current_fd = xbt_realloc(snapshot->current_fd, (total_fd + 1) * sizeof(fd_infos_t));
672     snapshot->current_fd[total_fd] = fd;
673     total_fd++;
674   }
675
676   snapshot->total_fd = total_fd;
677   closedir (fd_dir);
678 }
679
680 mc_snapshot_t MC_take_snapshot(int num_state)
681 {
682   mc_snapshot_t snapshot = xbt_new0(s_mc_snapshot_t, 1);
683
684   snapshot->enabled_processes = xbt_dynar_new(sizeof(int), NULL);
685   smx_process_t process;
686   xbt_swag_foreach(process, simix_global->process_list) {
687     xbt_dynar_push_as(snapshot->enabled_processes, int, (int)process->pid);
688   }
689
690   MC_snapshot_handle_ignore(snapshot);
691
692   MC_get_current_fd(snapshot);
693
694   const bool use_soft_dirty = _sg_mc_sparse_checkpoint
695     && _sg_mc_soft_dirty
696     && MC_process_is_self(&mc_model_checker->process);
697
698   /* Save the std heap and the writable mapped pages of libsimgrid and binary */
699   MC_get_memory_regions(snapshot);
700   if (use_soft_dirty)
701     mc_softdirty_reset();
702
703   snapshot->to_ignore = MC_take_snapshot_ignore();
704
705   if (_sg_mc_visited > 0 || strcmp(_sg_mc_property_file, "")) {
706     snapshot->stacks =
707         MC_take_snapshot_stacks(&snapshot);
708     if (_sg_mc_hash && snapshot->stacks != NULL) {
709       snapshot->hash = mc_hash_processes_state(num_state, snapshot->stacks);
710     } else {
711       snapshot->hash = 0;
712     }
713   } else {
714     snapshot->hash = 0;
715   }
716
717   MC_snapshot_ignore_restore(snapshot);
718   if (use_soft_dirty)
719     mc_model_checker->parent_snapshot = snapshot;
720   return snapshot;
721 }
722
723 static inline
724 void MC_restore_snapshot_regions(mc_snapshot_t snapshot)
725 {
726   mc_snapshot_t parent_snapshot = mc_model_checker->parent_snapshot;
727
728   const size_t n = snapshot->snapshot_regions_count;
729   for (size_t i = 0; i < n; i++) {
730     // For privatized, variables we decided it was not necessary to take the snapshot:
731     if (snapshot->snapshot_regions[i])
732       MC_region_restore(snapshot->snapshot_regions[i],
733         parent_snapshot ? parent_snapshot->snapshot_regions[i] : NULL);
734   }
735
736 #ifdef HAVE_SMPI
737   if(snapshot->privatization_index >= 0) {
738     // We just rewrote the global variables.
739     // The privatisation segment SMPI thinks
740     // is mapped might be inconsistent with the segment which
741     // is really mapped in memory (kernel state).
742     // We ask politely SMPI to map the segment anyway,
743     // even if it thinks it is the current one:
744     smpi_really_switch_data_segment(snapshot->privatization_index);
745   }
746 #endif
747 }
748
749 static inline
750 void MC_restore_snapshot_fds(mc_snapshot_t snapshot)
751 {
752   int new_fd;
753   size_t i;
754   for(i=0; i < snapshot->total_fd; i++){
755     
756     new_fd = open(snapshot->current_fd[i]->filename, snapshot->current_fd[i]->flags);
757     if (new_fd <0) {
758       xbt_die("Could not reopen the file %s fo restoring the file descriptor",
759         snapshot->current_fd[i]->filename);
760     }
761     if(new_fd != -1 && new_fd != snapshot->current_fd[i]->number){
762       dup2(new_fd, snapshot->current_fd[i]->number);
763       //fprintf(stderr, "%p\n", fdopen(snapshot->current_fd[i]->number, "rw"));
764       close(new_fd);
765     };
766     lseek(snapshot->current_fd[i]->number, snapshot->current_fd[i]->current_position, SEEK_SET);
767   }
768 }
769
770 void MC_restore_snapshot(mc_snapshot_t snapshot)
771 {
772   const bool use_soft_dirty = _sg_mc_sparse_checkpoint
773     && _sg_mc_soft_dirty
774     && MC_process_is_self(&mc_model_checker->process);
775
776   MC_restore_snapshot_regions(snapshot);
777   MC_restore_snapshot_fds(snapshot);
778   if (use_soft_dirty) {
779     mc_softdirty_reset();
780   }
781   MC_snapshot_ignore_restore(snapshot);
782   if (use_soft_dirty) {
783     mc_model_checker->parent_snapshot = snapshot;
784   }
785 }
786
787 mc_snapshot_t simcall_HANDLER_mc_snapshot(smx_simcall_t simcall)
788 {
789   return MC_take_snapshot(1);
790 }
791
792 void *MC_snapshot(void)
793 {
794   return simcall_mc_snapshot();
795 }