Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
fe602a4a00c6a93f7b85c5da3e565af5a9af05d0
[simgrid.git] / src / mc / mc_checkpoint.c
1 /* Copyright (c) 2008-2014. The SimGrid Team.
2  * All rights reserved.                                                     */
3
4 /* This program is free software; you can redistribute it and/or modify it
5  * under the terms of the license (GNU LGPL) which comes with this package. */
6
7 #define _GNU_SOURCE
8
9 #include <unistd.h>
10
11 #include <string.h>
12 #include <link.h>
13 #include <dirent.h>
14
15 #include "internal_config.h"
16 #include "mc_memory_map.h"
17 #include "mc_private.h"
18 #include "xbt/module.h"
19 #include <xbt/mmalloc.h>
20 #include "../smpi/private.h"
21 #include <alloca.h>
22
23 #include "xbt/mmalloc/mmprivate.h"
24
25 #include "../simix/smx_private.h"
26
27 #include <libunwind.h>
28 #include <libelf.h>
29
30 #include "mc_private.h"
31 #include <mc/mc.h>
32
33 #include "mc_snapshot.h"
34 #include "mc_object_info.h"
35 #include "mc_mmu.h"
36 #include "mc_unw.h"
37
38 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(mc_checkpoint, mc,
39                                 "Logging specific to mc_checkpoint");
40
41 /************************************  Free functions **************************************/
42 /*****************************************************************************************/
43
44 static void MC_snapshot_stack_free(mc_snapshot_stack_t s)
45 {
46   if (s) {
47     xbt_dynar_free(&(s->local_variables));
48     xbt_dynar_free(&(s->stack_frames));
49     mc_unw_destroy_context(s->context);
50     xbt_free(s->context);
51     xbt_free(s);
52   }
53 }
54
55 static void MC_snapshot_stack_free_voidp(void *s)
56 {
57   mc_snapshot_stack_t stack = (mc_snapshot_stack_t) * (void **) s;
58   MC_snapshot_stack_free(stack);
59 }
60
61 static void local_variable_free(local_variable_t v)
62 {
63   xbt_free(v->name);
64   xbt_free(v);
65 }
66
67 static void local_variable_free_voidp(void *v)
68 {
69   local_variable_free((local_variable_t) * (void **) v);
70 }
71
72 void MC_region_destroy(mc_mem_region_t region)
73 {
74   if (!region)
75     return;
76   switch(region->storage_type) {
77     case MC_REGION_STORAGE_TYPE_NONE:
78       break;
79     case MC_REGION_STORAGE_TYPE_FLAT:
80       xbt_free(region->flat.data);
81       break;
82     case MC_REGION_STORAGE_TYPE_CHUNKED:
83       mc_free_page_snapshot_region(region->chunked.page_numbers, mc_page_count(region->size));
84       xbt_free(region->chunked.page_numbers);
85       break;
86     case MC_REGION_STORAGE_TYPE_PRIVATIZED:
87       {
88         size_t regions_count = region->privatized.regions_count;
89         for (size_t i=0; i!=regions_count; ++i) {
90           MC_region_destroy(region->privatized.regions[i]);
91         }
92         free(region->privatized.regions);
93         break;
94       }
95   }
96   xbt_free(region);
97 }
98
99 void MC_free_snapshot(mc_snapshot_t snapshot)
100 {
101   for (size_t i = 0; i < snapshot->snapshot_regions_count; i++) {
102     MC_region_destroy(snapshot->snapshot_regions[i]);
103   }
104   xbt_free(snapshot->snapshot_regions);
105   xbt_free(snapshot->stack_sizes);
106   xbt_dynar_free(&(snapshot->stacks));
107   xbt_dynar_free(&(snapshot->to_ignore));
108   xbt_dynar_free(&snapshot->ignored_data);
109   xbt_free(snapshot);
110 }
111
112 /*******************************  Snapshot regions ********************************/
113 /*********************************************************************************/
114
115 static mc_mem_region_t mc_region_new_dense(
116   mc_region_type_t region_type,
117   void *start_addr, void* permanent_addr, size_t size, mc_mem_region_t ref_reg)
118 {
119   mc_mem_region_t region = xbt_new(s_mc_mem_region_t, 1);
120   region->region_type = region_type;
121   region->storage_type = MC_REGION_STORAGE_TYPE_FLAT;
122   region->start_addr = start_addr;
123   region->permanent_addr = permanent_addr;
124   region->size = size;
125   region->flat.data = xbt_malloc(size);
126   MC_process_read(&mc_model_checker->process, MC_ADDRESS_SPACE_READ_FLAGS_NONE,
127     region->flat.data, permanent_addr, size,
128     MC_PROCESS_INDEX_DISABLED);
129   XBT_DEBUG("New region : type : %d, data : %p (real addr %p), size : %zu",
130             region_type, region->flat.data, permanent_addr, size);
131   return region;
132 }
133
134 /** @brief Take a snapshot of a given region
135  *
136  * @param type
137  * @param start_addr   Address of the region in the simulated process
138  * @param permanent_addr Permanent address of this data (for privatized variables, this is the virtual address of the privatized mapping)
139  * @param size         Size of the data*
140  * @param ref_reg      Reference corresponding region
141  */
142 static mc_mem_region_t MC_region_new(mc_region_type_t type, void *start_addr, void* permanent_addr, size_t size, mc_mem_region_t ref_reg)
143 {
144   if (_sg_mc_sparse_checkpoint) {
145     return mc_region_new_sparse(type, start_addr, permanent_addr, size, ref_reg);
146   } else  {
147     return mc_region_new_dense(type, start_addr, permanent_addr, size, ref_reg);
148   }
149 }
150
151 /** @brief Restore a region from a snapshot
152  *
153  *  If we are using per page snapshots, it is possible to use the reference
154  *  region in order to do an incremental restoration of the region: the
155  *  softclean pages which are shared between the two snapshots do not need
156  *  to be restored.
157  *
158  *  @param reg     Target region
159  *  @param reg_reg Current region (if not NULL), used for lazy per page restoration
160  */
161 static void MC_region_restore(mc_mem_region_t region, mc_mem_region_t ref_region)
162 {
163   switch(region->storage_type) {
164   case MC_REGION_STORAGE_TYPE_NONE:
165   default:
166     xbt_die("Storage type not supported");
167     break;
168
169   case MC_REGION_STORAGE_TYPE_FLAT:
170     MC_process_write(&mc_model_checker->process, region->flat.data,
171       region->permanent_addr, region->size);
172     break;
173
174   case MC_REGION_STORAGE_TYPE_CHUNKED:
175     mc_region_restore_sparse(&mc_model_checker->process, region, ref_region);
176     break;
177
178   case MC_REGION_STORAGE_TYPE_PRIVATIZED:
179     {
180       bool has_ref_regions = ref_region &&
181         ref_region->storage_type == MC_REGION_STORAGE_TYPE_PRIVATIZED;
182       size_t process_count = region->privatized.regions_count;
183       for (size_t i = 0; i < process_count; i++) {
184         MC_region_restore(region->privatized.regions[i],
185           has_ref_regions ? ref_region->privatized.regions[i] : NULL);
186       }
187       break;
188     }
189   }
190 }
191
192 // FIXME, multiple privatisation regions
193 // FIXME, cross-process
194 static inline
195 void* MC_privatization_address(mc_process_t process, int process_index)
196 {
197   xbt_assert(process_index >= 0);
198   return smpi_privatisation_regions[process_index].address;
199 }
200
201 static mc_mem_region_t MC_region_new_privatized(
202     mc_region_type_t region_type, void *start_addr, void* permanent_addr, size_t size,
203     mc_mem_region_t ref_reg)
204 {
205   size_t process_count = smpi_process_count();
206   mc_mem_region_t region = xbt_new(s_mc_mem_region_t, 1);
207   region->region_type = region_type;
208   region->storage_type = MC_REGION_STORAGE_TYPE_PRIVATIZED;
209   region->start_addr = start_addr;
210   region->permanent_addr = permanent_addr;
211   region->size = size;
212   region->privatized.regions_count = process_count;
213   region->privatized.regions = xbt_new(mc_mem_region_t, process_count);
214
215   for (size_t i = 0; i < process_count; i++) {
216     mc_mem_region_t ref_subreg = NULL;
217     if (ref_reg && ref_reg->storage_type == MC_REGION_STORAGE_TYPE_PRIVATIZED)
218       ref_subreg = ref_reg->privatized.regions[i];
219     region->privatized.regions[i] =
220       MC_region_new(region_type, start_addr,
221         MC_privatization_address(&mc_model_checker->process, i), size,
222         ref_subreg);
223   }
224
225   return region;
226 }
227
228 static void MC_snapshot_add_region(int index, mc_snapshot_t snapshot, mc_region_type_t type,
229                                   mc_object_info_t object_info,
230                                   void *start_addr, void* permanent_addr, size_t size)
231 {
232   if (type == MC_REGION_TYPE_DATA)
233     xbt_assert(object_info, "Missing object info for object.");
234   else if (type == MC_REGION_TYPE_HEAP)
235     xbt_assert(!object_info, "Unexpected object info for heap region.");
236
237   mc_mem_region_t ref_reg = NULL;
238   if (mc_model_checker->parent_snapshot)
239     ref_reg = mc_model_checker->parent_snapshot->snapshot_regions[index];
240
241   mc_mem_region_t region;
242   const bool privatization_aware = MC_object_info_is_privatized(object_info);
243   if (privatization_aware && smpi_process_count())
244     region = MC_region_new_privatized(type, start_addr, permanent_addr, size, ref_reg);
245   else
246     region = MC_region_new(type, start_addr, permanent_addr, size, ref_reg);
247
248   region->object_info = object_info;
249   snapshot->snapshot_regions[index] = region;
250   return;
251 }
252
253 static void MC_get_memory_regions(mc_process_t process, mc_snapshot_t snapshot)
254 {
255   const size_t n = process->object_infos_size;
256   snapshot->snapshot_regions_count = n + 1;
257   snapshot->snapshot_regions = xbt_new0(mc_mem_region_t, n + 1);
258
259   for (size_t i = 0; i!=n; ++i) {
260     mc_object_info_t object_info = process->object_infos[i];
261     MC_snapshot_add_region(i, snapshot, MC_REGION_TYPE_DATA, object_info,
262       object_info->start_rw, object_info->start_rw,
263       object_info->end_rw - object_info->start_rw);
264   }
265
266   xbt_mheap_t heap = MC_process_get_heap(process);
267   void *start_heap = heap->base;
268   void *end_heap = heap->breakval;
269
270   MC_snapshot_add_region(n, snapshot, MC_REGION_TYPE_HEAP, NULL,
271                         start_heap, start_heap,
272                         (char *) end_heap - (char *) start_heap);
273   snapshot->heap_bytes_used = mmalloc_get_bytes_used_remote(
274     heap->heaplimit,
275     MC_process_get_malloc_info(process));
276
277 #ifdef HAVE_SMPI
278   if (smpi_privatize_global_variables && smpi_process_count()) {
279     // FIXME, cross-process
280     snapshot->privatization_index = smpi_loaded_page;
281   } else
282 #endif
283   {
284     snapshot->privatization_index = MC_PROCESS_INDEX_MISSING;
285   }
286 }
287
288 /** \brief Fills the position of the segments (executable, read-only, read/write).
289  *
290  *  `dl_iterate_phdr` would be more robust but would not work in cross-process.
291  * */
292 void MC_find_object_address(memory_map_t maps, mc_object_info_t result)
293 {
294   unsigned int i = 0;
295   s_map_region_t reg;
296   const char *name = basename(result->file_name);
297   while (i < maps->mapsize) {
298     reg = maps->regions[i];
299     if (maps->regions[i].pathname == NULL
300         || strcmp(basename(maps->regions[i].pathname), name)) {
301       // Nothing to do
302     } else if ((reg.prot & PROT_WRITE)) {
303       xbt_assert(!result->start_rw,
304                  "Multiple read-write segments for %s, not supported",
305                  maps->regions[i].pathname);
306       result->start_rw = reg.start_addr;
307       result->end_rw = reg.end_addr;
308       // .bss is usually after the .data:
309       s_map_region_t *next = &(maps->regions[i + 1]);
310       if (next->pathname == NULL && (next->prot & PROT_WRITE)
311           && next->start_addr == reg.end_addr) {
312         result->end_rw = maps->regions[i + 1].end_addr;
313       }
314     } else if ((reg.prot & PROT_READ) && (reg.prot & PROT_EXEC)) {
315       xbt_assert(!result->start_exec,
316                  "Multiple executable segments for %s, not supported",
317                  maps->regions[i].pathname);
318       result->start_exec = reg.start_addr;
319       result->end_exec = reg.end_addr;
320     } else if ((reg.prot & PROT_READ) && !(reg.prot & PROT_EXEC)) {
321       xbt_assert(!result->start_ro,
322                  "Multiple read only segments for %s, not supported",
323                  maps->regions[i].pathname);
324       result->start_ro = reg.start_addr;
325       result->end_ro = reg.end_addr;
326     }
327     i++;
328   }
329
330   result->start = result->start_rw;
331   if ((const void*) result->start_ro > result->start)
332     result->start = result->start_ro;
333   if ((const void*) result->start_exec > result->start)
334     result->start = result->start_exec;
335
336   result->end = result->end_rw;
337   if (result->end_ro && (const void*) result->end_ro < result->end)
338     result->end = result->end_ro;
339   if (result->end_exec && (const void*) result->end_exec > result->end)
340     result->end = result->end_exec;
341
342   xbt_assert(result->file_name);
343   xbt_assert(result->start_rw);
344   xbt_assert(result->start_exec);
345 }
346
347 /************************************* Take Snapshot ************************************/
348 /****************************************************************************************/
349
350 /** \brief Checks whether the variable is in scope for a given IP.
351  *
352  *  A variable may be defined only from a given value of IP.
353  *
354  *  \param var   Variable description
355  *  \param frame Scope description
356  *  \param ip    Instruction pointer
357  *  \return      true if the variable is valid
358  * */
359 static bool mc_valid_variable(dw_variable_t var, dw_frame_t scope,
360                               const void *ip)
361 {
362   // The variable is not yet valid:
363   if ((const void *) ((const char *) scope->low_pc + var->start_scope) > ip)
364     return false;
365   else
366     return true;
367 }
368
369 static void mc_fill_local_variables_values(mc_stack_frame_t stack_frame,
370                                            dw_frame_t scope, int process_index, xbt_dynar_t result)
371 {
372   mc_process_t process = &mc_model_checker->process;
373
374   void *ip = (void *) stack_frame->ip;
375   if (ip < scope->low_pc || ip >= scope->high_pc)
376     return;
377
378   unsigned cursor = 0;
379   dw_variable_t current_variable;
380   xbt_dynar_foreach(scope->variables, cursor, current_variable) {
381
382     if (!mc_valid_variable(current_variable, scope, (void *) stack_frame->ip))
383       continue;
384
385     int region_type;
386     // FIXME, get rid of `region_type`
387     if ((long) stack_frame->ip > (long) process->libsimgrid_info->start_exec)
388       region_type = 1;
389     else
390       region_type = 2;
391
392     local_variable_t new_var = xbt_new0(s_local_variable_t, 1);
393     new_var->subprogram = stack_frame->frame;
394     new_var->ip = stack_frame->ip;
395     new_var->name = xbt_strdup(current_variable->name);
396     new_var->type = current_variable->type;
397     new_var->region = region_type;
398
399     if (current_variable->address != NULL) {
400       new_var->address = current_variable->address;
401     } else if (current_variable->locations.size != 0) {
402       s_mc_location_t location;
403       // FIXME, cross-process support
404       mc_dwarf_resolve_locations(&location, &current_variable->locations,
405                                               current_variable->object_info,
406                                               &(stack_frame->unw_cursor),
407                                               (void *) stack_frame->frame_base,
408                                               NULL, process_index);
409
410       switch(mc_get_location_type(&location)) {
411       case MC_LOCATION_TYPE_ADDRESS:
412         new_var->address = location.memory_location;
413         break;
414       case MC_LOCATION_TYPE_REGISTER:
415       default:
416         xbt_die("Cannot handle non-address variable");
417       }
418
419     } else {
420       xbt_die("No address");
421     }
422
423     xbt_dynar_push(result, &new_var);
424   }
425
426   // Recursive processing of nested scopes:
427   dw_frame_t nested_scope = NULL;
428   xbt_dynar_foreach(scope->scopes, cursor, nested_scope) {
429     mc_fill_local_variables_values(stack_frame, nested_scope, process_index, result);
430   }
431 }
432
433 static xbt_dynar_t MC_get_local_variables_values(xbt_dynar_t stack_frames, int process_index)
434 {
435
436   unsigned cursor1 = 0;
437   mc_stack_frame_t stack_frame;
438   xbt_dynar_t variables =
439       xbt_dynar_new(sizeof(local_variable_t), local_variable_free_voidp);
440
441   xbt_dynar_foreach(stack_frames, cursor1, stack_frame) {
442     mc_fill_local_variables_values(stack_frame, stack_frame->frame, process_index, variables);
443   }
444
445   return variables;
446 }
447
448 static void MC_stack_frame_free_voipd(void *s)
449 {
450   mc_stack_frame_t stack_frame = *(mc_stack_frame_t *) s;
451   if (stack_frame) {
452     xbt_free(stack_frame->frame_name);
453     xbt_free(stack_frame);
454   }
455 }
456
457 static xbt_dynar_t MC_unwind_stack_frames(mc_unw_context_t stack_context)
458 {
459   mc_process_t process = &mc_model_checker->process;
460   xbt_dynar_t result =
461       xbt_dynar_new(sizeof(mc_stack_frame_t), MC_stack_frame_free_voipd);
462
463   unw_cursor_t c;
464
465   // TODO, check condition check (unw_init_local==0 means end of frame)
466   if (mc_unw_init_cursor(&c, stack_context) != 0) {
467
468     xbt_die("Could not initialize stack unwinding");
469
470   } else
471     while (1) {
472
473       mc_stack_frame_t stack_frame = xbt_new(s_mc_stack_frame_t, 1);
474       xbt_dynar_push(result, &stack_frame);
475
476       stack_frame->unw_cursor = c;
477
478       unw_word_t ip, sp;
479
480       unw_get_reg(&c, UNW_REG_IP, &ip);
481       unw_get_reg(&c, UNW_REG_SP, &sp);
482
483       stack_frame->ip = ip;
484       stack_frame->sp = sp;
485
486       // TODO, use real addresses in frame_t instead of fixing it here
487
488       dw_frame_t frame = MC_process_find_function(process, (void *) ip);
489       stack_frame->frame = frame;
490
491       if (frame) {
492         stack_frame->frame_name = xbt_strdup(frame->name);
493         stack_frame->frame_base =
494             (unw_word_t) mc_find_frame_base(frame, frame->object_info, &c);
495       } else {
496         stack_frame->frame_base = 0;
497         stack_frame->frame_name = NULL;
498       }
499
500       /* Stop before context switch with maestro */
501       if (frame != NULL && frame->name != NULL
502           && !strcmp(frame->name, "smx_ctx_sysv_wrapper"))
503         break;
504
505       int ret = unw_step(&c);
506       if (ret == 0) {
507         xbt_die("Unexpected end of stack.");
508       } else if (ret < 0) {
509         xbt_die("Error while unwinding stack");
510       }
511     }
512
513   if (xbt_dynar_length(result) == 0) {
514     XBT_INFO("unw_init_local failed");
515     xbt_abort();
516   }
517
518   return result;
519 };
520
521 static xbt_dynar_t MC_take_snapshot_stacks(mc_snapshot_t * snapshot)
522 {
523
524   xbt_dynar_t res =
525       xbt_dynar_new(sizeof(s_mc_snapshot_stack_t),
526                     MC_snapshot_stack_free_voidp);
527
528   unsigned int cursor = 0;
529   stack_region_t current_stack;
530
531   // FIXME, cross-process support (stack_areas)
532   xbt_dynar_foreach(stacks_areas, cursor, current_stack) {
533     mc_snapshot_stack_t st = xbt_new(s_mc_snapshot_stack_t, 1);
534
535     unw_context_t* original_context = (unw_context_t*) current_stack->context;
536
537     st->context = xbt_new0(s_mc_unw_context_t, 1);
538     if (mc_unw_init_context(st->context, &mc_model_checker->process,
539       original_context) < 0) {
540       xbt_die("Could not initialise the libunwind context.");
541     }
542
543     st->stack_frames = MC_unwind_stack_frames(st->context);
544     st->local_variables = MC_get_local_variables_values(st->stack_frames, current_stack->process_index);
545     st->process_index = current_stack->process_index;
546
547     unw_word_t sp = xbt_dynar_get_as(st->stack_frames, 0, mc_stack_frame_t)->sp;
548
549     xbt_dynar_push(res, &st);
550     (*snapshot)->stack_sizes =
551         xbt_realloc((*snapshot)->stack_sizes, (cursor + 1) * sizeof(size_t));
552     (*snapshot)->stack_sizes[cursor] =
553       (char*) current_stack->address + current_stack->size - (char*) sp;
554   }
555
556   return res;
557
558 }
559
560 // FIXME, cross-process support (mc_heap_comparison_ignore)
561 static xbt_dynar_t MC_take_snapshot_ignore()
562 {
563
564   if (mc_heap_comparison_ignore == NULL)
565     return NULL;
566
567   xbt_dynar_t cpy =
568       xbt_dynar_new(sizeof(mc_heap_ignore_region_t),
569                     heap_ignore_region_free_voidp);
570
571   unsigned int cursor = 0;
572   mc_heap_ignore_region_t current_region;
573
574   xbt_dynar_foreach(mc_heap_comparison_ignore, cursor, current_region) {
575     mc_heap_ignore_region_t new_region = NULL;
576     new_region = xbt_new0(s_mc_heap_ignore_region_t, 1);
577     new_region->address = current_region->address;
578     new_region->size = current_region->size;
579     new_region->block = current_region->block;
580     new_region->fragment = current_region->fragment;
581     xbt_dynar_push(cpy, &new_region);
582   }
583
584   return cpy;
585
586 }
587
588 static void mc_free_snapshot_ignored_data_pvoid(void* data) {
589   mc_snapshot_ignored_data_t ignored_data = (mc_snapshot_ignored_data_t) data;
590   free(ignored_data->data);
591 }
592
593 static void MC_snapshot_handle_ignore(mc_snapshot_t snapshot)
594 {
595   xbt_assert(snapshot->process);
596   snapshot->ignored_data = xbt_dynar_new(sizeof(s_mc_snapshot_ignored_data_t), mc_free_snapshot_ignored_data_pvoid);
597
598   // Copy the memory:
599   unsigned int cursor = 0;
600   mc_checkpoint_ignore_region_t region;
601   // FIXME, cross-process support (mc_checkpoint_ignore)
602   xbt_dynar_foreach (mc_model_checker->process.checkpoint_ignore, cursor, region) {
603     s_mc_snapshot_ignored_data_t ignored_data;
604     ignored_data.start = region->addr;
605     ignored_data.size = region->size;
606     ignored_data.data = malloc(region->size);
607     // TODO, we should do this once per privatization segment:
608     MC_process_read(snapshot->process,
609       MC_ADDRESS_SPACE_READ_FLAGS_NONE,
610       ignored_data.data, region->addr, region->size, MC_PROCESS_INDEX_DISABLED);
611     xbt_dynar_push(snapshot->ignored_data, &ignored_data);
612   }
613
614   // Zero the memory:
615   xbt_dynar_foreach (mc_model_checker->process.checkpoint_ignore, cursor, region) {
616     MC_process_clear_memory(snapshot->process, region->addr, region->size);
617   }
618
619 }
620
621 static void MC_snapshot_ignore_restore(mc_snapshot_t snapshot)
622 {
623   unsigned int cursor = 0;
624   s_mc_snapshot_ignored_data_t ignored_data;
625   xbt_dynar_foreach (snapshot->ignored_data, cursor, ignored_data) {
626     MC_process_write(snapshot->process,
627       ignored_data.data, ignored_data.start, ignored_data.size);
628   }
629 }
630
631 /** @brief Can we remove this snapshot?
632  *
633  * Some snapshots cannot be removed (yet) because we need them
634  * at this point.
635  *
636  * @param snapshot
637  */
638 int mc_important_snapshot(mc_snapshot_t snapshot)
639 {
640   // We need this snapshot in order to know which
641   // pages needs to be stored in the next snapshot.
642   // This field is only non-NULL when using soft-dirty
643   // page tracking.
644   if (snapshot == mc_model_checker->parent_snapshot)
645     return true;
646
647   return false;
648 }
649
650 static void MC_get_current_fd(mc_snapshot_t snapshot)
651 {
652
653   snapshot->total_fd = 0;
654
655   const size_t fd_dir_path_size = 20;
656   char fd_dir_path[fd_dir_path_size];
657   if (snprintf(fd_dir_path, fd_dir_path_size,
658     "/proc/%lli/fd", (long long int) snapshot->process->pid) > fd_dir_path_size)
659     xbt_die("Unexpected buffer is too small for fd_dir_path");
660
661   DIR* fd_dir = opendir(fd_dir_path);
662   if (fd_dir == NULL)
663     xbt_die("Cannot open directory '/proc/self/fd'\n");
664
665   size_t total_fd = 0;
666   struct dirent* fd_number;
667   while ((fd_number = readdir(fd_dir))) {
668
669     int fd_value = atoi(fd_number->d_name);
670
671     if(fd_value < 3)
672       continue;
673
674     const size_t source_size = 25;
675     char source[25];
676     if (snprintf(source, source_size, "/proc/%lli/fd/%s",
677         (long long int) snapshot->process->pid, fd_number->d_name) > source_size)
678       xbt_die("Unexpected buffer is too small for fd %s", fd_number->d_name);
679
680     const size_t link_size = 200;
681     char link[200];
682     int res = readlink(source, link, link_size);
683     if (res<0) {
684       xbt_die("Could not read link for %s", source);
685     }
686     if (res==200) {
687       xbt_die("Buffer to small for link of %s", source);
688     }
689     link[res] = '\0';
690
691     if(smpi_is_privatisation_file(link))
692       continue;
693
694     // This is (probably) the DIR* we are reading:
695     // TODO, read all the file entries at once and close the DIR.*
696     if(strcmp(fd_dir_path, link) == 0)
697       continue;
698
699     // We don't handle them.
700     // It does not mean we should silently ignore them however.
701     if (strncmp(link, "pipe:", 5) == 0 || strncmp(link, "socket:", 7) == 0)
702       continue;
703
704     // This is probably a shared memory used by lttng-ust:
705     if(strncmp("/dev/shm/ust-shm-tmp-", link, 21)==0)
706       continue;
707
708     // Add an entry for this FD in the snapshot:
709     fd_infos_t fd = xbt_new0(s_fd_infos_t, 1);
710     fd->filename = strdup(link);
711     fd->number = fd_value;
712     fd->flags = fcntl(fd_value, F_GETFL) | fcntl(fd_value, F_GETFD) ;
713     fd->current_position = lseek(fd_value, 0, SEEK_CUR);
714     snapshot->current_fd = xbt_realloc(snapshot->current_fd, (total_fd + 1) * sizeof(fd_infos_t));
715     snapshot->current_fd[total_fd] = fd;
716     total_fd++;
717   }
718
719   snapshot->total_fd = total_fd;
720   closedir (fd_dir);
721 }
722
723 static s_mc_address_space_class_t mc_snapshot_class = {
724   .read = (void*) &MC_snapshot_read
725 };
726
727 mc_snapshot_t MC_take_snapshot(int num_state)
728 {
729   mc_process_t mc_process = &mc_model_checker->process;
730   mc_snapshot_t snapshot = xbt_new0(s_mc_snapshot_t, 1);
731   snapshot->process = mc_process;
732   snapshot->address_space.address_space_class = &mc_snapshot_class;
733
734   snapshot->enabled_processes = xbt_dynar_new(sizeof(int), NULL);
735   smx_process_t process;
736   // FIXME, cross-process support (simix_global->process_list)
737   xbt_swag_foreach(process, simix_global->process_list) {
738     xbt_dynar_push_as(snapshot->enabled_processes, int, (int)process->pid);
739   }
740
741   MC_snapshot_handle_ignore(snapshot);
742
743   MC_get_current_fd(snapshot);
744
745   const bool use_soft_dirty = _sg_mc_sparse_checkpoint
746     && _sg_mc_soft_dirty
747     && MC_process_is_self(mc_process);
748
749   /* Save the std heap and the writable mapped pages of libsimgrid and binary */
750   MC_get_memory_regions(mc_process, snapshot);
751   if (use_soft_dirty)
752     mc_softdirty_reset();
753
754   snapshot->to_ignore = MC_take_snapshot_ignore();
755
756   if (_sg_mc_visited > 0 || strcmp(_sg_mc_property_file, "")) {
757     snapshot->stacks =
758         MC_take_snapshot_stacks(&snapshot);
759     if (_sg_mc_hash && snapshot->stacks != NULL) {
760       snapshot->hash = mc_hash_processes_state(num_state, snapshot->stacks);
761     } else {
762       snapshot->hash = 0;
763     }
764   } else {
765     snapshot->hash = 0;
766   }
767
768   MC_snapshot_ignore_restore(snapshot);
769   if (use_soft_dirty)
770     mc_model_checker->parent_snapshot = snapshot;
771   return snapshot;
772 }
773
774 static inline
775 void MC_restore_snapshot_regions(mc_snapshot_t snapshot)
776 {
777   mc_snapshot_t parent_snapshot = mc_model_checker->parent_snapshot;
778
779   const size_t n = snapshot->snapshot_regions_count;
780   for (size_t i = 0; i < n; i++) {
781     // For privatized, variables we decided it was not necessary to take the snapshot:
782     if (snapshot->snapshot_regions[i])
783       MC_region_restore(snapshot->snapshot_regions[i],
784         parent_snapshot ? parent_snapshot->snapshot_regions[i] : NULL);
785   }
786
787 #ifdef HAVE_SMPI
788   if(snapshot->privatization_index >= 0) {
789     // We just rewrote the global variables.
790     // The privatisation segment SMPI thinks
791     // is mapped might be inconsistent with the segment which
792     // is really mapped in memory (kernel state).
793     // We ask politely SMPI to map the segment anyway,
794     // even if it thinks it is the current one:
795     smpi_really_switch_data_segment(snapshot->privatization_index);
796   }
797 #endif
798 }
799
800 // FIXME, cross-process support ~ we need to implement this on the app side
801 // or use some form of [remote syscall execution](http://criu.org/Remote_syscall_execution)
802 // based on [parasite code execution](http://criu.org/Parasite_code).
803 static inline
804 void MC_restore_snapshot_fds(mc_snapshot_t snapshot)
805 {
806   int new_fd;
807   size_t i;
808   for(i=0; i < snapshot->total_fd; i++){
809     
810     new_fd = open(snapshot->current_fd[i]->filename, snapshot->current_fd[i]->flags);
811     if (new_fd <0) {
812       xbt_die("Could not reopen the file %s fo restoring the file descriptor",
813         snapshot->current_fd[i]->filename);
814     }
815     if(new_fd != -1 && new_fd != snapshot->current_fd[i]->number){
816       dup2(new_fd, snapshot->current_fd[i]->number);
817       //fprintf(stderr, "%p\n", fdopen(snapshot->current_fd[i]->number, "rw"));
818       close(new_fd);
819     };
820     lseek(snapshot->current_fd[i]->number, snapshot->current_fd[i]->current_position, SEEK_SET);
821   }
822 }
823
824 void MC_restore_snapshot(mc_snapshot_t snapshot)
825 {
826   const bool use_soft_dirty = _sg_mc_sparse_checkpoint
827     && _sg_mc_soft_dirty
828     && MC_process_is_self(&mc_model_checker->process);
829
830   MC_restore_snapshot_regions(snapshot);
831   MC_restore_snapshot_fds(snapshot);
832   if (use_soft_dirty) {
833     mc_softdirty_reset();
834   }
835   MC_snapshot_ignore_restore(snapshot);
836   if (use_soft_dirty) {
837     mc_model_checker->parent_snapshot = snapshot;
838   }
839
840   mc_model_checker->process.cache_flags = 0;
841 }
842
843 mc_snapshot_t simcall_HANDLER_mc_snapshot(smx_simcall_t simcall)
844 {
845   return MC_take_snapshot(1);
846 }
847
848 void *MC_snapshot(void)
849 {
850   return simcall_mc_snapshot();
851 }