Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
07f4c3c8e6e8b11b9b91f5e4874851a810356377
[simgrid.git] / src / simix / smx_network.cpp
1 /* Copyright (c) 2009-2017. The SimGrid Team.  All rights reserved.         */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 #include <algorithm>
7
8 #include <boost/range/algorithm.hpp>
9
10 #include "src/kernel/activity/CommImpl.hpp"
11 #include <xbt/ex.hpp>
12
13 #include "simgrid/s4u/Host.hpp"
14
15 #include "mc/mc.h"
16 #include "simgrid/s4u/Activity.hpp"
17 #include "simgrid/s4u/Mailbox.hpp"
18 #include "src/mc/mc_replay.h"
19 #include "src/simix/smx_private.h"
20 #include "src/surf/cpu_interface.hpp"
21 #include "src/surf/surf_interface.hpp"
22
23 #include "src/surf/network_interface.hpp"
24
25 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(simix_network, simix, "SIMIX network-related synchronization");
26
27 static void SIMIX_waitany_remove_simcall_from_actions(smx_simcall_t simcall);
28 static void SIMIX_comm_copy_data(smx_activity_t comm);
29 static void SIMIX_comm_start(simgrid::kernel::activity::CommImplPtr synchro);
30
31 /**
32  *  \brief Checks if there is a communication activity queued in a deque matching our needs
33  *  \param type The type of communication we are looking for (comm_send, comm_recv)
34  *  \return The communication activity if found, nullptr otherwise
35  */
36 static simgrid::kernel::activity::CommImplPtr
37 _find_matching_comm(boost::circular_buffer_space_optimized<smx_activity_t>* deque, e_smx_comm_type_t type,
38                     int (*match_fun)(void*, void*, smx_activity_t), void* this_user_data, smx_activity_t my_synchro,
39                     bool remove_matching)
40 {
41   void* other_user_data = nullptr;
42
43   for(auto it = deque->begin(); it != deque->end(); it++){
44     smx_activity_t synchro = *it;
45     simgrid::kernel::activity::CommImplPtr comm =
46         boost::dynamic_pointer_cast<simgrid::kernel::activity::CommImpl>(std::move(synchro));
47
48     if (comm->type == SIMIX_COMM_SEND) {
49       other_user_data = comm->src_data;
50     } else if (comm->type == SIMIX_COMM_RECEIVE) {
51       other_user_data = comm->dst_data;
52     }
53     if (comm->type == type && (match_fun == nullptr || match_fun(this_user_data, other_user_data, comm)) &&
54         (not comm->match_fun || comm->match_fun(other_user_data, this_user_data, my_synchro))) {
55       XBT_DEBUG("Found a matching communication synchro %p", comm.get());
56       if (remove_matching)
57         deque->erase(it);
58 #if SIMGRID_HAVE_MC
59       comm->mbox_cpy = comm->mbox;
60 #endif
61       comm->mbox = nullptr;
62       return comm;
63     }
64     XBT_DEBUG("Sorry, communication synchro %p does not match our needs:"
65               " its type is %d but we are looking for a comm of type %d (or maybe the filtering didn't match)",
66               comm.get(), (int)comm->type, (int)type);
67   }
68   XBT_DEBUG("No matching communication synchro found");
69   return nullptr;
70 }
71
72 /******************************************************************************/
73 /*                          Communication synchros                            */
74 /******************************************************************************/
75 XBT_PRIVATE void simcall_HANDLER_comm_send(smx_simcall_t simcall, smx_actor_t src, smx_mailbox_t mbox,
76                                   double task_size, double rate,
77                                   void *src_buff, size_t src_buff_size,
78                                   int (*match_fun)(void *, void *,smx_activity_t),
79                                   void (*copy_data_fun)(smx_activity_t, void*, size_t),
80           void *data, double timeout){
81   smx_activity_t comm = simcall_HANDLER_comm_isend(simcall, src, mbox, task_size, rate,
82                            src_buff, src_buff_size, match_fun, nullptr, copy_data_fun,
83                data, 0);
84   SIMCALL_SET_MC_VALUE(simcall, 0);
85   simcall_HANDLER_comm_wait(simcall, comm, timeout);
86 }
87 XBT_PRIVATE smx_activity_t simcall_HANDLER_comm_isend(smx_simcall_t simcall, smx_actor_t src_proc, smx_mailbox_t mbox,
88                                   double task_size, double rate,
89                                   void *src_buff, size_t src_buff_size,
90                                   int (*match_fun)(void *, void *,smx_activity_t),
91                                   void (*clean_fun)(void *), // used to free the synchro in case of problem after a detached send
92                                   void (*copy_data_fun)(smx_activity_t, void*, size_t),// used to copy data if not default one
93                           void *data, int detached)
94 {
95   XBT_DEBUG("send from mailbox %p", mbox);
96
97   /* Prepare a synchro describing us, so that it gets passed to the user-provided filter of other side */
98   simgrid::kernel::activity::CommImplPtr this_comm =
99       simgrid::kernel::activity::CommImplPtr(new simgrid::kernel::activity::CommImpl(SIMIX_COMM_SEND));
100
101   /* Look for communication synchro matching our needs. We also provide a description of
102    * ourself so that the other side also gets a chance of choosing if it wants to match with us.
103    *
104    * If it is not found then push our communication into the rendez-vous point */
105   simgrid::kernel::activity::CommImplPtr other_comm =
106       _find_matching_comm(&mbox->comm_queue, SIMIX_COMM_RECEIVE, match_fun, data, this_comm, /*remove_matching*/ true);
107
108   if (not other_comm) {
109     other_comm = std::move(this_comm);
110
111     if (mbox->permanent_receiver != nullptr) {
112       //this mailbox is for small messages, which have to be sent right now
113       other_comm->state   = SIMIX_READY;
114       other_comm->dst_proc=mbox->permanent_receiver.get();
115       mbox->done_comm_queue.push_back(other_comm);
116       XBT_DEBUG("pushing a message into the permanent receive list %p, comm %p", mbox, other_comm.get());
117
118     }else{
119       mbox->push(other_comm);
120     }
121   } else {
122     XBT_DEBUG("Receive already pushed");
123
124     other_comm->state = SIMIX_READY;
125     other_comm->type = SIMIX_COMM_READY;
126   }
127   src_proc->comms.push_back(other_comm);
128
129   if (detached) {
130     other_comm->detached = true;
131     other_comm->clean_fun = clean_fun;
132   } else {
133     other_comm->clean_fun = nullptr;
134   }
135
136   /* Setup the communication synchro */
137   other_comm->src_proc = src_proc;
138   other_comm->task_size = task_size;
139   other_comm->rate = rate;
140   other_comm->src_buff = src_buff;
141   other_comm->src_buff_size = src_buff_size;
142   other_comm->src_data = data;
143
144   other_comm->match_fun = match_fun;
145   other_comm->copy_data_fun = copy_data_fun;
146
147
148   if (MC_is_active() || MC_record_replay_is_active()) {
149     other_comm->state = SIMIX_RUNNING;
150     return (detached ? nullptr : other_comm);
151   }
152
153   SIMIX_comm_start(other_comm);
154   return (detached ? nullptr : other_comm);
155 }
156
157 XBT_PRIVATE void simcall_HANDLER_comm_recv(smx_simcall_t simcall, smx_actor_t receiver, smx_mailbox_t mbox,
158                          void *dst_buff, size_t *dst_buff_size,
159                          int (*match_fun)(void *, void *, smx_activity_t),
160                          void (*copy_data_fun)(smx_activity_t, void*, size_t),
161                          void *data, double timeout, double rate)
162 {
163   smx_activity_t comm = SIMIX_comm_irecv(receiver, mbox, dst_buff, dst_buff_size, match_fun, copy_data_fun, data, rate);
164   SIMCALL_SET_MC_VALUE(simcall, 0);
165   simcall_HANDLER_comm_wait(simcall, comm, timeout);
166 }
167
168 XBT_PRIVATE smx_activity_t simcall_HANDLER_comm_irecv(smx_simcall_t simcall, smx_actor_t receiver, smx_mailbox_t mbox,
169     void *dst_buff, size_t *dst_buff_size,
170     int (*match_fun)(void *, void *, smx_activity_t),
171     void (*copy_data_fun)(smx_activity_t, void*, size_t),
172     void *data, double rate)
173 {
174   return SIMIX_comm_irecv(receiver, mbox, dst_buff, dst_buff_size, match_fun, copy_data_fun, data, rate);
175 }
176
177 smx_activity_t SIMIX_comm_irecv(smx_actor_t dst_proc, smx_mailbox_t mbox, void *dst_buff, size_t *dst_buff_size,
178     int (*match_fun)(void *, void *, smx_activity_t),
179     void (*copy_data_fun)(smx_activity_t, void*, size_t), // used to copy data if not default one
180     void *data, double rate)
181 {
182   simgrid::kernel::activity::CommImplPtr this_synchro =
183       simgrid::kernel::activity::CommImplPtr(new simgrid::kernel::activity::CommImpl(SIMIX_COMM_RECEIVE));
184   XBT_DEBUG("recv from mbox %p. this_synchro=%p", mbox, this_synchro.get());
185
186   simgrid::kernel::activity::CommImplPtr other_comm;
187   //communication already done, get it inside the list of completed comms
188   if (mbox->permanent_receiver != nullptr && not mbox->done_comm_queue.empty()) {
189
190     XBT_DEBUG("We have a comm that has probably already been received, trying to match it, to skip the communication");
191     //find a match in the list of already received comms
192     other_comm = _find_matching_comm(&mbox->done_comm_queue, SIMIX_COMM_SEND, match_fun, data, this_synchro,
193                                      /*remove_matching*/ true);
194     //if not found, assume the receiver came first, register it to the mailbox in the classical way
195     if (not other_comm) {
196       XBT_DEBUG("We have messages in the permanent receive list, but not the one we are looking for, pushing request into list");
197       other_comm = this_synchro;
198       mbox->push(this_synchro);
199     } else {
200       if (other_comm->surf_comm && other_comm->remains() < 1e-12) {
201         XBT_DEBUG("comm %p has been already sent, and is finished, destroy it", other_comm.get());
202         other_comm->state = SIMIX_DONE;
203         other_comm->type = SIMIX_COMM_DONE;
204         other_comm->mbox = nullptr;
205       }
206     }
207   } else {
208     /* Prepare a comm describing us, so that it gets passed to the user-provided filter of other side */
209
210     /* Look for communication activity matching our needs. We also provide a description of
211      * ourself so that the other side also gets a chance of choosing if it wants to match with us.
212      *
213      * If it is not found then push our communication into the rendez-vous point */
214     other_comm = _find_matching_comm(&mbox->comm_queue, SIMIX_COMM_SEND, match_fun, data, this_synchro,
215                                      /*remove_matching*/ true);
216
217     if (other_comm == nullptr) {
218       XBT_DEBUG("Receive pushed first (%zu comm enqueued so far)", mbox->comm_queue.size());
219       other_comm = this_synchro;
220       mbox->push(this_synchro);
221     } else {
222       XBT_DEBUG("Match my %p with the existing %p", this_synchro.get(), other_comm.get());
223
224       other_comm->state = SIMIX_READY;
225       other_comm->type = SIMIX_COMM_READY;
226     }
227     dst_proc->comms.push_back(other_comm);
228   }
229
230   /* Setup communication synchro */
231   other_comm->dst_proc = dst_proc;
232   other_comm->dst_buff = dst_buff;
233   other_comm->dst_buff_size = dst_buff_size;
234   other_comm->dst_data = data;
235
236   if (rate > -1.0 && (other_comm->rate < 0.0 || rate < other_comm->rate))
237     other_comm->rate = rate;
238
239   other_comm->match_fun = match_fun;
240   other_comm->copy_data_fun = copy_data_fun;
241
242   if (MC_is_active() || MC_record_replay_is_active()) {
243     other_comm->state = SIMIX_RUNNING;
244     return other_comm;
245   }
246
247   SIMIX_comm_start(other_comm);
248   return other_comm;
249 }
250
251 smx_activity_t simcall_HANDLER_comm_iprobe(smx_simcall_t simcall, smx_mailbox_t mbox,
252                                    int type, int src, int tag,
253                                    int (*match_fun)(void *, void *, smx_activity_t),
254                                    void *data){
255   return SIMIX_comm_iprobe(simcall->issuer, mbox, type, src, tag, match_fun, data);
256 }
257
258 smx_activity_t SIMIX_comm_iprobe(smx_actor_t dst_proc, smx_mailbox_t mbox, int type, int src,
259                               int tag, int (*match_fun)(void *, void *, smx_activity_t), void *data)
260 {
261   XBT_DEBUG("iprobe from %p %p", mbox, &mbox->comm_queue);
262   simgrid::kernel::activity::CommImplPtr this_comm;
263   int smx_type;
264   if(type == 1){
265     this_comm = simgrid::kernel::activity::CommImplPtr(new simgrid::kernel::activity::CommImpl(SIMIX_COMM_SEND));
266     smx_type = SIMIX_COMM_RECEIVE;
267   } else{
268     this_comm = simgrid::kernel::activity::CommImplPtr(new simgrid::kernel::activity::CommImpl(SIMIX_COMM_RECEIVE));
269     smx_type = SIMIX_COMM_SEND;
270   }
271   smx_activity_t other_synchro=nullptr;
272   if (mbox->permanent_receiver != nullptr && not mbox->done_comm_queue.empty()) {
273     XBT_DEBUG("first check in the permanent recv mailbox, to see if we already got something");
274     other_synchro = _find_matching_comm(&mbox->done_comm_queue,
275       (e_smx_comm_type_t) smx_type, match_fun, data, this_comm,/*remove_matching*/false);
276   }
277   if (not other_synchro) {
278     XBT_DEBUG("check if we have more luck in the normal mailbox");
279     other_synchro = _find_matching_comm(&mbox->comm_queue,
280       (e_smx_comm_type_t) smx_type, match_fun, data, this_comm,/*remove_matching*/false);
281   }
282
283   return other_synchro;
284 }
285
286 void simcall_HANDLER_comm_wait(smx_simcall_t simcall, smx_activity_t synchro, double timeout)
287 {
288   /* Associate this simcall to the wait synchro */
289   XBT_DEBUG("simcall_HANDLER_comm_wait, %p", synchro.get());
290
291   synchro->simcalls.push_back(simcall);
292   simcall->issuer->waiting_synchro = synchro;
293
294   if (MC_is_active() || MC_record_replay_is_active()) {
295     int idx = SIMCALL_GET_MC_VALUE(simcall);
296     if (idx == 0) {
297       synchro->state = SIMIX_DONE;
298     } else {
299       /* If we reached this point, the wait simcall must have a timeout */
300       /* Otherwise it shouldn't be enabled and executed by the MC */
301       if (timeout < 0.0)
302         THROW_IMPOSSIBLE;
303
304       simgrid::kernel::activity::CommImplPtr comm =
305           boost::static_pointer_cast<simgrid::kernel::activity::CommImpl>(synchro);
306       if (comm->src_proc == simcall->issuer)
307         comm->state = SIMIX_SRC_TIMEOUT;
308       else
309         comm->state = SIMIX_DST_TIMEOUT;
310     }
311
312     SIMIX_comm_finish(synchro);
313     return;
314   }
315
316   /* If the synchro has already finish perform the error handling, */
317   /* otherwise set up a waiting timeout on the right side          */
318   if (synchro->state != SIMIX_WAITING && synchro->state != SIMIX_RUNNING) {
319     SIMIX_comm_finish(synchro);
320   } else { /* if (timeout >= 0) { we need a surf sleep action even when there is no timeout, otherwise surf won't tell us when the host fails */
321     surf_action_t sleep = simcall->issuer->host->pimpl_cpu->sleep(timeout);
322     sleep->setData(&*synchro);
323
324     simgrid::kernel::activity::CommImplPtr comm =
325         boost::static_pointer_cast<simgrid::kernel::activity::CommImpl>(synchro);
326     if (simcall->issuer == comm->src_proc)
327       comm->src_timeout = sleep;
328     else
329       comm->dst_timeout = sleep;
330   }
331 }
332
333 void simcall_HANDLER_comm_test(smx_simcall_t simcall, smx_activity_t synchro)
334 {
335   simgrid::kernel::activity::CommImplPtr comm =
336       boost::static_pointer_cast<simgrid::kernel::activity::CommImpl>(synchro);
337
338   if (MC_is_active() || MC_record_replay_is_active()){
339     simcall_comm_test__set__result(simcall, comm->src_proc && comm->dst_proc);
340     if (simcall_comm_test__get__result(simcall)){
341       synchro->state = SIMIX_DONE;
342       synchro->simcalls.push_back(simcall);
343       SIMIX_comm_finish(synchro);
344     } else {
345       SIMIX_simcall_answer(simcall);
346     }
347     return;
348   }
349
350   simcall_comm_test__set__result(simcall, (synchro->state != SIMIX_WAITING && synchro->state != SIMIX_RUNNING));
351   if (simcall_comm_test__get__result(simcall)) {
352     synchro->simcalls.push_back(simcall);
353     SIMIX_comm_finish(synchro);
354   } else {
355     SIMIX_simcall_answer(simcall);
356   }
357 }
358
359 void simcall_HANDLER_comm_testany(smx_simcall_t simcall, simgrid::kernel::activity::ActivityImplPtr comms[],
360                                   size_t count)
361 {
362   // The default result is -1 -- this means, "nothing is ready".
363   // It can be changed below, but only if something matches.
364   simcall_comm_testany__set__result(simcall, -1);
365
366   if (MC_is_active() || MC_record_replay_is_active()){
367     int idx = SIMCALL_GET_MC_VALUE(simcall);
368     if(idx == -1){
369       SIMIX_simcall_answer(simcall);
370     }else{
371       simgrid::kernel::activity::ActivityImplPtr synchro = comms[idx];
372       simcall_comm_testany__set__result(simcall, idx);
373       synchro->simcalls.push_back(simcall);
374       synchro->state = SIMIX_DONE;
375       SIMIX_comm_finish(synchro);
376     }
377     return;
378   }
379
380   for (std::size_t i = 0; i != count; ++i) {
381     simgrid::kernel::activity::ActivityImplPtr synchro = comms[i];
382     if (synchro->state != SIMIX_WAITING && synchro->state != SIMIX_RUNNING) {
383       simcall_comm_testany__set__result(simcall, i);
384       synchro->simcalls.push_back(simcall);
385       SIMIX_comm_finish(synchro);
386       return;
387     }
388   }
389   SIMIX_simcall_answer(simcall);
390 }
391
392 void simcall_HANDLER_comm_waitany(smx_simcall_t simcall, xbt_dynar_t synchros, double timeout)
393 {
394   if (MC_is_active() || MC_record_replay_is_active()){
395     if (timeout > 0.0)
396       xbt_die("Timeout not implemented for waitany in the model-checker");
397     int idx = SIMCALL_GET_MC_VALUE(simcall);
398     smx_activity_t synchro = xbt_dynar_get_as(synchros, idx, smx_activity_t);
399     synchro->simcalls.push_back(simcall);
400     simcall_comm_waitany__set__result(simcall, idx);
401     synchro->state = SIMIX_DONE;
402     SIMIX_comm_finish(synchro);
403     return;
404   }
405
406   if (timeout < 0.0){
407     simcall->timer = NULL;
408   } else {
409     simcall->timer = SIMIX_timer_set(SIMIX_get_clock() + timeout, [simcall]() {
410       SIMIX_waitany_remove_simcall_from_actions(simcall);
411       simcall_comm_waitany__set__result(simcall, -1);
412       SIMIX_simcall_answer(simcall);
413     });
414   }
415
416   unsigned int cursor;
417   simgrid::kernel::activity::ActivityImpl* ptr;
418   xbt_dynar_foreach(synchros, cursor, ptr){
419     smx_activity_t synchro = simgrid::kernel::activity::ActivityImplPtr(ptr);
420     /* associate this simcall to the the synchro */
421     synchro->simcalls.push_back(simcall);
422
423     /* see if the synchro is already finished */
424     if (synchro->state != SIMIX_WAITING && synchro->state != SIMIX_RUNNING){
425       SIMIX_comm_finish(synchro);
426       break;
427     }
428   }
429 }
430
431 void SIMIX_waitany_remove_simcall_from_actions(smx_simcall_t simcall)
432 {
433   unsigned int cursor = 0;
434   xbt_dynar_t synchros = simcall_comm_waitany__get__comms(simcall);
435
436   simgrid::kernel::activity::ActivityImpl* ptr;
437   xbt_dynar_foreach(synchros, cursor, ptr){
438     smx_activity_t synchro = simgrid::kernel::activity::ActivityImplPtr(ptr);
439
440     // Remove the first occurence of simcall:
441     auto i = boost::range::find(synchro->simcalls, simcall);
442     if (i !=  synchro->simcalls.end())
443       synchro->simcalls.erase(i);
444   }
445 }
446
447 /**
448  *  \brief Starts the simulation of a communication synchro.
449  *  \param synchro the communication synchro
450  */
451 static inline void SIMIX_comm_start(simgrid::kernel::activity::CommImplPtr comm)
452 {
453   /* If both the sender and the receiver are already there, start the communication */
454   if (comm->state == SIMIX_READY) {
455
456     simgrid::s4u::Host* sender   = comm->src_proc->host;
457     simgrid::s4u::Host* receiver = comm->dst_proc->host;
458
459     comm->surf_comm = surf_network_model->communicate(sender, receiver, comm->task_size, comm->rate);
460     comm->surf_comm->setData(comm.get());
461     comm->state = SIMIX_RUNNING;
462
463     XBT_DEBUG("Starting communication %p from '%s' to '%s' (surf_action: %p)", comm.get(), sender->cname(),
464               receiver->cname(), comm->surf_comm);
465
466     /* If a link is failed, detect it immediately */
467     if (comm->surf_comm->getState() == simgrid::surf::Action::State::failed) {
468       XBT_DEBUG("Communication from '%s' to '%s' failed to start because of a link failure", sender->cname(),
469                 receiver->cname());
470       comm->state = SIMIX_LINK_FAILURE;
471       comm->cleanupSurf();
472     }
473
474     /* If any of the process is suspend, create the synchro but stop its execution,
475        it will be restarted when the sender process resume */
476     if (SIMIX_process_is_suspended(comm->src_proc) || SIMIX_process_is_suspended(comm->dst_proc)) {
477       if (SIMIX_process_is_suspended(comm->src_proc))
478         XBT_DEBUG("The communication is suspended on startup because src (%s@%s) was suspended since it initiated the "
479                   "communication",
480                   comm->src_proc->cname(), comm->src_proc->host->cname());
481       else
482         XBT_DEBUG("The communication is suspended on startup because dst (%s@%s) was suspended since it initiated the "
483                   "communication",
484                   comm->dst_proc->cname(), comm->dst_proc->host->cname());
485
486       comm->surf_comm->suspend();
487     }
488   }
489 }
490
491 /**
492  * \brief Answers the SIMIX simcalls associated to a communication synchro.
493  * \param synchro a finished communication synchro
494  */
495 void SIMIX_comm_finish(smx_activity_t synchro)
496 {
497   simgrid::kernel::activity::CommImplPtr comm =
498       boost::static_pointer_cast<simgrid::kernel::activity::CommImpl>(synchro);
499
500   while (not synchro->simcalls.empty()) {
501     smx_simcall_t simcall = synchro->simcalls.front();
502     synchro->simcalls.pop_front();
503
504     /* If a waitany simcall is waiting for this synchro to finish, then remove it from the other synchros in the waitany
505      * list. Afterwards, get the position of the actual synchro in the waitany dynar and return it as the result of the
506      * simcall */
507
508     if (simcall->call == SIMCALL_NONE) //FIXME: maybe a better way to handle this case
509       continue; // if process handling comm is killed
510     if (simcall->call == SIMCALL_COMM_WAITANY) {
511       SIMIX_waitany_remove_simcall_from_actions(simcall);
512       if (simcall->timer) {
513         SIMIX_timer_remove(simcall->timer);
514         simcall->timer = nullptr;
515       }
516       if (not MC_is_active() && not MC_record_replay_is_active())
517         simcall_comm_waitany__set__result(simcall,
518                                           xbt_dynar_search(simcall_comm_waitany__get__comms(simcall), &synchro));
519     }
520
521     /* If the synchro is still in a rendez-vous point then remove from it */
522     if (comm->mbox)
523       comm->mbox->remove(comm);
524
525     XBT_DEBUG("SIMIX_comm_finish: synchro state = %d", (int)synchro->state);
526
527     /* Check out for errors */
528
529     if (simcall->issuer->host->isOff()) {
530       simcall->issuer->context->iwannadie = 1;
531       SMX_EXCEPTION(simcall->issuer, host_error, 0, "Host failed");
532     } else {
533       switch (comm->state) {
534
535         case SIMIX_DONE:
536           XBT_DEBUG("Communication %p complete!", synchro.get());
537           SIMIX_comm_copy_data(synchro);
538           break;
539
540         case SIMIX_SRC_TIMEOUT:
541           SMX_EXCEPTION(simcall->issuer, timeout_error, 0, "Communication timeouted because of sender");
542           break;
543
544         case SIMIX_DST_TIMEOUT:
545           SMX_EXCEPTION(simcall->issuer, timeout_error, 0, "Communication timeouted because of receiver");
546           break;
547
548         case SIMIX_SRC_HOST_FAILURE:
549           if (simcall->issuer == comm->src_proc)
550             simcall->issuer->context->iwannadie = 1;
551           //          SMX_EXCEPTION(simcall->issuer, host_error, 0, "Host failed");
552           else
553             SMX_EXCEPTION(simcall->issuer, network_error, 0, "Remote peer failed");
554           break;
555
556         case SIMIX_DST_HOST_FAILURE:
557           if (simcall->issuer == comm->dst_proc)
558             simcall->issuer->context->iwannadie = 1;
559           //          SMX_EXCEPTION(simcall->issuer, host_error, 0, "Host failed");
560           else
561             SMX_EXCEPTION(simcall->issuer, network_error, 0, "Remote peer failed");
562           break;
563
564         case SIMIX_LINK_FAILURE:
565           XBT_DEBUG("Link failure in synchro %p between '%s' and '%s': posting an exception to the issuer: %s (%p) "
566                     "detached:%d",
567                     synchro.get(), comm->src_proc ? comm->src_proc->host->cname() : nullptr,
568                     comm->dst_proc ? comm->dst_proc->host->cname() : nullptr, simcall->issuer->cname(), simcall->issuer,
569                     comm->detached);
570           if (comm->src_proc == simcall->issuer) {
571             XBT_DEBUG("I'm source");
572           } else if (comm->dst_proc == simcall->issuer) {
573             XBT_DEBUG("I'm dest");
574           } else {
575             XBT_DEBUG("I'm neither source nor dest");
576           }
577           SMX_EXCEPTION(simcall->issuer, network_error, 0, "Link failure");
578           break;
579
580         case SIMIX_CANCELED:
581           if (simcall->issuer == comm->dst_proc)
582             SMX_EXCEPTION(simcall->issuer, cancel_error, 0, "Communication canceled by the sender");
583           else
584             SMX_EXCEPTION(simcall->issuer, cancel_error, 0, "Communication canceled by the receiver");
585           break;
586
587         default:
588           xbt_die("Unexpected synchro state in SIMIX_comm_finish: %d", (int)synchro->state);
589       }
590     }
591
592     /* if there is an exception during a waitany or a testany, indicate the position of the failed communication */
593     if (simcall->issuer->exception) {
594       // In order to modify the exception we have to rethrow it:
595       try {
596         std::rethrow_exception(simcall->issuer->exception);
597       }
598       catch(xbt_ex& e) {
599         if (simcall->call == SIMCALL_COMM_WAITANY) {
600           e.value = xbt_dynar_search(simcall_comm_waitany__get__comms(simcall), &synchro);
601         }
602         else if (simcall->call == SIMCALL_COMM_TESTANY) {
603           e.value = -1;
604           auto comms = simcall_comm_testany__get__comms(simcall);
605           auto count = simcall_comm_testany__get__count(simcall);
606           auto element = std::find(comms, comms + count, synchro);
607           if (element == comms + count)
608             e.value = -1;
609           else
610             e.value = element - comms;
611         }
612         simcall->issuer->exception = std::make_exception_ptr(e);
613       }
614       catch(...) {
615         // Nothing to do
616       }
617     }
618
619     if (simcall->issuer->host->isOff()) {
620       simcall->issuer->context->iwannadie = 1;
621     }
622
623     simcall->issuer->waiting_synchro = nullptr;
624     simcall->issuer->comms.remove(synchro);
625     if(comm->detached){
626       if(simcall->issuer == comm->src_proc){
627         if(comm->dst_proc)
628           comm->dst_proc->comms.remove(synchro);
629       }
630       else if(simcall->issuer == comm->dst_proc){
631         if(comm->src_proc)
632           comm->src_proc->comms.remove(synchro);
633       }
634       else{
635         comm->dst_proc->comms.remove(synchro);
636         comm->src_proc->comms.remove(synchro);
637       }
638     }
639
640     SIMIX_simcall_answer(simcall);
641   }
642 }
643
644 /******************************************************************************/
645 /*                    SIMIX_comm_copy_data callbacks                       */
646 /******************************************************************************/
647 static void (*SIMIX_comm_copy_data_callback) (smx_activity_t, void*, size_t) = &SIMIX_comm_copy_pointer_callback;
648
649 void SIMIX_comm_set_copy_data_callback(void (*callback) (smx_activity_t, void*, size_t))
650 {
651   SIMIX_comm_copy_data_callback = callback;
652 }
653
654 void SIMIX_comm_copy_pointer_callback(smx_activity_t synchro, void* buff, size_t buff_size)
655 {
656   simgrid::kernel::activity::CommImplPtr comm =
657       boost::static_pointer_cast<simgrid::kernel::activity::CommImpl>(synchro);
658
659   xbt_assert((buff_size == sizeof(void *)), "Cannot copy %zu bytes: must be sizeof(void*)", buff_size);
660   *(void **) (comm->dst_buff) = buff;
661 }
662
663 void SIMIX_comm_copy_buffer_callback(smx_activity_t synchro, void* buff, size_t buff_size)
664 {
665   simgrid::kernel::activity::CommImplPtr comm =
666       boost::static_pointer_cast<simgrid::kernel::activity::CommImpl>(synchro);
667
668   XBT_DEBUG("Copy the data over");
669   memcpy(comm->dst_buff, buff, buff_size);
670   if (comm->detached) { // if this is a detached send, the source buffer was duplicated by SMPI sender to make the original buffer available to the application ASAP
671     xbt_free(buff);
672     comm->src_buff = nullptr;
673   }
674 }
675
676 /**
677  *  @brief Copy the communication data from the sender's buffer to the receiver's one
678  *  @param synchro The communication
679  */
680 void SIMIX_comm_copy_data(smx_activity_t synchro)
681 {
682   simgrid::kernel::activity::CommImplPtr comm =
683       boost::static_pointer_cast<simgrid::kernel::activity::CommImpl>(synchro);
684
685   size_t buff_size = comm->src_buff_size;
686   /* If there is no data to copy then return */
687   if (not comm->src_buff || not comm->dst_buff || comm->copied)
688     return;
689
690   XBT_DEBUG("Copying comm %p data from %s (%p) -> %s (%p) (%zu bytes)", comm.get(),
691             comm->src_proc ? comm->src_proc->host->cname() : "a finished process", comm->src_buff,
692             comm->dst_proc ? comm->dst_proc->host->cname() : "a finished process", comm->dst_buff, buff_size);
693
694   /* Copy at most dst_buff_size bytes of the message to receiver's buffer */
695   if (comm->dst_buff_size)
696     buff_size = MIN(buff_size, *(comm->dst_buff_size));
697
698   /* Update the receiver's buffer size to the copied amount */
699   if (comm->dst_buff_size)
700     *comm->dst_buff_size = buff_size;
701
702   if (buff_size > 0){
703       if(comm->copy_data_fun)
704         comm->copy_data_fun (comm, comm->src_buff, buff_size);
705       else
706         SIMIX_comm_copy_data_callback (comm, comm->src_buff, buff_size);
707   }
708
709   /* Set the copied flag so we copy data only once */
710   /* (this function might be called from both communication ends) */
711   comm->copied = 1;
712 }