Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
have only one refcounting system for the activities
[simgrid.git] / src / simix / smx_network.cpp
1 /* Copyright (c) 2009-2017. The SimGrid Team.  All rights reserved.         */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 #include <algorithm>
7
8 #include <boost/range/algorithm.hpp>
9
10 #include "src/kernel/activity/CommImpl.hpp"
11 #include <xbt/ex.hpp>
12
13 #include "simgrid/s4u/Host.hpp"
14
15 #include "mc/mc.h"
16 #include "simgrid/s4u/Activity.hpp"
17 #include "simgrid/s4u/Mailbox.hpp"
18 #include "src/mc/mc_replay.h"
19 #include "src/simix/smx_private.h"
20 #include "src/surf/cpu_interface.hpp"
21 #include "src/surf/surf_interface.hpp"
22
23 #include "src/surf/network_interface.hpp"
24
25 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(simix_network, simix, "SIMIX network-related synchronization");
26
27 static void SIMIX_waitany_remove_simcall_from_actions(smx_simcall_t simcall);
28 static void SIMIX_comm_copy_data(smx_activity_t comm);
29 static void SIMIX_comm_start(smx_activity_t synchro);
30 static simgrid::kernel::activity::CommImpl*
31 _find_matching_comm(boost::circular_buffer_space_optimized<smx_activity_t>* deque, e_smx_comm_type_t type,
32                     int (*match_fun)(void*, void*, smx_activity_t), void* user_data, smx_activity_t my_synchro,
33                     bool remove_matching);
34
35 /**
36  *  \brief Checks if there is a communication activity queued in a deque matching our needs
37  *  \param type The type of communication we are looking for (comm_send, comm_recv)
38  *  \return The communication activity if found, nullptr otherwise
39  */
40 static simgrid::kernel::activity::CommImpl*
41 _find_matching_comm(boost::circular_buffer_space_optimized<smx_activity_t>* deque, e_smx_comm_type_t type,
42                     int (*match_fun)(void*, void*, smx_activity_t), void* this_user_data, smx_activity_t my_synchro,
43                     bool remove_matching)
44 {
45   void* other_user_data = nullptr;
46
47   for(auto it = deque->begin(); it != deque->end(); it++){
48     smx_activity_t synchro = *it;
49     simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
50
51     if (comm->type == SIMIX_COMM_SEND) {
52       other_user_data = comm->src_data;
53     } else if (comm->type == SIMIX_COMM_RECEIVE) {
54       other_user_data = comm->dst_data;
55     }
56     if (comm->type == type && (match_fun == nullptr || match_fun(this_user_data, other_user_data, synchro)) &&
57         (not comm->match_fun || comm->match_fun(other_user_data, this_user_data, my_synchro))) {
58       XBT_DEBUG("Found a matching communication synchro %p", comm);
59       if (remove_matching)
60         deque->erase(it);
61       SIMIX_comm_ref(comm);
62 #if SIMGRID_HAVE_MC
63       comm->mbox_cpy = comm->mbox;
64 #endif
65       comm->mbox = nullptr;
66       return comm;
67     }
68     XBT_DEBUG("Sorry, communication synchro %p does not match our needs:"
69               " its type is %d but we are looking for a comm of type %d (or maybe the filtering didn't match)",
70               comm, (int)comm->type, (int)type);
71   }
72   XBT_DEBUG("No matching communication synchro found");
73   return nullptr;
74 }
75
76 /******************************************************************************/
77 /*                          Communication synchros                            */
78 /******************************************************************************/
79 XBT_PRIVATE void simcall_HANDLER_comm_send(smx_simcall_t simcall, smx_actor_t src, smx_mailbox_t mbox,
80                                   double task_size, double rate,
81                                   void *src_buff, size_t src_buff_size,
82                                   int (*match_fun)(void *, void *,smx_activity_t),
83                                   void (*copy_data_fun)(smx_activity_t, void*, size_t),
84           void *data, double timeout){
85   smx_activity_t comm = simcall_HANDLER_comm_isend(simcall, src, mbox, task_size, rate,
86                            src_buff, src_buff_size, match_fun, nullptr, copy_data_fun,
87                data, 0);
88   SIMCALL_SET_MC_VALUE(simcall, 0);
89   simcall_HANDLER_comm_wait(simcall, comm, timeout);
90 }
91 XBT_PRIVATE smx_activity_t simcall_HANDLER_comm_isend(smx_simcall_t simcall, smx_actor_t src_proc, smx_mailbox_t mbox,
92                                   double task_size, double rate,
93                                   void *src_buff, size_t src_buff_size,
94                                   int (*match_fun)(void *, void *,smx_activity_t),
95                                   void (*clean_fun)(void *), // used to free the synchro in case of problem after a detached send
96                                   void (*copy_data_fun)(smx_activity_t, void*, size_t),// used to copy data if not default one
97                           void *data, int detached)
98 {
99   XBT_DEBUG("send from %p", mbox);
100
101   /* Prepare a synchro describing us, so that it gets passed to the user-provided filter of other side */
102   simgrid::kernel::activity::CommImpl* this_comm = new simgrid::kernel::activity::CommImpl(SIMIX_COMM_SEND);
103
104   /* Look for communication synchro matching our needs. We also provide a description of
105    * ourself so that the other side also gets a chance of choosing if it wants to match with us.
106    *
107    * If it is not found then push our communication into the rendez-vous point */
108   simgrid::kernel::activity::CommImpl* other_comm =
109       _find_matching_comm(&mbox->comm_queue, SIMIX_COMM_RECEIVE, match_fun, data, this_comm, /*remove_matching*/ true);
110
111   if (not other_comm) {
112     other_comm = this_comm;
113
114     if (mbox->permanent_receiver!=nullptr){
115       //this mailbox is for small messages, which have to be sent right now
116       other_comm->state   = SIMIX_READY;
117       other_comm->dst_proc=mbox->permanent_receiver.get();
118       other_comm          = static_cast<simgrid::kernel::activity::CommImpl*>(SIMIX_comm_ref(other_comm));
119       mbox->done_comm_queue.push_back(other_comm);
120       XBT_DEBUG("pushing a message into the permanent receive list %p, comm %p", mbox, other_comm);
121
122     }else{
123       mbox->push(this_comm);
124     }
125   } else {
126     XBT_DEBUG("Receive already pushed");
127     SIMIX_comm_unref(this_comm);
128     SIMIX_comm_unref(this_comm);
129
130     other_comm->state = SIMIX_READY;
131     other_comm->type = SIMIX_COMM_READY;
132
133   }
134   src_proc->comms.push_back(other_comm);
135
136   if (detached) {
137     other_comm->detached = true;
138     other_comm->clean_fun = clean_fun;
139   } else {
140     other_comm->clean_fun = nullptr;
141   }
142
143   /* Setup the communication synchro */
144   other_comm->src_proc = src_proc;
145   other_comm->task_size = task_size;
146   other_comm->rate = rate;
147   other_comm->src_buff = src_buff;
148   other_comm->src_buff_size = src_buff_size;
149   other_comm->src_data = data;
150
151   other_comm->match_fun = match_fun;
152   other_comm->copy_data_fun = copy_data_fun;
153
154
155   if (MC_is_active() || MC_record_replay_is_active()) {
156     other_comm->state = SIMIX_RUNNING;
157     return (detached ? nullptr : other_comm);
158   }
159
160   SIMIX_comm_start(other_comm);
161   return (detached ? nullptr : other_comm);
162 }
163
164 XBT_PRIVATE void simcall_HANDLER_comm_recv(smx_simcall_t simcall, smx_actor_t receiver, smx_mailbox_t mbox,
165                          void *dst_buff, size_t *dst_buff_size,
166                          int (*match_fun)(void *, void *, smx_activity_t),
167                          void (*copy_data_fun)(smx_activity_t, void*, size_t),
168                          void *data, double timeout, double rate)
169 {
170   smx_activity_t comm = SIMIX_comm_irecv(receiver, mbox, dst_buff, dst_buff_size, match_fun, copy_data_fun, data, rate);
171   SIMCALL_SET_MC_VALUE(simcall, 0);
172   simcall_HANDLER_comm_wait(simcall, comm, timeout);
173 }
174
175 XBT_PRIVATE smx_activity_t simcall_HANDLER_comm_irecv(smx_simcall_t simcall, smx_actor_t receiver, smx_mailbox_t mbox,
176     void *dst_buff, size_t *dst_buff_size,
177     int (*match_fun)(void *, void *, smx_activity_t),
178     void (*copy_data_fun)(smx_activity_t, void*, size_t),
179     void *data, double rate)
180 {
181   return SIMIX_comm_irecv(receiver, mbox, dst_buff, dst_buff_size, match_fun, copy_data_fun, data, rate);
182 }
183
184 smx_activity_t SIMIX_comm_irecv(smx_actor_t dst_proc, smx_mailbox_t mbox, void *dst_buff, size_t *dst_buff_size,
185     int (*match_fun)(void *, void *, smx_activity_t),
186     void (*copy_data_fun)(smx_activity_t, void*, size_t), // used to copy data if not default one
187     void *data, double rate)
188 {
189   simgrid::kernel::activity::CommImpl* this_synchro = new simgrid::kernel::activity::CommImpl(SIMIX_COMM_RECEIVE);
190   XBT_DEBUG("recv from %p %p. this_synchro=%p", mbox, &mbox->comm_queue, this_synchro);
191
192   simgrid::kernel::activity::CommImpl* other_comm;
193   //communication already done, get it inside the list of completed comms
194   if (mbox->permanent_receiver != nullptr && not mbox->done_comm_queue.empty()) {
195
196     SIMIX_comm_unref(this_synchro);
197     XBT_DEBUG("We have a comm that has probably already been received, trying to match it, to skip the communication");
198     //find a match in the list of already received comms
199     other_comm = _find_matching_comm(&mbox->done_comm_queue, SIMIX_COMM_SEND, match_fun, data, this_synchro,
200                                      /*remove_matching*/ true);
201     //if not found, assume the receiver came first, register it to the mailbox in the classical way
202     if (not other_comm) {
203       XBT_DEBUG("We have messages in the permanent receive list, but not the one we are looking for, pushing request into list");
204       other_comm = this_synchro;
205       mbox->push(this_synchro);
206     } else {
207       if (other_comm->surf_comm && other_comm->remains() < 1e-12) {
208         XBT_DEBUG("comm %p has been already sent, and is finished, destroy it",other_comm);
209         other_comm->state = SIMIX_DONE;
210         other_comm->type = SIMIX_COMM_DONE;
211         other_comm->mbox = nullptr;
212         SIMIX_comm_unref(other_comm);
213       }
214       SIMIX_comm_unref(other_comm);
215       SIMIX_comm_unref(this_synchro);
216     }
217   } else {
218     /* Prepare a comm describing us, so that it gets passed to the user-provided filter of other side */
219
220     /* Look for communication activity matching our needs. We also provide a description of
221      * ourself so that the other side also gets a chance of choosing if it wants to match with us.
222      *
223      * If it is not found then push our communication into the rendez-vous point */
224     other_comm = _find_matching_comm(&mbox->comm_queue, SIMIX_COMM_SEND, match_fun, data, this_synchro,
225                                      /*remove_matching*/ true);
226
227     if (not other_comm) {
228       XBT_DEBUG("Receive pushed first %zu", mbox->comm_queue.size());
229       other_comm = this_synchro;
230       mbox->push(this_synchro);
231     } else {
232       XBT_DEBUG("Match my %p with the existing %p", this_synchro, other_comm);
233
234       other_comm = static_cast<simgrid::kernel::activity::CommImpl*>(other_comm);
235
236       other_comm->state = SIMIX_READY;
237       other_comm->type = SIMIX_COMM_READY;
238       SIMIX_comm_unref(this_synchro);
239       SIMIX_comm_unref(this_synchro);
240     }
241     dst_proc->comms.push_back(other_comm);
242   }
243
244   /* Setup communication synchro */
245   other_comm->dst_proc = dst_proc;
246   other_comm->dst_buff = dst_buff;
247   other_comm->dst_buff_size = dst_buff_size;
248   other_comm->dst_data = data;
249
250   if (rate > -1.0 && (other_comm->rate < 0.0 || rate < other_comm->rate))
251     other_comm->rate = rate;
252
253   other_comm->match_fun = match_fun;
254   other_comm->copy_data_fun = copy_data_fun;
255
256   if (MC_is_active() || MC_record_replay_is_active()) {
257     other_comm->state = SIMIX_RUNNING;
258     return other_comm;
259   }
260
261   SIMIX_comm_start(other_comm);
262   return other_comm;
263 }
264
265 smx_activity_t simcall_HANDLER_comm_iprobe(smx_simcall_t simcall, smx_mailbox_t mbox,
266                                    int type, int src, int tag,
267                                    int (*match_fun)(void *, void *, smx_activity_t),
268                                    void *data){
269   return SIMIX_comm_iprobe(simcall->issuer, mbox, type, src, tag, match_fun, data);
270 }
271
272 smx_activity_t SIMIX_comm_iprobe(smx_actor_t dst_proc, smx_mailbox_t mbox, int type, int src,
273                               int tag, int (*match_fun)(void *, void *, smx_activity_t), void *data)
274 {
275   XBT_DEBUG("iprobe from %p %p", mbox, &mbox->comm_queue);
276   simgrid::kernel::activity::CommImpl* this_comm;
277   int smx_type;
278   if(type == 1){
279     this_comm = new simgrid::kernel::activity::CommImpl(SIMIX_COMM_SEND);
280     smx_type = SIMIX_COMM_RECEIVE;
281   } else{
282     this_comm = new simgrid::kernel::activity::CommImpl(SIMIX_COMM_RECEIVE);
283     smx_type = SIMIX_COMM_SEND;
284   } 
285   smx_activity_t other_synchro=nullptr;
286   if (mbox->permanent_receiver != nullptr && not mbox->done_comm_queue.empty()) {
287     XBT_DEBUG("first check in the permanent recv mailbox, to see if we already got something");
288     other_synchro = _find_matching_comm(&mbox->done_comm_queue,
289       (e_smx_comm_type_t) smx_type, match_fun, data, this_comm,/*remove_matching*/false);
290   }
291   if (not other_synchro) {
292     XBT_DEBUG("check if we have more luck in the normal mailbox");
293     other_synchro = _find_matching_comm(&mbox->comm_queue,
294       (e_smx_comm_type_t) smx_type, match_fun, data, this_comm,/*remove_matching*/false);
295   }
296
297   if(other_synchro)
298     SIMIX_comm_unref(other_synchro);
299
300   SIMIX_comm_unref(this_comm);
301   return other_synchro;
302 }
303
304 void simcall_HANDLER_comm_wait(smx_simcall_t simcall, smx_activity_t synchro, double timeout)
305 {
306   /* Associate this simcall to the wait synchro */
307   XBT_DEBUG("simcall_HANDLER_comm_wait, %p", synchro);
308
309   synchro->simcalls.push_back(simcall);
310   simcall->issuer->waiting_synchro = synchro;
311
312   if (MC_is_active() || MC_record_replay_is_active()) {
313     int idx = SIMCALL_GET_MC_VALUE(simcall);
314     if (idx == 0) {
315       synchro->state = SIMIX_DONE;
316     } else {
317       /* If we reached this point, the wait simcall must have a timeout */
318       /* Otherwise it shouldn't be enabled and executed by the MC */
319       if (timeout < 0.0)
320         THROW_IMPOSSIBLE;
321
322       simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
323       if (comm->src_proc == simcall->issuer)
324         comm->state = SIMIX_SRC_TIMEOUT;
325       else
326         comm->state = SIMIX_DST_TIMEOUT;
327     }
328
329     SIMIX_comm_finish(synchro);
330     return;
331   }
332
333   /* If the synchro has already finish perform the error handling, */
334   /* otherwise set up a waiting timeout on the right side          */
335   if (synchro->state != SIMIX_WAITING && synchro->state != SIMIX_RUNNING) {
336     SIMIX_comm_finish(synchro);
337   } else { /* if (timeout >= 0) { we need a surf sleep action even when there is no timeout, otherwise surf won't tell us when the host fails */
338     surf_action_t sleep = simcall->issuer->host->pimpl_cpu->sleep(timeout);
339     sleep->setData(synchro);
340
341     simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
342     if (simcall->issuer == comm->src_proc)
343       comm->src_timeout = sleep;
344     else
345       comm->dst_timeout = sleep;
346   }
347 }
348
349 void simcall_HANDLER_comm_test(smx_simcall_t simcall, smx_activity_t synchro)
350 {
351   simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
352
353   if (MC_is_active() || MC_record_replay_is_active()){
354     simcall_comm_test__set__result(simcall, comm->src_proc && comm->dst_proc);
355     if (simcall_comm_test__get__result(simcall)){
356       synchro->state = SIMIX_DONE;
357       synchro->simcalls.push_back(simcall);
358       SIMIX_comm_finish(synchro);
359     } else {
360       SIMIX_simcall_answer(simcall);
361     }
362     return;
363   }
364
365   simcall_comm_test__set__result(simcall, (synchro->state != SIMIX_WAITING && synchro->state != SIMIX_RUNNING));
366   if (simcall_comm_test__get__result(simcall)) {
367     synchro->simcalls.push_back(simcall);
368     SIMIX_comm_finish(synchro);
369   } else {
370     SIMIX_simcall_answer(simcall);
371   }
372 }
373
374 void simcall_HANDLER_comm_testany(
375   smx_simcall_t simcall, simgrid::kernel::activity::ActivityImpl* comms[], size_t count)
376 {
377   // The default result is -1 -- this means, "nothing is ready".
378   // It can be changed below, but only if something matches.
379   simcall_comm_testany__set__result(simcall, -1);
380
381   if (MC_is_active() || MC_record_replay_is_active()){
382     int idx = SIMCALL_GET_MC_VALUE(simcall);
383     if(idx == -1){
384       SIMIX_simcall_answer(simcall);
385     }else{
386       simgrid::kernel::activity::ActivityImpl* synchro = comms[idx];
387       simcall_comm_testany__set__result(simcall, idx);
388       synchro->simcalls.push_back(simcall);
389       synchro->state = SIMIX_DONE;
390       SIMIX_comm_finish(synchro);
391     }
392     return;
393   }
394
395   for (std::size_t i = 0; i != count; ++i) {
396     simgrid::kernel::activity::ActivityImpl* synchro = comms[i];
397     if (synchro->state != SIMIX_WAITING && synchro->state != SIMIX_RUNNING) {
398       simcall_comm_testany__set__result(simcall, i);
399       synchro->simcalls.push_back(simcall);
400       SIMIX_comm_finish(synchro);
401       return;
402     }
403   }
404   SIMIX_simcall_answer(simcall);
405 }
406
407 void simcall_HANDLER_comm_waitany(smx_simcall_t simcall, xbt_dynar_t synchros, double timeout)
408 {
409   smx_activity_t synchro;
410   unsigned int cursor = 0;
411
412   if (MC_is_active() || MC_record_replay_is_active()){
413     if (timeout > 0.0)
414       xbt_die("Timeout not implemented for waitany in the model-checker"); 
415     int idx = SIMCALL_GET_MC_VALUE(simcall);
416     synchro = xbt_dynar_get_as(synchros, idx, smx_activity_t);
417     synchro->simcalls.push_back(simcall);
418     simcall_comm_waitany__set__result(simcall, idx);
419     synchro->state = SIMIX_DONE;
420     SIMIX_comm_finish(synchro);
421     return;
422   }
423   
424   if (timeout < 0.0){
425     simcall->timer = NULL;
426   } else {
427     simcall->timer = SIMIX_timer_set(SIMIX_get_clock() + timeout, [simcall]() {
428       SIMIX_waitany_remove_simcall_from_actions(simcall);
429       simcall_comm_waitany__set__result(simcall, -1);
430       SIMIX_simcall_answer(simcall);
431     });
432   }
433   
434   xbt_dynar_foreach(synchros, cursor, synchro){
435     /* associate this simcall to the the synchro */
436     synchro->simcalls.push_back(simcall);
437
438     /* see if the synchro is already finished */
439     if (synchro->state != SIMIX_WAITING && synchro->state != SIMIX_RUNNING){
440       SIMIX_comm_finish(synchro);
441       break;
442     }
443   }
444 }
445
446 void SIMIX_waitany_remove_simcall_from_actions(smx_simcall_t simcall)
447 {
448   smx_activity_t synchro;
449   unsigned int cursor = 0;
450   xbt_dynar_t synchros = simcall_comm_waitany__get__comms(simcall);
451
452   xbt_dynar_foreach(synchros, cursor, synchro) {
453     // Remove the first occurence of simcall:
454     auto i = boost::range::find(synchro->simcalls, simcall);
455     if (i !=  synchro->simcalls.end())
456       synchro->simcalls.erase(i);
457   }
458 }
459
460 /**
461  *  \brief Starts the simulation of a communication synchro.
462  *  \param synchro the communication synchro
463  */
464 static inline void SIMIX_comm_start(smx_activity_t synchro)
465 {
466   simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
467
468   /* If both the sender and the receiver are already there, start the communication */
469   if (synchro->state == SIMIX_READY) {
470
471     simgrid::s4u::Host* sender   = comm->src_proc->host;
472     simgrid::s4u::Host* receiver = comm->dst_proc->host;
473
474     comm->surf_comm = surf_network_model->communicate(sender, receiver, comm->task_size, comm->rate);
475     comm->surf_comm->setData(synchro);
476     comm->state = SIMIX_RUNNING;
477
478     XBT_DEBUG("Starting communication %p from '%s' to '%s' (surf_action: %p)", synchro, sender->cname(),
479               receiver->cname(), comm->surf_comm);
480
481     /* If a link is failed, detect it immediately */
482     if (comm->surf_comm->getState() == simgrid::surf::Action::State::failed) {
483       XBT_DEBUG("Communication from '%s' to '%s' failed to start because of a link failure", sender->cname(),
484                 receiver->cname());
485       comm->state = SIMIX_LINK_FAILURE;
486       comm->cleanupSurf();
487     }
488
489     /* If any of the process is suspend, create the synchro but stop its execution,
490        it will be restarted when the sender process resume */
491     if (SIMIX_process_is_suspended(comm->src_proc) || SIMIX_process_is_suspended(comm->dst_proc)) {
492       if (SIMIX_process_is_suspended(comm->src_proc))
493         XBT_DEBUG("The communication is suspended on startup because src (%s@%s) was suspended since it initiated the "
494                   "communication",
495                   comm->src_proc->cname(), comm->src_proc->host->cname());
496       else
497         XBT_DEBUG("The communication is suspended on startup because dst (%s@%s) was suspended since it initiated the "
498                   "communication",
499                   comm->dst_proc->cname(), comm->dst_proc->host->cname());
500
501       comm->surf_comm->suspend();
502     }
503   }
504 }
505
506 /**
507  * \brief Answers the SIMIX simcalls associated to a communication synchro.
508  * \param synchro a finished communication synchro
509  */
510 void SIMIX_comm_finish(smx_activity_t synchro)
511 {
512   simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
513
514   while (not synchro->simcalls.empty()) {
515     smx_simcall_t simcall = synchro->simcalls.front();
516     synchro->simcalls.pop_front();
517
518     /* If a waitany simcall is waiting for this synchro to finish, then remove it from the other synchros in the waitany
519      * list. Afterwards, get the position of the actual synchro in the waitany dynar and return it as the result of the
520      * simcall */
521
522     if (simcall->call == SIMCALL_NONE) //FIXME: maybe a better way to handle this case
523       continue; // if process handling comm is killed
524     if (simcall->call == SIMCALL_COMM_WAITANY) {
525       SIMIX_waitany_remove_simcall_from_actions(simcall);
526       if (simcall->timer) {
527         SIMIX_timer_remove(simcall->timer);
528         simcall->timer = nullptr;
529       }
530       if (not MC_is_active() && not MC_record_replay_is_active())
531         simcall_comm_waitany__set__result(simcall,
532                                           xbt_dynar_search(simcall_comm_waitany__get__comms(simcall), &synchro));
533     }
534
535     /* If the synchro is still in a rendez-vous point then remove from it */
536     if (comm->mbox)
537       comm->mbox->remove(comm);
538
539     XBT_DEBUG("SIMIX_comm_finish: synchro state = %d", (int)synchro->state);
540
541     /* Check out for errors */
542
543     if (simcall->issuer->host->isOff()) {
544       simcall->issuer->context->iwannadie = 1;
545       SMX_EXCEPTION(simcall->issuer, host_error, 0, "Host failed");
546     } else {
547       switch (comm->state) {
548
549         case SIMIX_DONE:
550           XBT_DEBUG("Communication %p complete!", synchro);
551           SIMIX_comm_copy_data(synchro);
552           break;
553
554         case SIMIX_SRC_TIMEOUT:
555           SMX_EXCEPTION(simcall->issuer, timeout_error, 0, "Communication timeouted because of sender");
556           break;
557
558         case SIMIX_DST_TIMEOUT:
559           SMX_EXCEPTION(simcall->issuer, timeout_error, 0, "Communication timeouted because of receiver");
560           break;
561
562         case SIMIX_SRC_HOST_FAILURE:
563           if (simcall->issuer == comm->src_proc)
564             simcall->issuer->context->iwannadie = 1;
565           //          SMX_EXCEPTION(simcall->issuer, host_error, 0, "Host failed");
566           else
567             SMX_EXCEPTION(simcall->issuer, network_error, 0, "Remote peer failed");
568           break;
569
570         case SIMIX_DST_HOST_FAILURE:
571           if (simcall->issuer == comm->dst_proc)
572             simcall->issuer->context->iwannadie = 1;
573           //          SMX_EXCEPTION(simcall->issuer, host_error, 0, "Host failed");
574           else
575             SMX_EXCEPTION(simcall->issuer, network_error, 0, "Remote peer failed");
576           break;
577
578         case SIMIX_LINK_FAILURE:
579           XBT_DEBUG("Link failure in synchro %p between '%s' and '%s': posting an exception to the issuer: %s (%p) "
580                     "detached:%d",
581                     synchro, comm->src_proc ? comm->src_proc->host->cname() : nullptr,
582                     comm->dst_proc ? comm->dst_proc->host->cname() : nullptr, simcall->issuer->cname(), simcall->issuer,
583                     comm->detached);
584           if (comm->src_proc == simcall->issuer) {
585             XBT_DEBUG("I'm source");
586           } else if (comm->dst_proc == simcall->issuer) {
587             XBT_DEBUG("I'm dest");
588           } else {
589             XBT_DEBUG("I'm neither source nor dest");
590           }
591           SMX_EXCEPTION(simcall->issuer, network_error, 0, "Link failure");
592           break;
593
594         case SIMIX_CANCELED:
595           if (simcall->issuer == comm->dst_proc)
596             SMX_EXCEPTION(simcall->issuer, cancel_error, 0, "Communication canceled by the sender");
597           else
598             SMX_EXCEPTION(simcall->issuer, cancel_error, 0, "Communication canceled by the receiver");
599           break;
600
601         default:
602           xbt_die("Unexpected synchro state in SIMIX_comm_finish: %d", (int)synchro->state);
603       }
604     }
605
606     /* if there is an exception during a waitany or a testany, indicate the position of the failed communication */
607     if (simcall->issuer->exception) {
608       // In order to modify the exception we have to rethrow it:
609       try {
610         std::rethrow_exception(simcall->issuer->exception);
611       }
612       catch(xbt_ex& e) {
613         if (simcall->call == SIMCALL_COMM_WAITANY) {
614           e.value = xbt_dynar_search(simcall_comm_waitany__get__comms(simcall), &synchro);
615         }
616         else if (simcall->call == SIMCALL_COMM_TESTANY) {
617           e.value = -1;
618           auto comms = simcall_comm_testany__get__comms(simcall);
619           auto count = simcall_comm_testany__get__count(simcall);
620           auto element = std::find(comms, comms + count, synchro);
621           if (element == comms + count)
622             e.value = -1;
623           else
624             e.value = element - comms;
625         }
626         simcall->issuer->exception = std::make_exception_ptr(e);
627       }
628       catch(...) {
629         // Nothing to do
630       }
631     }
632
633     if (simcall->issuer->host->isOff()) {
634       simcall->issuer->context->iwannadie = 1;
635     }
636
637     simcall->issuer->waiting_synchro = nullptr;
638     simcall->issuer->comms.remove(synchro);
639     if(comm->detached){
640       if(simcall->issuer == comm->src_proc){
641         if(comm->dst_proc)
642           comm->dst_proc->comms.remove(synchro);
643       }
644       else if(simcall->issuer == comm->dst_proc){
645         if(comm->src_proc)
646           comm->src_proc->comms.remove(synchro);
647       }
648       else{
649         comm->dst_proc->comms.remove(synchro);
650         comm->src_proc->comms.remove(synchro);
651       }
652     }
653
654     SIMIX_simcall_answer(simcall);
655   }
656 }
657
658 /******************************************************************************/
659 /*                    SIMIX_comm_copy_data callbacks                       */
660 /******************************************************************************/
661 static void (*SIMIX_comm_copy_data_callback) (smx_activity_t, void*, size_t) = &SIMIX_comm_copy_pointer_callback;
662
663 void SIMIX_comm_set_copy_data_callback(void (*callback) (smx_activity_t, void*, size_t))
664 {
665   SIMIX_comm_copy_data_callback = callback;
666 }
667
668 void SIMIX_comm_copy_pointer_callback(smx_activity_t synchro, void* buff, size_t buff_size)
669 {
670   simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
671
672   xbt_assert((buff_size == sizeof(void *)), "Cannot copy %zu bytes: must be sizeof(void*)", buff_size);
673   *(void **) (comm->dst_buff) = buff;
674 }
675
676 void SIMIX_comm_copy_buffer_callback(smx_activity_t synchro, void* buff, size_t buff_size)
677 {
678   simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
679
680   XBT_DEBUG("Copy the data over");
681   memcpy(comm->dst_buff, buff, buff_size);
682   if (comm->detached) { // if this is a detached send, the source buffer was duplicated by SMPI sender to make the original buffer available to the application ASAP
683     xbt_free(buff);
684     comm->src_buff = nullptr;
685   }
686 }
687
688 /**
689  *  @brief Copy the communication data from the sender's buffer to the receiver's one
690  *  @param synchro The communication
691  */
692 void SIMIX_comm_copy_data(smx_activity_t synchro)
693 {
694   simgrid::kernel::activity::CommImpl* comm = static_cast<simgrid::kernel::activity::CommImpl*>(synchro);
695
696   size_t buff_size = comm->src_buff_size;
697   /* If there is no data to copy then return */
698   if (not comm->src_buff || not comm->dst_buff || comm->copied)
699     return;
700
701   XBT_DEBUG("Copying comm %p data from %s (%p) -> %s (%p) (%zu bytes)", comm,
702             comm->src_proc ? comm->src_proc->host->cname() : "a finished process", comm->src_buff,
703             comm->dst_proc ? comm->dst_proc->host->cname() : "a finished process", comm->dst_buff, buff_size);
704
705   /* Copy at most dst_buff_size bytes of the message to receiver's buffer */
706   if (comm->dst_buff_size)
707     buff_size = MIN(buff_size, *(comm->dst_buff_size));
708
709   /* Update the receiver's buffer size to the copied amount */
710   if (comm->dst_buff_size)
711     *comm->dst_buff_size = buff_size;
712
713   if (buff_size > 0){
714       if(comm->copy_data_fun)
715         comm->copy_data_fun (comm, comm->src_buff, buff_size);
716       else
717         SIMIX_comm_copy_data_callback (comm, comm->src_buff, buff_size);
718   }
719
720   /* Set the copied flag so we copy data only once */
721   /* (this function might be called from both communication ends) */
722   comm->copied = 1;
723 }
724
725 /** Increase the refcount for this comm */
726 smx_activity_t SIMIX_comm_ref(smx_activity_t comm)
727 {
728   if (comm != nullptr)
729     comm->ref();
730   return comm;
731 }
732
733 /** Decrease the refcount for this comm */
734 void SIMIX_comm_unref(smx_activity_t comm)
735 {
736   if (comm != nullptr)
737     comm->unref();
738 }