Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
Add debug log for ODPOR + required explaining comments
[simgrid.git] / src / mc / explo / odpor / Execution.cpp
1 /* Copyright (c) 2008-2023. The SimGrid Team. All rights reserved.          */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 #include "src/mc/explo/odpor/Execution.hpp"
7 #include "src/mc/api/State.hpp"
8 #include "src/mc/explo/odpor/ReversibleRaceCalculator.hpp"
9 #include "xbt/asserts.h"
10 #include "xbt/string.hpp"
11 #include <algorithm>
12 #include <limits>
13 #include <vector>
14
15 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(mc_odpor_execution, mc_dfs, "ODPOR exploration algorithm of the model-checker");
16
17 namespace simgrid::mc::odpor {
18
19 std::vector<std::string> get_textual_trace(const PartialExecution& w)
20 {
21   std::vector<std::string> trace;
22   for (const auto& t : w) {
23     auto a = xbt::string_printf("Actor %ld: %s", t->aid_, t->to_string(true).c_str());
24     trace.emplace_back(std::move(a));
25   }
26   return trace;
27 }
28
29 Execution::Execution(const PartialExecution& w)
30 {
31   push_partial_execution(w);
32 }
33
34 void Execution::push_transition(std::shared_ptr<Transition> t)
35 {
36   if (t == nullptr) {
37     throw std::invalid_argument("Unexpectedly received `nullptr`");
38   }
39   ClockVector max_clock_vector;
40   for (const Event& e : this->contents_) {
41     if (e.get_transition()->depends(t.get())) {
42       max_clock_vector = ClockVector::max(max_clock_vector, e.get_clock_vector());
43     }
44   }
45   max_clock_vector[t->aid_] = this->size();
46   contents_.push_back(Event({std::move(t), max_clock_vector}));
47 }
48
49 void Execution::push_partial_execution(const PartialExecution& w)
50 {
51   for (const auto& t : w) {
52     push_transition(t);
53   }
54 }
55
56 std::vector<std::string> Execution::get_textual_trace() const
57 {
58   std::vector<std::string> trace;
59   for (const auto& t : this->contents_) {
60     auto a = xbt::string_printf("Actor %ld: %s", t.get_transition()->aid_, t.get_transition()->to_string(true).c_str());
61     trace.emplace_back(std::move(a));
62   }
63   return trace;
64 }
65
66 std::unordered_set<Execution::EventHandle> Execution::get_racing_events_of(Execution::EventHandle target) const
67 {
68   std::unordered_set<Execution::EventHandle> racing_events;
69   // This keep tracks of events that happens-before the target
70   std::unordered_set<Execution::EventHandle> disqualified_events;
71
72   // For each event of the execution
73   for (auto e_i = target; e_i != std::numeric_limits<Execution::EventHandle>::max(); e_i--) {
74     // We need `e_i -->_E target` as a necessary condition
75     if (not happens_before(e_i, target)) {
76       XBT_DEBUG("ODPOR_RACING_EVENTS with `%u` : `%u` discarded because `%u` --\\-->_E `%u`", target, e_i, e_i, target);
77       continue;
78     }
79
80     // Further, `proc(e_i) != proc(target)`
81     if (get_actor_with_handle(e_i) == get_actor_with_handle(target)) {
82       disqualified_events.insert(e_i);
83       XBT_DEBUG("ODPOR_RACING_EVENTS with `%u` : `%u` disqualified because proc(`%u`)=proc(`%u`)", target, e_i, e_i,
84                 target);
85       continue;
86     }
87
88     // There could an event that "happens-between" the two events which would discount `e_i` as a race
89     for (auto e_j = e_i; e_j < target; e_j++) {
90       // If both:
91       // 1. e_i --->_E e_j; and
92       // 2. disqualified_events.count(e_j) > 0
93       // then e_i --->_E target indirectly (either through
94       // e_j directly, or transitively through e_j)
95       if (disqualified_events.count(e_j) > 0 && happens_before(e_i, e_j)) {
96         XBT_DEBUG("ODPOR_RACING_EVENTS with `%u` : `%u` disqualified because `%u` happens-between `%u`-->`%u`-->`%u`)",
97                   target, e_i, e_j, e_i, e_j, target);
98         disqualified_events.insert(e_i);
99         break;
100       }
101     }
102
103     // If `e_i` wasn't disqualified in the last round,
104     // it's in a race with `target`. After marking it
105     // as such, we ensure no other event `e` can happen-before
106     // it (since this would transitively make it the event
107     // which "happens-between" `target` and `e`)
108     if (disqualified_events.count(e_i) == 0) {
109         XBT_DEBUG("ODPOR_RACING_EVENTS with `%u` : `%u` is a valid racing event",
110                   target, e_i);
111         disqualified_events.insert(e_i);
112       racing_events.insert(e_i);
113       disqualified_events.insert(e_i);
114     }
115   }
116
117   return racing_events;
118 }
119
120 std::unordered_set<Execution::EventHandle> Execution::get_reversible_races_of(EventHandle handle) const
121 {
122   std::unordered_set<EventHandle> reversible_races;
123   for (EventHandle race : get_racing_events_of(handle)) {
124     if (ReversibleRaceCalculator::is_race_reversible(*this, race, handle)) {
125       reversible_races.insert(race);
126     }
127   }
128   return reversible_races;
129 }
130
131 Execution Execution::get_prefix_before(Execution::EventHandle handle) const
132 {
133   return Execution(std::vector<Event>{contents_.begin(), contents_.begin() + handle});
134 }
135
136 std::unordered_set<aid_t>
137 Execution::get_missing_source_set_actors_from(EventHandle e, const std::unordered_set<aid_t>& backtrack_set) const
138 {
139   // If this execution is empty, there are no initials
140   // relative to the last transition added to the execution
141   // since such a transition does not exist
142   if (empty()) {
143     return std::unordered_set<aid_t>{};
144   }
145
146   // To actually compute `I_[E'](v) ∩ backtrack(E')`, we must
147   // first compute `E'` and "move" in the direction of `v`.
148   // We perform a scan over `E` (this execution) and make
149   // note of any events which occur after `e` but don't
150   // "happen-after" `e` by pushing them onto `E'`. Note that
151   // correctness is still preserved in computing `v` "on-the-fly"
152   // to determine if an event `e` by actor `q` is an initial for `E'`
153   // after `v`: only those events that "occur-before" `e` in `v` could
154   // "happen-before" `ve for any valid "happens-before" relation
155   // (see property 1 in the ODPOR paper, viz. "is included in <_E")
156
157   // First, grab `E' := pre(e, E)` and determine what actor `p` is
158   const auto next_E_p = get_latest_event_handle().value();
159   xbt_assert(e != next_E_p,
160              "This method assumes that the event `e` (%u) and `next_[E](p)` (%u)"
161              "are in a reversible race, yet we claim to have such a race between the"
162              "same event. This indicates the the SDPOR pseudocode implementation is broken "
163              "as it supplies these values.",
164              e, next_E_p);
165   Execution E_prime_v = get_prefix_before(e);
166   std::vector<sdpor::Execution::EventHandle> v;
167   std::unordered_set<aid_t> I_E_prime_v;
168   std::unordered_set<aid_t> disqualified_actors;
169
170   // Note `e + 1` here: `notdep(e, E)` is defined as the
171   // set of events that *occur-after* but don't *happen-after* `e`
172   for (auto e_prime = e + 1; e_prime <= next_E_p; ++e_prime) {
173     // Any event `e*` which occurs after `e` but which does not
174     // happen after `e` is a member of `v`. In addition to marking
175     // the event in `v`, we also "simulate" running the action `v`
176     // from E'
177     if (not happens_before(e, e_prime) || e_prime == next_E_p) {
178       // First, push the transition onto the hypothetical execution
179       E_prime_v.push_transition(get_event_with_handle(e_prime).get_transition());
180       const EventHandle e_prime_in_E_prime_v = E_prime_v.get_latest_event_handle().value();
181
182       // When checking whether any event in `dom_[E'](v)` happens before
183       // `next_[E'](q)` below for thread `q`, we must consider that the
184       // events relative to `E` (this execution) are different than those
185       // relative to `E'.v`. Thus e.g. event `7` in `E` may be event `4`
186       // in `E'.v`. Since we are asking about "happens-before"
187       // `-->_[E'.v]` about `E'.v`, we must build `v` relative to `E'`.
188       //
189       // Note that we add `q` to v regardless of whether `q` itself has been
190       // disqualified since  we've determined that `e_prime` "occurs-after" but
191       // does not "happen-after" `e`
192       v.push_back(e_prime_in_E_prime_v);
193
194       const aid_t q = E_prime_v.get_actor_with_handle(e_prime_in_E_prime_v);
195       if (disqualified_actors.count(q) > 0) { // Did we already note that `q` is not an initial?
196         continue;
197       }
198       const bool is_initial = std::none_of(v.begin(), v.end(), [&](const auto& e_star) {
199         return E_prime_v.happens_before(e_star, e_prime_in_E_prime_v);
200       });
201       if (is_initial) {
202         // If the backtrack set already contains `q`, we're done:
203         // they've made note to search for (or have already searched for)
204         // this initial
205         if (backtrack_set.count(q) > 0) {
206           return std::unordered_set<aid_t>{};
207         } else {
208           I_E_prime_v.insert(q);
209         }
210       } else {
211         // If `q` is disqualified as a candidate, clearly
212         // no event occurring after `e_prime` in `E` executed
213         // by actor `q` will qualify since any (valid) happens-before
214         // relation orders actions taken by each actor
215         disqualified_actors.insert(q);
216       }
217     }
218   }
219   xbt_assert(not I_E_prime_v.empty(),
220              "For any non-empty execution, we know that "
221              "at minimum one actor is an initial since "
222              "some execution is possible with respect to a "
223              "prefix before event `%u`, yet we didn't find anyone. "
224              "This implies the implementation of this function is broken.",
225              e);
226   return I_E_prime_v;
227 }
228
229 std::optional<PartialExecution> Execution::get_odpor_extension_from(EventHandle e, EventHandle e_prime,
230                                                                     const State& state_at_e) const
231 {
232   // `e` is assumed to be in a reversible race with `e_prime`.
233   // If `e > e_prime`, then `e` occurs-after `e_prime` which means
234   // `e` could not race with if
235   if (e > e_prime) {
236     throw std::invalid_argument("ODPOR extensions can only be computed for "
237                                 "events in a reversible race, which is claimed, "
238                                 "yet the racing event 'occurs-after' the target");
239   }
240
241   if (empty()) {
242     return std::nullopt;
243   }
244
245   PartialExecution v;
246   std::vector<Execution::EventHandle> v_handles;
247   std::unordered_set<aid_t> WI_E_prime_v;
248   std::unordered_set<aid_t> disqualified_actors;
249   Execution E_prime_v                           = get_prefix_before(e);
250   const std::unordered_set<aid_t> sleep_E_prime = state_at_e.get_sleeping_actors();
251
252   // Note `e + 1` here: `notdep(e, E)` is defined as the
253   // set of events that *occur-after* but don't *happen-after* `e`
254   //
255   // SUBTLE NOTE: ODPOR requires us to compute `notdep(e, E)` EVEN THOUGH
256   // the race is between `e` and `e'`; that is, events occurring in `E`
257   // that "occur-after" `e'` may end up in the partial execution `v`.
258   //
259   // Observe that `notdep(e, E).proc(e')` will contain all transitions
260   // that don't happen-after `e` in the order they appear FOLLOWED BY
261   // THE **TRANSITION** ASSOCIATED WITH **`e'`**!!
262   //
263   // SUBTLE NOTE: Observe that any event that "happens-after" `e'`
264   // must necessarily "happen-after" `e` as well, since `e` and
265   // `e'` are presumed to be in a reversible race. Hence, we know that
266   // all events `e_star` such that `e` "happens-before" `e_star` cannot affect
267   // the enabledness of `e'`; furthermore, `e'` cannot affect the enabledness
268   // of any event independent with `e` that "occurs-after" `e'`
269   for (auto e_star = e + 1; e_star <= get_latest_event_handle().value(); ++e_star) {
270     // Any event `e*` which occurs after `e` but which does not
271     // happen after `e` is a member of `v`. In addition to marking
272     // the event in `v`, we also "simulate" running the action `v` from E'
273     // to be able to compute `--->[E'.v]`
274     if (not happens_before(e, e_star)) {
275       xbt_assert(e_star != e_prime,
276                  "Invariant Violation: We claimed events %u and %u were in a reversible race, yet we also "
277                  "claim that they do not happen-before one another. This is impossible: "
278                  "are you sure that the two events are in a reversible race?",
279                  e, e_prime);
280       E_prime_v.push_transition(get_event_with_handle(e_star).get_transition());
281       v.push_back(get_event_with_handle(e_star).get_transition());
282
283       const EventHandle e_star_in_E_prime_v = E_prime_v.get_latest_event_handle().value();
284
285       // When checking whether any event in `dom_[E'](v)` happens before
286       // `next_[E'](q)` below for thread `q`, we must consider that the
287       // events relative to `E` (this execution) are different than those
288       // relative to `E'.v`. Thus e.g. event `7` in `E` may be event `4`
289       // in `E'.v`. Since we are asking about "happens-before"
290       // `-->_[E'.v]` about `E'.v`, we must build `v` relative to `E'`
291       v_handles.push_back(e_star_in_E_prime_v);
292
293       // Note that we add `q` to v regardless of whether `q` itself has been
294       // disqualified since `q` may itself disqualify other actors
295       // (i.e. even if `q` is disqualified from being an initial, it
296       // is still contained in the sequence `v`)
297       const aid_t q = E_prime_v.get_actor_with_handle(e_star_in_E_prime_v);
298       if (disqualified_actors.count(q) > 0) { // Did we already note that `q` is not an initial?
299         continue;
300       }
301       const bool is_initial = std::none_of(v_handles.begin(), v_handles.end(), [&](const auto& handle) {
302         return E_prime_v.happens_before(handle, e_star_in_E_prime_v);
303       });
304       if (is_initial) {
305         // If the sleep set already contains `q`, we're done:
306         // we've found an initial contained in the sleep set and
307         // so the intersection is non-empty
308         if (sleep_E_prime.count(q) > 0) {
309           return std::nullopt;
310         } else {
311           WI_E_prime_v.insert(q);
312         }
313       } else {
314         // If `q` is disqualified as a candidate, clearly
315         // no event occurring after `e_prime` in `E` executed
316         // by actor `q` will qualify since any (valid) happens-before
317         // relation orders actions taken by each actor
318         disqualified_actors.insert(q);
319       }
320     }
321   }
322
323   // Now we add `e_prime := <q, i>` to `E'.v` and repeat the same work
324   // It's possible `proc(e_prime)` is an initial
325   //
326   // Note the form of `v` in the pseudocode:
327   //  `v := notdep(e, E).e'^
328   E_prime_v.push_transition(get_event_with_handle(e_prime).get_transition());
329   v.push_back(get_event_with_handle(e_prime).get_transition());
330
331   const EventHandle e_prime_in_E_prime_v = E_prime_v.get_latest_event_handle().value();
332   v_handles.push_back(e_prime_in_E_prime_v);
333
334   const bool is_initial = std::none_of(v_handles.begin(), v_handles.end(), [&](const auto& handle) {
335     return E_prime_v.happens_before(handle, e_prime_in_E_prime_v);
336   });
337   if (is_initial) {
338     if (const aid_t q = E_prime_v.get_actor_with_handle(e_prime_in_E_prime_v); sleep_E_prime.count(q) > 0) {
339       return std::nullopt;
340     } else {
341       WI_E_prime_v.insert(q);
342     }
343   }
344
345   const Execution pre_E_e    = get_prefix_before(e);
346   const auto sleeping_actors = state_at_e.get_sleeping_actors();
347
348   // Check if any enabled actor that is independent with
349   // this execution after `v` is contained in the sleep set
350   for (const auto& [aid, astate] : state_at_e.get_actors_list()) {
351     const bool is_in_WI_E =
352         astate.is_enabled() and pre_E_e.is_independent_with_execution_of(v, astate.get_transition());
353     const bool is_in_sleep_set = sleeping_actors.count(aid) > 0;
354
355     // `action(aid)` is in `WI_[E](v)` but also is contained in the sleep set.
356     // This implies that the intersection between the two is non-empty
357     if (is_in_WI_E && is_in_sleep_set)
358       return std::nullopt;
359   }
360
361   return v;
362 }
363
364 bool Execution::is_initial_after_execution_of(const PartialExecution& w, aid_t p) const
365 {
366   auto E_w = *this;
367   std::vector<EventHandle> w_handles;
368   for (const auto& w_i : w) {
369     // Take one step in the direction of `w`
370     E_w.push_transition(w_i);
371
372     // If that step happened to be executed by `p`,
373     // great: we know that `p` is contained in `w`.
374     // We now need to verify that it doens't "happen-after"
375     // any events which occur before it
376     if (w_i->aid_ == p) {
377       const auto p_handle = E_w.get_latest_event_handle().value();
378       return std::none_of(w_handles.begin(), w_handles.end(),
379                           [&](const auto handle) { return E_w.happens_before(handle, p_handle); });
380     } else {
381       w_handles.push_back(E_w.get_latest_event_handle().value());
382     }
383   }
384   return false;
385 }
386
387 bool Execution::is_independent_with_execution_of(const PartialExecution& w, std::shared_ptr<Transition> next_E_p) const
388 {
389   // INVARIANT: Here, we assume that for any process `p_i` of `w`,
390   // the events of this execution followed by the execution of all
391   // actors occurring before `p_i` in `v` (`p_j`, `0 <= j < i`)
392   // are sufficient to enable `p_i`. This is fortunately the case
393   // with what ODPOR requires of us, viz. to ask the question about
394   // `v := notdep(e, E)` for some execution `E` and event `e` of
395   // that execution.
396   auto E_p_w = *this;
397   E_p_w.push_transition(std::move(next_E_p));
398   const auto p_handle = E_p_w.get_latest_event_handle().value();
399
400   // As we add events to `w`, verify that none
401   // of them "happen-after" the event associated with
402   // the step `next_E_p` (viz. p_handle)
403   for (const auto& w_i : w) {
404     E_p_w.push_transition(w_i);
405     const auto w_i_handle = E_p_w.get_latest_event_handle().value();
406     if (E_p_w.happens_before(p_handle, w_i_handle)) {
407       return false;
408     }
409   }
410   return true;
411 }
412
413 std::optional<PartialExecution> Execution::get_shortest_odpor_sq_subset_insertion(const PartialExecution& v,
414                                                                                   const PartialExecution& w) const
415 {
416   // See section 4 of Abdulla. et al.'s 2017 ODPOR paper for details (specifically
417   // where the [iterative] computation of `v ~_[E] w` is described)
418   auto E_v   = *this;
419   auto w_now = w;
420
421   for (const auto& next_E_p : v) {
422     // Is `p in `I_[E](w)`?
423     if (const aid_t p = next_E_p->aid_; E_v.is_initial_after_execution_of(w_now, p)) {
424       // Remove `p` from w and continue
425
426       // INVARIANT: If `p` occurs in `w`, it had better refer to the same
427       // transition referenced by `v`. Unfortunately, we have two
428       // sources of truth here which can be manipulated at the same
429       // time as arguments to the function. If ODPOR works correctly,
430       // they should always refer to the same value; but as a sanity check,
431       // we have an assert that tests that at least the types are the same.
432       const auto action_by_p_in_w =
433           std::find_if(w_now.begin(), w_now.end(), [=](const auto& action) { return action->aid_ == p; });
434       xbt_assert(action_by_p_in_w != w_now.end(), "Invariant violated: actor `p` "
435                                                   "is claimed to be an initial after `w` but is "
436                                                   "not actually contained in `w`. This indicates that there "
437                                                   "is a bug computing initials");
438       const auto& w_action = *action_by_p_in_w;
439       xbt_assert(w_action->type_ == next_E_p->type_,
440                  "Invariant violated: `v` claims that actor `%ld` executes '%s' while "
441                  "`w` claims that it executes '%s'. These two partial executions both "
442                  "refer to `next_[E](p)`, which should be the same",
443                  p, next_E_p->to_string(false).c_str(), w_action->to_string(false).c_str());
444       w_now.erase(action_by_p_in_w);
445     }
446     // Is `E ⊢ p ◇ w`?
447     else if (E_v.is_independent_with_execution_of(w_now, next_E_p)) {
448       // INVARIANT: Note that it is impossible for `p` to be
449       // excluded from the set `I_[E](w)` BUT ALSO be contained in
450       // `w` itself if `E ⊢ p ◇ w` (intuitively, the fact that `E ⊢ p ◇ w`
451       // means that are able to move `p` anywhere in `w` IF it occurred, so
452       // if it really does occur we know it must then be an initial).
453       // We assert this is the case here
454       const auto action_by_p_in_w =
455           std::find_if(w_now.begin(), w_now.end(), [=](const auto& action) { return action->aid_ == p; });
456       xbt_assert(action_by_p_in_w == w_now.end(),
457                  "Invariant violated: We claimed that actor `%ld` is not an initial "
458                  "after `w`, yet it's independent with all actions of `w` AND occurs in `w`."
459                  "This indicates that there is a bug computing initials",
460                  p);
461     } else {
462       // Neither of the two above conditions hold, so the relation fails
463       return std::nullopt;
464     }
465
466     // Move one step forward in the direction of `v` and repeat
467     E_v.push_transition(next_E_p);
468   }
469   return std::optional<PartialExecution>{std::move(w_now)};
470 }
471
472 bool Execution::happens_before(Execution::EventHandle e1_handle, Execution::EventHandle e2_handle) const
473 {
474   // 1. "happens-before" (-->_E) is a subset of "occurs before" (<_E)
475   // and is an irreflexive relation
476   if (e1_handle >= e2_handle) {
477     return false;
478   }
479
480   // Each execution maintains a stack of clock vectors which are updated
481   // according to the procedure outlined in section 4 of the original DPOR paper
482   const Event& e2     = get_event_with_handle(e2_handle);
483   const aid_t proc_e1 = get_actor_with_handle(e1_handle);
484
485   if (const auto e1_in_e2_clock = e2.get_clock_vector().get(proc_e1); e1_in_e2_clock.has_value()) {
486     return e1_handle <= e1_in_e2_clock.value();
487   }
488   // If `e1` does not appear in e2's clock vector, this implies
489   // not only that the transitions associated with `e1` and `e2
490   // are independent, but further that there are no transitive
491   // dependencies between e1 and e2
492   return false;
493 }
494
495 } // namespace simgrid::mc::odpor