Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
65d170f61bf3cc1e2575c7275a3d350756fef6e2
[simgrid.git] / src / kernel / context / ContextSwapped.cpp
1 /* Copyright (c) 2009-2021. The SimGrid Team. All rights reserved.          */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 #include "simgrid/Exception.hpp"
7 #include "simgrid/modelchecker.h"
8 #include "src/internal_config.h"
9 #include "src/kernel/EngineImpl.hpp"
10 #include "src/kernel/actor/ActorImpl.hpp"
11 #include "src/simix/smx_private.hpp"
12 #include "xbt/parmap.hpp"
13
14 #include "src/kernel/context/ContextSwapped.hpp"
15
16 #include <boost/core/demangle.hpp>
17 #include <memory>
18 #include <typeinfo>
19
20 #ifdef _WIN32
21 #include <malloc.h>
22 #include <windows.h>
23 #else
24 #include <sys/mman.h>
25 #endif
26
27 #ifdef __MINGW32__
28 #define _aligned_malloc __mingw_aligned_malloc
29 #define _aligned_free __mingw_aligned_free
30 #endif /*MINGW*/
31
32 #if HAVE_VALGRIND_H
33 #include <valgrind/valgrind.h>
34 #endif
35 #if HAVE_SANITIZER_ADDRESS_FIBER_SUPPORT
36 #include <sanitizer/asan_interface.h>
37 #endif
38 #if HAVE_SANITIZER_THREAD_FIBER_SUPPORT
39 #include <sanitizer/tsan_interface.h>
40 #endif
41
42 XBT_LOG_EXTERNAL_DEFAULT_CATEGORY(simix_context);
43
44 // The name of this function is currently hardcoded in MC (as string).
45 // Do not change it without fixing those references as well.
46 void smx_ctx_wrapper(simgrid::kernel::context::SwappedContext* context)
47 {
48 #if HAVE_SANITIZER_ADDRESS_FIBER_SUPPORT
49   __sanitizer_finish_switch_fiber(nullptr, &context->asan_ctx_->asan_stack_, &context->asan_ctx_->asan_stack_size_);
50 #endif
51   try {
52     (*context)();
53     context->Context::stop();
54   } catch (simgrid::ForcefulKillException const&) {
55     XBT_DEBUG("Caught a ForcefulKillException");
56   } catch (simgrid::Exception const& e) {
57     XBT_INFO("Actor killed by an uncaught exception %s", boost::core::demangle(typeid(e).name()).c_str());
58     throw;
59   }
60 #if HAVE_SANITIZER_ADDRESS_FIBER_SUPPORT
61   context->asan_stop_ = true;
62 #endif
63   context->suspend();
64   THROW_IMPOSSIBLE;
65 }
66
67 namespace simgrid {
68 namespace kernel {
69 namespace context {
70
71 /* thread-specific storage for the worker's context */
72 thread_local SwappedContext* SwappedContext::worker_context_ = nullptr;
73
74 SwappedContext::SwappedContext(std::function<void()>&& code, smx_actor_t actor, SwappedContextFactory* factory)
75     : Context(std::move(code), actor), factory_(*factory)
76 {
77   // Save maestro (=first created context) in preparation for run_all
78   if (not SIMIX_context_is_parallel() && factory_.maestro_context_ == nullptr)
79     factory_.maestro_context_ = this;
80
81   if (has_code()) {
82     xbt_assert((actor->get_stacksize() & 0xf) == 0, "Actor stack size should be multiple of 16");
83     if (smx_context_guard_size > 0 && not MC_is_active()) {
84 #if PTH_STACKGROWTH != -1
85       xbt_die(
86           "Stack overflow protection is known to be broken on your system: you stacks grow upwards (or detection is "
87           "broken). "
88           "Please disable stack guards with --cfg=contexts:guard-size:0");
89       /* Current code for stack overflow protection assumes that stacks are growing downward (PTH_STACKGROWTH == -1).
90        * Protected pages need to be put after the stack when PTH_STACKGROWTH == 1. */
91 #endif
92
93       size_t size = actor->get_stacksize() + smx_context_guard_size;
94 #if SIMGRID_HAVE_MC
95       /* Cannot use posix_memalign when SIMGRID_HAVE_MC. Align stack by hand, and save the
96        * pointer returned by xbt_malloc0. */
97       auto* alloc          = static_cast<unsigned char*>(xbt_malloc0(size + xbt_pagesize));
98       stack_               = alloc - (reinterpret_cast<uintptr_t>(alloc) & (xbt_pagesize - 1)) + xbt_pagesize;
99       reinterpret_cast<unsigned char**>(stack_)[-1] = alloc;
100 #elif !defined(_WIN32)
101       void* alloc;
102       xbt_assert(posix_memalign(&alloc, xbt_pagesize, size) == 0, "Failed to allocate stack.");
103       this->stack_ = static_cast<unsigned char*>(alloc);
104 #else
105       this->stack_ = static_cast<unsigned char*>(_aligned_malloc(size, xbt_pagesize));
106 #endif
107
108 #ifndef _WIN32
109       /* This is fatal. We are going to fail at some point when we try reusing this. */
110       xbt_assert(
111           mprotect(this->stack_, smx_context_guard_size, PROT_NONE) != -1,
112           "Failed to protect stack: %s.\n"
113           "If you are running a lot of actors, you may be exceeding the amount of mappings allowed per process.\n"
114           "On Linux systems, change this value with sudo sysctl -w vm.max_map_count=newvalue (default value: 65536)\n"
115           "Please see https://simgrid.org/doc/latest/Configuring_SimGrid.html#configuring-the-user-code-virtualization "
116           "for more information.",
117           strerror(errno));
118 #endif
119       this->stack_ = this->stack_ + smx_context_guard_size;
120     } else {
121       this->stack_ = static_cast<unsigned char*>(xbt_malloc0(actor->get_stacksize()));
122     }
123
124 #if HAVE_VALGRIND_H
125     if (RUNNING_ON_VALGRIND)
126       this->valgrind_stack_id_ = VALGRIND_STACK_REGISTER(this->stack_, this->stack_ + actor->get_stacksize());
127 #endif
128 #if HAVE_SANITIZER_ADDRESS_FIBER_SUPPORT
129     this->asan_stack_ = get_stack_bottom();
130 #endif
131 #if HAVE_SANITIZER_THREAD_FIBER_SUPPORT
132     this->tsan_fiber_ = __tsan_create_fiber(0);
133 #endif
134   } else {
135     // not has_code(): in maestro context
136 #if HAVE_SANITIZER_THREAD_FIBER_SUPPORT
137     this->tsan_fiber_ = __tsan_get_current_fiber();
138 #endif
139   }
140 }
141
142 SwappedContext::~SwappedContext()
143 {
144   if (stack_ == nullptr) // maestro has no extra stack
145     return;
146
147 #if HAVE_SANITIZER_THREAD_FIBER_SUPPORT
148   __tsan_destroy_fiber(tsan_fiber_);
149 #endif
150 #if HAVE_VALGRIND_H
151   if (valgrind_stack_id_ != 0)
152     VALGRIND_STACK_DEREGISTER(valgrind_stack_id_);
153 #endif
154
155 #ifndef _WIN32
156   if (smx_context_guard_size > 0 && not MC_is_active()) {
157     stack_ = stack_ - smx_context_guard_size;
158     if (mprotect(stack_, smx_context_guard_size, PROT_READ | PROT_WRITE) == -1) {
159       XBT_WARN("Failed to remove page protection: %s", strerror(errno));
160       /* try to pursue anyway */
161     }
162 #if SIMGRID_HAVE_MC
163     /* Retrieve the saved pointer.  See SIMIX_context_stack_new above. */
164     stack_ = reinterpret_cast<unsigned char**>(stack_)[-1];
165 #endif
166   }
167 #endif /* not windows */
168
169   xbt_free(stack_);
170 }
171
172 unsigned char* SwappedContext::get_stack_bottom() const
173 {
174   // Depending on the stack direction, its bottom (that make_fcontext needs) may be the lower or higher end
175 #if PTH_STACKGROWTH == 1
176   return stack_;
177 #else
178   return stack_ + get_actor()->get_stacksize();
179 #endif
180 }
181
182 void SwappedContext::stop()
183 {
184   Context::stop();
185   /* We must cut the actor execution using an exception to properly free the C++ RAII variables */
186   throw ForcefulKillException();
187 }
188
189 void SwappedContext::swap_into(SwappedContext* to)
190 {
191 #if HAVE_SANITIZER_ADDRESS_FIBER_SUPPORT
192   void* fake_stack = nullptr;
193   to->asan_ctx_    = this;
194   __sanitizer_start_switch_fiber(this->asan_stop_ ? nullptr : &fake_stack, to->asan_stack_, to->asan_stack_size_);
195 #endif
196 #if HAVE_SANITIZER_THREAD_FIBER_SUPPORT
197   __tsan_switch_to_fiber(to->tsan_fiber_, 0);
198 #endif
199
200   swap_into_for_real(to);
201
202 #if HAVE_SANITIZER_ADDRESS_FIBER_SUPPORT
203   __sanitizer_finish_switch_fiber(fake_stack, &this->asan_ctx_->asan_stack_, &this->asan_ctx_->asan_stack_size_);
204 #endif
205 }
206
207 /** Maestro wants to run all ready actors */
208 void SwappedContextFactory::run_all()
209 {
210   auto* engine = EngineImpl::get_instance();
211   /* This function is called by maestro at the beginning of a scheduling round to get all working threads executing some
212    * stuff It is much easier to understand what happens if you see the working threads as bodies that swap their soul
213    * for the ones of the simulated processes that must run.
214    */
215   if (SIMIX_context_is_parallel()) {
216     // We lazily create the parmap so that all options are actually processed when doing so.
217     if (parmap_ == nullptr)
218       parmap_ = std::make_unique<simgrid::xbt::Parmap<smx_actor_t>>(SIMIX_context_get_nthreads(),
219                                                                     SIMIX_context_get_parallel_mode());
220
221     // Usually, Parmap::apply() executes the provided function on all elements of the array.
222     // Here, the executed function does not return the control to the parmap before all the array is processed:
223     //   - suspend() should switch back to the worker_context (either maestro or one of its minions) to return
224     //     the control to the parmap. Instead, it uses parmap_->next() to steal another work, and does it directly.
225     //     It only yields back to worker_context when the work array is exhausted.
226     //   - So, resume() is only launched from the parmap for the first job of each minion.
227     parmap_->apply(
228         [](const actor::ActorImpl* actor) {
229           auto* context = static_cast<SwappedContext*>(actor->context_.get());
230           context->resume();
231         },
232         engine->get_actors_to_run());
233   } else { // sequential execution
234     if (not engine->has_actors_to_run())
235       return;
236
237     /* maestro is already saved in the first slot of workers_context_ */
238     const actor::ActorImpl* first_actor = engine->get_first_actor_to_run();
239     process_index_          = 1;
240     /* execute the first actor; it will chain to the others when using suspend() */
241     static_cast<SwappedContext*>(first_actor->context_.get())->resume();
242   }
243 }
244
245 /** Maestro wants to yield back to a given actor, so awake it on the current thread
246  *
247  * In parallel, it is only applied to the N first elements of the parmap array,
248  * where N is the amount of worker threads in the parmap.
249  * See SwappedContextFactory::run_all for details.
250  */
251 void SwappedContext::resume()
252 {
253   auto* old = static_cast<SwappedContext*>(self());
254   if (SIMIX_context_is_parallel()) {
255     // Save my current soul (either maestro, or one of the minions) in a thread-specific area
256     worker_context_ = old;
257   }
258   // Switch my soul and the actor's one
259   Context::set_current(this);
260   old->swap_into(this);
261   // No body runs that soul anymore at this point, but it is stored in a safe place.
262   // When the executed actor will do a blocking action, ActorImpl::yield() will call suspend(), below.
263 }
264
265 /** The actor wants to yield back to maestro, because it is blocked in a simcall (i.e., in ActorImpl::yield())
266  *
267  * Actually, it does not really yield back to maestro, but directly into the next executable actor.
268  *
269  * This makes the parmap::apply awkward (see SwappedContextFactory::run_all()) because it only apply regularly
270  * on the few first elements of the array, but it saves a lot of context switches back to maestro,
271  * and directly forth to the next executable actor.
272  */
273 void SwappedContext::suspend()
274 {
275   SwappedContext* next_context;
276   if (SIMIX_context_is_parallel()) {
277     // Get some more work to directly swap into the next executable actor instead of yielding back to the parmap
278     boost::optional<smx_actor_t> next_work = factory_.parmap_->next();
279     if (next_work) {
280       // There is a next soul to embody (ie, another executable actor)
281       XBT_DEBUG("Run next process");
282       next_context = static_cast<SwappedContext*>(next_work.get()->context_.get());
283     } else {
284       // All actors were run, go back to the parmap context
285       XBT_DEBUG("No more actors to run");
286       // worker_context_ is my own soul, stored in thread_local when starting the scheduling round
287       next_context = worker_context_;
288       // When given that soul, the body will wait for the next scheduling round
289     }
290   } else { // sequential execution
291     auto* engine = EngineImpl::get_instance();
292     /* determine the next context */
293     unsigned long int i = factory_.process_index_;
294     factory_.process_index_++;
295
296     if (i < engine->get_actor_to_run_count()) {
297       /* Actually swap into the next actor directly without transiting to maestro */
298       XBT_DEBUG("Run next actor");
299       next_context = static_cast<SwappedContext*>(engine->get_actor_to_run_at(i)->context_.get());
300     } else {
301       /* all processes were run, actually return to maestro */
302       XBT_DEBUG("No more actors to run");
303       next_context = factory_.maestro_context_;
304     }
305   }
306   Context::set_current(next_context);
307   this->swap_into(next_context);
308 }
309
310 } // namespace context
311 } // namespace kernel
312 } // namespace simgrid