Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
Add new entry in Release_Notes.
[simgrid.git] / docs / source / Models.rst
1 .. raw:: html
2
3    <object id="TOC" data="graphical-toc.svg" type="image/svg+xml"></object>
4    <script>
5    window.onload=function() { // Wait for the SVG to be loaded before changing it
6      var elem=document.querySelector("#TOC").contentDocument.getElementById("ModelBox")
7      elem.style="opacity:0.93999999;fill:#ff0000;fill-opacity:0.1;stroke:#000000;stroke-width:0.35277778;stroke-linecap:round;stroke-linejoin:round;stroke-miterlimit:4;stroke-dasharray:none;stroke-dashoffset:0;stroke-opacity:1";
8    }
9    </script>
10    <br/>
11    <br/>
12
13 .. _models:
14
15 The SimGrid models
16 ##################
17
18 This page focuses on the **performance models** that compute the duration of :ref:`all activities <S4U_main_concepts>`
19 throughout the simulation, based on the platform characteristics and on the other activities that concurrently use the
20 resources. If you are looking for information on other kinds of models (such as routing models or compute model), please refer to :ref:`the
21 bottom of this page <models_other>`.
22
23 Modeled resources
24 *****************
25
26 The primary objective of SimGrid is to provide simulated timing information
27 for the usage of three kinds of resources: networks, CPUs, and disks.
28
29 The **network models** have been improved and regularly validated for almost 20 years. It should be possible to get
30 accurate simulations once you properly :ref:`calibrate the models for your settings<models_calibration>`. As detailed
31 in the next sections, SimGrid provides several network models. Two plugins can also be used to compute the energy
32 consumption of the network: one for :ref:`wired networks<plugin_link_energy>` and another one for :ref:`Wi-Fi networks
33 <plugin_link_energy>`. Note that at first some users find the way in which SimGrid simulates :ref:`TCP performance<understanding_lv08>` to be
34 counter-intuitive; in our experience this is due these users misunderstandings the (complex) behavior
35 of TCP in real networks.
36
37 The **CPU models** are less developed in SimGrid. Through the S4U API, the user can specify amounts of
38 computational work (expressed in FLOPs, for floating point operations) that each computation "consumes", and the model
39 simply divides this amount by a CPU's FLOP rate to compute the duration of the computation 
40 (accounting for number of cores and all concurrent computations with a time-sharing model). In SMPI, the user code
41 is automatically timed, and the :ref:`computing speed<cfg=smpi/host-speed>` of the host machine is used to evaluate
42 the corresponding amount of FLOPs. This model should be sufficient for most users, even though assuming a constant FLOP
43 rate for each machine remains a crude simplification (in reality, the FLOP rate varies because of I/O, memory, and
44 cache effects). It is possible to :ref:`overcome this simplification<cfg=smpi/comp-adjustment-file>`, but the
45 required calibration process is rather intricate and not documented yet (feel free to
46 :ref:`contact the community<community>`).
47 In the future, more advanced models may be added but the existing model have proven good enough 
48 over the last two decades. The CPU energy consumption can be computed with the
49 :ref:`relevant plugin<plugin_host_energy>`.
50
51 The **disk models** in SimGrid have been included more recently than those for networks and CPUs, but they should
52 still prove useful to most users. `Studies have shown <https://hal.inria.fr/hal-01197128>`_ that these models are sensitive
53 to various conditions, and a :ref:`calibration process<howto_disk>` is provided. As usual, you probably want to
54 assess simulation accuracy through an appropriate validation campaign.
55
56 .. _models-lmm:
57
58 LMM-based Models
59 ****************
60
61 SimGrid aims at the sweet spot between simulation accuracy and simulation speed. In terms of accuracy, the goal is for simulations
62 to report correct
63 performance trends when comparing competing designs while placing minimal burden on the user. We also want to allow power users to
64 fine tune the simulation models to achieve simulation results that are within 5% or less of what would be observed
65 on a real platform. For example, we accurately determined the `speedup achieved by the Tibidabo ARM-based cluster <http://hal.inria.fr/hal-00919507>`_
66 before it was even built. In terms of simulation speed, the goal it to be fast and scalable enough to allow the study of modern IT systems
67 at scale. SimGrid was, for example, used to simulate `a Chord ring with millions of actors
68 <https://hal.inria.fr/inria-00602216>`_ (even though results were not really more instructive than those obtained at smaller scales),
69 or `a qualification run at full-scale of the Stampede supercomputer
70 <https://hal.inria.fr/hal-02096571>`_.
71
72 Most SimGrid models are based on a linear max-min solver (LMM), as depicted below. The actors' activities are
73 represented by actions in the simulation kernel, accounting for both the initial amount of work of the corresponding
74 activity (in FLOPs for CPU activities or bytes for network and disk activities), and the currently remaining
75 amount of work to process.
76
77 At each simulation step, the instantaneous speed for each action is computed according
78 to the model. A set of constraints is used to express resource capacity constraints, i.e., that the cumulative instantaneous consumption of a
79 given resource by a set actions must remain below the nominal capacity of that resource. In the example
80 below, it is stated that the compute speed :math:`\varrho_1` of activity 1 plus the compute speed :math:`\varrho_n`
81 of activity :math:`n`, which both run on host A, must remain smaller than that host's total compute speed :math:`C_A`.
82
83 .. image:: img/lmm-overview.svg
84
85 There are many valuations of :math:`\varrho_1, \ldots{}, \varrho_n` that must respect sets of constraints.
86 SimGrid usually computes the instantaneous speeds according to a Max-Min objective function, that is, maximizing the
87 minimum over all :math:`\varrho_i`. The coefficients associated to each variable in the inequalities are used to model
88 some performance effects, such as the fact that TCP tends to favor communications with small RTTs. These coefficients
89 are computed from both hard-coded values and :ref:`latency and bandwidth factors<cfg=network/latency-factor>` (more
90 details on network performance modeling are given in the next section).
91
92 Once the instantaneous speeds are computed for all acttions, the simulation kernel computes the earliest terminating action
93 given their respective speeds and remaining amounts of work. The simulated time is then updated along with remaning
94 amounts of work. At this point, some actions have no remaining work and are removed from the LMM. The corresponding activities thus terminate, which in turn
95 unblocks the corresponding actors that can then continue executing. 
96
97 Most of the SimGrid models build upon the LMM solver, which they adapt and configure in various ways. For CPU
98 and disk activities, the LMM-based models are respectively named **Cas01** and **S19**. The existing network models are
99 described in the next section.
100
101 .. _models_TCP:
102
103 The TCP models
104 **************
105
106 SimGrid provides several network performance models that compute the time taken by each communication in isolation.
107 **CM02** is the simplest one. It captures TCP windowing effects, but does not introduce any correction factors. This
108 model should be used if you prefer human-understandable results over realistic ones. **LV08** (the default model) uses
109 constant factors that are intended to capture common effects such as slow-start, the fact that TCP headers reduce the
110 *effective* bandwidth, or TCP's ACK messages. **SMPI** uses more advanced factors that also capture the MPI-specific
111 effects such as the switch between the eager vs. rendez-vous communication modes. You can :ref:`choose the
112 model <options_model_select>` on via command-line arguments, and each model can be :ref:`further configured <options_model>`.
113
114 The LMM solver is then used as described above to compute the effect of contention on the communication time when using TCP. 
115 For the sake of realism, the sharing on saturated links is not necessarily a fair sharing
116 (unless when ``weight-S=0``, in which case the following mechanism is disabled).
117 Instead, flows receive an amount of bandwidth inversely proportional to their round trip time. This is modeled
118 in the LMM as a priority that depends on the :ref:`weight-S <cfg=network/weight-S>` parameter. More precisely, this
119 priority is computed for each flow as :math:`\displaystyle\sum_{l\in links}\left(Lat(l)+\frac{weightS}{Bandwidth(l)}\right)`, i.e., as the sum of the
120 latencies of all links traversed by the communication, plus the sum of `weight-S` over the bandwidth of each link along
121 the path. This dependency on the link bandwidths is for the model to account for the TCP protocol's reactivity.
122
123 Regardless of the TCP model in used, the latency is paid beforehand. It is as if the communication only starts after a
124 small delay that corresponds to the end-to-end latency. During that time, the communication has no impact on the links (i.e., the other
125 communications are not slowed down, because there is no contention yet).
126
127 As an alternative to the above LMM-based models, it is possible to use the :ref:`ns-3 simulator as a network model <models_ns3>`. ns-3 performs
128 a much more detailed, packet-level simulation 
129 than the above models. As a result is is much slower but will produce more accurate results. 
130 Both simulators have time complexity that is linear in the size of their input, but ns-3 has a much larger input in case of large communications
131 because it considers individual network packets. 
132 However, the above SimGrid models must be carefully :ref:`calibrated <models_calibration>` if
133 achieve very high accuracy is needed, while ns-3 is less demanding in this regard.
134
135 .. _understanding_cm02:
136
137 CM02
138 ====
139
140 This is a simple model of TCP performance, where the sender stops sending packets when its TCP window is full. If the
141 acknowledgment packets are returned in time to the sender, the TCP window has no impact on the performance, which is then
142 only limited by link bandwidths. Otherwise, late acknowledgments will reduce the data transfer rate.
143
144 SimGrid models this mechanism as follows: :math:`real\_BW = min(physical\_BW, \frac{TCP\_GAMMA}{2\times latency})` The used
145 bandwidth is either the physical bandwidth that is configured in the platform, or a value that represents a bandwidth
146 limit due to late acknowledgments. This value is the maximal TCP window size (noted TCP Gamma in SimGrid) divided by the
147 round-trip time (i.e. twice the one-way latency). The default value of TCP Gamma is 4194304. This value can be changed with
148 the :ref:`network/TCP-gamma <cfg=network/TCP-gamma>` configuration item.
149
150 If you want to disable this mechanism altogether (e.g.,to model UDP or memory operations), you should set TCP-gamma
151 to 0. Otherwise, the time it takes to send 10 Gib of data over a 10 Gib/s link that is otherwise unused is computed as
152 :math:`latency + \frac{size}{bandwidth}`, but the bandwidth in the denominator may be the physical
153 one (10Gb/s) or the one induced by the TCP window, depending on the latency:
154
155  - If the link latency is 0, the communication, expectedly, takes one second.
156  - If the link latency is 0.00001s, :math:`\frac{gamma}{2\times lat}=209,715,200,000 \approx 209Gib/s` which is larger than the
157    physical bandwidth. So the physical bandwidth is used (the link is fully utilized) and the communication takes 1.00001s
158  - If the link latency is 0.001s, :math:`\frac{gamma}{2\times lat}=2,097,152,000 \approx 2Gib/s`, which is smaller than the
159    physical bandwidth. The communication thus fails to fully utilize the link and takes about 4.77s.
160  - With a link latency of 0.1s, :math:`gamma/2\times lat \approx 21Mb/s`, so the communication takes about 476.84 + 0.1 seconds!
161  - More cases are tested and their validity checked by the test ``teshsuite/models/cm02-tcpgamma/cm02-tcpgamma.tesh`` in our test suite.
162
163 For more details, please refer to "A Network Model for Simulation of Grid Application" by Henri Casanova and Loris
164 Marchal (published in 2002, hence the model name).
165
166 .. _understanding_lv08:
167
168 LV08 (default)
169 ==============
170
171 This model builds on CM02 to model TCP windowing (see above). It also introduces corrections factors for further realism:
172 latency-factor is 13.01, bandwidth-factor is 0.97 while weight-S is 20537. Lets consider the following platform:
173
174 .. code-block:: xml
175
176    <host id="A" speed="1Gf" />
177    <host id="B" speed="1Gf" />
178
179    <link id="link1" latency="10ms" bandwidth="1Mbps" />
180
181    <route src="A" dst="B">
182      <link_ctn id="link1" />
183    </route>
184
185 If host `A` sends ``100kB`` (a hundred kilobytes, that is, 8e5 bits) to host `B`, one can expect that this communication would
186 take `0.81` seconds to complete according to a simple latency-plus-size-divided-by-bandwidth model (0.01 + 8e5/1e6 = 0.81 -- the
187 size was converted from bytes to bits) since the latency is small enough to ensure that the physical bandwidth is used (see the
188 discussion on CM02 above). However, the LV08 model is more complex to account for three phenomena that directly impact the
189 simulation time:
190
191   - The size of a message at the application level (i.e., 100kB in this example) is not the size that is actually
192     transferred over the network. To mimic the fact that TCP and IP headers are added to each packet of the original
193     payload, the TCP model of SimGrid empirically considers that `only 97% of the nominal bandwidth` are available. In
194     other words, the size of your message is increased by a few percents, whichever this size.
195
196   - In the real world, the TCP protocol is not able to fully exploit the bandwidth of a link from the emission of the
197     first packet. To reflect this `slow start` phenomenon, the latency declared in the platform file is multiplied by
198     `a factor of 13.01`. Here again, this is an empirically determined value that may not correspond to every TCP
199     implementations on every networks. It can be tuned when more realistic simulated times for the transfer of short
200     messages are needed though.
201
202   - When data is transferred from A to B, some TCP ACK messages travel in the opposite direction. To reflect the impact
203     of this `cross-traffic`, SimGrid simulates a flow from B to A that represents an additional bandwidth consumption
204     of `0.05%`. The route from B to A is implicitly declared in the platform file and uses the same link `link1` as if
205     the two hosts were connected through a communication bus. The bandwidth share allocated to a data transfer from A
206     to B is then the available bandwidth of `link1` (i.e., 97% of the nominal bandwidth of 1Mb/s) divided by 1.05
207     (i.e., the total consumption). This feature, activated by default, can be disabled by adding the
208     ``--cfg=network/crosstraffic:0`` flag to the command line.
209
210 As a consequence, the time to transfer 100kB from A to B as simulated by the default TCP model of SimGrid is not 0.81
211 seconds but
212
213 .. code-block:: python
214
215     0.01 * 13.01 + 800000 / ((0.97 * 1e6) / 1.05) =  0.996079 seconds.
216
217 For more details, please refer to "Accuracy study and improvement of network simulation in the SimGrid framework" by
218 Arnaud Legrand and Pedro Velho.
219
220 .. _models_l07:
221
222 Parallel tasks (L07)
223 ********************
224
225 This model is rather different from the other LMM models because it uses another objective function, which is called *bottleneck*.
226 This is because this model is intended to be used for parallel tasks, that is sets of actions that mix flops and bytes, while the
227 Max-Min objective function requires that all variables be expressed using the same unit (which is why in the implementation
228 we have one LMM system per resource kind).
229
230 Use the :ref:`relevant configuration <options_model_select>` to select this model in your simulation.
231
232 .. _models_wifi:
233
234 WiFi zones
235 **********
236
237 In SimGrid, WiFi networks are modeled with WiFi zones, where a zone contains the access point of the WiFi network and
238 the hosts connected to it (called `stations` in the WiFi world). The network inside a WiFi zone is modeled by declaring
239 a single regular link with a specific attribute. This link is then added to the routes to and from the stations within
240 this WiFi zone. The main difference of WiFi networks, when compared to wired networks, is that performance is not determined by link bandwidths
241 and latencies but by both the access point WiFi characteristics and the distance between that access point and a given
242 station.
243
244 In SimGrid, WiFi zones can be used with the LMM-based models or the ns-3-based model.
245
246 Declaring a WiFi zone
247 =====================
248
249 To declare a new WiFi network, simply declare a network zone with the ``WIFI`` routing attribute.
250
251 .. code-block:: xml
252
253         <zone id="SSID_1" routing="WIFI">
254
255 Inside this zone you must declare which host or router will be the access point of the WiFi network.
256
257 .. code-block:: xml
258
259         <prop id="access_point" value="alice"/>
260
261 Then simply declare the stations (hosts) and routers inside the WiFi network. Remember that one must have the same name
262 as the "access point" property.
263
264 .. code-block:: xml
265
266         <router id="alice" speed="1Gf"/>
267         <host id="STA0-0" speed="1Gf"/>
268         <host id="STA0-1" speed="1Gf"/>
269
270 Finally, close the WiFi zone.
271
272 .. code-block:: xml
273
274         </zone>
275
276 The WiFi zone may be connected to another zone using a traditional link and a zoneRoute. Note that the connection between two
277 zones is always wired.
278
279 .. code-block:: xml
280
281         <link id="wireline" bandwidth="100Mbps" latency="2ms" sharing_policy="SHARED"/>
282
283         <zoneRoute src="SSID_1" dst="SSID_2" gw_src="alice" gw_dst="bob">
284             <link_ctn id="wireline"/>
285         </zoneRoute>
286
287 WiFi network performance
288 ========================
289
290 The performance of a wifi network is controlled by the three following properties:
291
292  * ``mcs`` (`Modulation and Coding Scheme <https://en.wikipedia.org/wiki/Link_adaptation>`_)
293    is a property of the WiFi zone. Roughly speaking, it defines the speed at which the access point exchanges data
294    with all the stations. It depends on the access point's model and configuration. Possible values for mcs can be
295    found on Wikipedia for example.
296    |br| By default, ``mcs=3``.
297  * ``nss`` (Number of Spatial Streams, or `number of antennas <https://en.wikipedia.org/wiki/IEEE_802.11n-2009#Number_of_antennas>`_) is another property of the WiFi zone. It defines the amount of simultaneous data streams that the access
298    point can sustain. Not all values of MCS and NSS are valid nor compatible (cf. `802.11n standard <https://en.wikipedia.org/wiki/IEEE_802.11n-2009#Data_rates>`_).
299    |br| By default, ``nss=1``.
300  * ``wifi_distance`` is the distance from a station to the access point. Since each station can have its own specific value
301    it is a property of the stations declared inside the WiFi zone.
302    |br| By default, ``wifi_distance=10``.
303
304 Here is an example of a zone with non-default ``mcs`` and ``nss`` values.
305
306 .. code-block:: xml
307
308         <zone id="SSID_1" routing="WIFI">
309             <prop id="access_point" value="alice"/>
310             <prop id="mcs" value="2"/>
311             <prop id="nss" value="2"/>
312         ...
313         </zone>
314
315 Here is an example of setting the ``wifi_distance`` of a given station.
316
317 .. code-block:: xml
318
319         <host id="STA0-0" speed="1Gf">
320             <prop id="wifi_distance" value="37"/>
321         </host>
322
323 Constant-time model
324 *******************
325
326 This model is one of the few SimGrid network models that is not based on the LMM solver. In this
327 model, all communication take a constant time (one second by default). It provides the lowest level of realism, but is
328 faster and much simpler to understand. This model may prove interesting though if you plan to study abstract
329 distributed algorithms such as leader election or causal broadcast.
330
331 .. _models_ns3:
332
333 ns-3 as a SimGrid model
334 ***********************
335
336 The **ns-3 based model** is the most accurate network model in SimGrid. It relies on the well-known `ns-3 packet-level network
337 simulator <http://www.nsnam.org>`_ to compute full timing information related to network transfers. This model is much slower
338 than the LMM-based models. This is because ns-3 simulates the movement of every network packet involved in every communication,
339 while the LMM-based models only recompute the respective instantaneous speeds of the currently ongoing communications when a
340 communication starts or stops. In other terms, both SimGrid and ns-3 are fast and highly optimized, but while SimGrid only
341 depends on application-level events (starting and stoping of communications), ns-3 depends on network-level events (sending a
342 packet).
343
344 You need to install ns-3 and recompile SimGrid accordingly to use this model.
345
346 The SimGrid/ns-3 binding only contains features that are common to both systems. Not all ns-3 models are available from SimGrid
347 (only the TCP and WiFi ones are), while not all SimGrid platform files can be used in conjunction with ns-3 (routes must be of
348 length 1). Note also that the platform built in ns-3 from the SimGrid description is very basic. Finally, communicating from a
349 host to itself is forbidden in ns-3, so every such communication is simulated to take zero time.
350
351 By default, the ns-3 model in SimGrid is not idempotent, unless you patch your version of ns-3 with [this
352 patch](https://gitlab.com/nsnam/ns-3-dev/-/merge_requests/1338). It is perfectly OK to have a non-idempotent model in SimGrid as
353 long as you only have only one such model, and as long as you don't use utterly advanced things in SimGrid. If you do want to
354 have an idempotent ns-3, apply the previously mentioned patch, and recompile SimGrid. It should detect the patch and react
355 accordingly.
356
357 Compiling the ns-3/SimGrid binding
358 ==================================
359
360 Installing ns-3
361 ---------------
362
363 SimGrid requires ns-3 version 3.26 or higher, and you probably want the most
364 recent version of both SimGrid and ns-3. While the Debian package of SimGrid
365 does not have the ns-3 bindings activated, you can still use the packaged version
366 of ns-3 by grabbing the ``libns3-dev ns3`` packages. Alternatively, you can
367 install ns-3 from scratch (see the `ns-3 documentation <http://www.nsnam.org>`_).
368
369 Enabling ns-3 in SimGrid
370 ------------------------
371
372 SimGrid must be recompiled with the ``enable_ns3`` option activated in cmake.
373 Optionally, use ``NS3_HINT`` to tell cmake where ns3 is installed on
374 your disk.
375
376 .. code-block:: console
377
378    $ cmake . -Denable_ns3=ON -DNS3_HINT=/opt/ns3 # or change the path if needed
379
380 cmake will report whether ns-3 was found,
381 and this information is also available in ``include/simgrid/config.h``
382 If your local copy defines the variable ``SIMGRID_HAVE_NS3`` to 1, then ns-3
383 was correctly detected. Otherwise, explore ``CMakeFiles/CMakeOutput.log`` and
384 ``CMakeFiles/CMakeError.log`` to diagnose the problem.
385
386 Test that ns-3 was successfully integrated with the following command (executed from your SimGrid
387 build directory). It will run all SimGrid tests that are related to the ns-3
388 integration. If no test is run at all, then ns-3 is disabled in cmake.
389
390 .. code-block:: console
391
392    $ ctest -R ns3
393
394 Troubleshooting
395 ---------------
396
397 If you use a version of ns-3 that is not known to SimGrid yet, edit
398 ``tools/cmake/Modules/FindNS3.cmake`` in your SimGrid tree, according to the
399 comments on top of this file. Conversely, if something goes wrong with an old
400 version of either SimGrid or ns-3, try upgrading everything.
401
402 Note that there is a known bug with the version 3.31 of ns3 when it is built with
403 MPI support, like it is with the libns3-dev package in Debian 11 « Bullseye ».
404 A simple workaround is to edit the file
405 ``/usr/include/ns3.31/ns3/point-to-point-helper.h`` to remove the ``#ifdef NS3_MPI``
406 include guard.  This can be achieved with the following command (as root):
407
408 .. code-block:: console
409
410    # sed -i '/^#ifdef NS3_MPI/,+2s,^#,//&,' /usr/include/ns3.31/ns3/point-to-point-helper.h
411
412 .. _ns3_use:
413
414 Using ns-3 from SimGrid
415 =======================
416
417 Platform files compatibility
418 ----------------------------
419
420 Any route with more than one hop will be ignored when using ns-3. They are
421 harmless, but you still need to connect your hosts using one-hop routes.
422 The best solution is to add routers to split your route. Here is an
423 example of an invalid platform:
424
425 .. code-block:: xml
426
427    <?xml version='1.0'?>
428    <!DOCTYPE platform SYSTEM "https://simgrid.org/simgrid.dtd">
429    <platform version="4.1">
430      <zone id="zone0" routing="Floyd">
431        <host id="alice" speed="1Gf" />
432        <host id="bob"   speed="1Gf" />
433
434        <link id="l1" bandwidth="1Mbps" latency="5ms" />
435        <link id="l2" bandwidth="1Mbps" latency="5ms" />
436
437        <route src="alice" dst="bob">
438          <link_ctn id="l1"/>            <!-- !!!! IGNORED WHEN USED WITH ns-3       !!!! -->
439          <link_ctn id="l2"/>            <!-- !!!! ROUTES MUST CONTAIN ONE LINK ONLY !!!! -->
440        </route>
441      </zone>
442    </platform>
443
444 This platform file can be reformulated as follows to make it usable with the ns-3 binding.
445 There is no direct connection from alice to bob, but that's OK because ns-3
446 automatically routes from point to point (using
447 ``ns3::Ipv4GlobalRoutingHelper::PopulateRoutingTables``).
448
449 .. code-block:: xml
450
451    <?xml version='1.0'?>
452    <!DOCTYPE platform SYSTEM "https://simgrid.org/simgrid.dtd">
453    <platform version="4.1">
454      <zone id="zone0" routing="Full">
455        <host id="alice" speed="1Gf" />
456        <host id="bob"   speed="1Gf" />
457
458        <router id="r1" /> <!-- routers are compute-less hosts -->
459
460        <link id="l1" bandwidth="1Mbps" latency="5ms"/>
461        <link id="l2" bandwidth="1Mbps" latency="5ms"/>
462
463        <route src="alice" dst="r1">
464          <link_ctn id="l1"/>
465        </route>
466
467        <route src="r1" dst="bob">
468          <link_ctn id="l2"/>
469        </route>
470      </zone>
471    </platform>
472
473 Once your platform is OK, just change the :ref:`network/model
474 <options_model_select>` configuration option to `ns-3` as follows. The other
475 options can be used as usual.
476
477 .. code-block:: console
478
479    $ ./network-ns3 --cfg=network/model:ns-3 (other parameters)
480
481 Many other files from the ``examples/platform`` directory are usable with the
482 ns-3 model, such as `examples/platforms/dogbone.xml <https://framagit.org/simgrid/simgrid/tree/master/examples/platforms/dogbone.xml>`_.
483 Check the file  `examples/cpp/network-ns3/network-ns3.tesh <https://framagit.org/simgrid/simgrid/tree/master/examples/cpp/network-ns3/network-ns3.tesh>`_
484 to see which ones are used in our regression tests.
485
486 Alternatively, you can manually modify the ns-3 settings by retrieving
487 the ns-3 node from any given host with the
488 :cpp:func:`simgrid::get_ns3node_from_sghost` function (defined in
489 ``simgrid/plugins/ns3.hpp``).
490
491 .. doxygenfunction:: simgrid::get_ns3node_from_sghost
492
493 Random seed
494 -----------
495 It is possible to define a fixed or random seed for ns-3's random number generator using the config tag.
496
497 .. code-block:: xml
498
499         <?xml version='1.0'?><!DOCTYPE platform SYSTEM "https://simgrid.org/simgrid.dtd">
500         <platform version="4.1">
501             <config>
502                     <prop id = "network/model" value = "ns-3" />
503                     <prop id = "ns3/seed" value = "time" />
504             </config>
505         ...
506         </platform>
507
508 The first property defines that this platform will be used with the ns-3 model.
509 The second property defines the seed that will be used. If defined to ``time``, as done above,
510 it will use a random seed.
511
512 Limitations
513 ===========
514
515 A ns-3 platform is automatically created based on the provided SimGrid
516 platform. However, there are some known caveats:
517
518   * The default values (e.g., TCP parameters) are the ns-3 default values.
519   * ns-3 networks are routed using the shortest path algorithm, using ``ns3::Ipv4GlobalRoutingHelper::PopulateRoutingTables``.
520   * End hosts cannot have more than one network interface card. So, your SimGrid hosts
521     should be connected to the platform through only one link. Otherwise, your
522     SimGrid host will be considered as a router (FIXME: is it still true?).
523
524 Our goal is to keep the ns-3 plugin of SimGrid as easy (and hopefully readable)
525 as possible. If the current state of development does not fit your needs, you can modify
526 this plugin and/or create your own plugin based on the current one. If you come up
527 with interesting improvements, please contribute them back.
528
529 Troubleshooting
530 ===============
531
532 If your simulation hangs in a communication, this is probably because one host
533 is sending data that is not routable in your platform. Make sure that you only
534 use routes of length 1, and that any host is connected to the platform.
535 Arguably, SimGrid could detect this situation and report it, but unfortunately,
536 this still has to be done.
537
538 FMI-based models
539 ****************
540
541 `FMI <https://fmi-standard.org/>`_ is a standard to exchange models between simulators. If you want to plug such a model
542 into SimGrid, you need the `SimGrid-FMI external plugin <https://framagit.org/simgrid/simgrid-FMI>`_.
543 There is a specific `documentation <https://simgrid.frama.io/simgrid-FMI/index.html>`_ available for the plugin.
544 This was used to accurately study a *Smart grid* through co-simulation: `PandaPower <http://www.pandapower.org/>`_ was
545 used to simulate the power grid, `ns-3 <https://nsnam.org/>`_ was used to simulate the communication network while SimGrid was
546 used to simulate the IT infrastructure. Please also refer to the `relevant publication <https://hal.science/hal-03217562>`_
547 for more details.
548
549 .. _models_other:
550
551 Other kind of models
552 ********************
553
554 Models are key components of SimGrid, as they should be for any simulation framework, and beyond the above performance models
555 SimGrid employs other models:
556
557 The **routing models** constitute advanced elements of the platform description. This description naturally entails
558 :ref:`components<platform>` that are very related to the performance models. For instance, determining the execution
559 time of a task obviously depends on the characteristics of the machine that executes this task. Furthermore, networking
560 zones can be interconnected to compose larger platforms `in a scalable way <http://hal.inria.fr/hal-00650233/>`_. Each
561 of these zones can be given a specific :ref:`routing model<platform_routing>` that efficiently computes the list of
562 links forming a network path between two given hosts.
563
564 The model checker uses an abstraction of the performance simulations. Mc SimGrid explores every causally possible
565 execution paths of the application, completely abstracting the performance away. The simulated time is not even
566 computed in this mode! The abstraction involved in this process also models the mutual impacts among actions, to not
567 re-explore histories that only differ by the order of independent and unrelated actions. As with the rest of the model
568 checker, these models are unfortunately still to be documented properly.
569
570
571 .. |br| raw:: html
572
573    <br />