Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
MPI3 changed MPI interface to use const everywhere it could.
[simgrid.git] / examples / s4u / platform-failures / s4u-platform-failures.cpp
1 /* Copyright (c) 2007-2019. The SimGrid Team. All rights reserved.          */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 /* This example shows how to work with the state profile of an host or a link,
7  * specifying when the resource must be turned on or off.
8  *
9  * To set such a profile, the first way is to use a file in the XML, while the second is to use the programmatic
10  * interface. Once this profile is in place, the resource will automatically be turned on and off.
11  *
12  * The actors running on an host that is turned off will receive a simgrid::HostFailureException. Since we specified
13  * on_failure="RESTART" for each actors in the XML file, they will be automatically restarted when the host starts
14  * again.
15  *
16  * Communications using failed links will .. fail.
17  */
18
19 #include "simgrid/s4u.hpp"
20 #include "xbt/str.h"
21
22 XBT_LOG_NEW_DEFAULT_CATEGORY(s4u_test, "Messages specific for this s4u example");
23
24 static int master(int argc, char* argv[])
25 {
26   xbt_assert(argc == 5, "Expecting one parameter");
27
28   simgrid::s4u::Mailbox* mailbox;
29   long number_of_tasks = xbt_str_parse_int(argv[1], "Invalid amount of tasks: %s");
30   double comp_size     = xbt_str_parse_double(argv[2], "Invalid computational size: %s");
31   double comm_size     = xbt_str_parse_double(argv[3], "Invalid communication size: %s");
32   long workers_count   = xbt_str_parse_int(argv[4], "Invalid amount of workers: %s");
33
34   XBT_INFO("Got %ld workers and %ld tasks to process", workers_count, number_of_tasks);
35
36   for (int i = 0; i < number_of_tasks; i++) {
37     mailbox         = simgrid::s4u::Mailbox::by_name(std::string("worker-") + std::to_string(i % workers_count));
38     double* payload = new double(comp_size);
39     try {
40       XBT_INFO("Send a message to %s", mailbox->get_cname());
41       mailbox->put(payload, comm_size, 10.0);
42       XBT_INFO("Send to %s completed", mailbox->get_cname());
43     } catch (simgrid::TimeoutError& e) {
44       delete payload;
45       XBT_INFO("Mmh. Got timeouted while speaking to '%s'. Nevermind. Let's keep going!", mailbox->get_cname());
46     } catch (xbt_ex& e) {
47       if (e.category != network_error)
48         xbt_die("Unexpected behavior");
49       XBT_INFO("Mmh. The communication with '%s' failed. Nevermind. Let's keep going!", mailbox->get_cname());
50       delete payload;
51     }
52   }
53
54   XBT_INFO("All tasks have been dispatched. Let's tell everybody the computation is over.");
55   for (int i = 0; i < workers_count; i++) {
56     /* - Eventually tell all the workers to stop by sending a "finalize" task */
57     mailbox         = simgrid::s4u::Mailbox::by_name(std::string("worker-") + std::to_string(i));
58     double* payload = new double(-1.0);
59     try {
60       mailbox->put(payload, 0, 1.0);
61     } catch (simgrid::HostFailureException& e) {
62       delete payload;
63       XBT_INFO("Gloups. The cpu on which I'm running just turned off!. See you!");
64       return -1;
65     } catch (simgrid::TimeoutError& e) {
66       delete payload;
67       XBT_INFO("Mmh. Got timeouted while speaking to '%s'. Nevermind. Let's keep going!", mailbox->get_cname());
68     } catch (xbt_ex& e) {
69       delete payload;
70       if (e.category != network_error)
71         xbt_die("Unexpected behavior");
72       XBT_INFO("Mmh. Something went wrong with '%s'. Nevermind. Let's keep going!", mailbox->get_cname());
73     }
74   }
75
76   XBT_INFO("Goodbye now!");
77   return 0;
78 }
79
80 static int worker(int argc, char* argv[])
81 {
82   xbt_assert(argc == 2, "Expecting one parameter");
83   long id                          = xbt_str_parse_int(argv[1], "Invalid argument %s");
84   simgrid::s4u::Mailbox* mailbox   = simgrid::s4u::Mailbox::by_name(std::string("worker-") + std::to_string(id));
85   double* payload                  = nullptr;
86   double comp_size                 = -1;
87   while (1) {
88     try {
89       XBT_INFO("Waiting a message on %s", mailbox->get_cname());
90       payload   = static_cast<double*>(mailbox->get());
91       xbt_assert(payload != nullptr, "mailbox->get() failed");
92       comp_size = *payload;
93       delete payload;
94       if (comp_size < 0) { /* - Exit when -1.0 is received */
95         XBT_INFO("I'm done. See you!");
96         break;
97       }
98       /*  - Otherwise, process the task */
99       XBT_INFO("Start execution...");
100       simgrid::s4u::this_actor::execute(comp_size);
101       XBT_INFO("Execution complete.");
102     } catch (simgrid::HostFailureException& e) {
103       XBT_INFO("Gloups. The cpu on which I'm running just turned off!. See you!");
104       delete payload;
105       return -1;
106     } catch (xbt_ex& e) {
107       if (e.category != network_error)
108         xbt_die("Unexpected behavior. Category: %s", xbt_ex_catname(e.category));
109       XBT_INFO("Mmh. Something went wrong. Nevermind. Let's keep going!");
110     }
111   }
112   return 0;
113 }
114
115 int main(int argc, char* argv[])
116 {
117   simgrid::s4u::Engine e(&argc, argv);
118   e.load_platform(argv[1]);
119   e.register_function("master", master);
120   e.register_function("worker", worker);
121   e.load_deployment(argv[2]);
122
123   e.run();
124
125   XBT_INFO("Simulation time %g", simgrid::s4u::Engine::get_clock());
126   return 0;
127 }