Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
convert some catch locations to simgrid::HostFailureException
[simgrid.git] / teshsuite / msg / host_on_off_processes / host_on_off_processes.cpp
1 /* Copyright (c) 2010-2018. The SimGrid Team. All rights reserved.          */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 #include "simgrid/Exception.hpp"
7 #include "simgrid/msg.h"
8
9 #include <stdio.h> /* sscanf */
10
11 XBT_LOG_NEW_DEFAULT_CATEGORY(msg_test, "Messages specific for this msg example");
12
13 xbt_dynar_t tests;
14 int tasks_done = 0;
15
16 static void task_cleanup_handler(void* task)
17 {
18   if (task)
19     MSG_task_destroy(static_cast<msg_task_t>(task));
20 }
21
22 static int process_daemon(int /*argc*/, char** /*argv*/)
23 {
24   msg_process_t self = MSG_process_self();
25   XBT_INFO("  Start daemon on %s (%f)", MSG_host_get_name(MSG_host_self()), MSG_host_get_speed(MSG_host_self()));
26   for (;;) {
27     msg_task_t task = MSG_task_create("daemon", MSG_host_get_speed(MSG_host_self()), 0, NULL);
28     MSG_process_set_data(self, task);
29     XBT_INFO("  Execute daemon");
30     msg_error_t res = MSG_task_execute(task);
31     MSG_task_destroy(task);
32     tasks_done++;
33     if (res == MSG_HOST_FAILURE) {
34       XBT_INFO("Host as died as expected, do nothing else");
35       return 0;
36     }
37   }
38   XBT_INFO("  daemon done. See you!");
39   return 0;
40 }
41
42 static int process_sleep(int /*argc*/, char** /*argv*/)
43 {
44   for (;;) {
45     XBT_INFO("  I'm alive but I should sleep");
46     MSG_process_sleep(10);
47   }
48   XBT_INFO("  I'm done. See you!");
49   return 0;
50 }
51
52 static int commTX(int /*argc*/, char** /*argv*/)
53 {
54   const char* mailbox = "comm";
55   XBT_INFO("  Start TX");
56   msg_task_t task = MSG_task_create("COMM", 0, 100000000, NULL);
57   MSG_task_dsend(task, mailbox, task_cleanup_handler);
58   // We should wait a bit (if not the process will end before the communication, hence an exception on the other side).
59   try {
60     MSG_process_sleep(30);
61   } catch (simgrid::HostFailureException& e) {
62     XBT_INFO("The host has died ... as expected.");
63   }
64   XBT_INFO("  TX done");
65   return 0;
66 }
67
68 static int commRX(int /*argc*/, char** /*argv*/)
69 {
70   msg_task_t task     = NULL;
71   const char* mailbox = "comm";
72   XBT_INFO("  Start RX");
73   msg_error_t error = MSG_task_receive(&(task), mailbox);
74   if (error == MSG_OK) {
75     XBT_INFO("  Receive message: %s", task->name);
76     MSG_task_destroy(task);
77   } else if (error == MSG_HOST_FAILURE) {
78     XBT_INFO("  Receive message: HOST_FAILURE");
79   } else if (error == MSG_TRANSFER_FAILURE) {
80     XBT_INFO("  Receive message: TRANSFER_FAILURE");
81   } else {
82     XBT_INFO("  Receive message: %u", static_cast<unsigned int>(error));
83   }
84   XBT_INFO("  RX Done");
85   return 0;
86 }
87
88 static int test_launcher(int /*argc*/, char** /*argv*/)
89 {
90   int test = 0;
91   char** argvF;
92   msg_host_t jupiter = MSG_host_by_name("Jupiter");
93
94   test = 1;
95   // Create a process running a simple task on a host and turn the host off during the execution of the process.
96   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
97     XBT_INFO("Test 1:");
98     XBT_INFO("  Create a process on Jupiter");
99     argvF    = xbt_new(char*, 2);
100     argvF[0] = xbt_strdup("process_daemon");
101     MSG_process_create_with_arguments("process_daemon", process_daemon, NULL, jupiter, 1, argvF);
102     MSG_process_sleep(3);
103     XBT_INFO("  Turn off Jupiter");
104     MSG_host_off(jupiter);
105     MSG_process_sleep(10);
106     XBT_INFO("Test 1 seems ok, cool !(#Processes: %d, it should be 1; #tasks: %d)", MSG_process_get_number(),
107              tasks_done);
108   }
109
110   test = 2;
111   // Create a process that on a host that is turned off (this should not be possible)
112   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
113     XBT_INFO("Test 2:");
114     XBT_INFO("  Turn off Jupiter");
115     // adsein: Jupiter is already, hence nothing should happen
116     // adsein: This can be one additional test, to check that you cannot shutdown twice a host
117     MSG_host_off(jupiter);
118     argvF    = xbt_new(char*, 2);
119     argvF[0] = xbt_strdup("process_daemon");
120     MSG_process_create_with_arguments("process_daemon", process_daemon, NULL, jupiter, 1, argvF);
121     MSG_process_sleep(10);
122     XBT_INFO("  Test 2 does not crash as it should (number of Process : %d, it should be 1)", MSG_process_get_number());
123     XBT_INFO("  Ok so let's turn on/off the node to see whether the process is correctly bound to Jupiter");
124     MSG_host_on(jupiter);
125     XBT_INFO("  Turn off");
126     MSG_host_off(jupiter);
127     XBT_INFO("  sleep");
128     MSG_process_sleep(10);
129     XBT_INFO("number of Process : %d it should be 1. The daemon that has been created for test2 has been correctly "
130              "destroyed....ok at least it looks rigorous, cool ! You just have to disallow the possibility to create "
131              "a new process on a node when the node is off.)",
132              MSG_process_get_number());
133   }
134
135   test = 3;
136   // Create a process running sucessive sleeps on a host and turn the host off during the execution of the process.
137   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
138     XBT_INFO("Test 3:");
139     MSG_host_on(jupiter);
140     argvF    = xbt_new(char*, 2);
141     argvF[0] = xbt_strdup("process_sleep");
142     MSG_process_create_with_arguments("process_sleep", process_sleep, NULL, jupiter, 1, argvF);
143     MSG_process_sleep(100);
144     XBT_INFO("  Turn off");
145     MSG_host_off(jupiter);
146     XBT_INFO("  sleep for 10 seconds");
147     MSG_process_sleep(10000);
148     XBT_INFO("number of Process : %d it should be 1 (i.e. the Test one))", MSG_process_get_number());
149   }
150
151   test = 4;
152   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
153     XBT_INFO("Test 4 (turn off src during a communication) : Create a Process/task to make a communication between "
154              "Jupiter and Tremblay and turn off Jupiter during the communication");
155     MSG_host_on(jupiter);
156     MSG_process_sleep(10);
157     argvF    = xbt_new(char*, 2);
158     argvF[0] = xbt_strdup("commRX");
159     MSG_process_create_with_arguments("commRX", commRX, NULL, MSG_host_by_name("Tremblay"), 1, argvF);
160     argvF    = xbt_new(char*, 2);
161     argvF[0] = xbt_strdup("commTX");
162     MSG_process_create_with_arguments("commTX", commTX, NULL, jupiter, 1, argvF);
163     XBT_INFO("  number of processes: %d", MSG_process_get_number());
164     MSG_process_sleep(10);
165     XBT_INFO("  Turn Jupiter off");
166     MSG_host_off(jupiter);
167     XBT_INFO("Test 4 is ok.  (number of Process : %d, it should be 1 or 2 if RX has not been satisfied)."
168              " An exception is raised when we turn off a node that has a process sleeping",
169              MSG_process_get_number());
170   }
171
172   test = 5;
173   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
174     XBT_INFO("Test 5 (turn off dest during a communication : Create a Process/task to make a communication between "
175              "Tremblay and Jupiter and turn off Jupiter during the communication");
176     MSG_host_on(jupiter);
177     MSG_process_sleep(10);
178     argvF    = xbt_new(char*, 2);
179     argvF[0] = xbt_strdup("commRX");
180     MSG_process_create_with_arguments("commRX", commRX, NULL, jupiter, 1, argvF);
181     argvF    = xbt_new(char*, 2);
182     argvF[0] = xbt_strdup("commTX");
183     MSG_process_create_with_arguments("commTX", commTX, NULL, MSG_host_by_name("Tremblay"), 1, argvF);
184     XBT_INFO("  number of processes: %d", MSG_process_get_number());
185     MSG_process_sleep(10);
186     XBT_INFO("  Turn Jupiter off");
187     MSG_host_off(jupiter);
188     XBT_INFO("Test 5 seems ok (number of Process: %d, it should be 2)", MSG_process_get_number());
189   }
190
191   test = 6;
192   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
193     XBT_INFO("Test 6: Turn on Jupiter, assign a VM on Jupiter, launch a process inside the VM, and turn off the node");
194
195     // Create VM0
196     msg_vm_t vm0 = MSG_vm_create_core(jupiter, "vm0");
197     MSG_vm_start(vm0);
198
199     argvF    = xbt_new(char*, 2);
200     argvF[0] = xbt_strdup("process_daemon");
201     msg_process_t daemon =
202         MSG_process_create_with_arguments("process_daemon", process_daemon, NULL, (msg_host_t)vm0, 1, argvF);
203
204     argvF    = xbt_new(char*, 2);
205     argvF[0] = xbt_strdup("process_daemonJUPI");
206     MSG_process_create_with_arguments("process_daemonJUPI", process_daemon, NULL, jupiter, 1, argvF);
207
208     MSG_process_suspend(daemon);
209     MSG_vm_set_bound(vm0, 90);
210     MSG_process_resume(daemon);
211
212     MSG_process_sleep(10);
213
214     XBT_INFO("  Turn Jupiter off");
215     MSG_host_off(jupiter);
216     XBT_INFO("  Shutdown vm0");
217     MSG_vm_shutdown(vm0);
218     XBT_INFO("  Destroy vm0");
219     MSG_vm_destroy(vm0);
220     XBT_INFO("Test 6 is also weird: when the node Jupiter is turned off once again, the VM and its daemon are not "
221              "killed. However, the issue regarding the shutdown of hosted VMs can be seen a feature not a bug ;)");
222   }
223
224   XBT_INFO("  Test done. See you!");
225   return 0;
226 }
227
228 int main(int argc, char* argv[])
229 {
230   msg_error_t res;
231
232   MSG_init(&argc, argv);
233   xbt_assert(argc == 3, "Usage: %s platform_file test_number\n\tExample: %s msg_platform.xml 1\n", argv[0], argv[0]);
234
235   unsigned int iter;
236   char* groups;
237   xbt_dynar_t s_tests = xbt_str_split(argv[2], ",");
238   int tmp_test        = 0;
239   tests               = xbt_dynar_new(sizeof(int), NULL);
240   xbt_dynar_foreach (s_tests, iter, groups) {
241     sscanf(xbt_dynar_get_as(s_tests, iter, char*), "%d", &tmp_test);
242     xbt_dynar_set_as(tests, iter, int, tmp_test);
243   }
244   xbt_dynar_free(&s_tests);
245
246   MSG_create_environment(argv[1]);
247
248   MSG_process_create("test_launcher", test_launcher, NULL, MSG_get_host_by_name("Tremblay"));
249
250   res = MSG_main();
251
252   XBT_INFO("Simulation time %g", MSG_get_clock());
253   xbt_dynar_free(&tests);
254
255   return res != MSG_OK;
256 }