Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
MSG_process_sleep should intercept HostFailureException and report it accordingly
[simgrid.git] / teshsuite / msg / host_on_off_processes / host_on_off_processes.cpp
1 /* Copyright (c) 2010-2018. The SimGrid Team. All rights reserved.          */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 #include "simgrid/Exception.hpp"
7 #include "simgrid/msg.h"
8
9 #include <stdio.h> /* sscanf */
10
11 XBT_LOG_NEW_DEFAULT_CATEGORY(msg_test, "Messages specific for this msg example");
12
13 xbt_dynar_t tests;
14 int tasks_done = 0;
15
16 static void task_cleanup_handler(void* task)
17 {
18   if (task)
19     MSG_task_destroy(static_cast<msg_task_t>(task));
20 }
21
22 static int process_daemon(int /*argc*/, char** /*argv*/)
23 {
24   msg_process_t self = MSG_process_self();
25   XBT_INFO("  Start daemon on %s (%f)", MSG_host_get_name(MSG_host_self()), MSG_host_get_speed(MSG_host_self()));
26   for (;;) {
27     msg_task_t task = MSG_task_create("daemon", MSG_host_get_speed(MSG_host_self()), 0, NULL);
28     MSG_process_set_data(self, task);
29     XBT_INFO("  Execute daemon");
30     msg_error_t res = MSG_task_execute(task);
31     MSG_task_destroy(task);
32     tasks_done++;
33     if (res == MSG_HOST_FAILURE) {
34       XBT_INFO("Host as died as expected, do nothing else");
35       return 0;
36     }
37   }
38   XBT_INFO("  daemon done. See you!");
39   return 0;
40 }
41
42 static int process_sleep(int /*argc*/, char** /*argv*/)
43 {
44   for (;;) {
45     XBT_INFO("  I'm alive but I should sleep");
46     int res = MSG_process_sleep(10);
47     if (res == MSG_HOST_FAILURE) {
48       XBT_INFO("Host as died as expected, do nothing else");
49       return 0;
50     }
51   }
52   XBT_INFO("  I'm done. See you!");
53   return 0;
54 }
55
56 static int commTX(int /*argc*/, char** /*argv*/)
57 {
58   const char* mailbox = "comm";
59   XBT_INFO("  Start TX");
60   msg_task_t task = MSG_task_create("COMM", 0, 100000000, NULL);
61   MSG_task_dsend(task, mailbox, task_cleanup_handler);
62   // We should wait a bit (if not the process will end before the communication, hence an exception on the other side).
63   int res = MSG_process_sleep(30);
64   if (res == MSG_HOST_FAILURE) {
65     XBT_INFO("The host has died ... as expected.");
66   }
67   XBT_INFO("  TX done");
68   return 0;
69 }
70
71 static int commRX(int /*argc*/, char** /*argv*/)
72 {
73   msg_task_t task     = NULL;
74   const char* mailbox = "comm";
75   XBT_INFO("  Start RX");
76   msg_error_t error = MSG_task_receive(&(task), mailbox);
77   if (error == MSG_OK) {
78     XBT_INFO("  Receive message: %s", task->name);
79     MSG_task_destroy(task);
80   } else if (error == MSG_HOST_FAILURE) {
81     XBT_INFO("  Receive message: HOST_FAILURE");
82   } else if (error == MSG_TRANSFER_FAILURE) {
83     XBT_INFO("  Receive message: TRANSFER_FAILURE");
84   } else {
85     XBT_INFO("  Receive message: %u", static_cast<unsigned int>(error));
86   }
87   XBT_INFO("  RX Done");
88   return 0;
89 }
90
91 static int test_launcher(int /*argc*/, char** /*argv*/)
92 {
93   int test = 0;
94   char** argvF;
95   msg_host_t jupiter = MSG_host_by_name("Jupiter");
96
97   test = 1;
98   // Create a process running a simple task on a host and turn the host off during the execution of the process.
99   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
100     XBT_INFO("Test 1:");
101     XBT_INFO("  Create a process on Jupiter");
102     argvF    = xbt_new(char*, 2);
103     argvF[0] = xbt_strdup("process_daemon");
104     MSG_process_create_with_arguments("process_daemon", process_daemon, NULL, jupiter, 1, argvF);
105     MSG_process_sleep(3);
106     XBT_INFO("  Turn off Jupiter");
107     MSG_host_off(jupiter);
108     MSG_process_sleep(10);
109     XBT_INFO("Test 1 seems ok, cool !(#Processes: %d, it should be 1; #tasks: %d)", MSG_process_get_number(),
110              tasks_done);
111   }
112
113   test = 2;
114   // Create a process that on a host that is turned off (this should not be possible)
115   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
116     XBT_INFO("Test 2:");
117     XBT_INFO("  Turn off Jupiter");
118     // adsein: Jupiter is already, hence nothing should happen
119     // adsein: This can be one additional test, to check that you cannot shutdown twice a host
120     MSG_host_off(jupiter);
121     argvF    = xbt_new(char*, 2);
122     argvF[0] = xbt_strdup("process_daemon");
123     MSG_process_create_with_arguments("process_daemon", process_daemon, NULL, jupiter, 1, argvF);
124     MSG_process_sleep(10);
125     XBT_INFO("  Test 2 does not crash as it should (number of Process : %d, it should be 1)", MSG_process_get_number());
126     XBT_INFO("  Ok so let's turn on/off the node to see whether the process is correctly bound to Jupiter");
127     MSG_host_on(jupiter);
128     XBT_INFO("  Turn off");
129     MSG_host_off(jupiter);
130     XBT_INFO("  sleep");
131     MSG_process_sleep(10);
132     XBT_INFO("number of Process : %d it should be 1. The daemon that has been created for test2 has been correctly "
133              "destroyed....ok at least it looks rigorous, cool ! You just have to disallow the possibility to create "
134              "a new process on a node when the node is off.)",
135              MSG_process_get_number());
136   }
137
138   test = 3;
139   // Create a process running sucessive sleeps on a host and turn the host off during the execution of the process.
140   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
141     XBT_INFO("Test 3:");
142     MSG_host_on(jupiter);
143     argvF    = xbt_new(char*, 2);
144     argvF[0] = xbt_strdup("process_sleep");
145     MSG_process_create_with_arguments("process_sleep", process_sleep, NULL, jupiter, 1, argvF);
146     MSG_process_sleep(100);
147     XBT_INFO("  Turn off");
148     MSG_host_off(jupiter);
149     XBT_INFO("  sleep for 10 seconds");
150     MSG_process_sleep(10000);
151     XBT_INFO("number of Process : %d it should be 1 (i.e. the Test one))", MSG_process_get_number());
152   }
153
154   test = 4;
155   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
156     XBT_INFO("Test 4 (turn off src during a communication) : Create a Process/task to make a communication between "
157              "Jupiter and Tremblay and turn off Jupiter during the communication");
158     MSG_host_on(jupiter);
159     MSG_process_sleep(10);
160     argvF    = xbt_new(char*, 2);
161     argvF[0] = xbt_strdup("commRX");
162     MSG_process_create_with_arguments("commRX", commRX, NULL, MSG_host_by_name("Tremblay"), 1, argvF);
163     argvF    = xbt_new(char*, 2);
164     argvF[0] = xbt_strdup("commTX");
165     MSG_process_create_with_arguments("commTX", commTX, NULL, jupiter, 1, argvF);
166     XBT_INFO("  number of processes: %d", MSG_process_get_number());
167     MSG_process_sleep(10);
168     XBT_INFO("  Turn Jupiter off");
169     MSG_host_off(jupiter);
170     XBT_INFO("Test 4 is ok.  (number of Process : %d, it should be 1 or 2 if RX has not been satisfied)."
171              " An exception is raised when we turn off a node that has a process sleeping",
172              MSG_process_get_number());
173   }
174
175   test = 5;
176   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
177     XBT_INFO("Test 5 (turn off dest during a communication : Create a Process/task to make a communication between "
178              "Tremblay and Jupiter and turn off Jupiter during the communication");
179     MSG_host_on(jupiter);
180     MSG_process_sleep(10);
181     argvF    = xbt_new(char*, 2);
182     argvF[0] = xbt_strdup("commRX");
183     MSG_process_create_with_arguments("commRX", commRX, NULL, jupiter, 1, argvF);
184     argvF    = xbt_new(char*, 2);
185     argvF[0] = xbt_strdup("commTX");
186     MSG_process_create_with_arguments("commTX", commTX, NULL, MSG_host_by_name("Tremblay"), 1, argvF);
187     XBT_INFO("  number of processes: %d", MSG_process_get_number());
188     MSG_process_sleep(10);
189     XBT_INFO("  Turn Jupiter off");
190     MSG_host_off(jupiter);
191     XBT_INFO("Test 5 seems ok (number of Process: %d, it should be 2)", MSG_process_get_number());
192   }
193
194   test = 6;
195   if (xbt_dynar_search_or_negative(tests, &test) != -1) {
196     XBT_INFO("Test 6: Turn on Jupiter, assign a VM on Jupiter, launch a process inside the VM, and turn off the node");
197
198     // Create VM0
199     msg_vm_t vm0 = MSG_vm_create_core(jupiter, "vm0");
200     MSG_vm_start(vm0);
201
202     argvF    = xbt_new(char*, 2);
203     argvF[0] = xbt_strdup("process_daemon");
204     msg_process_t daemon =
205         MSG_process_create_with_arguments("process_daemon", process_daemon, NULL, (msg_host_t)vm0, 1, argvF);
206
207     argvF    = xbt_new(char*, 2);
208     argvF[0] = xbt_strdup("process_daemonJUPI");
209     MSG_process_create_with_arguments("process_daemonJUPI", process_daemon, NULL, jupiter, 1, argvF);
210
211     MSG_process_suspend(daemon);
212     MSG_vm_set_bound(vm0, 90);
213     MSG_process_resume(daemon);
214
215     MSG_process_sleep(10);
216
217     XBT_INFO("  Turn Jupiter off");
218     MSG_host_off(jupiter);
219     XBT_INFO("  Shutdown vm0");
220     MSG_vm_shutdown(vm0);
221     XBT_INFO("  Destroy vm0");
222     MSG_vm_destroy(vm0);
223     XBT_INFO("Test 6 is also weird: when the node Jupiter is turned off once again, the VM and its daemon are not "
224              "killed. However, the issue regarding the shutdown of hosted VMs can be seen a feature not a bug ;)");
225   }
226
227   XBT_INFO("  Test done. See you!");
228   return 0;
229 }
230
231 int main(int argc, char* argv[])
232 {
233   msg_error_t res;
234
235   MSG_init(&argc, argv);
236   xbt_assert(argc == 3, "Usage: %s platform_file test_number\n\tExample: %s msg_platform.xml 1\n", argv[0], argv[0]);
237
238   unsigned int iter;
239   char* groups;
240   xbt_dynar_t s_tests = xbt_str_split(argv[2], ",");
241   int tmp_test        = 0;
242   tests               = xbt_dynar_new(sizeof(int), NULL);
243   xbt_dynar_foreach (s_tests, iter, groups) {
244     sscanf(xbt_dynar_get_as(s_tests, iter, char*), "%d", &tmp_test);
245     xbt_dynar_set_as(tests, iter, int, tmp_test);
246   }
247   xbt_dynar_free(&s_tests);
248
249   MSG_create_environment(argv[1]);
250
251   MSG_process_create("test_launcher", test_launcher, NULL, MSG_get_host_by_name("Tremblay"));
252
253   res = MSG_main();
254
255   XBT_INFO("Simulation time %g", MSG_get_clock());
256   xbt_dynar_free(&tests);
257
258   return res != MSG_OK;
259 }