Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
65148e3079e89ecb7be41c94a660f83204fdf7a2
[simgrid.git] / examples / msg / masterslave / masterslave_failure.c
1 /*      $Id$     */
2
3 /* Copyright (c) 2002,2003,2004 Arnaud Legrand. All rights reserved.        */
4
5 /* This program is free software; you can redistribute it and/or modify it
6  * under the terms of the license (GNU LGPL) which comes with this package. */
7
8 #include <stdio.h>
9 #include "msg/msg.h"            /* Yeah! If you want to use msg, you need to include msg/msg.h */
10 #include "xbt/sysdep.h"         /* calloc, printf */
11
12 /* Create a log channel to have nice outputs. */
13 #include "xbt/log.h"
14 #include "xbt/asserts.h"
15 XBT_LOG_NEW_DEFAULT_CATEGORY(msg_test,
16                              "Messages specific for this msg example");
17
18 int master(int argc, char *argv[]);
19 int slave(int argc, char *argv[]);
20 int forwarder(int argc, char *argv[]);
21 MSG_error_t test_all(const char *platform_file, const char *application_file);
22
23 typedef enum {
24   PORT_22 = 0,
25   MAX_CHANNEL
26 } channel_t;
27
28 #define FINALIZE ((void*)221297)        /* a magic number to tell people to stop working */
29
30 /** Emitter function  */
31 int master(int argc, char *argv[])
32 {
33   int slaves_count = 0;
34   m_host_t *slaves = NULL;
35   int number_of_tasks = 0;
36   double task_comp_size = 0;
37   double task_comm_size = 0;
38
39
40   int i;
41
42   xbt_assert1(sscanf(argv[1], "%d", &number_of_tasks),
43               "Invalid argument %s\n", argv[1]);
44   xbt_assert1(sscanf(argv[2], "%lg", &task_comp_size),
45               "Invalid argument %s\n", argv[2]);
46   xbt_assert1(sscanf(argv[3], "%lg", &task_comm_size),
47               "Invalid argument %s\n", argv[3]);
48
49   {                             /* Process organisation */
50     slaves_count = argc - 4;
51     slaves = xbt_new0(m_host_t, slaves_count);
52
53     for (i = 4; i < argc; i++) {
54       slaves[i - 4] = MSG_get_host_by_name(argv[i]);
55       if (slaves[i - 4] == NULL) {
56         INFO1("Unknown host %s. Stopping Now! ", argv[i]);
57         abort();
58       }
59     }
60   }
61
62   INFO1("Got %d slave(s) :", slaves_count);
63   for (i = 0; i < slaves_count; i++)
64     INFO1("%s", slaves[i]->name);
65
66   INFO1("Got %d task to process :", number_of_tasks);
67
68   for (i = 0; i < number_of_tasks; i++) {
69     m_task_t task = MSG_task_create("Task", task_comp_size, task_comm_size,
70                                     xbt_new0(double, 1));
71     int a;
72     *((double *) task->data) = MSG_get_clock();
73
74     a =
75       MSG_task_put_with_timeout(task, slaves[i % slaves_count], PORT_22,
76                                 10.0);
77     if (a == MSG_OK) {
78       INFO0("Send completed");
79     } else if (a == MSG_HOST_FAILURE) {
80       INFO0
81         ("Gloups. The cpu on which I'm running just turned off!. See you!");
82       free(slaves);
83       return 0;
84     } else if (a == MSG_TRANSFER_FAILURE) {
85       INFO1
86         ("Mmh. Something went wrong with '%s'. Nevermind. Let's keep going!",
87          slaves[i % slaves_count]->name);
88       MSG_task_destroy(task);
89     } else if (a == MSG_TIMEOUT_FAILURE) {
90       INFO1
91         ("Mmh. Got timeouted while speaking to '%s'. Nevermind. Let's keep going!",
92          slaves[i % slaves_count]->name);
93       MSG_task_destroy(task);
94     } else {
95       INFO0("Hey ?! What's up ? ");
96       xbt_assert0(0, "Unexpected behavior");
97     }
98   }
99
100   INFO0
101     ("All tasks have been dispatched. Let's tell everybody the computation is over.");
102   for (i = 0; i < slaves_count; i++) {
103     m_task_t task = MSG_task_create("finalize", 0, 0, FINALIZE);
104     int a = MSG_task_put_with_timeout(task, slaves[i], PORT_22, 1.0);
105     if (a == MSG_OK)
106       continue;
107     if (a == MSG_HOST_FAILURE) {
108       INFO0
109         ("Gloups. The cpu on which I'm running just turned off!. See you!");
110       return 0;
111     } else if (a == MSG_TRANSFER_FAILURE) {
112       INFO1("Mmh. Can't reach '%s'! Nevermind. Let's keep going!",
113             slaves[i]->name);
114       MSG_task_destroy(task);
115     } else if (a == MSG_TIMEOUT_FAILURE) {
116       INFO1
117         ("Mmh. Got timeouted while speaking to '%s'. Nevermind. Let's keep going!",
118          slaves[i % slaves_count]->name);
119       MSG_task_destroy(task);
120     } else {
121       INFO0("Hey ?! What's up ? ");
122       xbt_assert2(0, "Unexpected behavior with '%s': %d", slaves[i]->name, a);
123     }
124   }
125
126   INFO0("Goodbye now!");
127   free(slaves);
128   return 0;
129 }                               /* end_of_master */
130
131 /** Receiver function  */
132 int slave(int argc, char *argv[])
133 {
134   while (1) {
135     m_task_t task = NULL;
136     int a;
137     double time1, time2;
138
139     time1 = MSG_get_clock();
140     a = MSG_task_get(&(task), PORT_22);
141     time2 = MSG_get_clock();
142     if (a == MSG_OK) {
143       INFO1("Received \"%s\"", MSG_task_get_name(task));
144       if (MSG_task_get_data(task) == FINALIZE) {
145         MSG_task_destroy(task);
146         break;
147       }
148       if (time1 < *((double *) task->data))
149         time1 = *((double *) task->data);
150       INFO1("Communication time : \"%f\"", time2 - time1);
151       INFO1("Processing \"%s\"", MSG_task_get_name(task));
152       a = MSG_task_execute(task);
153       if (a == MSG_OK) {
154         INFO1("\"%s\" done", MSG_task_get_name(task));
155         free(task->data);
156         MSG_task_destroy(task);
157       } else if (a == MSG_HOST_FAILURE) {
158         INFO0
159           ("Gloups. The cpu on which I'm running just turned off!. See you!");
160         return 0;
161       } else {
162         INFO0("Hey ?! What's up ? ");
163         xbt_assert0(0, "Unexpected behavior");
164       }
165     } else if (a == MSG_HOST_FAILURE) {
166       INFO0
167         ("Gloups. The cpu on which I'm running just turned off!. See you!");
168       return 0;
169     } else if (a == MSG_TRANSFER_FAILURE) {
170       INFO0("Mmh. Something went wrong. Nevermind. Let's keep going!");
171     } else {
172       INFO0("Hey ?! What's up ? ");
173       xbt_assert0(0, "Unexpected behavior");
174     }
175   }
176   INFO0("I'm done. See you!");
177   return 0;
178 }                               /* end_of_slave */
179
180 /** Test function */
181 MSG_error_t test_all(const char *platform_file, const char *application_file)
182 {
183   MSG_error_t res = MSG_OK;
184
185   /* MSG_config("workstation_model","KCCFLN05"); */
186   {                             /*  Simulation setting */
187     MSG_set_channel_number(MAX_CHANNEL);
188     MSG_create_environment(platform_file);
189   }
190   {                             /*   Application deployment */
191     MSG_function_register("master", master);
192     MSG_function_register("slave", slave);
193     MSG_launch_application(application_file);
194   }
195   res = MSG_main();
196
197   INFO1("Simulation time %g", MSG_get_clock());
198   return res;
199 }                               /* end_of_test_all */
200
201
202 /** Main function */
203 int main(int argc, char *argv[])
204 {
205   MSG_error_t res = MSG_OK;
206
207   MSG_global_init(&argc, argv);
208   if (argc < 3) {
209     printf("Usage: %s platform_file deployment_file\n", argv[0]);
210     printf("example: %s msg_platform.xml msg_deployment.xml\n", argv[0]);
211     exit(1);
212   }
213   res = test_all(argv[1], argv[2]);
214   MSG_clean();
215
216   if (res == MSG_OK)
217     return 0;
218   else
219     return 1;
220 }                               /* end_of_main */