Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
move VM into their namespace, and greatly reduce the amount of sg_host_get_name ...
[simgrid.git] / examples / msg / platform-failures / platform-failures.tesh
1 #! ./tesh
2
3 p Testing a simple master/worker example application handling failures TCP crosstraffic DISABLED
4
5 ! output sort 19
6 $ $SG_TEST_EXENV ${bindir:=.}/platform-failures$EXEEXT --log=xbt_cfg.thres:critical --log=no_loc ${srcdir:=.}/small_platform_with_failures.xml ${srcdir:=.}/../msg/app-masterworker/app-masterworker_d.xml --cfg=path:${srcdir} --cfg=network/crosstraffic:0 "--log=root.fmt:[%10.6r]%e(%i:%P@%h)%e%m%n"
7 > [  0.000000] (0:maestro@) Cannot launch process 'worker' on failed host 'Fafard'
8 > [  0.000000] (1:master@Tremblay) Got 5 workers and 20 tasks to process
9 > [  0.010309] (1:master@Tremblay) Send completed
10 > [  0.010309] (2:worker@Tremblay) Received "Task"
11 > [  0.010309] (2:worker@Tremblay) Communication time : "0.010309"
12 > [  0.010309] (2:worker@Tremblay) Processing "Task"
13 > [  1.000000] (0:maestro@) Restart processes on host Fafard
14 > [  1.000000] (1:master@Tremblay) Mmh. Something went wrong with 'worker-1'. Nevermind. Let's keep going!
15 > [  1.000000] (3:worker@Jupiter) Gloups. The cpu on which I'm running just turned off!. See you!
16 > [  2.000000] (0:maestro@) Restart processes on host Jupiter
17 > [  2.010309] (2:worker@Tremblay) "Task" done
18 > [ 11.000000] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
19 > [ 12.030928] (1:master@Tremblay) Send completed
20 > [ 12.030928] (4:worker@Ginette) Received "Task"
21 > [ 12.030928] (4:worker@Ginette) Communication time : "1.030928"
22 > [ 12.030928] (4:worker@Ginette) Processing "Task"
23 > [ 13.061856] (1:master@Tremblay) Send completed
24 > [ 13.061856] (5:worker@Bourassa) Received "Task"
25 > [ 13.061856] (5:worker@Bourassa) Communication time : "1.030928"
26 > [ 13.061856] (5:worker@Bourassa) Processing "Task"
27 > [ 13.072165] (1:master@Tremblay) Send completed
28 > [ 13.072165] (2:worker@Tremblay) Received "Task"
29 > [ 13.072165] (2:worker@Tremblay) Communication time : "0.010309"
30 > [ 13.072165] (2:worker@Tremblay) Processing "Task"
31 > [ 14.030928] (4:worker@Ginette) "Task" done
32 > [ 14.103093] (1:master@Tremblay) Send completed
33 > [ 14.103093] (6:worker@Jupiter) Received "Task"
34 > [ 14.103093] (6:worker@Jupiter) Communication time : "1.030928"
35 > [ 14.103093] (6:worker@Jupiter) Processing "Task"
36 > [ 15.061856] (5:worker@Bourassa) "Task" done
37 > [ 15.072165] (2:worker@Tremblay) "Task" done
38 > [ 16.103093] (6:worker@Jupiter) "Task" done
39 > [ 24.103093] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
40 > [ 24.103093] (1:master@Tremblay) Mmh. Something went wrong with 'worker-3'. Nevermind. Let's keep going!
41 > [ 24.103093] (4:worker@Ginette) Mmh. Something went wrong. Nevermind. Let's keep going!
42 > [ 25.134021] (1:master@Tremblay) Send completed
43 > [ 25.134021] (5:worker@Bourassa) Received "Task"
44 > [ 25.134021] (5:worker@Bourassa) Communication time : "1.030928"
45 > [ 25.134021] (5:worker@Bourassa) Processing "Task"
46 > [ 25.144330] (1:master@Tremblay) Send completed
47 > [ 25.144330] (2:worker@Tremblay) Received "Task"
48 > [ 25.144330] (2:worker@Tremblay) Communication time : "0.010309"
49 > [ 25.144330] (2:worker@Tremblay) Processing "Task"
50 > [ 26.175258] (1:master@Tremblay) Send completed
51 > [ 26.175258] (6:worker@Jupiter) Received "Task"
52 > [ 26.175258] (6:worker@Jupiter) Communication time : "1.030928"
53 > [ 26.175258] (6:worker@Jupiter) Processing "Task"
54 > [ 27.134021] (5:worker@Bourassa) "Task" done
55 > [ 27.144330] (2:worker@Tremblay) "Task" done
56 > [ 28.175258] (6:worker@Jupiter) "Task" done
57 > [ 36.175258] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
58 > [ 37.206186] (1:master@Tremblay) Send completed
59 > [ 37.206186] (1:master@Tremblay) Mmh. Something went wrong with 'worker-4'. Nevermind. Let's keep going!
60 > [ 37.206186] (4:worker@Ginette) Received "Task"
61 > [ 37.206186] (4:worker@Ginette) Communication time : "1.030928"
62 > [ 37.206186] (4:worker@Ginette) Processing "Task"
63 > [ 37.206186] (5:worker@Bourassa) Mmh. Something went wrong. Nevermind. Let's keep going!
64 > [ 37.216495] (1:master@Tremblay) Send completed
65 > [ 37.216495] (2:worker@Tremblay) Received "Task"
66 > [ 37.216495] (2:worker@Tremblay) Communication time : "0.010309"
67 > [ 37.216495] (2:worker@Tremblay) Processing "Task"
68 > [ 38.247423] (1:master@Tremblay) Send completed
69 > [ 38.247423] (6:worker@Jupiter) Received "Task"
70 > [ 38.247423] (6:worker@Jupiter) Communication time : "1.030928"
71 > [ 38.247423] (6:worker@Jupiter) Processing "Task"
72 > [ 39.206186] (4:worker@Ginette) "Task" done
73 > [ 39.216495] (2:worker@Tremblay) "Task" done
74 > [ 40.247423] (6:worker@Jupiter) "Task" done
75 > [ 48.247423] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
76 > [ 49.278351] (1:master@Tremblay) Send completed
77 > [ 49.278351] (4:worker@Ginette) Received "Task"
78 > [ 49.278351] (4:worker@Ginette) Communication time : "1.030928"
79 > [ 49.278351] (4:worker@Ginette) Processing "Task"
80 > [ 50.000000] (4:worker@Ginette) Gloups. The cpu on which I'm running just turned off!. See you!
81 > [ 50.309278] (1:master@Tremblay) Send completed
82 > [ 50.309278] (1:master@Tremblay) All tasks have been dispatched. Let's tell everybody the computation is over.
83 > [ 50.309278] (2:worker@Tremblay) Received "finalize"
84 > [ 50.309278] (2:worker@Tremblay) I'm done. See you!
85 > [ 50.309278] (5:worker@Bourassa) Received "Task"
86 > [ 50.309278] (5:worker@Bourassa) Communication time : "1.030928"
87 > [ 50.309278] (5:worker@Bourassa) Processing "Task"
88 > [ 50.309278] (6:worker@Jupiter) Received "finalize"
89 > [ 50.309278] (6:worker@Jupiter) I'm done. See you!
90 > [ 51.309278] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
91 > [ 52.309278] (0:maestro@) Simulation time 52.3093
92 > [ 52.309278] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-3'. Nevermind. Let's keep going!
93 > [ 52.309278] (1:master@Tremblay) Goodbye now!
94 > [ 52.309278] (5:worker@Bourassa) "Task" done
95 > [ 52.309278] (5:worker@Bourassa) Received "finalize"
96 > [ 52.309278] (5:worker@Bourassa) I'm done. See you!
97
98 p Testing a simple master/worker example application handling failures. TCP crosstraffic ENABLED
99
100 ! output sort 19
101 $ $SG_TEST_EXENV ${bindir:=.}/platform-failures$EXEEXT --log=xbt_cfg.thres:critical --log=no_loc ${srcdir:=.}/small_platform_with_failures.xml ${srcdir:=.}/../msg/app-masterworker/app-masterworker_d.xml --cfg=path:${srcdir} "--log=root.fmt:[%10.6r]%e(%i:%P@%h)%e%m%n"
102 > [  0.000000] (0:maestro@) Cannot launch process 'worker' on failed host 'Fafard'
103 > [  0.000000] (1:master@Tremblay) Got 5 workers and 20 tasks to process
104 > [  0.010825] (1:master@Tremblay) Send completed
105 > [  0.010825] (2:worker@Tremblay) Received "Task"
106 > [  0.010825] (2:worker@Tremblay) Communication time : "0.010825"
107 > [  0.010825] (2:worker@Tremblay) Processing "Task"
108 > [  1.000000] (0:maestro@) Restart processes on host Fafard
109 > [  1.000000] (1:master@Tremblay) Mmh. Something went wrong with 'worker-1'. Nevermind. Let's keep going!
110 > [  1.000000] (3:worker@Jupiter) Gloups. The cpu on which I'm running just turned off!. See you!
111 > [  2.000000] (0:maestro@) Restart processes on host Jupiter
112 > [  2.010825] (2:worker@Tremblay) "Task" done
113 > [ 11.000000] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
114 > [ 12.082474] (1:master@Tremblay) Send completed
115 > [ 12.082474] (4:worker@Ginette) Received "Task"
116 > [ 12.082474] (4:worker@Ginette) Communication time : "1.082474"
117 > [ 12.082474] (4:worker@Ginette) Processing "Task"
118 > [ 13.164948] (1:master@Tremblay) Send completed
119 > [ 13.164948] (5:worker@Bourassa) Received "Task"
120 > [ 13.164948] (5:worker@Bourassa) Communication time : "1.082474"
121 > [ 13.164948] (5:worker@Bourassa) Processing "Task"
122 > [ 13.175773] (1:master@Tremblay) Send completed
123 > [ 13.175773] (2:worker@Tremblay) Received "Task"
124 > [ 13.175773] (2:worker@Tremblay) Communication time : "0.010825"
125 > [ 13.175773] (2:worker@Tremblay) Processing "Task"
126 > [ 14.082474] (4:worker@Ginette) "Task" done
127 > [ 14.258247] (1:master@Tremblay) Send completed
128 > [ 14.258247] (6:worker@Jupiter) Received "Task"
129 > [ 14.258247] (6:worker@Jupiter) Communication time : "1.082474"
130 > [ 14.258247] (6:worker@Jupiter) Processing "Task"
131 > [ 15.164948] (5:worker@Bourassa) "Task" done
132 > [ 15.175773] (2:worker@Tremblay) "Task" done
133 > [ 16.258247] (6:worker@Jupiter) "Task" done
134 > [ 24.258247] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
135 > [ 24.258247] (1:master@Tremblay) Mmh. Something went wrong with 'worker-3'. Nevermind. Let's keep going!
136 > [ 24.258247] (4:worker@Ginette) Mmh. Something went wrong. Nevermind. Let's keep going!
137 > [ 25.340722] (1:master@Tremblay) Send completed
138 > [ 25.340722] (5:worker@Bourassa) Received "Task"
139 > [ 25.340722] (5:worker@Bourassa) Communication time : "1.082474"
140 > [ 25.340722] (5:worker@Bourassa) Processing "Task"
141 > [ 25.351546] (1:master@Tremblay) Send completed
142 > [ 25.351546] (2:worker@Tremblay) Received "Task"
143 > [ 25.351546] (2:worker@Tremblay) Communication time : "0.010825"
144 > [ 25.351546] (2:worker@Tremblay) Processing "Task"
145 > [ 26.434021] (1:master@Tremblay) Send completed
146 > [ 26.434021] (6:worker@Jupiter) Received "Task"
147 > [ 26.434021] (6:worker@Jupiter) Communication time : "1.082474"
148 > [ 26.434021] (6:worker@Jupiter) Processing "Task"
149 > [ 27.340722] (5:worker@Bourassa) "Task" done
150 > [ 27.351546] (2:worker@Tremblay) "Task" done
151 > [ 28.434021] (6:worker@Jupiter) "Task" done
152 > [ 36.434021] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
153 > [ 37.516495] (1:master@Tremblay) Send completed
154 > [ 37.516495] (1:master@Tremblay) Mmh. Something went wrong with 'worker-4'. Nevermind. Let's keep going!
155 > [ 37.516495] (4:worker@Ginette) Received "Task"
156 > [ 37.516495] (4:worker@Ginette) Communication time : "1.082474"
157 > [ 37.516495] (4:worker@Ginette) Processing "Task"
158 > [ 37.516495] (5:worker@Bourassa) Mmh. Something went wrong. Nevermind. Let's keep going!
159 > [ 37.527320] (1:master@Tremblay) Send completed
160 > [ 37.527320] (2:worker@Tremblay) Received "Task"
161 > [ 37.527320] (2:worker@Tremblay) Communication time : "0.010825"
162 > [ 37.527320] (2:worker@Tremblay) Processing "Task"
163 > [ 38.609794] (1:master@Tremblay) Send completed
164 > [ 38.609794] (6:worker@Jupiter) Received "Task"
165 > [ 38.609794] (6:worker@Jupiter) Communication time : "1.082474"
166 > [ 38.609794] (6:worker@Jupiter) Processing "Task"
167 > [ 39.516495] (4:worker@Ginette) "Task" done
168 > [ 39.527320] (2:worker@Tremblay) "Task" done
169 > [ 40.609794] (6:worker@Jupiter) "Task" done
170 > [ 48.609794] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
171 > [ 49.692268] (1:master@Tremblay) Send completed
172 > [ 49.692268] (4:worker@Ginette) Received "Task"
173 > [ 49.692268] (4:worker@Ginette) Communication time : "1.082474"
174 > [ 49.692268] (4:worker@Ginette) Processing "Task"
175 > [ 50.000000] (4:worker@Ginette) Gloups. The cpu on which I'm running just turned off!. See you!
176 > [ 50.774742] (1:master@Tremblay) Send completed
177 > [ 50.774742] (1:master@Tremblay) All tasks have been dispatched. Let's tell everybody the computation is over.
178 > [ 50.774742] (2:worker@Tremblay) Received "finalize"
179 > [ 50.774742] (2:worker@Tremblay) I'm done. See you!
180 > [ 50.774742] (5:worker@Bourassa) Received "Task"
181 > [ 50.774742] (5:worker@Bourassa) Communication time : "1.082474"
182 > [ 50.774742] (5:worker@Bourassa) Processing "Task"
183 > [ 50.774742] (6:worker@Jupiter) Received "finalize"
184 > [ 50.774742] (6:worker@Jupiter) I'm done. See you!
185 > [ 51.774742] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
186 > [ 52.774742] (0:maestro@) Simulation time 52.7747
187 > [ 52.774742] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-3'. Nevermind. Let's keep going!
188 > [ 52.774742] (1:master@Tremblay) Goodbye now!
189 > [ 52.774742] (5:worker@Bourassa) "Task" done
190 > [ 52.774742] (5:worker@Bourassa) Received "finalize"
191 > [ 52.774742] (5:worker@Bourassa) I'm done. See you!
192
193 p Testing a simple master/worker example application handling failures. CPU_TI optimization enabled
194
195 ! output sort 19
196 $ $SG_TEST_EXENV ${bindir:=.}/platform-failures$EXEEXT --log=xbt_cfg.thres:critical --log=no_loc ${srcdir:=.}/small_platform_with_failures.xml ${srcdir:=.}/../msg/app-masterworker/app-masterworker_d.xml --cfg=path:${srcdir} -cfg=cpu/optim:TI "--log=root.fmt:[%10.6r]%e(%i:%P@%h)%e%m%n"
197 > [  0.000000] (0:maestro@) Cannot launch process 'worker' on failed host 'Fafard'
198 > [  0.000000] (1:master@Tremblay) Got 5 workers and 20 tasks to process
199 > [  0.010825] (1:master@Tremblay) Send completed
200 > [  0.010825] (2:worker@Tremblay) Received "Task"
201 > [  0.010825] (2:worker@Tremblay) Communication time : "0.010825"
202 > [  0.010825] (2:worker@Tremblay) Processing "Task"
203 > [  1.000000] (0:maestro@) Restart processes on host Fafard
204 > [  1.000000] (1:master@Tremblay) Mmh. Something went wrong with 'worker-1'. Nevermind. Let's keep going!
205 > [  1.000000] (3:worker@Jupiter) Gloups. The cpu on which I'm running just turned off!. See you!
206 > [  2.000000] (0:maestro@) Restart processes on host Jupiter
207 > [  2.010825] (2:worker@Tremblay) "Task" done
208 > [ 11.000000] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
209 > [ 12.082474] (1:master@Tremblay) Send completed
210 > [ 12.082474] (4:worker@Ginette) Received "Task"
211 > [ 12.082474] (4:worker@Ginette) Communication time : "1.082474"
212 > [ 12.082474] (4:worker@Ginette) Processing "Task"
213 > [ 13.164948] (1:master@Tremblay) Send completed
214 > [ 13.164948] (5:worker@Bourassa) Received "Task"
215 > [ 13.164948] (5:worker@Bourassa) Communication time : "1.082474"
216 > [ 13.164948] (5:worker@Bourassa) Processing "Task"
217 > [ 13.175773] (1:master@Tremblay) Send completed
218 > [ 13.175773] (2:worker@Tremblay) Received "Task"
219 > [ 13.175773] (2:worker@Tremblay) Communication time : "0.010825"
220 > [ 13.175773] (2:worker@Tremblay) Processing "Task"
221 > [ 14.082474] (4:worker@Ginette) "Task" done
222 > [ 14.258247] (1:master@Tremblay) Send completed
223 > [ 14.258247] (6:worker@Jupiter) Received "Task"
224 > [ 14.258247] (6:worker@Jupiter) Communication time : "1.082474"
225 > [ 14.258247] (6:worker@Jupiter) Processing "Task"
226 > [ 15.164948] (5:worker@Bourassa) "Task" done
227 > [ 15.175773] (2:worker@Tremblay) "Task" done
228 > [ 16.258247] (6:worker@Jupiter) "Task" done
229 > [ 24.258247] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
230 > [ 24.258247] (1:master@Tremblay) Mmh. Something went wrong with 'worker-3'. Nevermind. Let's keep going!
231 > [ 24.258247] (4:worker@Ginette) Mmh. Something went wrong. Nevermind. Let's keep going!
232 > [ 25.340722] (1:master@Tremblay) Send completed
233 > [ 25.340722] (5:worker@Bourassa) Received "Task"
234 > [ 25.340722] (5:worker@Bourassa) Communication time : "1.082474"
235 > [ 25.340722] (5:worker@Bourassa) Processing "Task"
236 > [ 25.351546] (1:master@Tremblay) Send completed
237 > [ 25.351546] (2:worker@Tremblay) Received "Task"
238 > [ 25.351546] (2:worker@Tremblay) Communication time : "0.010825"
239 > [ 25.351546] (2:worker@Tremblay) Processing "Task"
240 > [ 26.434021] (1:master@Tremblay) Send completed
241 > [ 26.434021] (6:worker@Jupiter) Received "Task"
242 > [ 26.434021] (6:worker@Jupiter) Communication time : "1.082474"
243 > [ 26.434021] (6:worker@Jupiter) Processing "Task"
244 > [ 27.340722] (5:worker@Bourassa) "Task" done
245 > [ 27.351546] (2:worker@Tremblay) "Task" done
246 > [ 28.434021] (6:worker@Jupiter) "Task" done
247 > [ 36.434021] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
248 > [ 37.516495] (1:master@Tremblay) Send completed
249 > [ 37.516495] (1:master@Tremblay) Mmh. Something went wrong with 'worker-4'. Nevermind. Let's keep going!
250 > [ 37.516495] (4:worker@Ginette) Received "Task"
251 > [ 37.516495] (4:worker@Ginette) Communication time : "1.082474"
252 > [ 37.516495] (4:worker@Ginette) Processing "Task"
253 > [ 37.516495] (5:worker@Bourassa) Mmh. Something went wrong. Nevermind. Let's keep going!
254 > [ 37.527320] (1:master@Tremblay) Send completed
255 > [ 37.527320] (2:worker@Tremblay) Received "Task"
256 > [ 37.527320] (2:worker@Tremblay) Communication time : "0.010825"
257 > [ 37.527320] (2:worker@Tremblay) Processing "Task"
258 > [ 38.609794] (1:master@Tremblay) Send completed
259 > [ 38.609794] (6:worker@Jupiter) Received "Task"
260 > [ 38.609794] (6:worker@Jupiter) Communication time : "1.082474"
261 > [ 38.609794] (6:worker@Jupiter) Processing "Task"
262 > [ 39.516495] (4:worker@Ginette) "Task" done
263 > [ 39.527320] (2:worker@Tremblay) "Task" done
264 > [ 40.609794] (6:worker@Jupiter) "Task" done
265 > [ 48.609794] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
266 > [ 49.692268] (1:master@Tremblay) Send completed
267 > [ 49.692268] (4:worker@Ginette) Received "Task"
268 > [ 49.692268] (4:worker@Ginette) Communication time : "1.082474"
269 > [ 49.692268] (4:worker@Ginette) Processing "Task"
270 > [ 50.000000] (4:worker@Ginette) Gloups. The cpu on which I'm running just turned off!. See you!
271 > [ 50.774742] (1:master@Tremblay) Send completed
272 > [ 50.774742] (1:master@Tremblay) All tasks have been dispatched. Let's tell everybody the computation is over.
273 > [ 50.774742] (2:worker@Tremblay) Received "finalize"
274 > [ 50.774742] (2:worker@Tremblay) I'm done. See you!
275 > [ 50.774742] (5:worker@Bourassa) Received "Task"
276 > [ 50.774742] (5:worker@Bourassa) Communication time : "1.082474"
277 > [ 50.774742] (5:worker@Bourassa) Processing "Task"
278 > [ 50.774742] (6:worker@Jupiter) Received "finalize"
279 > [ 50.774742] (6:worker@Jupiter) I'm done. See you!
280 > [ 51.774742] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-2'. Nevermind. Let's keep going!
281 > [ 52.774742] (0:maestro@) Simulation time 52.7747
282 > [ 52.774742] (1:master@Tremblay) Mmh. Got timeouted while speaking to 'worker-3'. Nevermind. Let's keep going!
283 > [ 52.774742] (1:master@Tremblay) Goodbye now!
284 > [ 52.774742] (5:worker@Bourassa) "Task" done
285 > [ 52.774742] (5:worker@Bourassa) Received "finalize"
286 > [ 52.774742] (5:worker@Bourassa) I'm done. See you!