Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
Preserve on_exit funcions between restarts.
[simgrid.git] / src / surf / HostImpl.cpp
1 /* Copyright (c) 2013-2019. The SimGrid Team. All rights reserved.          */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 #include "src/plugins/vm/VirtualMachineImpl.hpp"
7 #include "src/simix/smx_private.hpp"
8
9 #include <string>
10
11 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(surf_host, surf, "Logging specific to the SURF host module");
12
13 simgrid::surf::HostModel *surf_host_model = nullptr;
14
15 /*************
16  * Callbacks *t
17  *************/
18
19 namespace simgrid {
20 namespace surf {
21
22 /*********
23  * Model *
24  *********/
25 /* Helper function for executeParallelTask */
26 static inline double has_cost(const double* array, size_t pos)
27 {
28   if (array)
29     return array[pos];
30   else
31     return -1.0;
32 }
33
34 kernel::resource::Action* HostModel::execute_parallel(const std::vector<s4u::Host*>& host_list,
35                                                       const double* flops_amount, const double* bytes_amount,
36                                                       double rate)
37 {
38   kernel::resource::Action* action = nullptr;
39   if ((host_list.size() == 1) && (has_cost(bytes_amount, 0) <= 0) && (has_cost(flops_amount, 0) > 0)) {
40     action = host_list[0]->pimpl_cpu->execution_start(flops_amount[0]);
41   } else if ((host_list.size() == 1) && (has_cost(flops_amount, 0) <= 0)) {
42     action = surf_network_model->communicate(host_list[0], host_list[0], bytes_amount[0], rate);
43   } else if ((host_list.size() == 2) && (has_cost(flops_amount, 0) <= 0) && (has_cost(flops_amount, 1) <= 0)) {
44     int nb = 0;
45     double value = 0.0;
46
47     for (size_t i = 0; i < host_list.size() * host_list.size(); i++) {
48       if (has_cost(bytes_amount, i) > 0.0) {
49         nb++;
50         value = has_cost(bytes_amount, i);
51       }
52     }
53     if (nb == 1) {
54       action = surf_network_model->communicate(host_list[0], host_list[1], value, rate);
55     } else if (nb == 0) {
56       xbt_die("Cannot have a communication with no flop to exchange in this model. You should consider using the "
57           "ptask model");
58     } else {
59       xbt_die("Cannot have a communication that is not a simple point-to-point in this model. You should consider "
60           "using the ptask model");
61     }
62   } else {
63     xbt_die(
64         "This model only accepts one of the following. You should consider using the ptask model for the other cases.\n"
65         " - execution with one host only and no communication\n"
66         " - Self-comms with one host only\n"
67         " - Communications with two hosts and no computation");
68   }
69   return action;
70 }
71
72 /************
73  * Resource *
74  ************/
75 HostImpl::HostImpl(s4u::Host* host) : piface_(host)
76 {
77   /* The VM wants to reinstall a new HostImpl, but we don't want to leak the previously existing one */
78   delete piface_->pimpl_;
79   piface_->pimpl_ = this;
80 }
81
82 HostImpl::~HostImpl()
83 {
84   /* All processes should be gone when the host is turned off (by the end of the simulation). */
85   if (not process_list_.empty()) {
86     std::string msg = std::string("Shutting down host, but it's not empty:");
87     for (auto const& process : process_list_)
88       msg += "\n\t" + std::string(process.get_name());
89
90     SIMIX_display_process_status();
91     THROWF(arg_error, 0, "%s", msg.c_str());
92   }
93   for (auto const& arg : actors_at_boot_)
94     delete arg;
95   actors_at_boot_.clear();
96 }
97
98 /** Re-starts all the actors that are marked as restartable.
99  *
100  * Weird things will happen if you turn on a host that is already on. S4U is fool-proof, not this.
101  */
102 void HostImpl::turn_on()
103 {
104   for (auto const& arg : actors_at_boot_) {
105     XBT_DEBUG("Booting Actor %s(%s) right now", arg->name.c_str(), arg->host->get_cname());
106     simgrid::kernel::actor::ActorImplPtr actor = simgrid::kernel::actor::ActorImpl::create(
107         arg->name.c_str(), arg->code, nullptr, arg->host, arg->properties.get(), nullptr);
108     actor->on_exit = arg->on_exit;
109     if (arg->kill_time >= 0)
110       actor->set_kill_time(arg->kill_time);
111     if (arg->auto_restart)
112       actor->set_auto_restart(arg->auto_restart);
113     if (arg->daemon_)
114       actor->daemonize();
115   }
116 }
117
118 /** Kill all actors hosted here */
119 void HostImpl::turn_off()
120 {
121   if (not process_list_.empty()) {
122     for (auto& actor : process_list_) {
123       XBT_DEBUG("Killing Actor %s@%s on behalf of %s which turned off that host.", actor.get_cname(),
124                 actor.get_host()->get_cname(), SIMIX_process_self()->get_cname());
125       SIMIX_process_self()->kill(&actor);
126     }
127   }
128   // When a host is turned off, we want to keep only the actors that should restart for when it will boot again.
129   // Then get rid of the others.
130   auto elm = remove_if(begin(actors_at_boot_), end(actors_at_boot_), [](kernel::actor::ProcessArg* arg) {
131     if (arg->auto_restart)
132       return false;
133     delete arg;
134     return true;
135   });
136   actors_at_boot_.erase(elm, end(actors_at_boot_));
137 }
138
139 std::vector<s4u::ActorPtr> HostImpl::get_all_actors()
140 {
141   std::vector<s4u::ActorPtr> res;
142   for (auto& actor : process_list_)
143     res.push_back(actor.ciface());
144   return res;
145 }
146 size_t HostImpl::get_actor_count()
147 {
148   return process_list_.size();
149 }
150 std::vector<const char*> HostImpl::get_attached_storages()
151 {
152   std::vector<const char*> storages;
153   for (auto const& s : storage_)
154     if (s.second->getHost() == piface_->get_cname())
155       storages.push_back(s.second->piface_.get_cname());
156   return storages;
157 }
158
159 }
160 }