Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
c748eb5b303cf204a4ac2307c1e7a36eb422dd7c
[simgrid.git] / src / smpi / plugins / load_balancer / LoadBalancer.cpp
1 /* Copyright (c) 2006-2019. The SimGrid Team. All rights reserved.          */
2
3 /* This program is free software; you can redistribute it and/or modify it
4  * under the terms of the license (GNU LGPL) which comes with this package. */
5
6 #include <algorithm>
7 #include <map>
8 #include <unordered_map>
9 #include <queue>
10
11 #include <boost/heap/fibonacci_heap.hpp>
12 #include <simgrid/plugins/load.h>
13 #include <src/smpi/plugins/load_balancer/load_balancer.hpp>
14
15 XBT_LOG_EXTERNAL_DEFAULT_CATEGORY(plugin_load_balancer);
16
17 namespace simgrid {
18 namespace plugin {
19 namespace loadbalancer {
20
21 class XBT_PRIVATE compare_hosts {
22 public:
23   bool operator()(simgrid::s4u::Host* const a, simgrid::s4u::Host* const b) const;
24 };
25
26 typedef boost::heap::fibonacci_heap<simgrid::s4u::Host*, boost::heap::compare<compare_hosts>>::handle_type heap_handle;
27
28 /**
29  * Structure that imitates a std::pair, but it allows us
30  * to use meaningful names instead of .first and .second
31  */
32 struct XBT_PRIVATE pair_handle_load
33 {
34   heap_handle update_handle;
35   double load;
36 };
37
38 static std::map<simgrid::s4u::Host* const, pair_handle_load> additional_load;
39
40 bool compare_hosts::operator()(simgrid::s4u::Host* const a, simgrid::s4u::Host* const b) const {
41   return additional_load[a].load > additional_load[b].load;
42 }
43
44
45 void LoadBalancer::run()
46 {
47   simgrid::s4u::Engine* engine                     = simgrid::s4u::Engine::get_instance();
48   std::vector<simgrid::s4u::Host*> available_hosts =
49       engine->get_filtered_hosts([](simgrid::s4u::Host* host) { return host->is_on(); });
50   xbt_assert(available_hosts.size() > 0, "No hosts available; are they all switched off?");
51
52   // TODO: Account for daemon background load (-> use especially the availability file)
53
54   std::vector<simgrid::s4u::ActorPtr> all_actors =
55       engine->get_filtered_actors([](simgrid::s4u::ActorPtr actor) { return not actor->is_daemon(); });
56
57   for (auto const& actor : all_actors) {
58     new_mapping.assign(actor, actor->get_host());
59   }
60   // Sort the actors, from highest to lowest load; we then just iterate over these actors
61   std::sort(all_actors.begin(), all_actors.end(), [this](simgrid::s4u::ActorPtr a, simgrid::s4u::ActorPtr b) {
62     return actor_computation[a->get_pid()] > actor_computation[b->get_pid()];
63   });
64
65   // Sort the hosts. Use a heap datastructure, because we have to reorder
66   // after a host got another actor assigned (or moved from).
67   // We can't use std::priorityQueue here because we modify *two* elements: The top element, which
68   // we can access and which has the lowest load, gets a new actor assigned. 
69   // However, the host loosing that actor must be updated as well. 
70   // std::priorityQueue is immutable and hence doesn't work for us.
71   //
72   // This heap contains the least loaded host at the top
73   boost::heap::fibonacci_heap<simgrid::s4u::Host*, boost::heap::compare<compare_hosts>> usable_hosts;
74   for (auto& host : available_hosts) {
75     std::vector<simgrid::s4u::ActorPtr> actors = host->get_all_actors();
76     heap_handle update_handle                  = usable_hosts.push(host); // Required to update elements in the heap
77     additional_load[host]                      = {update_handle, 0};      // Save the handle for later
78     const double total_flops_computed          = sg_host_get_computed_flops(host);
79     for (auto const& actor : actors) {
80       additional_load[host].load += actor_computation[actor->get_pid()] / total_flops_computed; // Normalize load - this allows comparison
81                                                                                                 // even between hosts with different frequencies
82       XBT_DEBUG("Actor %li -> %f", actor->get_pid(), actor_computation[actor->get_pid()]);
83     }
84     usable_hosts.increase(update_handle);
85     XBT_DEBUG("Host %s initialized to %f", host->get_cname(), additional_load[host].load);
86   }
87
88   // Implementation of the Greedy algorithm
89   for (auto const& actor : all_actors) {
90     simgrid::s4u::Host* target_host = usable_hosts.top(); // This is the host with the lowest load
91
92     simgrid::s4u::Host* cur_mapped_host = new_mapping.get_host(actor);
93     if (target_host != cur_mapped_host
94         && additional_load[target_host].load + actor_computation[actor->get_pid()] < additional_load[cur_mapped_host].load
95         && new_mapping.count_actors(cur_mapped_host) > 1) {
96       usable_hosts.pop();
97       XBT_DEBUG("Assigning %li from %s to %s -- actor_load: %f -- host_load: %f", actor->get_pid(), actor->get_host()->get_cname(), target_host->get_cname(), actor_computation[actor->get_pid()], additional_load[target_host].load);
98       additional_load[cur_mapped_host].load = std::max<double>(0.0, additional_load[cur_mapped_host].load - actor_computation[actor->get_pid()]); // No negative loads, please!
99       usable_hosts.update(additional_load[cur_mapped_host].update_handle, cur_mapped_host);
100       additional_load[target_host].load         += actor_computation[actor->get_pid()];
101
102       new_mapping.assign(actor, target_host);
103
104       XBT_DEBUG("Assigning actor %li to host %s", actor->get_pid(), target_host->get_cname());
105
106       XBT_DEBUG("host_load: %f after the assignment", additional_load[target_host].load);
107       additional_load[target_host].update_handle = usable_hosts.push(target_host); // Save update handle for later
108     }
109   }
110
111   while (!usable_hosts.empty()) {
112     simgrid::s4u::Host* host = usable_hosts.top();
113     usable_hosts.pop();
114
115     sg_host_load_reset(host); // Reset host load for next iterations
116
117     if (XBT_LOG_ISENABLED(plugin_load_balancer, e_xbt_log_priority_t::xbt_log_priority_debug)) {
118       /* Debug messages that allow us to verify the load for each host */
119       XBT_DEBUG("Host: %s, load total: %f", host->get_cname(), additional_load[host].load);
120       double load_verif = 0.0;
121       new_mapping.for_each_actor(host,
122           [this, &load_verif](simgrid::s4u::ActorPtr actor) {
123             load_verif += actor_computation[actor->get_pid()];
124             XBT_DEBUG("        %li (load: %f)", actor->get_pid(), actor_computation[actor->get_pid()]);
125       });
126       XBT_DEBUG("Host load verification: %f", load_verif);
127     }
128   }
129   for (auto& elem : actor_computation) { // Reset actor load
130     elem.second = 0;
131   }
132 }
133
134 simgrid::s4u::Host* LoadBalancer::get_mapping(simgrid::s4u::ActorPtr actor)
135 {
136   return new_mapping.get_host(actor);
137 }
138
139 void LoadBalancer::record_actor_computation(simgrid::s4u::Actor const& actor, double load)
140 {
141   actor_computation[actor.get_pid()] += load;
142 }
143 }
144 }
145 }