Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
declaration of the variables at the begining of the function
[simgrid.git] / examples / gras / pmm / pmm.c
index dc7da5b..f429b09 100755 (executable)
 
 #include "gras.h"
 #include "xbt/matrix.h"
-#include "amok/hostmanagement.h"
+#include "amok/peermanagement.h"
 
 #define PROC_MATRIX_SIZE 3
 #define NEIGHBOR_COUNT PROC_MATRIX_SIZE - 1
 #define SLAVE_COUNT (PROC_MATRIX_SIZE*PROC_MATRIX_SIZE)
 
-#define DATA_MATRIX_SIZE 9
+#define DATA_MATRIX_SIZE 18
 const int submatrix_size = DATA_MATRIX_SIZE/PROC_MATRIX_SIZE;
 
 XBT_LOG_NEW_DEFAULT_CATEGORY(pmm,"Parallel Matrix Multiplication");
@@ -33,8 +33,8 @@ typedef struct s_result result_t;
 GRAS_DEFINE_TYPE(s_pmm_assignment,struct s_pmm_assignment {
   int linepos;
   int rowpos;
-  xbt_host_t line[NEIGHBOR_COUNT];
-  xbt_host_t row[NEIGHBOR_COUNT];
+  xbt_peer_t line[NEIGHBOR_COUNT];
+  xbt_peer_t row[NEIGHBOR_COUNT];
   xbt_matrix_t A GRAS_ANNOTE(subtype,double);
   xbt_matrix_t B GRAS_ANNOTE(subtype,double);
 });
@@ -86,13 +86,13 @@ int master (int argc,char *argv[]) {
 
   gras_socket_t from;
 
-  xbt_dynar_t hosts; /* group of slaves */
-  xbt_host_t grid[SLAVE_COUNT]; /* The slaves as an array */
+  xbt_dynar_t peers; /* group of slaves */
+  xbt_peer_t grid[SLAVE_COUNT]; /* The slaves as an array */
   gras_socket_t socket[SLAVE_COUNT]; /* sockets for brodcast to slaves */
 
   /* Init the GRAS's infrastructure */
   gras_init(&argc, argv);
-  amok_hm_init();
+  amok_pm_init();
   register_messages();
       
   /* Initialize data matrices */
@@ -101,30 +101,33 @@ int master (int argc,char *argv[]) {
   C = xbt_matrix_double_new_zeros(DATA_MATRIX_SIZE,DATA_MATRIX_SIZE);
        
   /* Create the connexions */
+  xbt_assert0(argc>1, "Usage: master <port>");
   gras_socket_server(atoi(argv[1]));
-  hosts=amok_hm_group_new("pmm");
-  INFO0("Wait for peers for 10 sec");
-  gras_msg_handleall(10); /* friends, we're ready. Come and play */
-  INFO1("Got %ld pals",xbt_dynar_length(hosts));
+  peers=amok_pm_group_new("pmm");
+   
+  /* friends, we're ready. Come and play */
+  INFO0("Wait for peers for 5 sec");
+  gras_msg_handleall(5);
+  INFO1("Got %ld pals",xbt_dynar_length(peers));
 
   for (i=0;
-       i<xbt_dynar_length(hosts) && i<SLAVE_COUNT;
+       i<xbt_dynar_length(peers) && i<SLAVE_COUNT;
        i++) {
 
-    xbt_dynar_get_cpy(hosts,i,&grid[i]);
+    xbt_dynar_get_cpy(peers,i,&grid[i]);
     socket[i]=gras_socket_client(grid[i]->name,grid[i]->port);
-    INFO2("Connected to %s:%d.",grid[i]->name,grid[i]->port);
   }
   xbt_assert2(i==SLAVE_COUNT,
              "Not enough slaves for this setting (got %d of %d). Change the deployment file",
              i,SLAVE_COUNT);
 
   /* Kill surnumerous slaves */
-  for (i=SLAVE_COUNT; i<xbt_dynar_length(hosts); ) {
-    xbt_host_t h;
+  for (i=SLAVE_COUNT; i<xbt_dynar_length(peers); ) {
+    xbt_peer_t h;
 
-    xbt_dynar_get_cpy(hosts,i,&h);
-    amok_hm_kill_hp(h->name,h->port);
+    xbt_dynar_remove_at(peers,i,&h);
+    INFO2("Too much slaves. Killing %s:%d", h->name, h->port);
+    amok_pm_kill_hp(h->name,h->port);
     free(h);
   }
 
@@ -167,7 +170,7 @@ int master (int argc,char *argv[]) {
       line++;
     }
                
-    gras_msg_send(socket[i],gras_msgtype_by_name("pmm_slave"),&assignment);
+    gras_msg_send(socket[i],"pmm_slave",&assignment);
     xbt_matrix_free(assignment.A);
     xbt_matrix_free(assignment.B);
   }
@@ -176,7 +179,7 @@ int master (int argc,char *argv[]) {
 
   /* Retrieve the results */
   for( i=0;i< SLAVE_COUNT;i++){
-    gras_msg_wait(6000,gras_msgtype_by_name("result"),&from,&result);
+    gras_msg_wait(6000,"result",&from,&result);
     VERB2("%d slaves are done already. Waiting for %d",i+1, SLAVE_COUNT);
     xbt_matrix_copy_values(C,result.C,   submatrix_size,submatrix_size,
                           submatrix_size*result.linepos,
@@ -193,7 +196,7 @@ int master (int argc,char *argv[]) {
      INFO1("Matrix size too big (%d>30) to be displayed here",DATA_MATRIX_SIZE);
   }
 
-  amok_hm_group_shutdown ("pmm");   /* Ok, we're out of here */
+  amok_pm_group_shutdown ("pmm");   /* Ok, we're out of here */
 
   for(i=0; i<SLAVE_COUNT; i++) {
      gras_socket_close(socket[i]);
@@ -252,12 +255,12 @@ static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
   for (i=0 ; i<PROC_MATRIX_SIZE-1 ; i++){
     socket_line[i]=gras_socket_client(assignment.line[i]->name,
                                      assignment.line[i]->port);
-    xbt_host_free(assignment.line[i]);
+    xbt_peer_free(assignment.line[i]);
   }
   for (i=0 ; i<PROC_MATRIX_SIZE-1 ; i++){
     socket_row[i]=gras_socket_client(assignment.row[i]->name,
                                     assignment.row[i]->port);
-    xbt_host_free(assignment.row[i]);    
+    xbt_peer_free(assignment.row[i]);    
   }
 
   for (step=0; step<PROC_MATRIX_SIZE;step++) {
@@ -270,9 +273,7 @@ static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
          INFO2("LINE:   Send to %s:%d",
                gras_socket_peer_name(socket_row[l]),
                gras_socket_peer_port(socket_row[l]));
-        gras_msg_send(socket_row[l], 
-                      gras_msgtype_by_name("dataB"), 
-                      &mydataB);
+        gras_msg_send(socket_row[l], "dataB", &mydataB);
        }
        
        
@@ -283,7 +284,7 @@ static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
     } else {
       TRY {
        xbt_matrix_free(bB);
-       gras_msg_wait(600,gras_msgtype_by_name("dataB"),&from,&bB);
+       gras_msg_wait(600,"dataB",&from,&bB);
       } CATCH(e) {
        RETHROW0("Can't get a data message from line : %s");
       }
@@ -298,7 +299,7 @@ static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
          INFO2("ROW:   Send to %s:%d",
                gras_socket_peer_name(socket_line[l-1]),
                gras_socket_peer_port(socket_line[l-1]));
-         gras_msg_send(socket_line[l-1],gras_msgtype_by_name("dataA"), &mydataA);
+         gras_msg_send(socket_line[l-1],"dataA", &mydataA);
        }
        xbt_matrix_free(bA);
        bA = xbt_matrix_new_sub(mydataA,
@@ -307,7 +308,7 @@ static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
     } else {
       TRY {
        xbt_matrix_free(bA);
-       gras_msg_wait(1200,gras_msgtype_by_name("dataA"), &from,&bA);
+       gras_msg_wait(1200,"dataA", &from,&bA);
       } CATCH(e) {
        RETHROW0("Can't get a data message from row : %s");
       }
@@ -324,7 +325,7 @@ static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
   result.rowpos=myrow;
 
   TRY {
-    gras_msg_send(master, gras_msgtype_by_name("result"),&result);
+    gras_msg_send(master, "result",&result);
   } CATCH(e) {
     RETHROW0("Failed to send answer to server: %s");
   }
@@ -338,9 +339,9 @@ static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
 
   xbt_matrix_free(mydataA);
   xbt_matrix_free(mydataB);
+  /* FIXME: some are said to be unknown 
   gras_socket_close(master);
   gras_socket_close(from);
-  /* FIXME: some are said to be unknown 
   for (l=0; l < PROC_MATRIX_SIZE-1; l++) {
      if (socket_line[l])
        gras_socket_close(socket_line[l]);
@@ -348,30 +349,41 @@ static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
        gras_socket_close(socket_row[l]); 
   }*/
 
-  return 1;
+  return 0;
 }
 
 int slave(int argc,char *argv[]) {
   gras_socket_t mysock;
-  gras_socket_t master;
+  gras_socket_t master = NULL;
+  int connected = 0;
 
   /* Init the GRAS's infrastructure */
   gras_init(&argc, argv);
-  amok_hm_init();
+  amok_pm_init();
 
   /*  Register the known messages and my callback */
   register_messages();
-  gras_cb_register(gras_msgtype_by_name("pmm_slave"),pmm_worker_cb);
+  gras_cb_register("pmm_slave",pmm_worker_cb);
 
   /* Create the connexions */
   mysock = gras_socket_server_range(3000,9999,0,0);
-  INFO1("Sensor starting (on port %d)",gras_os_myport());
-  gras_os_sleep(2); /* let the master get ready */
-  master = gras_socket_client_from_string(argv[1]);
+  INFO1("Sensor starting (on port %d)",gras_os_myport());  
+  while (!connected) { 
+     xbt_ex_t e;
+     TRY {       
+       master = gras_socket_client_from_string(argv[1]);
+       connected = 1;
+     } CATCH(e) {
+       if (e.category != system_error)
+         RETHROW;
+       xbt_ex_free(e);
+       gras_os_sleep(0.5);
+     }
+  }
                                
   /* Join and run the group */
-  amok_hm_group_join(master,"pmm");
-  amok_hm_mainloop(600);
+  amok_pm_group_join(master,"pmm");
+  amok_pm_mainloop(600);
 
   /* housekeeping */
   gras_socket_close(mysock);