Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
First wave of GRAS API breaking: gras_cb_register wants a message name (char*) as...
[simgrid.git] / examples / gras / pmm / pmm.c
1 /* $Id$ */
2 /* pmm - parallel matrix multiplication "double diffusion"                  */
3
4 /* Copyright (c) 2006 Ahmed Harbaoui.                                       */
5 /* Copyright (c) 2006 Martin Quinson.                                       */
6 /* All rights reserved.                                                     */
7
8 /* This program is free software; you can redistribute it and/or modify it
9  * under the terms of the license (GNU LGPL) which comes with this package. */
10
11 #include "gras.h"
12 #include "xbt/matrix.h"
13 #include "amok/peermanagement.h"
14
15 #define PROC_MATRIX_SIZE 3
16 #define NEIGHBOR_COUNT PROC_MATRIX_SIZE - 1
17 #define SLAVE_COUNT (PROC_MATRIX_SIZE*PROC_MATRIX_SIZE)
18
19 #define DATA_MATRIX_SIZE 18
20 const int submatrix_size = DATA_MATRIX_SIZE/PROC_MATRIX_SIZE;
21
22 XBT_LOG_NEW_DEFAULT_CATEGORY(pmm,"Parallel Matrix Multiplication");
23
24 /* struct for recovering results */
25 GRAS_DEFINE_TYPE(s_result,struct s_result {
26   int linepos;
27   int rowpos;
28   xbt_matrix_t C GRAS_ANNOTE(subtype,double);
29 });
30 typedef struct s_result result_t;
31
32 /* struct to send initial data to slave */
33 GRAS_DEFINE_TYPE(s_pmm_assignment,struct s_pmm_assignment {
34   int linepos;
35   int rowpos;
36   xbt_peer_t line[NEIGHBOR_COUNT];
37   xbt_peer_t row[NEIGHBOR_COUNT];
38   xbt_matrix_t A GRAS_ANNOTE(subtype,double);
39   xbt_matrix_t B GRAS_ANNOTE(subtype,double);
40 });
41 typedef struct s_pmm_assignment s_pmm_assignment_t;
42
43 /* register messages which may be sent (common to client and server) */
44 static void register_messages(void) {
45   gras_datadesc_type_t result_type;
46   gras_datadesc_type_t pmm_assignment_type;
47
48   gras_datadesc_set_const("NEIGHBOR_COUNT",NEIGHBOR_COUNT);
49   result_type=gras_datadesc_by_symbol(s_result);
50   pmm_assignment_type=gras_datadesc_by_symbol(s_pmm_assignment);
51         
52   /* receive a final result from slave */
53   gras_msgtype_declare("result", result_type);
54
55   /* send from master to slave to assign a position and some data */
56   gras_msgtype_declare("pmm_slave", pmm_assignment_type);
57
58   /* send data between slaves */
59   gras_msgtype_declare("dataA", gras_datadesc_matrix(gras_datadesc_by_name("double"),NULL));
60   gras_msgtype_declare("dataB", gras_datadesc_matrix(gras_datadesc_by_name("double"),NULL));
61 }
62
63 /* Function prototypes */
64 int slave (int argc,char *argv[]);
65 int master (int argc,char *argv[]);
66
67
68 /* **********************************************************************
69  * master code
70  * **********************************************************************/
71
72 /* Global private data */
73 typedef struct {
74   int nbr_row,nbr_line;
75   int remaining_step;
76   int remaining_ack;
77 } master_data_t;
78
79
80 int master (int argc,char *argv[]) {
81
82   int i;
83
84   xbt_matrix_t A,B,C;
85   result_t result;
86
87   gras_socket_t from;
88
89   xbt_dynar_t peers; /* group of slaves */
90   xbt_peer_t grid[SLAVE_COUNT]; /* The slaves as an array */
91   gras_socket_t socket[SLAVE_COUNT]; /* sockets for brodcast to slaves */
92
93   /* Init the GRAS's infrastructure */
94   gras_init(&argc, argv);
95   amok_pm_init();
96   register_messages();
97       
98   /* Initialize data matrices */
99   A = xbt_matrix_double_new_id(DATA_MATRIX_SIZE,DATA_MATRIX_SIZE);
100   B = xbt_matrix_double_new_seq(DATA_MATRIX_SIZE,DATA_MATRIX_SIZE);
101   C = xbt_matrix_double_new_zeros(DATA_MATRIX_SIZE,DATA_MATRIX_SIZE);
102         
103   /* Create the connexions */
104   xbt_assert0(argc>1, "Usage: master <port>");
105   gras_socket_server(atoi(argv[1]));
106   peers=amok_pm_group_new("pmm");
107    
108   /* friends, we're ready. Come and play */
109   INFO0("Wait for peers for 5 sec");
110   gras_msg_handleall(5);
111   INFO1("Got %ld pals",xbt_dynar_length(peers));
112
113   for (i=0;
114        i<xbt_dynar_length(peers) && i<SLAVE_COUNT;
115        i++) {
116
117     xbt_dynar_get_cpy(peers,i,&grid[i]);
118     INFO2("Connecting to %s:%d.",grid[i]->name,grid[i]->port);
119     socket[i]=gras_socket_client(grid[i]->name,grid[i]->port);
120     INFO2("Connected to %s:%d.",grid[i]->name,grid[i]->port);
121   }
122   xbt_assert2(i==SLAVE_COUNT,
123               "Not enough slaves for this setting (got %d of %d). Change the deployment file",
124               i,SLAVE_COUNT);
125
126   /* Kill surnumerous slaves */
127   for (i=SLAVE_COUNT; i<xbt_dynar_length(peers); ) {
128     xbt_peer_t h;
129
130     xbt_dynar_remove_at(peers,i,&h);
131     INFO2("Too much slaves. Killing %s:%d", h->name, h->port);
132     amok_pm_kill_hp(h->name,h->port);
133     free(h);
134   }
135
136
137   /* Assign job to slaves */
138   int row=0, line=0;
139   INFO0("XXXXXXXXXXXXXXXXXXXXXX begin Multiplication");
140   for(i=0 ; i<SLAVE_COUNT; i++){
141     s_pmm_assignment_t assignment;
142     int j,k;
143
144     assignment.linepos=line; // assigned line
145     assignment.rowpos=row;   // assigned row
146
147     /* Neiborhood */
148     for (j=0,k=0; j<PROC_MATRIX_SIZE; j++) {
149       if (i != j*PROC_MATRIX_SIZE+(row)) {          
150          assignment.row[k] = grid[ j*PROC_MATRIX_SIZE+(row) ] ;
151          k++;
152       }
153     }
154     for (j=0,k=0; j<PROC_MATRIX_SIZE; j++) {
155       if (i != (line)*PROC_MATRIX_SIZE+j) {         
156          assignment.line[k] =  grid[ (line)*PROC_MATRIX_SIZE+j ] ;
157          k++;
158       }
159     }
160
161     assignment.A=xbt_matrix_new_sub(A,
162                                     submatrix_size,submatrix_size,
163                                     submatrix_size*line,submatrix_size*row,
164                                     NULL);
165     assignment.B=xbt_matrix_new_sub(B,
166                                     submatrix_size,submatrix_size,
167                                     submatrix_size*line,submatrix_size*row,
168                                     NULL);
169     row++;
170     if (row >= PROC_MATRIX_SIZE) {
171       row=0;
172       line++;
173     }
174                 
175     gras_msg_send(socket[i],gras_msgtype_by_name("pmm_slave"),&assignment);
176     xbt_matrix_free(assignment.A);
177     xbt_matrix_free(assignment.B);
178   }
179
180   /* (have a rest while the slave perform the multiplication) */
181
182   /* Retrieve the results */
183   for( i=0;i< SLAVE_COUNT;i++){
184     gras_msg_wait(6000,gras_msgtype_by_name("result"),&from,&result);
185     VERB2("%d slaves are done already. Waiting for %d",i+1, SLAVE_COUNT);
186     xbt_matrix_copy_values(C,result.C,   submatrix_size,submatrix_size,
187                            submatrix_size*result.linepos,
188                            submatrix_size*result.rowpos,
189                            0,0,NULL);
190     xbt_matrix_free(result.C);
191   }
192   /*    end of gather   */
193
194   if (DATA_MATRIX_SIZE < 30) {
195      INFO0 ("The Result of Multiplication is :");
196      xbt_matrix_dump(C,"C:res",0,xbt_matrix_dump_display_double);
197   } else {
198      INFO1("Matrix size too big (%d>30) to be displayed here",DATA_MATRIX_SIZE);
199   }
200
201   amok_pm_group_shutdown ("pmm");   /* Ok, we're out of here */
202
203   for(i=0; i<SLAVE_COUNT; i++) {
204      gras_socket_close(socket[i]);
205   }
206    
207   xbt_matrix_free(A);
208   xbt_matrix_free(B);
209   xbt_matrix_free(C);
210   gras_exit();
211   return 0;
212 } /* end_of_master */
213
214 /* **********************************************************************
215  * slave code
216  * **********************************************************************/
217
218 static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
219   /* Recover my initialized Data and My Position*/
220   s_pmm_assignment_t assignment = *(s_pmm_assignment_t*)payload;
221   gras_socket_t master = gras_msg_cb_ctx_from(ctx);
222
223   xbt_ex_t e; 
224
225   int step,l;
226   xbt_matrix_t bA=xbt_matrix_new(submatrix_size,submatrix_size,
227                                  sizeof(double),NULL);
228   xbt_matrix_t bB=xbt_matrix_new(submatrix_size,submatrix_size,
229                                  sizeof(double),NULL);
230
231   int myline,myrow;
232   xbt_matrix_t mydataA,mydataB;
233   xbt_matrix_t bC=xbt_matrix_double_new_zeros(submatrix_size,submatrix_size);
234   
235   result_t result;
236  
237   gras_socket_t from;  /* to exchange data with my neighbor */
238
239   /* sockets for brodcast to other slave */
240   gras_socket_t socket_line[PROC_MATRIX_SIZE-1];
241   gras_socket_t socket_row[PROC_MATRIX_SIZE-1];
242   memset(socket_line,0,sizeof(socket_line));
243   memset(socket_row,0,sizeof(socket_row));
244    
245   int i;
246
247   gras_os_sleep(1); /* wait for my pals */
248
249   myline  = assignment.linepos;
250   myrow   = assignment.rowpos;
251   mydataA = assignment.A;
252   mydataB = assignment.B;
253
254   INFO2("Receive my pos (%d,%d) and assignment",myline,myrow);
255
256   /* Get my neighborhood from the assignment message (skipping myself) */
257   for (i=0 ; i<PROC_MATRIX_SIZE-1 ; i++){
258     socket_line[i]=gras_socket_client(assignment.line[i]->name,
259                                       assignment.line[i]->port);
260     xbt_peer_free(assignment.line[i]);
261   }
262   for (i=0 ; i<PROC_MATRIX_SIZE-1 ; i++){
263     socket_row[i]=gras_socket_client(assignment.row[i]->name,
264                                      assignment.row[i]->port);
265     xbt_peer_free(assignment.row[i]);    
266   }
267
268   for (step=0; step<PROC_MATRIX_SIZE;step++) {
269         
270     /* a line brodcast */
271     if(myline==step){
272        INFO3("LINE: step(%d) = Myline(%d). Broadcast my data (myport=%d).",
273              step,myline,gras_os_myport());
274        for (l=0;l < PROC_MATRIX_SIZE-1 ;l++) {
275           INFO2("LINE:   Send to %s:%d",
276                 gras_socket_peer_name(socket_row[l]),
277                 gras_socket_peer_port(socket_row[l]));
278          gras_msg_send(socket_row[l], 
279                        gras_msgtype_by_name("dataB"), 
280                        &mydataB);
281        }
282        
283         
284        xbt_matrix_free(bB);
285        bB = xbt_matrix_new_sub(mydataB,
286                                submatrix_size,submatrix_size,
287                                0,0,NULL);       
288     } else {
289       TRY {
290         xbt_matrix_free(bB);
291         gras_msg_wait(600,gras_msgtype_by_name("dataB"),&from,&bB);
292       } CATCH(e) {
293         RETHROW0("Can't get a data message from line : %s");
294       }
295       INFO4("LINE: step(%d) <> Myline(%d). Receive data from %s:%d",step,myline,
296             gras_socket_peer_name(from), gras_socket_peer_port(from));
297     }
298
299     /* a row brodcast */
300     if (myrow==step) { 
301        INFO2("ROW: step(%d)=myrow(%d). Broadcast my data",step,myrow);
302        for (l=1;l < PROC_MATRIX_SIZE ; l++) {
303           INFO2("ROW:   Send to %s:%d",
304                 gras_socket_peer_name(socket_line[l-1]),
305                 gras_socket_peer_port(socket_line[l-1]));
306           gras_msg_send(socket_line[l-1],gras_msgtype_by_name("dataA"), &mydataA);
307        }
308        xbt_matrix_free(bA);
309        bA = xbt_matrix_new_sub(mydataA,
310                                submatrix_size,submatrix_size,
311                                0,0,NULL);
312     } else {
313       TRY {
314         xbt_matrix_free(bA);
315         gras_msg_wait(1200,gras_msgtype_by_name("dataA"), &from,&bA);
316       } CATCH(e) {
317         RETHROW0("Can't get a data message from row : %s");
318       }
319       INFO3("ROW: step(%d)<>myrow(%d). Receive data from %s",step,myrow,
320             gras_socket_peer_name(from));
321     }
322     xbt_matrix_double_addmult(bA,bB,bC);
323
324   };
325  
326   /* send Result to master */  
327   result.C=bC;
328   result.linepos=myline;
329   result.rowpos=myrow;
330
331   TRY {
332     gras_msg_send(master, gras_msgtype_by_name("result"),&result);
333   } CATCH(e) {
334     RETHROW0("Failed to send answer to server: %s");
335   }
336   INFO2(">>>>>>>> Result sent to %s:%d <<<<<<<<",
337         gras_socket_peer_name(master),gras_socket_peer_port(master));
338   /*  Free the allocated resources, and shut GRAS down */
339
340   xbt_matrix_free(bA);
341   xbt_matrix_free(bB);
342   xbt_matrix_free(bC);
343
344   xbt_matrix_free(mydataA);
345   xbt_matrix_free(mydataB);
346   gras_socket_close(master);
347   gras_socket_close(from);
348   /* FIXME: some are said to be unknown 
349   for (l=0; l < PROC_MATRIX_SIZE-1; l++) {
350      if (socket_line[l])
351        gras_socket_close(socket_line[l]);
352      if (socket_row[l])
353        gras_socket_close(socket_row[l]); 
354   }*/
355
356   return 1;
357 }
358
359 int slave(int argc,char *argv[]) {
360   gras_socket_t mysock;
361   gras_socket_t master;
362
363   /* Init the GRAS's infrastructure */
364   gras_init(&argc, argv);
365   amok_pm_init();
366
367   /*  Register the known messages and my callback */
368   register_messages();
369   gras_cb_register("pmm_slave",pmm_worker_cb);
370
371   /* Create the connexions */
372   mysock = gras_socket_server_range(3000,9999,0,0);
373   gras_os_sleep(1); /* let the master get ready */
374   INFO1("Sensor starting (on port %d)",gras_os_myport());
375   master = gras_socket_client_from_string(argv[1]);
376                                 
377   /* Join and run the group */
378   amok_pm_group_join(master,"pmm");
379   amok_pm_mainloop(600);
380
381   /* housekeeping */
382   gras_socket_close(mysock);
383   //  gras_socket_close(master); Unknown
384   gras_exit();
385   return 0;
386 } /* end_of_slave */