Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
stick to the file naming convention presented in the tutorial
[simgrid.git] / examples / gras / pmm / pmm.c
1 /* $Id$ */
2 /* pmm - parallel matrix multiplication "double diffusion"                  */
3
4 /* Copyright (c) 2006 Ahmed Harbaoui.                                       */
5 /* Copyright (c) 2006 Martin Quinson.                                       */
6 /* All rights reserved.                                                     */
7
8 /* This program is free software; you can redistribute it and/or modify it
9  * under the terms of the license (GNU LGPL) which comes with this package. */
10
11 #include "gras.h"
12 #include "xbt/matrix.h"
13 #include "amok/peermanagement.h"
14
15 #define PROC_MATRIX_SIZE 3
16 #define NEIGHBOR_COUNT PROC_MATRIX_SIZE - 1
17 #define SLAVE_COUNT (PROC_MATRIX_SIZE*PROC_MATRIX_SIZE)
18
19 #define DATA_MATRIX_SIZE 9
20 const int submatrix_size = DATA_MATRIX_SIZE/PROC_MATRIX_SIZE;
21
22 XBT_LOG_NEW_DEFAULT_CATEGORY(pmm,"Parallel Matrix Multiplication");
23
24 /* struct for recovering results */
25 GRAS_DEFINE_TYPE(s_result,struct s_result {
26   int linepos;
27   int rowpos;
28   xbt_matrix_t C GRAS_ANNOTE(subtype,double);
29 });
30 typedef struct s_result result_t;
31
32 /* struct to send initial data to slave */
33 GRAS_DEFINE_TYPE(s_pmm_assignment,struct s_pmm_assignment {
34   int linepos;
35   int rowpos;
36   xbt_peer_t line[NEIGHBOR_COUNT];
37   xbt_peer_t row[NEIGHBOR_COUNT];
38   xbt_matrix_t A GRAS_ANNOTE(subtype,double);
39   xbt_matrix_t B GRAS_ANNOTE(subtype,double);
40 });
41 typedef struct s_pmm_assignment s_pmm_assignment_t;
42
43 /* register messages which may be sent (common to client and server) */
44 static void register_messages(void) {
45   gras_datadesc_type_t result_type;
46   gras_datadesc_type_t pmm_assignment_type;
47
48   gras_datadesc_set_const("NEIGHBOR_COUNT",NEIGHBOR_COUNT);
49   result_type=gras_datadesc_by_symbol(s_result);
50   pmm_assignment_type=gras_datadesc_by_symbol(s_pmm_assignment);
51         
52   /* receive a final result from slave */
53   gras_msgtype_declare("result", result_type);
54
55   /* send from master to slave to assign a position and some data */
56   gras_msgtype_declare("pmm_slave", pmm_assignment_type);
57
58   /* send data between slaves */
59   gras_msgtype_declare("dataA", gras_datadesc_matrix(gras_datadesc_by_name("double"),NULL));
60   gras_msgtype_declare("dataB", gras_datadesc_matrix(gras_datadesc_by_name("double"),NULL));
61 }
62
63 /* Function prototypes */
64 int slave (int argc,char *argv[]);
65 int master (int argc,char *argv[]);
66
67
68 /* **********************************************************************
69  * master code
70  * **********************************************************************/
71
72 /* Global private data */
73 typedef struct {
74   int nbr_row,nbr_line;
75   int remaining_step;
76   int remaining_ack;
77 } master_data_t;
78
79
80 int master (int argc,char *argv[]) {
81
82   int i;
83
84   xbt_matrix_t A,B,C;
85   result_t result;
86
87   gras_socket_t from;
88
89   xbt_dynar_t peers; /* group of slaves */
90   xbt_peer_t grid[SLAVE_COUNT]; /* The slaves as an array */
91   gras_socket_t socket[SLAVE_COUNT]; /* sockets for brodcast to slaves */
92
93   /* Init the GRAS's infrastructure */
94   gras_init(&argc, argv);
95   amok_pm_init();
96   register_messages();
97       
98   /* Initialize data matrices */
99   A = xbt_matrix_double_new_id(DATA_MATRIX_SIZE,DATA_MATRIX_SIZE);
100   B = xbt_matrix_double_new_seq(DATA_MATRIX_SIZE,DATA_MATRIX_SIZE);
101   C = xbt_matrix_double_new_zeros(DATA_MATRIX_SIZE,DATA_MATRIX_SIZE);
102         
103   /* Create the connexions */
104   xbt_assert0(argc>1, "Usage: master <port>");
105   gras_socket_server(atoi(argv[1]));
106   peers=amok_pm_group_new("pmm");
107   INFO0("Wait for peers for 10 sec");
108   gras_msg_handleall(10); /* friends, we're ready. Come and play */
109   INFO1("Got %ld pals",xbt_dynar_length(peers));
110
111   for (i=0;
112        i<xbt_dynar_length(peers) && i<SLAVE_COUNT;
113        i++) {
114
115     xbt_dynar_get_cpy(peers,i,&grid[i]);
116     socket[i]=gras_socket_client(grid[i]->name,grid[i]->port);
117     INFO2("Connected to %s:%d.",grid[i]->name,grid[i]->port);
118   }
119   xbt_assert2(i==SLAVE_COUNT,
120               "Not enough slaves for this setting (got %d of %d). Change the deployment file",
121               i,SLAVE_COUNT);
122
123   /* Kill surnumerous slaves */
124   for (i=SLAVE_COUNT; i<xbt_dynar_length(peers); ) {
125     xbt_peer_t h;
126
127     xbt_dynar_get_cpy(peers,i,&h);
128     amok_pm_kill_hp(h->name,h->port);
129     free(h);
130   }
131
132
133   /* Assign job to slaves */
134   int row=0, line=0;
135   INFO0("XXXXXXXXXXXXXXXXXXXXXX begin Multiplication");
136   for(i=0 ; i<SLAVE_COUNT; i++){
137     s_pmm_assignment_t assignment;
138     int j,k;
139
140     assignment.linepos=line; // assigned line
141     assignment.rowpos=row;   // assigned row
142
143     /* Neiborhood */
144     for (j=0,k=0; j<PROC_MATRIX_SIZE; j++) {
145       if (i != j*PROC_MATRIX_SIZE+(row)) {          
146          assignment.row[k] = grid[ j*PROC_MATRIX_SIZE+(row) ] ;
147          k++;
148       }
149     }
150     for (j=0,k=0; j<PROC_MATRIX_SIZE; j++) {
151       if (i != (line)*PROC_MATRIX_SIZE+j) {         
152          assignment.line[k] =  grid[ (line)*PROC_MATRIX_SIZE+j ] ;
153          k++;
154       }
155     }
156
157     assignment.A=xbt_matrix_new_sub(A,
158                                     submatrix_size,submatrix_size,
159                                     submatrix_size*line,submatrix_size*row,
160                                     NULL);
161     assignment.B=xbt_matrix_new_sub(B,
162                                     submatrix_size,submatrix_size,
163                                     submatrix_size*line,submatrix_size*row,
164                                     NULL);
165     row++;
166     if (row >= PROC_MATRIX_SIZE) {
167       row=0;
168       line++;
169     }
170                 
171     gras_msg_send(socket[i],gras_msgtype_by_name("pmm_slave"),&assignment);
172     xbt_matrix_free(assignment.A);
173     xbt_matrix_free(assignment.B);
174   }
175
176   /* (have a rest while the slave perform the multiplication) */
177
178   /* Retrieve the results */
179   for( i=0;i< SLAVE_COUNT;i++){
180     gras_msg_wait(6000,gras_msgtype_by_name("result"),&from,&result);
181     VERB2("%d slaves are done already. Waiting for %d",i+1, SLAVE_COUNT);
182     xbt_matrix_copy_values(C,result.C,   submatrix_size,submatrix_size,
183                            submatrix_size*result.linepos,
184                            submatrix_size*result.rowpos,
185                            0,0,NULL);
186     xbt_matrix_free(result.C);
187   }
188   /*    end of gather   */
189
190   if (DATA_MATRIX_SIZE < 30) {
191      INFO0 ("The Result of Multiplication is :");
192      xbt_matrix_dump(C,"C:res",0,xbt_matrix_dump_display_double);
193   } else {
194      INFO1("Matrix size too big (%d>30) to be displayed here",DATA_MATRIX_SIZE);
195   }
196
197   amok_pm_group_shutdown ("pmm");   /* Ok, we're out of here */
198
199   for(i=0; i<SLAVE_COUNT; i++) {
200      gras_socket_close(socket[i]);
201   }
202    
203   xbt_matrix_free(A);
204   xbt_matrix_free(B);
205   xbt_matrix_free(C);
206   gras_exit();
207   return 0;
208 } /* end_of_master */
209
210 /* **********************************************************************
211  * slave code
212  * **********************************************************************/
213
214 static int pmm_worker_cb(gras_msg_cb_ctx_t ctx, void *payload) {
215   /* Recover my initialized Data and My Position*/
216   s_pmm_assignment_t assignment = *(s_pmm_assignment_t*)payload;
217   gras_socket_t master = gras_msg_cb_ctx_from(ctx);
218
219   xbt_ex_t e; 
220
221   int step,l;
222   xbt_matrix_t bA=xbt_matrix_new(submatrix_size,submatrix_size,
223                                  sizeof(double),NULL);
224   xbt_matrix_t bB=xbt_matrix_new(submatrix_size,submatrix_size,
225                                  sizeof(double),NULL);
226
227   int myline,myrow;
228   xbt_matrix_t mydataA,mydataB;
229   xbt_matrix_t bC=xbt_matrix_double_new_zeros(submatrix_size,submatrix_size);
230   
231   result_t result;
232  
233   gras_socket_t from;  /* to exchange data with my neighbor */
234
235   /* sockets for brodcast to other slave */
236   gras_socket_t socket_line[PROC_MATRIX_SIZE-1];
237   gras_socket_t socket_row[PROC_MATRIX_SIZE-1];
238   memset(socket_line,0,sizeof(socket_line));
239   memset(socket_row,0,sizeof(socket_row));
240    
241   int i;
242
243   gras_os_sleep(1); /* wait for my pals */
244
245   myline  = assignment.linepos;
246   myrow   = assignment.rowpos;
247   mydataA = assignment.A;
248   mydataB = assignment.B;
249
250   INFO2("Receive my pos (%d,%d) and assignment",myline,myrow);
251
252   /* Get my neighborhood from the assignment message (skipping myself) */
253   for (i=0 ; i<PROC_MATRIX_SIZE-1 ; i++){
254     socket_line[i]=gras_socket_client(assignment.line[i]->name,
255                                       assignment.line[i]->port);
256     xbt_peer_free(assignment.line[i]);
257   }
258   for (i=0 ; i<PROC_MATRIX_SIZE-1 ; i++){
259     socket_row[i]=gras_socket_client(assignment.row[i]->name,
260                                      assignment.row[i]->port);
261     xbt_peer_free(assignment.row[i]);    
262   }
263
264   for (step=0; step<PROC_MATRIX_SIZE;step++) {
265         
266     /* a line brodcast */
267     if(myline==step){
268        INFO3("LINE: step(%d) = Myline(%d). Broadcast my data (myport=%d).",
269              step,myline,gras_os_myport());
270        for (l=0;l < PROC_MATRIX_SIZE-1 ;l++) {
271           INFO2("LINE:   Send to %s:%d",
272                 gras_socket_peer_name(socket_row[l]),
273                 gras_socket_peer_port(socket_row[l]));
274          gras_msg_send(socket_row[l], 
275                        gras_msgtype_by_name("dataB"), 
276                        &mydataB);
277        }
278        
279         
280        xbt_matrix_free(bB);
281        bB = xbt_matrix_new_sub(mydataB,
282                                submatrix_size,submatrix_size,
283                                0,0,NULL);       
284     } else {
285       TRY {
286         xbt_matrix_free(bB);
287         gras_msg_wait(600,gras_msgtype_by_name("dataB"),&from,&bB);
288       } CATCH(e) {
289         RETHROW0("Can't get a data message from line : %s");
290       }
291       INFO4("LINE: step(%d) <> Myline(%d). Receive data from %s:%d",step,myline,
292             gras_socket_peer_name(from), gras_socket_peer_port(from));
293     }
294
295     /* a row brodcast */
296     if (myrow==step) { 
297        INFO2("ROW: step(%d)=myrow(%d). Broadcast my data",step,myrow);
298        for (l=1;l < PROC_MATRIX_SIZE ; l++) {
299           INFO2("ROW:   Send to %s:%d",
300                 gras_socket_peer_name(socket_line[l-1]),
301                 gras_socket_peer_port(socket_line[l-1]));
302           gras_msg_send(socket_line[l-1],gras_msgtype_by_name("dataA"), &mydataA);
303        }
304        xbt_matrix_free(bA);
305        bA = xbt_matrix_new_sub(mydataA,
306                                submatrix_size,submatrix_size,
307                                0,0,NULL);
308     } else {
309       TRY {
310         xbt_matrix_free(bA);
311         gras_msg_wait(1200,gras_msgtype_by_name("dataA"), &from,&bA);
312       } CATCH(e) {
313         RETHROW0("Can't get a data message from row : %s");
314       }
315       INFO3("ROW: step(%d)<>myrow(%d). Receive data from %s",step,myrow,
316             gras_socket_peer_name(from));
317     }
318     xbt_matrix_double_addmult(bA,bB,bC);
319
320   };
321  
322   /* send Result to master */  
323   result.C=bC;
324   result.linepos=myline;
325   result.rowpos=myrow;
326
327   TRY {
328     gras_msg_send(master, gras_msgtype_by_name("result"),&result);
329   } CATCH(e) {
330     RETHROW0("Failed to send answer to server: %s");
331   }
332   INFO2(">>>>>>>> Result sent to %s:%d <<<<<<<<",
333         gras_socket_peer_name(master),gras_socket_peer_port(master));
334   /*  Free the allocated resources, and shut GRAS down */
335
336   xbt_matrix_free(bA);
337   xbt_matrix_free(bB);
338   xbt_matrix_free(bC);
339
340   xbt_matrix_free(mydataA);
341   xbt_matrix_free(mydataB);
342   gras_socket_close(master);
343   gras_socket_close(from);
344   /* FIXME: some are said to be unknown 
345   for (l=0; l < PROC_MATRIX_SIZE-1; l++) {
346      if (socket_line[l])
347        gras_socket_close(socket_line[l]);
348      if (socket_row[l])
349        gras_socket_close(socket_row[l]); 
350   }*/
351
352   return 1;
353 }
354
355 int slave(int argc,char *argv[]) {
356   gras_socket_t mysock;
357   gras_socket_t master;
358
359   /* Init the GRAS's infrastructure */
360   gras_init(&argc, argv);
361   amok_pm_init();
362
363   /*  Register the known messages and my callback */
364   register_messages();
365   gras_cb_register(gras_msgtype_by_name("pmm_slave"),pmm_worker_cb);
366
367   /* Create the connexions */
368   mysock = gras_socket_server_range(3000,9999,0,0);
369   INFO1("Sensor starting (on port %d)",gras_os_myport());
370   gras_os_sleep(2); /* let the master get ready */
371   master = gras_socket_client_from_string(argv[1]);
372                                 
373   /* Join and run the group */
374   amok_pm_group_join(master,"pmm");
375   amok_pm_mainloop(600);
376
377   /* housekeeping */
378   gras_socket_close(mysock);
379   //  gras_socket_close(master); Unknown
380   gras_exit();
381   return 0;
382 } /* end_of_slave */