Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
603559d35656069b41edc2f4aafbd53ed35596a2
[simgrid.git] / ChangeLog
1 SimGrid (3.3.4) unstable; urgency=low
2
3  The "Desktop Grid needs love too" release.
4
5  Models improvements:
6  * Major speedup in the maxmin system solving by using lazy evaluation
7    Instead of solving completely the maxmin system at each iteration, 
8      only invalidate (and recompute) the modified parts. 
9    This new feature is enabled in default models but you can try to
10      turn it on with "--cfg:maxmin-selective-update=1" for other models.
11  * Cas01 IMproved as default CPU model
12    This CPU model is the same Cas01 model, but it uses the
13      maxmin-selective-update flag and a heap structure to manage
14      actions on SURF kernel. 
15    It reduces the complexity to find the next action to finish and,
16      consequently, it's faster than the old Cas01.
17    This is the new default CPU model (Cas01).   
18  * Rename the old Cas01 model to Cas01_fullupdate
19    Keep the old cpu model Cas01 with the new name of Cas01_fullupdate.
20    Use "--cfg=cpu_model:Cas01_fullupdate" to use the old default CPU model.
21  * CpuTI (CPU Trace Integration)
22    A new CPU model whose objective is simulate faster when using
23      availability trace files. 
24    Instead of using a full featured, over engineered maxmin system for
25      CPU modeling, this model does the pre-integration of traces files
26      to calculate the amount of CPU power available, and so, executes
27      faster than the old CPU models. 
28    Use "--cfg=cpu_model:CpuTI" to change to this CPU model.
29  * Use LV08 as default network model since it gives better accuracy
30     for small messages and shouldn't change things for big ones.
31    Use --cfg=network_model:CM02 to get the previous behavior.
32    
33    
34          ******************************************
35          *DO NOT MIX 3.3.4 RESULTS WITH OLDER ONES* 
36          ******************************************
37    * The new CPU model may changes simulations!
38      The point is that events occurring at the exact same timestamp
39         are not scheduled in the same order with the old and new 
40         version. This may be enough to completely change the execution
41         of simulations in some cases. 
42    * The new network model will change simulations!
43      This new model is more realistic than the previous one, so you
44        should consider redoing your old experiments with this model.
45      Sorry for the inconvenience.
46
47  MSG:
48  * Port of MSG's mailbox on top of SIMIX network
49    The put/get mechanism was greatly simplified thanks to the new SIMIX module.
50
51  SIMIX:
52  * New SIMIX network module
53    It provides a rendez-vous point (aka mailbox) based send/recv API to perform
54    synchronous communication.
55  * Add semaphores as SIMIX synchronization mechanism.
56    
57  SimDag:
58  * new function SD_daxload(char*) to load a DAX file 
59    (see http://vtcpc.isi.edu/pegasus/index.php/WorkflowGenerator)
60  * Introduce typed tasks. Specify its kind and cost at creation. 
61    At scheduling, just give where it should be placed, and the cost
62    for each involved resource is automatically computed.
63    Existing constructors so far (more to come of course):
64     - SD_task_create_comm_e2e() for end-to-end communication
65     - SD_task_create_comp_seq() for sequential computation
66    Use SD_task_schedulev() / SD_task_schedulel() to schedule them.
67  * new function SD_task_dump() for debuging display
68  * new function SD_task_dotty(task,FILE*) writing to file the info
69    about the task in dotty format
70  * SD_task_dependency_exists() can now cope with having one of its
71    arguments NULL. If so, it tests whether the other argument has any 
72    dependency.
73  * Add getters on list of preceding/following tasks:
74     SD_task_get_parents(task) and SD_task_get_children(task)
75  * Add getters on amount of workstations and list:
76     SD_task_get_workstation_count(t) and SD_task_get_workstation_list(t)
77  * Add getter on task kind: SD_task_get_kind(task)
78  * Update the start_time and finish_time of tasks on completion/failure
79  * Bugfix: Remove task from state swags when destroyed
80  
81  GRAS:
82  * New function: void gras_cpu_burn(double flops) -- a simple CPU burner
83
84  XBT:
85  * New function: xbt_dynar_dopar(dynar,fun) to map a function over the
86    dynar with one separate thread per value of the dynar.
87  * Change the prototype of xbt_thread_create(), sorry. 
88    Added a boolean parameter indicating whether we want to join this
89    thread (used in SG only for now)
90  * Implement xbt_thread_join and xbt_thread_yield in SG also.
91    
92  Bug fixes:
93  * GTNetS wrappers should now be usable again (and betterly tested too)
94  * Fix a major regression from 3.2 where the timeout provided to
95    MSG_task_put_with_timeout() was used as absolute time before which
96    the comm should be done.
97  * Start to fix the <cluster> tag. 
98    - Internal links should be good now (beside of the loopback, which
99      use the private link instead)
100    - paths to the external world is still rather broken
101    - the <route:multi> tag is just broken. Actually that's brain-dead.
102      We need sth like <route:multi src="myCluster" dst="$*-${myCluster}">
103      to make it less stupid
104    ** Check your platform with teshsuite/simdag/platforms/flatifier **
105  * Fix a source-level compatibility glitch from 3.2: after defining
106    MSG_USE_DEPRECATED, you can use the old name
107    MSG_task_put_with_time_out() for MSG_task_put_with_timeout()
108  * Allow to compile from the SVN with automake 1.11
109  * Fix some problems when using the "start_time" tag in deployment XMLs.
110  * Fix #8569: XBT/synchro.h has redundant declarations
111  * Fix #8563: MSG return values and exceptions
112    Introduce a MSG_TIMEOUT_FAILURE return code and use it consistently.
113  * Integrate patch #8636: Obey DESTDIR when installing documentation.
114    Thanks to Robson Peixoto.
115  * Fix a vicious bug in dictionaries inducing that some elements were
116    not freed on xbt_dict_free()
117
118  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> 
119
120 SimGrid (3.3.3) stable; urgency=low
121
122  The "Need for Speed" release.
123  
124  The timings done to validate the 3.3.2 were faulty. 
125  Instead of being 5% faster, it was 15% slower (compared to 3.3.1).
126    
127  The problem was a conversion from a manually handled vector to
128    xbt_dynar_t on the critical path. 
129  xbt_dynar_foreach calls functions, inducing stack management crap.
130
131  We inlined these functions and xbt_dynar_foreach is now breath taking.
132  We also inlined xbt_swag_belong on the way.
133
134  Here are some approximate speedup measurements (on master/slaves
135   simulations lasting between 10s and 20s each):
136    3.3.1                   -> 3.3.2: about same performance
137    3.3.2                   -> 3.3.3: 40% speedup
138    3.3.1                   -> 3.3.3: 40% speedup
139    3.3.1 with inline patch -> 3.3.3: 30% speedup
140    
141  Our reading is that the refactoring which occurred in 3.3.2 made us
142   suffer much more from the xbt_dynar_foreach low performance, but
143   once we solved this, this refactoring proved to be very performance
144   effective. From the 40% speedup, somehow, 10% are due to the
145   inlining and 30% to the refactoring.
146
147  That's a pitty that gcc cannot inline functions placed in other files
148   alone. We have to choose between:
149   - break the encapsulation (by putting private data structures and
150     accessors in headers files to help gcc)
151   - live with low performance 
152   - switch to a decent compiler such as icc (not quite possible).
153
154  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Thu, 20 Aug 2009 21:21:33 +0200
155
156 SimGrid (3.3.2) stable; urgency=low
157
158  The "Simplicity does not preceed complexity, but follows it" release.
159
160  The main contributors of this release were (lexical order):
161    Silas De Munck, Stéphane Genaud, Martin Quinson, Cristian Rosa.
162        
163  SURF: 
164   * Extract the routing logic into its own object.
165     (was dupplicated in network.c and workstation_LV07.c;
166      Allows to implement other ways of storing that info)
167     => kill now useless network_card concept
168     - Use dynar to represent routes (instead of void** + int*)
169     - kill link_set (use surf_network_model->resource_set instead)
170     - Add a command-line option to choose the routing schema to use
171     - Add three new models: 
172       * Floyd (shortest path computed at initialization)
173       * Dijikstra (shortest path recomputed all the time)
174       * Cached Dijikstra (shortest path computed on need)
175       All these models where contributed by Silas De Munck, and are
176       described in his ICCS09 paper.
177
178   * Simplify model declaration
179     (less redirections, less function to write when defining a model)
180     - Factorize stuff between models:
181       - model_init/exit
182       - Set of resources:
183         surf_model_resource_set(model)
184         surf_model_resource_by_name(model, name)
185     - Unify the types of models in s_surf_model_t (using an union)
186     - Embeed fields of common_public directly into s_surf_model_t
187     - Rename model methods:
188       action_free ~> action_unref
189       action_change_state ~> action_state_set
190       action_get_state    ~> action_state_get
191     - Change model methods into functions :
192       (model)->common_public->action_use  ~> surf_action_ref
193       
194   * Implement a generic resource; use it as ancestor to specific ones
195     (allows to kill duplicated code in models)
196     Drawback: timer command don't need no name nor properties;
197               workstation_CLM03 don't need no properties
198     (but I guess we can live with those few bytes wasted)
199     
200   * Improve the action object model
201     - implement a constructor avoiding dupplicated code about field
202       initialization in generic_action part.
203       
204   * Kill the SDP model: it has an external dependency, is deprecated
205     in flavor of modern lmm models, and didn't compile since a while
206  
207  SIMIX:
208   * Relocation of the context module from XBT to SIMIX.
209     (the context were decoupled from the simix processes, duplicating a lot of code)
210     => a lot of code was factorized
211     - less overhead is introduced during scheduling
212     - simpler API for the context factory
213     - the logic for process creation,destruction and manipulation was simplified
214   * Simplification of the s_smx_process_t data structure.
215     => accesing the simix level data associated to a process is faster now, 
216        and the code is a lot more readable.
217        
218  SMPI:
219   * Implement some more MPI primitives: 
220     MPI_Bcast, MPI_Waitany, MPI_Waitall, MPI_Reduce, MPI_Allreduce, MPI_Scatter, MPI_Sendrecv, MPI_Alltoall
221     -implementation: Bcast: flat or 2-ary tree (default), 
222                      Barrier: 4-ary tree,
223                      Reduce: flat tree
224                      Allreduce: Reduce then Bcast
225                      Alltoall: "basic_linear" if data per proc < 3Kb, "otherwise pairwise". 
226                                Not yet implemented: "Bruck" for data per proc < 200b and comm size > 12
227                      Alltoallv: flat tree, like ompi
228                      Scatter: flat tree
229   * Add support for optimized collectives (Bcast is now binomial by default)
230   * Port smpirun and smpicc to OS X
231
232  SimDag:
233   * Kill SD_link_get_properties: hard to maintain and makes very little sense
234     Shout out if you used it.
235     
236  GRAS:
237   * Display the list of still queued messages in SG mode when existing
238     the process.
239
240  XBT:
241   * Add xbt_set_get_by_name_or_null() [Silas De Munck]
242   * Add xbt_graph_node_get_outedges() [Silas De Munck]
243   * Add xbt_str_from_file(FILE*)
244   * Add xbt_dict_get_key achieving a linear reverse search
245   * Remove the context module 
246
247  Portability report of this version:
248   * Main portability targets:
249     - Linux(debian)/x86/context   
250     - Linux(debian)/x86/pthreads 
251     - Linux(debian)/amd64/context 
252     - Linux(debian)/amd64/pthreads
253     On these, we still have the eratic breakages of gras/pmm and 
254       amok/saturate_sg reported in previous version. We still think
255       that the tests are the cause of the fault, not the tested code.
256       
257     - Mac OSX Leopard/x86/context
258     Still false negative in tesh autotesting.
259     Smpi still fails, but this time because readlink does not accept -f
260     Everything seems to work properly beside of that.
261     
262   * Exotic platforms:
263     - AIX version 5.3 (only tested contexts this time)
264       Smpi still fails there because mktemp is not installed. 
265       Everything seems to work properly beside of that.
266     - OpenSolaris 11
267       I managed to compile it for the first time, but several breakages.
268       Won't delay the release for this exotic platform.
269     
270   * Windows: it's still lagging behind. If you want to help, please
271     stand up.
272
273  Timing report of this version:
274   This version seem to be more than 5% faster than 3.3.1 (on linux
275     64bits with contextes). The gain is less than expected, we are
276     investigating this for next release.
277
278  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Wed, 19 Aug 2009 17:07:12 +0200
279
280 SimGrid (3.3.1) stable; urgency=low
281
282  OVERALL CHANGES:
283   * Implement a --cfg-help to show existing configuration variables
284   * Build chain do not require doxygen in maintainer mode
285
286  GRAS:
287   * fix a bug on struct sizeof computation, which prevented the
288     exchange of arrays of structs in some conditions
289     - added a regression test about this in datadesc_usage
290   * Allow the exchange of 0-long dynamic vectors.
291     - for that, use -1 as indicator of dynamic size instead of 0
292     - This implied to change any size from unsigned long to long,
293       reducing a bit communication abilities, but I guess that with
294       64bits being quite common, this is more than enough.
295     - This also induce a protocol change, thus bumping network protocol
296       version from 0 to 1 (if we have external users, we have to get
297       clean on that point too ;)
298     - added two regression tests about this in datadesc_usage
299   * Be more verbose when propagating local exceptions
300     This helps debugging.
301   * Display the status of simulated processes when receiving SIGINT in
302     simulation mode
303
304  MSG:
305   * Allow to control the simulation from a trace file.
306     New functions MSG_action_register() and MSG_action_trace_run()
307     The first one allows to associate a function execution to each
308      kind of action while the second one parses a trace file and
309      triggers the corresponding actions within the system.
310     For now, only a toy example is provided in examples/msg/actions
311   * Add an exemple of process migration in examples/msg/migration
312   * Fix a bug in task exchange which broke MSG_task_get_sender()
313     Add a teshsuite regression test for that.
314     [Bug: if MSG_task_get_sender() is called after sender exit,
315      bad things happen]
316   * Fix a bug which prevented suspend/resume to work properly
317   * Display the status of simulated processes when receiving SIGINT
318     This fixes a regression of v3.3. due to the introduction of SIMIX
319   * Bug fixing in failure management:
320     - trace could not start by a failure at time 0
321     - failure during communications were not working
322         
323  SIMIX:
324   * Add SIMIX_process_set_name() to change the name of the current
325     process in the log messages.
326   * Store smx_hosts in a dict since we only retrieve them by name
327   * Move the configuration infrastructure to surf
328
329  SIMDAG:
330   * Move the configuration infrastructure to surf
331
332  SMPI: 
333   * Massive internal cleanups:
334     - Store internal structures on processes instead of hosts (allows
335       to have more than one process per host, in addition of being more 
336       logical)
337     - Cleanup the initialization/finalization process
338     - Kill a whole bunch of unneeded synchronization: 
339       processes run in exclusive manner within the simulator
340     - Move queues from global tables to process data fields
341   * Improve smpirun:
342     - now accept -platform and -hostfile arguments
343     - Pass the right rank value to processes according to the hostfile
344   * Compile the examples by default, and use them as regression tests
345   * Implement MPI_Wtime()
346   * Change the reference speed to a command line option
347   
348  SURF:
349   * TCP_gamma can now be specified as command line option using
350     --cfg=TCP_gamma:10000000.0
351   * Change the --surf-path cmd line option into --cfg=path:
352   
353  XBT:
354   * Also include strbuff from xbt.h public header
355   * xbt_ex_display(): do not free the exception after displaying 
356     This allows to do more with the given exception afterward.
357     Users should call xbt_ex_free() themselves.
358     
359     
360
361  Portability report of this version:
362   * Main portability targets:
363     - Linux(debian)/x86/context   
364     - Linux(debian)/x86/pthreads 
365     - Linux(debian)/amd64/context 
366     - Linux(debian)/amd64/pthreads
367     These targets fail about 1/10 of times on gras/pmm, but we believe
368       that this is because of the test, not because of simgrid.
369     amok/saturate_sg fails even more rarely, and the test may not be
370       the problem.
371       
372     - Mac OSX Leopard/x86/context
373     The test suite still spits tons of errors because some obscure
374       force prevents us from removing the temporary directories
375       arguing that they still contain some metadata I've never heard of.
376     Smpi fails because seq is not installed.
377     Everything seems to work properly beside of that.
378     
379   * Exotic platforms:
380     - AIX version 5.3 (both contexts and pthread)
381       Smpi still fails there because mktemp is not installed. 
382       XML inclusions seems rosty on AIX.
383     
384   * Windows: it's still lagging behind. If you want to help, please
385     stand up.
386
387  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Sat, 27 Jun 2009 00:14:30 +0200
388
389 SimGrid (3.3) stable; urgency=high
390
391  OVERALL CHANGES:
392
393   * JAVA BINDINGS for MSG (you dreamt of them? We made them)
394     [Malek Cherier & Mt]
395
396   * Introduce the SIMIX module: factorize code between MSG and GRAS.
397     [Bruno Donassolo]
398   
399     Until now, GRAS were using MSG as an interface to SURF. It was
400     quite difficult because both interface have several differences
401     (MSG channels vs GRAS sockets were the most notable point).
402    
403     This also opens the gate to SMPI (which should occur soon) and speed
404     up simulations by to 40% (even if it were not the main goal).
405   
406     ************************************** 
407     *DO NOT MIX 3.2 RESULTS WITH 3.3 ONES* Simix may changes simulations!
408     **************************************
409     The point is that events occuring at the exact same timestamp are
410     not scheduled in the same order with the old and new version. This
411     may be enough to completely change the execution of simulations in
412     some cases. Sorry for the inconvenience.
413
414   * Cleanup and upgrade the XML format to push further scalability
415     issues (check http://hal.inria.fr/inria-00256883/ for more info)
416
417   * Improve the testing infrastructure with tesh. Now a very large part of
418     the code is tested not only by being run but also by checking that the
419     output match an expected output [Mt].
420
421   * Move on to FleXML v1.7 for the embeeded XML parsers. This version
422     is really less memory-demanding, which should allow you to use
423     larger files in SimGrid [AL].
424     
425   * Inform valgrind about our contextes, so that it becomes usable
426     with the default (and more effecient) version of SimGrid
427     [contributed by Sékou Diakite, many thanks]
428
429  GRAS:
430   * Introduce a listener thread in charge of receiving incomming
431     messages from the network. It allows to overlap communication and
432     computation but most notably, it removes some stupid deadlocks due
433     to the fact that so far, a process could not send and receive at
434     the same time. This made most non trivial communication schema
435     impossible.
436   * Convert the PIDs from long int to int to match the MSG ones (and
437     linux ones too) [Mt]
438   * New function: gras_agent_spawn() to launch a new process on
439     current host. Only working in simulation for now. [Mt]
440   * New function: gras_os_hostport() returning a constant form (ie,
441     not needing to be freed) of "gras_os_hostname():gras_os_myport()"
442
443  XBT:
444   * Make the backtrace of exceptions more human readable [Mt]
445   * New module: xbt/str [Mt]
446     a ton of string utility functions (split, join, printf to a newly
447     allocated buffer, trim, etc)
448   * New module: xbt/hash [Mt]
449     SHA1 hashing algorithm (more to come if needed)
450   * New module: xbt/synchro [Mt]
451     synchronization tools (mutex and conditions) working the same way
452     in simulation and in real life (mainly useful for GRAS, but not
453     only).
454   * New module: xbt/queue [Mt]
455     classical producer/consumer synchronization scheme
456   * xbt_dynar_new_sync() creates a synchronized dynar. All access
457     (using the classical functions will get serialized) [Mt]
458   * Make dictionary internal table dynamic. No need to specify its size
459     anymore; functions xbt_dict_new_ext() and xbt_dict_hashsize_set()
460     thus dropped. [Mt].
461   * Make sure the log channels are organized as a tree under windows
462     (because of ANSI C compatibility issue, any channel were child of
463      root directly) [Mt].
464
465  SURF:
466   * Cleaned many thing in surf and fixed a few bugs [AL].
467   * Add a nice command line configuration mechanism to compose models [AL].
468   * Add a new model for parallel tasks (ptask_L07) that is less buggy than
469     the previous one (KCCFLN05). It relies on something that looks like
470     a max-min sharing mechanism but cannot be written as such. A new solver
471     was thus designed [AL].
472   * Add a new solver to lmm. Based on Lagrange optimization and
473     gradient-based descent, it enables to efficiently maximise systems s.a
474   
475      sum f_i(x_i) s.t Ax<= b  with A_{i,j}>=0 and f_i a concave function.
476
477     This solver enables to propose two new network models for TCP Reno and
478     TCP Vegas based on Low's work. These models still need to be fully
479     tested though [Pedro Velho].
480
481  SIMDAG [AL]:
482   * Bug fix in SD_simulate. Now the time bound given as argument is
483     used.
484   * Use the new parallel task model (ptask_L07) as default.
485   * Use the SURF command line configuration mechanism.
486   * 0-size tasks (for synchronization) should now work.
487
488  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Sun Apr 12 05:20:36 CEST 2009
489
490 SimGrid (3.2) stable; urgency=high
491
492   OVERALL CHANGES:
493    * Port to windows.
494      We still experience issues on this platform, but we believe that at
495      least MSG is usable.
496
497   GRAS API BREAKAGE (for simplification purpose, sorry):
498    * the gras_msgtype_by_name is not used anymore. Instead of 
499        gras_msg_send(toserver, gras_msgtype_by_name("request"), &request);
500      you can write (and must)
501        gras_msg_send(toserver, "request", &request);
502    - If you still want to pass a gras_msgtype_t to the function (to cache
503      the type and avoid the lookup time), use the gras_msg_send_() variant.
504    - Impacted functions:
505      gras_cb_register, gras_cb_unregister, gras_msg_send, gras_msg_wait,
506      gras_msg_rpccall, gras_msg_rpc_async_call, gras_msg_wait_ext
507    * The callbacks are now expected to return 0 when everything went well
508      (just like the main() function)
509
510   GRAS new features and improvements:
511   * New module mecanism where user code can use per process globals [Mt]
512     This is similar to gras_userdata_*() functions, but for libraries. It
513       factorize some code developped over and over in the examples and AMOK.
514     It has still to be documented and used (only amok/peermanagement is
515       converted for now).
516   * Fix a vicious bug in the TCP buffering mecanism which leaded to message
517     loss when they were small enough to fit into the buffer and sent quickly
518     enough so that they can all get received in one shoot.   
519   * gras_datadesc_by_name and gras_msgtype_by_name: now raise an exception
520     if not found. Use the *_or_null() variant for the old semantic.
521   * In gras_msg_handle, do not discard messages without callback.
522     They are probably messages to be explicitly awaited later (ie, proofs of
523     mis-synchronization in userland since they are sent before being awaited)
524     No big deal usually.
525   * gras_socket_meas_send/recv: semantic changed!
526     The numerical arguments used to be (1) the total amount of data to send
527     and (2) msg_size. This was changed to (1) msg_size and (2) amount of
528     messages. This was need for the fool willing to send more than MAXINT
529     bytes on quite fat pipes.       
530         
531   AMOK:
532   * Do really rename the hostmanagement module to peermanagement. [Mt]
533     Ie, rename functions from amok_hm_* to amok_pm_*. This breaks the API,
534     but this is rather new and this was documented in the module
535     documentation (poor excuses, I admit)
536   * Bandwidth measurement semantic changed! This follows the changes to
537     gras_socket_meas_send/recv explained above.
538     
539   SIMDAG:
540   * A sequential mode has been added to the workstations. When a workstation
541     is in sequential mode, it can execute only one task, and the other tasks
542     are waiting in a FIFO. [Christophe Thiery]
543
544   SURF:
545   * The KCCFLN05 workstation model now handles parallel tasks. It is the
546     model for SIMDAG. [Christophe Thiery]
547   * Bug fix in the maxmin solver: Some values were close to 0 instead of
548     equal to 0, which caused some bad behaviors in
549     saturated_constraint_set_update. I now use a threshold mechanism like in
550     surf. [AL]
551
552   XBT:
553   * When running manually src/testall, you select specific units [Mt]
554     testall is the result of our cunit mecanism, and should replace all
555     the scripty thingy around since bash don't run easily on billware.
556
557   * A mallocator system has been added. [Christophe Thiery]
558     Mallocators allow you to recycle your unused objects instead of freeing them
559     and allocating new ones.
560
561   Documentation update:
562   * FAQ reworking + New FAQs:
563     - "Valgrind spits tons of errors!" [Mt]
564     - "How to repport bugs" [Mt]
565     - "Cross-compiling a Windows DLL of SimGrid from Linux" [Mt]
566     - "What is the difference between MSG, SimDag, and GRAS?" [Mt]
567     - Communication time measurement within MSG [AL]
568     - I experience weird communication times when I change the latency [AL]
569   * GRAS tutorial [Mt]
570     It contains:
571      - an introduction to the framework and to the used communication model
572      - an initiatic tour introducing the most proheminent features:
573        o Part 1: Bases
574          . Lesson 0: Installing GRAS
575          . Lesson 1: Setting up your own project
576        o Part 2: Message passing
577          . Lesson 2: Exchanging simple messages
578          . Lesson 3: Passing arguments to the processes (in SG)
579          . Lesson 4: Attaching callbacks to messages
580          . Lesson 5: Using globals in processes
581          . Lesson 6: Logging informations properly
582          . Lesson 7: Using internal timers
583          . Lesson 8: Handling errors through exceptions
584          . Lesson 9: Exchanging simple data
585          . Lesson 10: Remote Procedure Calling (RPC)
586          . Lesson 11: Explicitely waiting for messages
587          . Recapping of message passing features in GRAS
588      - A HOWTO section containing:
589        o HOWTO design a GRAS application
590        More are due, of course. They will come latter. In the meanwhile, you can 
591        check the examples which are still here.
592
593  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Fri Mar 16 21:11:46 CET 2007
594
595 SimGrid (3.1) stable; urgency=high
596
597   General:
598   * Port to gcc 4.x   
599     There was a stack corruption somewhere, visible only when optimizing
600     with these versions. [Vince]
601
602   SIMDAG:
603   * This is a NEW module! SimDAG (SD for short) is a revival of the old SG
604     module that enabled to play with Directed Acyclic Graphs. It is built
605     directly on top of SURF and provides an API rather close to the old
606     SG. Some old codes using SG are currently under rewrite to check that
607     all needful functions are provided. [Christophe Thiery]
608         
609   SURF:
610   * Complete rewrite of the KCCFLN05 workstation model. It is now an
611     extension of the classical CLM03 model that gracefully handles
612     failures. This is now the default model for MSG and GRAS. It doesn't
613     handle parallel tasks yet though. [AL]
614   * Bug fix: Weights were not correctly set in the network part. 
615     WARNING: This may have resulted in incorrect results with simulations
616     where there are more than one flow on a given link. [AL]
617
618   SURF, MSG, GRAS:
619   * After a (long ?) discussion on simgrid-devel, we have decided that the
620     convention we had on units was stupid. That is why it has been decided
621     to move from (MBits, MFlops, seconds) to (Bits, Flops, seconds). 
622     WARNING : This means that all previous platform files will not work as
623     such with this version! A warning is issued to ask users to update
624     their files. [AL]
625     A conversion script can be found in the contrib module of the CVS, under
626     the name contrib/platform_generation/surfxml_update.pl [MQ]
627
628   MSG,GRAS:
629   * Bug fix: Processes were started in reverse order, wrt deployment file.
630     WARNING: if your code relies on this bug, please fix it.    [AL]
631   * Bug fix: Add a test in MSG_task_execute to stop whenever a task is
632     being executed on two different locations.                  [AL]
633   * Bug fix: Failures are now better supported thanks to Derrick's tests
634     (there was many failure situations I hadn't thought of and that weren't
635     correctly handled). [AL]
636   * New function: MSG_host_is_avail indicates you whether a given m_host_t
637     is up or down. [AL]
638
639   GRAS:
640   * New! a real RPC mecanism, as it ought to be since too long. [MQ]
641       Exception occurring on server-side are propagated back to client (!).
642       
643     API CHANGE: the callback changed their prototype. Change:
644         int my_handler(gras_socket_t expeditor, void *payload_data) {
645       to:
646         int my_handler(gras_msg_cb_ctx_t ctx  , void *payload_data) {
647           gras_socket_t expeditor=gras_msg_cb_ctx_from(ctx);
648       and you're set.
649   * New! function: gras_msg_handleall to deal with all messages arriving
650       within a given period.
651   * New! function: gras_socket_server_range to get a server socket in a
652     range of port numbers (ease to avoid port number conflicts) [MQ]
653   * New! gras processes display their backtrace when they get a SIGUSR1
654       or when Ctrl-C is pressed. Use Ctrl-C Ctrl-C to exit.
655       Sweet to debug RL processes [MQ]
656
657   AMOK:
658   * Bandwidth module: 
659     - Do not force experiment sizes to be expressed in kb, or it becomes
660       impossible to measure the latency this way (needs one byte-long tests)
661     WARNING: this changes the amok_bw_* function semantic. [MQ]
662     - Implements the link saturation stuff. [MQ]
663   * Peer management module: 
664     New! module factorizing code that we wrote over and over [MQ].
665       
666   XBT:
667   * New module: cunit (my jUnit implementation in ansi C) [MQ]
668     - Test units are placed directly into the library code, they get extracted
669       automatically and placed into the src/testall binary.
670     - Convert most of the XBT tests to this system.
671   * New functions: xbt_dynar_getfirst_as() and xbt_dynar_getlast_as() [MQ]
672   * XML parsing: rewrote parts of flexml to enable multiple xml parsers to
673     live in the same C code. This required to change a little bit the API
674     of surfxml parsing but shouldn't be an issue for end-users. [AL]
675   * New module: sparse graph structure with basic algorithms (this is work
676     in progress and the API is not considered to be frozen yet). [AL]
677   * Display more information on backtraces: source line & function names are
678     now displayed just like valgrind does (rely on addr2line tool) [MQ]
679   * New function: xbt_backtrace_display(). Sweet while debuging [MQ]
680   * Reworked a little bit some #include statements to load only required
681     headers. Some user code that relied on SimGrid to include stdlib or
682     stdio may need to include it by themselves. [AL]
683   * Fixed xbt/log.h. A missing SG_BEGIN_DECL prevented compilation with
684     g++. [AL]
685   * Renamed xbt_host_t into xbt_peer_t since it betterly describes what I
686     meant. This breaks the API of AMOK and of xbt/config. Sorry about this,
687     but I guess that almost nobody used those parts. [MQ]
688
689  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Fri, 14 Jul 2006 01:32:27 +0200
690
691 SimGrid (3.0.1) stable; urgency=low
692
693   XBT:
694   * Unfortunately, I had missed 5 misnamed functions:
695       xbt_fifo_item_t xbt_fifo_newitem(void);
696       void xbt_fifo_freeitem(xbt_fifo_item_t);
697       xbt_fifo_item_t xbt_fifo_getFirstItem(xbt_fifo_t l);
698       xbt_fifo_item_t xbt_fifo_getNextItem(xbt_fifo_item_t i);
699       xbt_fifo_item_t xbt_fifo_getPrevItem(xbt_fifo_item_t i);
700     They're now deprecated. Please use their new versions:
701       xbt_fifo_item_t xbt_fifo_new_item(void);
702       void xbt_fifo_free_item(xbt_fifo_item_t);
703       xbt_fifo_item_t xbt_fifo_get_first_item(xbt_fifo_t l);
704       xbt_fifo_item_t xbt_fifo_get_next_item(xbt_fifo_item_t i);
705       xbt_fifo_item_t xbt_fifo_get_prev_item(xbt_fifo_item_t i);
706     [AL]
707   * Bugfix: really disconnect fifo items which are remove_item()ed [AL]
708   * Documentation: xbt_log module unmercifully reworked [MQ]
709   * Bugfix: there was a problem with the ending of contexts with 
710     the pthread backend. It caused some weird deadlock or behavior
711     depending on the pthread implementation. [AL]
712   * Bugfix: get the exceptions raised in the simulator repport where
713     and why they come from when they are not catched in time [AL, MQ]
714
715   SURF:
716   * Bugfix: Do repport the error when two non-connected hosts try to
717     exchange data (Thanks to Flavien for stumbling into this one) [AL]
718   
719   SURF:
720   * Add additionnal checkings on communications. Assert that two
721     communicating hosts are connected by a set of links... [AL]
722         
723   MSG:
724   * Add additionnal checkings on channel values in communication [AL]
725   * New: MSG_task_get_source to see on which host a task was generated [HC]
726   * New: int MSG_task_probe_from_host(int channel, m_host_t host): returns
727     the number of tasks waiting to be received on channel and sent
728     by host. [AL]
729   * New: MSG_error_t MSG_task_get_from_host(m_task_t * task, int channel, m_host_t host); 
730     waits for the first task coming from a given host.. [AL]
731         
732   GRAS new functionnalities: [MQ]
733   * Enhance the parsing macro to allow the size of multidimentional objects
734     to be given thru annotations.
735   * New example (and documentation): Matrix Multiplication a la RPC 
736     (as when I was young!) and fix a bunch of bugs found on the way.
737
738   GRAS performance improvements: [MQ]
739   [DataDesc]
740   * Reduce the amount of cbps creation/destruction by making it static to 
741     datadesc_send/recv() and using a (newly created) cbps_reset (based on 
742     dynar_reset ())
743   [Virtu]
744   * Change libdata to a set so that we can search for stuff by ID (and thus 
745     reduce the insane amount of dict lookups)     
746   
747   [Transport]
748   * Actually implement gras_datadesc_copy() so that we don't have to mimick
749     RL communication on top of SG since it's so uneffective. 
750     It may also be used for inter-thread communication in RL, one day. 
751   * Use gras_datadesc_copy() to exchange messages on top of SG 
752     Allows to:
753     - improve message exchange performance on top of SG
754     - deprecate transport_plugin_sg.c:gras_trp_sg_chunk_send() & recv()
755   * Don't exchange on the network the size of the used part of buffer,
756     instead, specify the possible buffer size to read(). 
757     Advantages:
758      - reduces the amount of read/write calls (one pair per exchange)
759      - reduces the amount of exchanged data (the size)
760      - allows to retrieve all arrived data on receiver side, if we don't need
761        it right now (subsequent read will peek the buffer)
762      - allows the receiver to proceed with the begining of the stream before
763        everything is arrived
764      - make it possible to build an iov transport (using readv/writev)
765     Extra difficulty: 
766      - take care of the data with non-stable storage (like stacked data),
767        and bufferize them.
768   * If possible, TCP send uses vector I/O (when writev() is here) 
769      - Don't use it for receive since we send data sizes and data on the
770        same stream, so we wouldn't be able to chain large amount of chunks
771        before having to flush the stuff to read the size.
772   * Rework the transport plugin mecanism to simplify it and reduce the
773     amount of pointer dereferencement when searching for the right function 
774     to use. 
775
776   * I guess that now, we do almost as few system calls as possible while
777     doing as few data copy as possible.
778
779     To improve it further, we could try to send all the sizes first and then
780     all the data (to use iov on receiving size), but it's only a partial
781     solution: when you have 2 dimensional data, the sizes of the second
782     dimension is data of the first dimension, so you need 3 streams.
783
784     I'm not sure the potential performance gains justify the coding burden.
785
786  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Fri, 21 Oct 2005 14:42:20 +0200
787
788 SimGrid (3.00) stable; urgency=high
789   
790  SURF:
791   * New! Give the possibility to hijack the surf parser and thus bypass 
792     MSG_create_environment and MSG_launch_application. Have a look at
793     examples/msg/msg_test_surfxml_bypassed.c to see how it can be done.
794         
795  -- Arnaud Legrand <simgrid-devel@lists.gforge.inria.fr>  Sat, 20 Aug 2005 23:25:25 -0700
796
797 SimGrid (2.96) unstable; urgency=low
798
799   AKA SimGrid 3 rc 2.
800   
801   XBT:
802   * New! Exception handling with setjmp or such (code from OSSP ex) [MQ]
803     This deprecates the xbt_error_t mecanisms. 
804     It modifies (simplifies) all XBT and GRAS API.
805     MSG API keeps unchanged (exceptions raised by XBT are catched from 
806      within MSG and masked with existing error handling facilities)
807
808   SURF:
809   * New! Add a FATPIPE model. [AL]
810   * New! Add a parallel task model. [AL]
811   * New! Add automatically a loopback interface (in the default
812     network model) if none was precised.
813
814   MSG
815   * Bugfix: MSG_process_resume now works with the current running process. 
816     [AL]
817   * New! Add MSG_parallel_task_create and MSG_parallel_task_execute. [AL]
818   * Modification of MSG_task_get_compute_duration. Once a task has been
819     processed, the value returned by this function is now equal to 0. [AL]
820   * New! Add double MSG_task_get_remaining_computation(m_task_t task) and
821     MSG_error_t MSG_task_cancel(m_task_t task). Add a state
822     (MSG_TASK_CANCELLED) to MSG_error_t corresponding to the cancelation
823     of a m_task. For now, MSG_task_cancel only works with computation
824     tasks. [AL]
825   * New! Add double MSG_get_host_speed(m_host_t h) that returns the speed
826     of the processor (in Mflop/s) regardless of the current load on the
827     machine. [AL]
828   * API Change: use proper naming convention for MSG_getClock and 
829     MSG_process_isSuspended: MSG_get_clock and MSG_process_is_suspended.
830     [AL]
831   * New! Add void MSG_task_set_priority(m_task_t task, double priority). 
832     This function changes the priority of a computation task. This priority
833     doesn't affect the transfer rate. A priority of 2 will make a task 
834     receive two times more cpu power than the other ones. This function 
835     has been added to suit the needs of Nguyen The Loc and hasn't been that
836     much tested yet. So if it fails, please report it and send me your code. 
837     [AL]
838   * API Change: removed all functions and types that were marked "deprecated" 
839     since many months. Renamed MSG_global_init_args to MSG_global_init.
840
841  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Mon,  8 Aug 2005 17:58:47 -0700
842
843 SimGrid (2.95) unstable; urgency=low
844
845   XBT
846   * Steal some nice code to GNU pth to fix context detection and usage [AL]
847   * Cleanup in the xbt_config API; add configuration callbacks. [MQ]
848   * Cleanup in the initialization API: the unused "defaultlog" is dead. [MQ]
849
850   SURF
851   * Bugfix: Allow absolute paths for platform description files [MQ]
852   * Bugfix: do free the variables after use. Leads to drastic performance 
853     improvement [AL] 
854   * Implement max_duration (ie, timeouts) on resources [AL]
855
856   MSG
857   * Implement MSG_config to configure MSG at runtime. xbt_cfg test on a real
858     case ;) [MQ]
859   * Implement MSG_channel_select_from() to help GRAS now that SURF provide
860     the needed support (timeouts) [AL]
861
862   GRAS (new features)
863   * Implement measurement sockets. You can now get the bandwidth between two
864     hosts thanks to AMOK (see below). [MQ]
865   * gras_datadesc_dynar() builds a dynar type descriptor, allowing to send
866     dynar over the network (yeah) [MQ]
867   * Real (even if simplistic) implementation of gras_os_myname() on RL [MQ]
868   * simple/static token-ring example. [Alexandre Colucci and MQ]
869   * Use MSG_channel_select_from() and remove the *slow* hack we had to put
870     in place before [MQ]
871   
872   GRAS (bug fixes)
873   * Differentiate the types "char[22]" and "unsigned char[22]" in automatic
874     type parsing. "short" and "long" modifiers were also ignored; other
875     modifier (such as reference level) are still ignored. [MQ] 
876   * Embeed the buffer size within the buffer itself on SG. [MQ]
877     That way, send() are atomic and cannot get intermixed anymore (at least
878     the ones which are less than 100k; bigger messages still have the issue)
879   * Array size pushed by the field, not by the field type (or each
880     and every long int will push stuff to the cbps) [MQ]
881   * use select() to sleep since it allows to portably sleep less than one
882     second. [MQ]
883
884   GRAS (minor cleanups)
885   * <project>.Makefile.local (generated from gras_stub_generator) |MQ]:
886     - Do clean .o files
887     - Compile with -g
888   * Type Callbacks now receive the gras_datadesc_type_t they work on as argument.
889   * type category 'ignored' killed as it was never used and were difficult
890     to transmit.
891   * whether a type can cycle or not is now a flag, leaving room for more
892     flags (as "ignored", if we feel the need one day ;)
893   * Rename raw sockets to measurement sockets since "raw" has another
894     meaning in networking community. 
895   
896   AMOK 
897   * Advanced Metacomputing Overlay Kit introduction. It is based over GRAS
898     and offers features not belonging to GRAS but that most applications
899     need. One day, it may be a set of plugins loadable at runtime.
900   * New module: bandwidth 
901     bandwidth measurement between arbitrary nodes running this module. [MQ]
902
903  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Thu, 30 Jun 2005 16:29:20 -0700
904
905 SimGrid (2.94) unstable; urgency=low
906
907   The first beta release of SimGrid 3 !
908
909   >>>Arnaud<<<
910   (documentation)
911   * Update the main page and the FAQ. Adding references to gforge.
912
913   (gras)
914   * Add a gras_os_getpid function.
915
916   (msg)
917   * Add MSG_task_get_compute_duration() and MSG_task_get_data_size()
918   * Extend the logs so that they also print PID, hostname, date, ... if
919     available.
920   * Convert the MSG example to the use of xbt_logs instead of PRINT_MESSAGE,
921     and kill the old version which were in testsuite/
922   * Rewrite tools/MSG_visualization/colorize.pl for using with logs instead
923     of PRINT_MESSAGE
924
925   (xbt)
926   * Add xbt_os_time(). As the rest of xbt/portability, this is not public
927     for users. Instead, each programming environment (GRAS, MSG,...) use it
928     when needed to provide such a feature to users.
929     Don't shortcut the mecanism or you will also shortcut the virtualization
930     you need on the simulator.
931
932   >>>Martin<<<
933   (infrastructure)
934   * Cleanups in configury with regard to compile optimization/warning flags.
935     Also add -fno-loop-optimize to any powerpc since it's the optimization
936     killing gcc (< 3.4.0).
937   * Doxygen cleanups: move MSG examples, kill the second Doxygen phase
938     needed by MSG examples complications
939   * Borrow configury beautifications from PHP
940
941   (xbt)
942   * Bugfix: XBT_LOG_NEW_DEFAULT_CATEGORY now compiles without compiler
943     warning (thanks loris for stumbling into this one).
944   * Bugfix: stop loading private headers (gras_config.h) from the public
945     ones (xbt/swag.h).
946
947   (gras)
948   * Change SIMGRID_INSTALL_PATH to GRAS_ROOT in Makefiles generated for user.
949   * Rename gras_get_my_fqdn to gras_os_myname and implement it in the simulator
950     RL would imply a DNS resolver, which is *hard* to do in a portable way
951     (and therefore delayed).
952   * Implement a real timer mecanism and use it in timing macros. This allows
953     to avoid rounding errors and get a 0.000005 sec precision in timing
954     macros. While I was at it, various cleanups:
955      - allow to declare more than one timed section per file (fix a stupid bug)
956      - move some private declaration to the right place
957      - merge conditional execution and timing macros into emulation module
958      - document the module
959      - make sure the module cleanups its mess on gras_exit
960   * Documentation improvements:
961      - (new) how to compile applications using GRAS
962      - (new) emulation support (timing macros)
963
964  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Fri, 13 May 2005 10:49:31 +0200
965
966 SimGrid (2.93) unstable; urgency=low
967
968   Alpha 4 on the path to SimGrid 3 (aka the "neuf-trois" version)
969
970   [Arnaud]
971    - Use Paje properly where used. Still to be sanitized properly.
972    - Portability fix: Add an implementation of the contexts using pthread
973
974   [Martin]
975   (misc)
976    - Add xbt_procname(): returns the name of the current process.
977      Use it to show the current process's name in all logging.
978   (infrastructure)
979    - fix detection of older flex version and the reaction, since we do
980      depend on modern ones (we use lex_destroy)
981    - Better separation of SG and RL in the libs: remove all simulation code
982      from libgras. As a result, this lib is now only 200k when stripped.
983      Some of the xbt modules may also be duplicated (two sets and such) and
984      should be cleaned/killed before SG3.
985    - Insist on using xlC on AIX because of weird problems involving gcc there.
986    - Cleanup the make remote stuff. This is now done by scripts
987      tools/graspe-{master,slave} (GRAS Platform Expender). This is still
988      mainly for our private use, but we're working on changing them to user
989      tools, too.
990   (gras)
991    - Bugfix: flush the socket on close only if there is some *output*.
992    - Bugfix: flush idempotent when there's nothing to send (don't send size=0)
993   (msg)
994    - Add MSG_task_get_name. The task names are mainly for debugging purpose,
995      but anyway.
996
997  -- SimGrid team <simgrid2-users@listes.ens-lyon.fr>  Fri,  4 Mar 2005 14:32:37 -0800
998
999 SimGrid (2.92) unstable; urgency=low
1000
1001   Alpha 3 on the path to SimGrid 3
1002   
1003   [Arnaud]
1004   (gras)
1005    - New! First try of benchmarking macros.
1006    - New! First try so that gras_stub_generator generate deployment and
1007      remote compilation helpers.
1008   (msg)
1009    - Bugfix: Initialization fix in msg_test.
1010
1011   [Martin]
1012   (surf)
1013    - Bugfix: applied patch to lexer so that it doesn't need a huge heap.
1014   (xbt)
1015    - Bugfix: let dicts work with NULL content (_foreach didn't) and cleanups
1016   (gras)
1017    - API Change: gras_os_sleep to take the amount of seconds as a double.
1018      Accepting an int was error prone since it was the only location where
1019      seconds were coded as such. It leaded to damn rounding errors.
1020    - Bugfix: Hard to belive that timers ever worked before this.
1021
1022  -- SimGrid team <simgrid2-users@listes.ens-lyon.fr>  Wed, 23 Feb 2005 22:09:21 +0100
1023
1024 SimGrid (2.91) unstable; urgency=low
1025
1026   Alpha 2 on the path to SimGrid 3
1027   
1028   [Arnaud]
1029   (surf)
1030    - Bug fix in the lmm_solver.
1031   (msg)
1032    - New! Interface to Paje (see http://www-id.imag.fr/Logiciels/paje/) 
1033      through the function MSG_paje_output.
1034    - New! Introducing two new functions MSG_process_kill() and MSG_process_killall().
1035    - It is possible to bound the rate of a communication in MSG with 
1036      MSG_task_put_bounded() (was already in the previous version but I had forgotten 
1037      to write it in the changelog).
1038    - Bug fix to let GRAS run on top of MSG until we move it directly on top
1039      of the SURF.
1040     
1041   [Martin]
1042   (infrastructure)
1043    - Various cleanups to the autotools stuff
1044    - Begin to move Gras examples to examples/gras/
1045    - Let make distcheck work again (yeah!)
1046   (documentation)
1047    - documentation overhauled using doxygen. 
1048      gtk-doc-tools is dead in SimGrid now.
1049    - Automatically extract all existing logging categories, and add the list
1050      to the documentation (long standing one, to say the less)
1051   (gras)
1052    - Cleanup the known architecture table. Reorder the entries to group what
1053      should be, and use a more consistent naming scheme.
1054      (some of the test dataset are still to be regenerated)
1055    - New! Allow library to register globals on each process just as userdata
1056      does. 
1057       This is implemented using a xbt_dict and not a xbt_set, so we loose the
1058        lookup time (for now).
1059       Use it in msg and trp.
1060       This cleans a lot the internals and helps enforcing privacy of the
1061        headers between the gras components.
1062    - New! Add a timer mechanism, not unlike cron(8) and at(1). 
1063    - Bugfix: gras_os_time was delirious in RL.
1064    - Bugfix: gras_trp_select/RL don't run into the wall when asked to select
1065      onto 0 sockets.
1066    - Reenable GRAS now that it works.
1067
1068  -- Arnaud Legrand <Arnaud.Legrand@imag.fr>  Mon, 14 Feb 2005 14:02:13 -0800
1069
1070 SimGrid (2.90) unstable; urgency=low
1071
1072   Alpha 1 on the path to SimGrid 3
1073
1074   * It is a long time since the last release of SimGrid. I'm sorry about
1075     that but as I had told you, I was rewriting a lot of things. I apologize 
1076     to those who had been reporting bugs to me and that I had not answered. 
1077     If your bug is still in the new version, please tell me. Here is a 
1078     summary of the main changes.
1079
1080   * REVOLUTION 1: The SimGrid project has merged with the GRAS project
1081     lead by Martin Quinson. As a consequence SimGrid gains a lot in
1082     portability, speed, and a lot more but you'll figure it out later. 
1083     SimGrid now comprises 3 different projects : MSG, GRAS and SMPI. 
1084     I wanted to release the new MSG as soon as possible and I have 
1085     broken GRAS, which is the reason why, for now, only MSG is fully 
1086     functional. A laconic description of these projects is available 
1087     in the documentation.
1088   
1089   * REVOLUTION 2: I have removed SG and I am now using a new simulation
1090     kernel optimized for our needs (called SURF but only the developers
1091     should use it). Hence, MSG is now roughly 30 times faster and I think
1092     that by rewriting a little bit MSG, I could event speed it up a little
1093     bit more. Beside the gain in speed, it is also much easier to encode a
1094     new platform model with SURF than it was with SG. More to come...
1095   
1096   * REVOLUTION 3: I have tried to change a little as possible the API of
1097     MSG but a few things really had to disappear. The main differences
1098     with the previous version are :
1099        1) no more m_links_t and the corresponding functions. Platforms are
1100          directly read from a XML description and cannot be hard-coded
1101          anymore. The same format is used for application deployment
1102          description. The new format is described in the documentation. 
1103          Have a look in tools/platform_generation. There is a tiny script 
1104          that converts from the old platform format to the new one. Concerning
1105          the application deployment format, parsing the old one is tricky.  
1106          I think most of you should however be able to convert your files.  If 
1107          it is really an issue, I can write a C code that does the conversion. 
1108          Let me know.
1109        2) the toolbox tbx does not exist anymore. We now have a library
1110           with much more data-structures but without the hash-tables (we have 
1111           dictionaries that are much faster).
1112
1113  -- Arnaud Legrand <Arnaud.Legrand@imag.fr>  Mon, 31 Jan 2005 10:45:53 -0800
1114
1115 *****************************************************************************
1116 * Follows the old GRAS changelog. It does not follow the same syntax, but I *
1117 * don't feel like converting the oldies. (Mt)                                *
1118 *****************************************************************************
1119
1120 2005-01-31 Arnaud
1121   Version 2.90: "the long awaited one"
1122   - Finished rewriting and debugging MSG. Rewrote the documentation.
1123   - disable GRAS for now since it needs to be ported to the newest SG
1124
1125 2004-12-16 Martin
1126   - Finish the port to windows (using mingw32 for cross-compile)
1127
1128 2004-11-28 Arnaud
1129   - Main loop and datastructures of SURF. A cpu resource object is
1130     functional. Surf can thus be used to create cpu's with variable
1131     performance on which you can execute some actions.
1132         
1133 2004-11-15 Martin Quinson
1134   - Port to ARM. Simply added the alignment and size descriptions. Should
1135     work, but the ARM machines are so slow that I didn't had the opportunity
1136     to 'make check' over there yet.
1137
1138 2004-11-15 Arnaud Legrand
1139   - Trace manager now written. It uses a heap structure and is therefore
1140     expected to be efficient. It may however be speeded up (particularly
1141     when many events occur at the same date) by using red and black
1142     trees. One day maybe... 
1143   - Max-min linear system solver written. It uses a sparse matrix
1144     structure taking advantage of its expected use. Most operations are
1145     O(1) and free/calloc are called as few as possible. The computation of
1146     the minimum could however be improved by using a red and black tree
1147     (again ! ;).
1148
1149 2004-11-03 Arnaud Legrand
1150   - Rename every gras_* function that was in xbt/ to its xbt_
1151     counterpart.
1152   - Add a heap and a doubly-linked list to xbt
1153   - Added a dichotomy to the dictionaries. make check works as well before
1154     so I assume that the patch is correct. I do not know however if things
1155     run effectively faster than before now. :)
1156
1157   Inclusion of the SimGrid tree in the GRAS one. The archive is renamed to
1158   SimGrid, and the version number is bumped to 2.x
1159
1160 2004-10-29 Martin Quinson
1161   - Introduction of the remote errors. 
1162     They are the result of a RMI/RPC on the remote machine.
1163     ErrCodes being scalar values, you can't get the host on which those
1164     errors did happen. Extending the error mechanism as in Gnome is possible.
1165     No idea yet whether it is a good idea.
1166     
1167 2004-10-28 Martin Quinson
1168   - Interface revolution: the Starred Structure Eradication.
1169     I used to do typedef struct {} toto_t; and then handle *toto_t.
1170     Arnaud (and Oli) didn't like it, and I surrendered. Now, you have:
1171       - ???_t is a valid type (builded with typedef)
1172       - s_toto_t is a structure (access to fields with .)
1173       - s_toto   is a structure needing 'struct' keyword to be used
1174       - e_toto_t is an enum
1175       -   toto_t is an 'object' (struct*)
1176     Exemple:
1177       typedef struct s_toto {} s_toto_t, *toto_t;
1178       typedef enum {} e_toto_t;
1179     Moreover, only toto_t (and e_toto_t) are public. The rest (mainly
1180      s_toto_t) is private.
1181     
1182   - While I was at it, all gras_<obj>_free() functions want a gras_<obj>_t*
1183     so that it can set the variable to NULL. It was so for dicts and sets,
1184     it changed for dynars.
1185     
1186   - Fix a bunch of memleaks in dict_remove
1187   - Fix a bug in sg/server_socket opening: it failed all the time.
1188
1189 2004-10-07 Martin Quinson
1190   - Speed up dynar lookup operation a bit.
1191   
1192     gras_dynar_get is dead. 
1193     
1194     Now, you can choose between gras_dynar_get_cpy (the old gras_dynar_get
1195     but should be avoided for efficiency reasons) and gras_dynar_get_ptr
1196     (which gives you the address of the stored data).
1197     
1198     gras_dynar_get_as is an helpful macro which allows you to retrieve a
1199     copy of the data using an affectation to do the job and not a memcpy.
1200     
1201     int toto = gras_dynar_get_as(dyn,0,int); rewrites itself to
1202     int toto = *(int*)gras_dynar_get_ptr(dyn,0);
1203     
1204     It does not really speedup the dynar test because they are
1205     setting elements all the time (and look them seldom). But the dict does
1206     far more lookup than setting.
1207
1208     So, this brings the dict_crash test from ~33s to ~25s (200000 elms).
1209
1210 2004-10-05 Martin Quinson
1211   - Allow to (en/dis)able the cycle detection at run time.
1212   
1213     Whether we should check for cycle or not is now a property of each
1214     datatype. When you think there may be some cycle, use datadesc_cycle_set.
1215     datadesc_cycle_unset allow to remove this property when previously set.
1216     
1217     Note that the cycle detection is off by default since it impacts the 
1218     performance. Watch the data you feed GRAS with ;)
1219     
1220     This property is hereditary. Any element embedded in a structure having it
1221     set have it set for the time of this data exchange.
1222     
1223     You should set it both on sender and receiver side. If you don't set it on
1224     sender side, it will enter an endless loop. If you forget on receiver
1225     side, the cycles won't be recreated after communication.
1226     
1227   - Header reorganization.
1228     Kill gras_private.h, each submodule must load the headers it needs.
1229
1230 2004-10-04 Martin Quinson
1231   - Interface revolution: do not try to survive to malloc failure.
1232   
1233     Now, gras_malloc and friends call gras_abort() on failure.
1234     As a conclusion, malloc_error is not a valid error anymore, and all
1235       functions for which it was the only gras_error_t return value are
1236       changed. They now return void, or there result directly. 
1237     This simplify the API a lot.
1238
1239 2004-09-29 Martin Quinson
1240   - Re-enable raw sockets.
1241     Created by gras_socket_{client,server}_ext;
1242     Used with gras_raw_{send,recv}
1243     No select possible.
1244     
1245     It should allow to kill the last bits of gras first version soon.
1246   
1247     This is not completely satisfactory yet (duplicate code with
1248      chunk_{send,recv}; a bit out of the plugin mechanism), but it should
1249      work. 
1250
1251   - Simplify transport plugin (internal) interface by not passing any
1252     argument to _server and _client, but embedding them in the socket
1253     struct directly. 
1254
1255 2004-09-28 Martin Quinson
1256   - Finish the port to AIX.
1257     autoconf was my problem (segfault within the malloc replacement
1258     function. No idea why)
1259         
1260 2004-09-16 Martin Quinson
1261   - Fix some size_t madness on 64bit architectures.
1262   
1263 2004-09-08 Martin Quinson
1264   - Reduce the number of system headers loaded, overload some more system
1265     calls (such as malloc to cast the result of the system one, and work
1266     properly on AIX)
1267   - Fix and reintroduce the config support
1268
1269 2004-09-07 Martin Quinson
1270   - Source code reorganization to allow Arnaud to surf all over there.
1271   - Allow to document the logging categories.
1272   - Remove all uppercase from logging categories and useless cleanup in names.
1273
1274 2004-08-18 Martin Quinson
1275   Version 0.6.2 (protocol not changed; API changed)
1276   - Interface cleanup: gras_msgtype_by_name returns the type (instead of a
1277      gras_error_t), and NULL when not found. Functions expecting a msgtype
1278      as argument (msg_wait; msg_send) deal with NULL argument by providing a
1279      hopefully usefull message.
1280   - Portability to prehistoric sparcs again
1281
1282 2004-08-17 Martin Quinson
1283   Version 0.6.1 (protocol not changed; ABI not changed)
1284   - prealloc some buffers to speed things up
1285
1286 2004-08-11 Martin Quinson
1287   Version 0.6 (protocol not changed; ABI expended)
1288   - The parsing macro can deal with the references, provided that you add
1289     the relevant annotations (using GRAS_ANNOTE(size,field_name))
1290
1291 2004-08-09 Martin Quinson
1292   Version 0.5 (protocol not changed; ABI changed)
1293   - Allow to off turn the cycle detection code in data exchange at
1294     compilation time. It should be at run time, but I'm short of time (and
1295     the config stuff is still broken). That way, we keep dict out of the
1296     critical path, which is good because the performance is poor:
1297      - search not dichotomial yet
1298      - dynar give no way to access their content and memcpy everytime
1299   - In composed data description (struct, ref and so on), stop foolness of
1300     keeping the subtype's ID, but store the type itself. This keeps sets out
1301     of the critical path, which is good since they rely on dynar and
1302     dictionnaries. The only loose of that is that we cannot detect the
1303     redeclaration of a structure/union with another content (but I'm not sure 
1304     the code detected well this error before anyway). We still can detect
1305     the redefinition discrepancy for the other types.
1306   - Use a whole bunch of optimisation flags (plus -fno-strict-aliasing since
1307     it breaks the code because of type-punning used all over the place).
1308     This breaks on all non-gcc architectures (for now).
1309     
1310   All those changes (plus the buffer of last time) allow me to gain 2 order
1311   of magnitude on cruel tests consisting of 800000 array of integers on two
1312   level of a hierarchical structure (200 secondes -> 4 secondes)
1313   
1314   API change:
1315     - the selector of reference must now return the type it points to, not
1316       the ID of this type.
1317
1318 2004-08-06 Martin Quinson
1319   Version 0.4 (protocol changed; ABI not changed)
1320   - Allow to pass --gras-log argument to processes in simulation mode. Really.
1321   - New debugging level: trace (under debug) to see effect of GRAS_IN/OUT
1322   - Implement a buffer transport, and use it by default (it relies on tcp in
1323      real life and on sg in simulation).
1324     That's a bit hackish since I had a new field to the structure to store
1325      its data without interfering with the subtype ones. Inheritance
1326      is tricky in C. And that's a kind of reverse inheritance with one class
1327      derivating two classes. Or maybe a game with java interfaces. Anyway,
1328      that's damn hard in C (at least).
1329     Moreover, I got tired while trying to ensure plugin separation and
1330      genericity in SG mode. MSG wants me to do weird things, so let's go for
1331      cruel hacks (temporarily of course ;).
1332      See comment in transport_private.h:71
1333   - do not include all the _interface headers in private but in the files
1334     which really need them (to cut the compilation time when they are
1335     modified) 
1336
1337 2004-07-26 Martin Quinson
1338   Version 0.3 (protocol not changed; ABI changed)
1339   - Major overhault of the datadesc interface to simplify it:
1340     - shorted the function names:
1341       s/gras_datadesc_declare_struct/gras_datadesc_struct/ and so on
1342     - add a trivial way to push/pop integers into the cbps without malloc.
1343       This allows to make really generic sub_type description, which simply
1344         pop their size of the stack.
1345     - add a function gras_datadesc_ref_pop_arr() which does what users want
1346       most of the time: Declare a dynamic array (which pops its size of the
1347       stack) and declare a reference to it. Poor name, but anyway.
1348     - kill the post-send callback, add a post-receive one
1349     
1350 2004-07-23 Martin Quinson
1351   Version 0.2 (protocol changed; ABI changed)
1352   - add some testing for cpbs in the test cases, and fix some more bugs.
1353     This invalidate again the little64 data file, since I cannot regenerate
1354     it myself.
1355   - remove an awfull optimization in the logging stuff, allowing me to:
1356     - understand it again
1357     - learn gcc how to check that the argument match the provided format
1358     - fix all errors revealed by gcc after that
1359   - internal keys of dict are not \0 terminated. Deal with it properly in
1360     loggings instead of segfaulting when the user want to see the logs :-/
1361
1362 2004-07-22 Martin Quinson
1363   - Fix some stupid bug preventing cbps (callback postit) from working
1364
1365 2004-07-21 Martin Quinson
1366   - Some documentation cleanups
1367   - remove the useless last argument of msgtype_declare
1368   - rename the Virtu functions to fit into the 'os' namespace
1369   - move headers src/include -> src/include/gras/ and stop fooling with 
1370     gras -> . symbolic link
1371   - make distcheck is now successful
1372
1373 2004-07-19 Martin Quinson
1374   Version 0.1.1
1375   - Build shared library also
1376   - Install html doc to the right location
1377   - stop removing maintainer files in make clean
1378   - build tests only on make check
1379   
1380 2004-07-13 Martin Quinson
1381   version 0.1
1382   - No major issue in previous version => change versionning schema
1383   - Re-enable little64 convertion test now that Abdou kindly regenerated the
1384     corresponding dataset.
1385   
1386 2004-07-11 Martin Quinson
1387   version 0.0.4
1388   - Get it working with any kind of structure (we can compute the padding
1389     bytes remotely for all the architectures I have access to)
1390   - Implement the structure parsing macro (still not quite robust/complete)
1391   - Improvement to the remote testing toysuite
1392   
1393 2004-07-10 Martin Quinson
1394  [autoconf mechanism]
1395   - get ride of a bunch of deprecated macros
1396   - actually run the test for two-compliment, not only compile it :-/
1397   - test whether the structures get packed (and bail out if yes. Damn.
1398     Alignment is a serious matter)
1399   - test whether the structures get compacted (but respecting the alignment
1400     constraints of each types)
1401   - test whether the array fields of structures can straddle alignment boundaries
1402  [base]
1403   - Damnit, double are bigger than float (typo in creation of 'double' datadesc)
1404     (took me 2 hours to find that bug, looking at the wrong place)
1405   - Add gras_datadesc_declare_{union,struct}_close(). They must be used
1406     before sending/receiving and are used to compute the offsets of fields
1407   - Given that padding size depend even on compiler options, keep track of
1408     alignment and aligned_size only for the current architecture. Not a big
1409     deal since we send structure fields one after the other (seems
1410     reasonable).    
1411   - Add the datastructure used for IEEE paper by the PBIO guys to the test
1412     program, let it work on linux/gcc/little32. portability todo.
1413
1414 2004-07-08 Martin Quinson
1415   - import and improve remote compilation support from FAST
1416   - make sure make check works on half a dozen of machines out there
1417
1418 2004-07-07 Martin Quinson
1419  Let's say it's version 0.0.3 ;)
1420   - Implement conversions (yuhu!)
1421   - Let it work on solaris (beside conversion, of course)
1422   - Stupid me, using rand() to generate the conversion datatests in not wise.
1423
1424 2004-07-06 Martin Quinson
1425   - Let make dist work, since I'm gonna need it to compile on remote hosts
1426   - Let Tests/datadesc_usage write the architecture on which the file was
1427     generated as first byte.
1428   - Add PowerPC (being also IRIX64), SPARC (also power4) and ALPHA
1429     architecture descriptions. 
1430   - Add datadesc_usage.{i386,ppc,sparc} files being the result of execution
1431     on those architectures.
1432   - Optimization: send/recv array of scalar in one shoot
1433
1434 2004-07-05 Martin Quinson
1435   - YEAH! GRAS/SG and GRAS/RL are both able to run the ping example !
1436   
1437   - Plug a whole bunch of memleaks
1438   - each process now have to call gras_{init,exit}. One day, their log
1439     settings will be separated
1440   - Continue the code factorisation between SG, RL and common in Transport.
1441
1442 2004-07-04 Martin Quinson
1443  [Transport]
1444   - Redistribution between SG and RL. 
1445     We wanna have to accept in SG, so move accepted related parts of RL in
1446     the common part. (more precisely, the dynar of all known sockets is no
1447     more a static in transport.c, but part of the process_data)
1448  [Core/module.c] 
1449  [gras_stub_generator]
1450   - Bug fix: Do call gras_process_init from gras_init (wasnt called in RL).
1451
1452 2004-07-03 Martin Quinson
1453   - Create a new log channel tbx containing dict, set, log, dynar (to shut
1454     them all up in one shot)
1455  [DataDesc]
1456   - Fix the ugly case of reference to dynamic array.
1457   - New (semi-public) function gras_datadesc_size to allow the messaging
1458     layer to malloc the needed space for the buffer.
1459  [Transport]
1460   - gras_socket_close now expect the socket to close (and not its address to
1461     put NULL in it after it). This is because the socket passed to handlers
1462     is one of their argument (=> not writable).
1463  [Messaging]
1464   - propagate the interface cleanup from last week in datadesc, ie remove a
1465     superfluous level of indirection. User pass adress of variable
1466     containing data (both when sending and receiving), and not of a variable
1467     being a pointer to the data. Let's say that I like it better ;)
1468       The price for that is constructs like "int msg=*(int*)payload" in
1469     handlers, but it's a fine price, IMHO.
1470  [examples/ping]
1471   - Let it work in RL (yuhu)
1472
1473 2004-06-21 Martin Quinson
1474  [Transport]
1475    - porting SG plugin and SG select to new standards (works almost).
1476    - plug memleaks and fix bugs around.
1477    
1478  [DataDesc] 
1479    - cleanup the prototype of data recv and force users to specify when they 
1480      want to handle references to objects. Test case working even for cycles.
1481    - plug memleaks. Valgrind is perfectly ok with this.
1482
1483 2004-06-12 Martin Quinson
1484  [Transport] 
1485    - cleanup the separation between plugin and main code in plugin creation 
1486
1487 2004-06-11 Martin Quinson
1488  [Transport]
1489    - Reput hook for raw sockets, needed for BW experiments
1490    - kill a few lines of dead code
1491  [Data description] Interface cleanup
1492    - gras_datadesc_by_name returns the searched type or NULL.
1493      That way, no variable is needed to use a type desc once, which makes
1494       the code clearer.
1495    - gras_datadesc_declare_[struct|union]_append_name is removed. The last
1496       two parameters were strings (field name, type name), leading to
1497       common errors.
1498  [Dicos] Interface cleanup
1499    - gras_dico_retrieve -> gras_dico_get ; gras_dico_insert -> gras_dico_set 
1500      This is consistant with the dynar API.
1501
1502 2004-04-21 Martin Quinson
1503  [Messaging]
1504    - Porting to new standards.
1505  [Data description]
1506    - interface cleanup. 
1507      There is no bag anymore, no need to take extra provision to mask the
1508        pointers behind "ID". 
1509      Better splitup of functions between files create/exchange/convert.
1510        This is still a bit artificial since convert and receive are so
1511        interleaved, but anyway.
1512  [Virtu(process)]
1513    - add a queued message list to procdata (the ones not matching criteria
1514      in msg_wait)
1515    - factorize some more code between SG and RL wrt procdata
1516  [Tests]
1517    - use gras_exit in example to track memleaks
1518    - get rid of gs_example now that GS is properly integrated into gras
1519    - update run_test to integrate the lastest tests (datadesc)
1520  [Logging]
1521    - rename WARNINGn macros to WARNn since it prooved error-prone
1522      
1523 2004-04-19 Martin Quinson
1524  [Data description]
1525    - register init/exit functions within gras module mechanism   
1526    - send/receive function. 
1527    Convertion is not implemented, but short-cutted if not needed.
1528    struct/array elements are sent one by one (instead of block-wise), but
1529      nobody really cares (yet). Get a prototype before optimizing.
1530    - tests (using a file socket) for DD send/receive on:
1531      - base types: int, float
1532      - array: fixed size, string (ie ref to dynamic string)
1533      - structure: homogeneous, heterogeneous
1534      - chained list, graph with cycle
1535    Believe it or not, valgrind is not too unhappy with the results. The
1536     cycle happily segfaults, but the others are ok. And I'm sick of pointers
1537     for now.
1538  [Transport]
1539    [File plugin] 
1540      - Bugfix when using a filename explicitely (instead of '-')
1541
1542 2004-04-09 Martin Quinson
1543  [Transport plugins]
1544    - factorize more code between RL and SG in socket creation
1545    - Complete the implementation and tests of:
1546      o TCP
1547      o file (only in RL, and mainly for debugging)
1548      
1549      I lost 3 days to design a portable address resolver, and then decided
1550        that the prototype mainly have to run on my box.
1551      Addressing portability too early may be like optimizing too early :-/
1552  [Tests]
1553    - use gras_init in the Tests instead of the crappy parse_log_opt 
1554      (the latter function is removed)
1555  [Conditional execution]
1556    - New functions: gras_if_RL/gras_if_SG (basic support for this)
1557  [Code reorganisation]
1558   - Get rid of libgrasutils.a since it makes more trouble than it solves.
1559     Build examples against the RL library, since there is no way to disable
1560     its creation for now.
1561
1562 For information, the beginning of coding on GRAS was back in june
1563 2003. I guess that every line has been rewritten at least twice since
1564 then.