Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
Added changes for SMPI.
[simgrid.git] / ChangeLog
1 SimGrid (3.6) unstable; urgency=low
2
3  SMPI
4  * New MPI functions supported: MPI_Comm_disconnect, MPI_Comm_get_name
5  * Fortran: New user-level cache variable to store the rank of the running
6    process. This improves performance by an order of magnitude.
7  * C: New coccinelle script to automatically locate and modifiy global and
8    local static variables.
9  * Improved SMPI network model with a sender-side gap to account for multiple
10    parallel sends.
11
12  MSG
13  * New function MSG_comm_get_status(). MSG_comm_test() and MSG_comm_testany()
14    only say if a communication is finished, no matter whether it succeeded or
15    failed. You can call MSG_comm_get_status() to know the status of a finished
16    communication.
17  * New function MSG_task_dsend() to send a task and detach it. When a
18    communication is detached, you are never notified of its success or failure
19    and the memory is released automatically once it is finished. This function
20    is useful when you don't care about the end nor the success of a
21    communication.
22  * Change the prototypes of action replay. Sorry for inconvenience,
23    but this is really more efficient this way (and to adapt your code,
24    you just have to fix the initialization, that shouldn't be too long)
25  * Kill the braindead MSG_task_refcount_dec() function. I guess nobody
26    ever managed to do anything useful with it.
27  * New function MSG_comm_testany(). Similarly to MSG_comm_waitany(), it
28    takes a dynar of communications. It returns immediately and gives the
29    index of a finished communication (if any).
30  * New example: a basic implementation of the Chord P2P algorithm.
31
32  SURF
33  * New model for multi-core CPUs. You can now use the core attribute to
34    precise the number of cores of a host. This is a basic model. Every
35    process running on the host receives at most the power provided in
36    the DTD (throughput<=power). Total throughput of process cannot exceed
37    power * num_cores.
38  * New peer tag. This peer tag creates a tiny AS comprising a host and a
39    router linked by an up-link and a down-link (possibly asymmetrical).
40    This kind of pattern allows to easily build last-mile model style platforms.
41    Aggregating such patterns in a rule-based AS is thus the technique of
42    choice for modeling large peer-to-peer/volunteer computing/cloud platforms.
43  * New model for Vivaldi routing. We transformed the Vivaldi network model
44    into a Vivaldi routing model (based on the rule-based model). This allows to
45    combine Vivaldi based latencies with last-mile platforms.
46
47  SIMIX
48  * Introduce a new context factory "raw", highly inspirated from the
49    ucontext factory, but using manually crafted functions in assembly to
50    do the work in an efficient manner.
51  * Allow to change the used context factory at run time, not only at
52    compilation time. Use --cfg=contexts/factory:raw for maximal speed.
53  * Add an option --cfg=contexts/stacksize:N to set the stack size of the user
54    contextes at runtime (only with raw contexts or ucontexts).
55  * Completely rewrote this module to allow parallel execution of user
56    processes. Use --cfg=contexts/nthreads:N to execute user processes
57    with N parallel threads (the default is 1, meaning no parallelism).
58  * Allow to decide dynamically between sequential and parallel modes.
59    When nthreads > 1, you can use --cfg=contexts/threshold:P to run the user
60    processes in parallel only when their number is greater than or equal to P
61    (the default is 2).
62  * Added a check for NaN of IEEE754 infinite in the double entries of 
63    the smx_user.c file
64
65  XBT
66  * New command line option: if you pass --cfg=verbose-exit:0, SimGrid
67    won't output the state of processes when interrupted with Ctrl-C
68  * Add a new function xbt_dynar_to_array that transforms a dynar into a
69    NULL-terminated array. This may solve backward compatibility issues
70    due to the change to return type of SD_simulate. See also:
71    http://lists.gforge.inria.fr/pipermail/simgrid-user/2010-December/002206.html
72  * Add new macros with variable number of arguments.
73    - in xbt/log.h: XBT_DEBUG, XBT_VERB, XBT_INFO, etc.
74    - in xbt/asserts.h: xbt_assert
75    - in xbt/cunit.h: xbt_test_{add,fail,assert,log}
76    - in xbt/ex.h: THROWF and RETHROWF.
77    Define XBT_USE_DEPRECATED if you want to use the old numbered macros like
78    INFO1, INFO2, etc.
79  * Change xbt_die() to accept a format string with arguments, just like printf.
80  * New data structure: xbt_lib_t, like a dict but more general and with better
81    memory handling.
82
83  INSTR
84  * New configuration options
85    Options triva/categorized and triva/uncategorized can be used to generate
86    graph configuration files for Triva visualization tool.
87  * Configuration option tracing/platform is renamed to tracing/categorized
88  * XBT logging makes tracing error checks easier, new root log hierarchy: instr
89  * New TRACE_user_link_variable interface:
90    User provides the name of the link and the tracing variable to attach to it
91  * the declaration of tracing categories must be done after the environment
92    creation
93  * simpler tracing interface, just one way to declare categories
94     TRACE_category or TRACE_category_with_color, it is up to you
95  * links in the trace file are again identified by their names
96  * trace contains the full platform hierarchy exactly as declared using the ASes
97  * Options tracing/msg/[task|process]:1 groups the process by hosts
98    for both cases, tasks and processes must have names that are unique during the simulation
99    these options generate traces that are suited to gantt-charts, such as the space-time view of Paje
100  * The experimental option tracing/msg/volume is deprecated
101    its functionality may be reincorporated if needed
102  * Buffering
103    The tracing generates a trace file with unordered timestamped events,
104    because of the way the core simulator (surf) works. A script available
105    at the tools directory (fix-paje-trace.sh) can be used to put the events
106    in order. We have changed the tracing so it can generate ordered timestamped
107    events in the final trace, but depending on the simulator (and how much time
108    is simulated) that can lead to a huge memory utilization. It is desactivated 
109    by default, but it can be activated using the --cfg=tracing/buffer:1 switch.
110    
111  Build Infrastructure
112  * Define a SIMGRID_VERSION macro in simgrid_config.h.
113    - We are trying hard to keep the API stable, but it may happen that
114      some things change (we're a research project after all, not a
115      nuclear plant operating system). If such things should happen, you
116      could rely on that macro to adapt.
117    - current value: 30600 for 3.06.00, aka 3.6
118  * Define macro MAKE_SIMGRID_VERSION(major, minor, patch) to help building
119    a number that can be compared with SIMGRID_VERSION.
120  * Add a build option -Denable_debug (set to ON by default): when set to OFF,
121    assertions and verbose/debug logging events are disabled at compile time.
122
123  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>
124
125 SimGrid (3.5) stable; urgency=medium
126
127  Model Checking
128  * New feature to any SimGrid-based simulator: Model-Checking
129    Check SIN#1 for more details.
130
131  SMPI
132  * New Model SMPI (three-interval linear regression for correction factors)
133    See RR-7426, available at http://hal.inria.fr/inria-00527150
134  * Ability to use FORTRAN MPI code (through f2c, automatically privatized)
135  * New MPI functions supported: MPI_Get_count(), MPI_Comm_split()
136  * New: RAM folding (see RR-7426 and examples/smpi/NAS/DT-folding)
137  * New: execution sampling (see RR-7426 and examples/smpi/NAS/EP-sampling)
138  * See also src/smpi/README
139
140  Tracing:
141  Tracing:
142  * Tracing system
143    - Tracing API changes: TRACE_start and TRACE_end should not be called
144      by user-code. They are automatically called by simulators created
145      with SimDAG, MSG and SMPI if the toolkit is compiled with
146      tracing_enabled=ON. Categories declaration and utilization remain the
147      same for MSG and SimDag.
148    - A function was added to the tracing API to declare categories with
149      colors:
150         - TRACE_category_with_color (char *category, char *color)
151                 where color must be in the following format
152                     "%f %f %f", red, green, blue
153                 and red, green, blue are float values in the interval [0, 1]
154         - User can specify NULL as color parameter, or continue calling
155             TRACE_category (cat)
156           On that case, the tracing system will define random colors
157    - The following command-line options are supported:
158         --cfg=tracing/filename:msg.trace
159         --cfg=tracing:1               (activate tracing, needed to use others)
160         --cfg=tracing/platform:1      (categorized resource use)
161         --cfg=tracing/uncategorized:1 (uncategorized resource use)
162         --cfg=tracing/msg/task:1      (task creation)
163         --cfg=tracing/msg/process:1   (process creation, migration)
164         --cfg=tracing/msg/volume:1    (volume of MSG send/recv)
165         --cfg=tracing/smpi:1          (SMPI interface tracing)
166         --cfg=tracing/simdag:1        (allow SimDAG tasks receive categories)
167    - examples of examples/msg/tracing updated
168  * Tracing SimDag
169    - DAXLoader and DOTLoader functions can generate tasks with categories
170    - A new function to attribute a category to SD tasks:
171         TRACE_sd_set_task_category (SD_task_t task, char *category)
172  * Tracing the MPI interface implemented by SMPI
173    - Collective operations are traced with states
174    - Point-to-Point operations are traced with states/links
175    - Tracing activated by a parameter "-trace filename" passed
176      to smpirun during execution (considering that simgrid
177      is compiled with tracing enabled)
178    - To run the simulation with gdb, the simulator
179      accepts --cfg=tracing/smpi:1 to trace SMPI
180    - tesh files to check if smpi tracing is ok
181    - See examples/smpi/NAS/DT-trace
182  * GTNetS tracing re-worked
183    - adaptation to the tracing system of GTNets to cope
184      with modifications regarding the fullduplex mode
185    - new tesh files to check if gtnets tracing is ok
186
187  MSG
188  * Asynchronous communications through the functions:
189    MSG_task_isend/irecv and MSG_comm_test/wait/waitall
190  * New function: MSG_load_platform_script()
191    to make possible using a lua script instead of XML files to set up platforms
192  * New function: MSG_set_function
193    to associate functions to processes, used when bypassing the parser
194  * New functions: MSG_task_set_name(), MSG_task_set_compute_duration()
195
196  Platforms: Add some more examples in examples/platforms
197  * Grid'5000: see www.grid5000.fr
198  * *_30000_hosts.xml: various huge files [mainly scalability testing]
199
200  SURF
201  * Change the XML format. This is a very important modification. SimGrid
202    3.5 introduces a new hierarchical format based on the notion of
203    Autonomous Systems. Compatibility with old format is ensured
204    through the perl script provided in the install bin directory
205    bin/simgrid_update_xml.
206    It is now possible to build platforms with specific routing
207    mechanism (Full/Dijkstra/DijkstraCache/Floyd) and to easily
208    connect several platforms together. We will try to provide soon
209    set of realistic platforms exploiting these properties (have a
210    look at examples/platforms/ for the moment).
211  * Take the opportunity of the XML format change to be a good XML citizen:
212    rename link:ctn to link_ctn and similar changes (also dealed with by
213    simgrid_update_xml)
214  * Add a new routing scheme (rule-based) using regular expressions. It
215    enables to have an extremely low memory footprint when the
216    underlying routing is simple and can be compactly described. You
217    need to have libpcre4-dev (perl regular expressions) installed if
218    you want to use this routing scheme.
219  * Revive the cluster TAG and allow to easily and efficiently (both in
220    term of memory and speed) connect clusters together. Have a look
221    at teshsuite/simdag/platforms/ to see how this can be done. With
222    this tag, you can create clusters with thousands of tasks at no
223    cost (have a look at examples/platforms/).
224    Note: clusters are implemented as ASes, so there is no need for an
225    enclosing AS tag if you have only one cluster in your platform.
226  * Add new generic functions in the public interface that allows the user
227    to call SURF 'create_resource' methods from your code (same
228    functionality as the XML bypass mechanism but with a much lighter
229    burden).
230  * Add a new model (enabled through command line --cfg=network/model:SMPI)
231    that uses a piecewise linear approximation to produce better
232    results when exchanging small messages.
233  * Add a new parameter to handle correctly full duplex link and account
234    for interferences between uplink and downlink communications
235    (activate with --cfg=fullduplex:1).
236
237  SIMDAG
238  * Rename the SD_READY (all dependencies are satisfied and task is
239    scheduled) state in SD_RUNNABLE and define a new SD_SCHEDULABLE (all
240    dependencies are satisfied) state.
241    This prevents a confusion between the notion of "ready to schedule"
242    (SD_SCHEDULABLE) used in DAG scheduling and that of "ready to be
243    simulated" (SD_RUNNABLE) used by the simulation kernel.
244  * Change the way a task is considered as ready. Instead of removing
245    dependencies when a task is done, a counter is decreased. This way,
246    it is always possible to reach ancestors thanks to the
247    SD_taks_get_parents function (even after the end of the simulation.)
248  * Change the return type of SD_Simulate from (SD_task_t*) into
249    xbt_dynar_t. This function was in handling a dynar internally and
250    converted it into a NULL terminated array for historical reasons.
251  * New function SD_dotload(char*) to load a DAG described in dot
252    format. This loader and the corresponding examples require the
253    installation of the graphviz library.
254  * Fix a bug in the management of tasks of size 0 in the surf network
255    models. This problem was only visible with SIMDAG and you should
256    thus disregard results produced with earlier versions if you
257    relied on this feature (some tasks were blocked because of this).
258  * Fix a bunch of stuff that prevented to use classical models with SIMDAG
259    even though your applications were doing only point-to-point
260    communications and sequential computations. Now you can really use any
261    model you want (of course, if you create real parallel tasks, which are
262    not implemented in most models beside ptaskL07, this will abort).
263  * Add an example that schedules a DAX on an heterogeneous platform
264    using a Min-Min strategy.
265  * New function SD_workstation_get_current_task() that returns the kind
266    of task currently running on a workstation in the sequential access
267    mode.
268  * Raise some warnings when unexecuted tasks remains at the end of the
269    simulation. This is usually caused by cycles in the DAG.
270
271  SIMIX
272  * New function: SIMIX_process_set_function() called by MSG_set_function
273  * Change the underlying waiting queue in semaphores so that a process
274    can wait on several of them simultaneously (as in waitany).
275  * Fix the way to handle tokens in semaphores so that all access patterns
276    work: {acquire, acquire_timeout, waitany} / {release, release_forever}.
277  * kill the dirty pimple SIMIX_message_sizes_output()
278    Please use (proper) visualization instead
279
280  XBT
281  * New data container: setset (set of sets of elements)
282  * New module: mmalloc (mapped malloc, allowing to have several
283    independent segments of malloc)
284  * New function: xbt_dict_cursor_set_data()
285  * New functions: xbt_dynar_sort(), xbt_dynar_compare()
286  * New function: xbt_dynar_is_empty()
287  * New function: xbt_fifo_get_last_item()
288  * Fix xbt_dynar_shrink(): use the right element size.
289  * Fix xbt_dynar_set*(): allow index larger than current size and memset 0
290    uninitialized areas during expand.
291  * Fix semaphores: previous implementation was severely broken.
292  * Use library init/fini functions for our initialization.
293    - you can use logs and other feature as soon as you want in your
294      code (even before the xbt_init / MSG_init)
295    - xbt_exit is now a no-op and produce a warning when used.
296
297  GRAS:
298  * Port GRAS to new SIMIX mechanisms. This allows gras users to
299    benefit from the latest improvement to the simulation kernel.
300  * Kill measurement sockets for now. If you rely on them, sorry. This
301    release is not for you. This feature will be reintroduced in the
302    future, but we cannot delay the release any further.
303  * New function: gras_msgtype_get_name().
304  * Implement gras_agent_spawn in RL too (the prototype changed a bit)
305  * Fix (at last) the pmm example: it should not randomly fail anymore.
306
307  Build chain: bug fixes and overall polishing
308  * Cmake is now stable enough. Hence, we killed the autotools.
309  * Port to windows ( TM :)
310  * Fix the 'make install' target.
311    No need to use 'make install-simgrid' anymore
312  * Introduce a 'make dist' target compiling a *source* archive
313    'make package' compiles a binary archive
314  * Compile java files only on need
315  * Add --cd and --setenv command line options to tesh
316  * Out of source builds are not fully supported yet, but we are close
317  * Enable supernovae and optimization flags by default for our users
318
319  LUA Bindings
320  * Add layer to set up environment directly from lua, without XML.
321  * The effect of gras_stub_generator can be achieved through
322    lua too (check examples/gras/console/ping_generator.lua)
323
324  -- Wed, 01 Dec 2010 22:09:23 +0100 Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>
325
326 SimGrid (3.4.1) stable; urgency=low
327
328  The "Polishing easter eggs is probably a good idea" release.
329  This is a bug fixes release only.
330
331
332  Java Bindings
333  * Fix a bug preventing the tasks from begin garbage collected.
334
335  MSG
336  * Fix a bug occuring when a host involved in a communication fails.
337    This was not detected properly by the other peer involved in the
338    communication. Now, it's reported as a network error.
339
340  SimDag
341  * Warn the user about loop dependencies in data flow of DAX files
342  * Obey the control-flow dependencies of DAX files
343
344  Cmake
345  * Add option "enable_smpi" allowing to not compile SMPI.
346    Probably useful for the (Mac) users experiencing a build error here
347  * Improve the detection of lua5.1 and ruby1.8
348
349  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Tus, 04 May 2010 28 16:11:16 +0100
350
351 SimGrid (3.4) stable; urgency=low
352
353  The "Easter in Cargese" release. Also known as (major changes):
354
355   * the "se habla Java, Ruby 話せます, fala-se Lua (and deaf-friendly)"
356     ~> bindings were greatly improved
357     ~> new tracing infrastructure for better visualization introduced
358
359   * the "Welcome to configury modernity" release.
360     ~> we switched from autotools to cmake, and improved our cdash
361
362
363  A more detailled list of changes follow (full detail in svn log).
364
365  Java Bindings: Various Cleanups
366   * (install java-gcj-compat-dev on debian-like to use them)
367   * Remove put/get: no need to export deprecated interface in Java
368     Use send/receive instead.
369   * Cleanup the examples and add a README per directory
370   * Remove example autoDestination (that's the only way to go now)
371   * Remove example explicitDestination (was a plain copy of basic)
372   * Make JniException a runtime exception, so that there is no need to
373     declare the fact that you may encounter such a beast. I guess that
374     nobody will ever want to survive such error.
375   * Create specific errors for each MSG case of failure:
376     host failure, transfer failure, timeout, task cancelled
377   * Cleanup the exceptions that may get thrown by each function
378   * Other internal cleanups in Java bindings. Performance still bad :/
379  Ruby and Lua Bindings: create them
380   * (install ruby1.8-dev/liblua5.1-0-dev on debian-like to use them)
381   * That's new and great, you should try them out.
382     Same functionalities than Java bindings, only even less polished
383  SimDag:
384   * Kill the useless "rate" argument of SD_task_get_execution_time()
385     Everyone used to provide -1 as a value, it was not used, and the
386     semantic of a possible use wasn't even clear.
387   * SD_SCHED_NO_COST: Constant to use as cost in SD_task_schedule()
388     either as comm costs or compute costs to mean that there is no
389     such thing for that specific task.
390   * Add a SD_task_set_name() function
391   * Fix SD_task_unschedule() on typed tasks
392   * Fix SD_task_get_execution_time() to return seconds, not flop*sec
393   * In DAX loader, accept useless 'level' attributes to <job> since
394     LIGO DAGs have them (seem to be to ease graphical representation).
395  MSG:
396   * Add an example masterslave_mailbox.c using send/receive and not
397     the deprecated put/get interface.
398   * Kill the MSG_paje_output() function. It's a noop since 2 years.
399   * Kill MSG_WARNING and MSG_FATAL return codes: they were not used
400     anywere in source.
401   * Rename MSG_TIMEOUT_FAILURE into MSG_TIMEOUT for sake of logic
402     (declare MSG_USE_DEPRECATED to still have the old name)
403   * Add a MSG_task_set_data() function
404   * About trace replay (see examples/msg/actions):
405     - implement barrier
406     - Allow to work with splitted trace files for each process
407       Give the specific trace file as argument of each process,
408         and call MSG_action_trace_run(NULL)
409       You can still have one merged file for all processes.
410     - Fix implementation of collective operations
411   * Allow task_execute() on 0-sized tasks (closes #10063)
412  SMPI:
413   * This is the first release of SimGrid where SMPI is not considered
414     beta anymore (even if some corners should still be improved)
415   * Port over the new SIMIX_network submodule (internal refactoring)
416   * Basic support to log events as with SMPE (use --cfg=SMPE:1)
417   * Implement more missing elements of the standard:
418     - MPI_COMM_SELF
419     - MPI_MAXLOC MPI_MINLOC + all associated datatype MPI_DOUBLE_INT,
420       MPI_FLOAT_INT, etc.
421     - MPI_Address() MPI_Get_count() MPI_Type_free() MPI_Type_extent()
422       MPI_Scan() MPI_Get_processor_name()
423     - Added implementation of missing case for Alltoall (warning: it's
424       *not* the bruck variant from OpenMPI; based on Alltoallv instead)
425     - SMPI_MPI_Gather() SMPI_MPI_Gatherv() SMPI_MPI_Scatterv()
426       SMPI_MPI_Reduce_scatter() SMPI_MPI_Allgather()
427       SMPI_MPI_Allgatherv()
428   * Bug fixes include:
429     - MPI_Waitsome() was broken
430     - Allow relative includes in smpicc
431     - Command line cfg argument 'reference_speed' was ignored...
432     - Some functions did not properly lead to auto-benching of user code
433     - smpicc passes -O2 by default (just like openmpi one)
434  SIMIX:
435   * add SIMIX_action_suspend() and SIMIX_action_resume() functions
436   * Bug fixes about timeouts during communications
437   * add SIMIX_message_sizes_output() as a pimple to write to file the
438     amount of messages per size. Use gnuplot to get histogram.
439     Pimple because that's the only user-visible function of simix,
440      defined directly in xbt.h (irk, sorry)
441   * About semaphores:
442      - Add a SIMIX_sem_get_capacity() function
443      - Fix interactions with processe resume/suspende
444      - release_forever() was stupidly broken
445      - Fix SIMIX_display_process_status() for processes in a semaphore
446      - Make SIMIX_sem_block_onto() user-visible
447   * Refactoring context stuff:
448     - Use pseudo-OOP for better modularity
449     - reimplement SIMIX_process_kill() without process_schedule() so
450       that the latter can take as invariant that it is called from
451       maestro.
452     - Merge context_start into context_new for sake of simplicity
453  SURF:
454   * Add a Vivaldi network model, coded live during SUD'10 ;)
455   * Rename configuration variables to start a hierarchy:
456     o cpu_model -> cpu/model
457     o network_model -> network/model
458     o workstation_model -> workstation/model
459   * New configuration variables:
460     o network/bandwidth_factor: correction to bandwith
461     o network/latency_factor: correction to latency
462     o netwotk/weight_S: correction to the weight of competing streams
463   * Add a long description to the models, that users can see with such
464     argument on the command line: --cfg=cpu/model:help
465   * --help-models display the long description of all known models
466  XBT:
467   * config: add the ability to set a default value after registration
468     Does not override any previously set value (e.g. from cmd line)
469   * dict: allow to have integer key and data.
470     When so, you need to use the following functions
471      void xbt_dicti_set(xbt_dict_t dict, uintptr_t key, uintptr_t data);
472      uintptr_t xbt_dicti_get(xbt_dict_t dict, uintptr_t key);
473      void xbt_dicti_remove(xbt_dict_t dict, uintptr_t key);
474     In contrary to regular dicts, the key is not malloced before copy.
475     Mixing scalar and regular elements in the same dict is not tested
476       (but may work).
477   * Allow to use xbt_dynar_shrink() to expend the dynar instead
478  Tracing for Visualization:
479   * SimGrid is now instrumented in order to generate a trace file for
480     visualization analysis: to use it, need to compile SimGrid with the
481     "tracing" option enabled, and instrument the program using SimGrid with
482     TRACE_start, TRACE_category, TRACE_msg_set_task_category and TRACE_end
483     (among other functions).
484   * The instrumentation only traces the platform utilization for now
485   * Documentation to use the tracing functions and how to analyze the
486     traces with the Triva tool is written.
487   * More information about: SimGrid FAQ (in the section Tracing Simulations
488     for Visualization)
489  Build system:
490   * We moved to cmake as default build system. Autotools support will
491     be dropped soon. Check the FAQ for more info about how to use it.
492   * Greatly improved our cdash/ctest interactions
493     Check http://cdash.inria.fr/CDash/index.php?project=Simgrid
494   * Added memory checking tests with valgrind; lot of memleak fixing.
495     This may be the first release of simgrid with so few memory issues
496   * Added code coverage tests.
497     Our coverage is still improvable, but at least we see it on cdash.
498
499  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Wed, 28 Apr 2010 28 17:11:16 +0100
500
501 SimGrid (3.3.4) stable; urgency=low
502
503  The "Desktop Grid needs love too" release (also called Xmas release).
504
505  Models improvements:
506  * Major speedup in the maxmin system solving by using lazy evaluation
507    Instead of solving completely the maxmin system at each iteration,
508      only invalidate (and recompute) the modified parts.
509    This new feature is enabled in default models but you can try to
510      turn it on with "--cfg:maxmin-selective-update=1" for other models.
511  * Cas01 IMproved as default CPU model
512    This CPU model is the same Cas01 model, but it uses the
513      maxmin-selective-update flag and a heap structure to manage
514      actions on SURF kernel.
515    It reduces the complexity to find the next action to finish and,
516      consequently, it's faster than the old Cas01.
517    This is the new default CPU model (Cas01).
518  * Rename the old Cas01 model to Cas01_fullupdate
519    Keep the old cpu model Cas01 with the new name of Cas01_fullupdate.
520    Use "--cfg=cpu_model:Cas01_fullupdate" to use the old default CPU model.
521  * CpuTI (CPU Trace Integration)
522    A new CPU model whose objective is simulate faster when using
523      availability trace files.
524    Instead of using a full featured, over engineered maxmin system for
525      CPU modeling, this model does the pre-integration of traces files
526      to calculate the amount of CPU power available, and so, executes
527      faster than the old CPU models.
528    Use "--cfg=cpu_model:CpuTI" to change to this CPU model.
529  * Use LV08 as default network model since it gives better accuracy
530     for small messages and shouldn't change things for big ones.
531    Use --cfg=network_model:CM02 to get the previous behavior.
532
533
534          ******************************************
535          *DO NOT MIX 3.3.4 RESULTS WITH OLDER ONES*
536          ******************************************
537    * The new CPU model may changes simulations!
538      The point is that events occurring at the exact same timestamp
539         are not scheduled in the same order with the old and new
540         version. This may be enough to completely change the execution
541         of simulations in some cases.
542    * The new network model will change simulations!
543      This new model is more realistic than the previous one, so you
544        should consider redoing your old experiments with this model.
545      Sorry for the inconvenience.
546
547  Build System:
548  * Introduce the supernovae compilation mode
549    When compiled that way, the whole SimGrid (or almost) is put in a
550      single compilation unit and compiled in one shoot.
551   This is to help gcc which has difficulties to inline stuff from one
552      file into another.
553   The speedup seem to be above 15%, althrough more tests are needed on
554      amd64 to confirm that gain.
555
556  MSG:
557  * Port of MSG's mailbox on top of SIMIX network
558    The put/get mechanism was greatly simplified on the way.
559
560  SIMIX:
561  * New SIMIX network module. Provides:
562    - Mailbox: rendez-vous mecanism to find with who you want to speak
563    - Synchronous send/recv: easier and hopefully faster since the
564      logic is handled in the maestro process directly now
565    - Asynchronous send/recv: you dreamt of it? It's here now
566      Too bad that nobody cared enough to propagate the change to MSG.
567  * Add semaphores as SIMIX synchronization mechanism.
568
569  SimDag:
570  * new function SD_daxload(char*) to load a DAX file
571    (see http://vtcpc.isi.edu/pegasus/index.php/WorkflowGenerator)
572  * Introduce typed tasks. Specify its kind and cost at creation.
573    At scheduling, just give where it should be placed, and the cost
574    for each involved resource is automatically computed.
575    Existing constructors so far (more to come of course):
576     - SD_task_create_comm_e2e() for end-to-end communication
577     - SD_task_create_comp_seq() for sequential computation
578    Use SD_task_schedulev() / SD_task_schedulel() to schedule them.
579  * new function SD_task_dump() for debuging display
580  * new function SD_task_dotty(task,FILE*) writing to file the info
581    about the task in dotty format
582  * SD_task_dependency_exists() can now cope with having one of its
583    arguments NULL. If so, it tests whether the other argument has any
584    dependency.
585  * Add getters on list of preceding/following tasks:
586     SD_task_get_parents(task) and SD_task_get_children(task)
587  * Add getters on amount of workstations and list:
588     SD_task_get_workstation_count(t) and SD_task_get_workstation_list(t)
589  * Add getter on task kind: SD_task_get_kind(task)
590  * Update the start_time and finish_time of tasks on completion/failure
591  * Bugfix: Remove task from state swags when destroyed
592
593  GRAS:
594  * New function: void gras_cpu_burn(double flops) -- a simple CPU burner
595
596  XBT:
597  * New function: xbt_dynar_dopar(dynar,fun) to map a function over the
598    dynar with one separate thread per value of the dynar.
599  * Change the prototype of xbt_thread_create(), sorry.
600    Added a boolean parameter indicating whether we want to join this
601    thread (used in SG only for now)
602  * Implement xbt_thread_join and xbt_thread_yield in SG also.
603
604  Bug fixes:
605  * GTNetS wrappers should now be usable again (and betterly tested too)
606  * Fix a major regression from 3.2 where the timeout provided to
607    MSG_task_put_with_timeout() was used as absolute time before which
608    the comm should be done.
609  * Start to fix the <cluster> tag.
610    - Internal links should be good now (beside of the loopback, which
611      use the private link instead)
612    - paths to the external world is still rather broken
613    - the <route:multi> tag is just broken. Actually that's brain-dead.
614      We need sth like <route:multi src="myCluster" dst="$*-${myCluster}">
615      to make it less stupid
616    ** Check your platform with teshsuite/simdag/platforms/flatifier **
617  * Fix a source-level compatibility glitch from 3.2: after defining
618    MSG_USE_DEPRECATED, you can use the old name
619    MSG_task_put_with_time_out() for MSG_task_put_with_timeout()
620  * Allow to compile from the SVN with automake 1.11
621  * Fix some problems when using the "start_time" tag in deployment XMLs.
622  * Fix #8569: XBT/synchro.h has redundant declarations
623  * Fix #8563: MSG return values and exceptions
624    Introduce a MSG_TIMEOUT_FAILURE return code and use it consistently.
625  * Integrate patch #8636: Obey DESTDIR when installing documentation.
626    Thanks to Robson Peixoto.
627  * Fix a vicious bug in dictionaries inducing that some elements were
628    not freed on xbt_dict_free()
629
630  Portability report of this version:
631   * Main portability targets:
632     - linux (ubuntu (804/810/910) /debian (4/5/testing) /fedora (core11))
633       on (amd64/i386/ia64)
634     - mac leopard on i386
635     Known problems: http://cdash.inria.fr/CDash/index.php?project=Simgrid
636      but nothing critical.
637   * Other platforms: windows, AIX and others were not tested for this release
638
639  Timing report of this version:
640   * Lazy evaluation brings arbitrary speedup (ie, speedup depending on
641     scenario parameters). From 8h to a few seconds in desktop grid settings.
642   * Supernovae brings about 25% speedup on i386.
643
644  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Thu, 24 Dec 2009 19:07:39 +0100
645
646 SimGrid (3.3.3) stable; urgency=low
647
648  The "Need for Speed" release.
649
650  The timings done to validate the 3.3.2 were faulty.
651  Instead of being 5% faster, it was 15% slower (compared to 3.3.1).
652
653  The problem was a conversion from a manually handled vector to
654    xbt_dynar_t on the critical path.
655  xbt_dynar_foreach calls functions, inducing stack management crap.
656
657  We inlined these functions and xbt_dynar_foreach is now breath taking.
658  We also inlined xbt_swag_belong on the way.
659
660  Here are some approximate speedup measurements (on master/slaves
661   simulations lasting between 10s and 20s each):
662    3.3.1                   -> 3.3.2: about same performance
663    3.3.2                   -> 3.3.3: 40% speedup
664    3.3.1                   -> 3.3.3: 40% speedup
665    3.3.1 with inline patch -> 3.3.3: 30% speedup
666
667  Our reading is that the refactoring which occurred in 3.3.2 made us
668   suffer much more from the xbt_dynar_foreach low performance, but
669   once we solved this, this refactoring proved to be very performance
670   effective. From the 40% speedup, somehow, 10% are due to the
671   inlining and 30% to the refactoring.
672
673  That's a pitty that gcc cannot inline functions placed in other files
674   alone. We have to choose between:
675   - break the encapsulation (by putting private data structures and
676     accessors in headers files to help gcc)
677   - live with low performance
678   - switch to a decent compiler such as icc (not quite possible).
679
680  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Thu, 20 Aug 2009 21:21:33 +0200
681
682 SimGrid (3.3.2) stable; urgency=low
683
684  The "Simplicity does not preceed complexity, but follows it" release.
685
686  The main contributors of this release were (lexical order):
687    Silas De Munck, Stéphane Genaud, Martin Quinson, Cristian Rosa.
688
689  SURF:
690   * Extract the routing logic into its own object.
691     (was dupplicated in network.c and workstation_LV07.c;
692      Allows to implement other ways of storing that info)
693     => kill now useless network_card concept
694     - Use dynar to represent routes (instead of void** + int*)
695     - kill link_set (use surf_network_model->resource_set instead)
696     - Add a command-line option to choose the routing schema to use
697     - Add three new models:
698       * Floyd (shortest path computed at initialization)
699       * Dijikstra (shortest path recomputed all the time)
700       * Cached Dijikstra (shortest path computed on need)
701       All these models where contributed by Silas De Munck, and are
702       described in his ICCS09 paper.
703
704   * Simplify model declaration
705     (less redirections, less function to write when defining a model)
706     - Factorize stuff between models:
707       - model_init/exit
708       - Set of resources:
709         surf_model_resource_set(model)
710         surf_model_resource_by_name(model, name)
711     - Unify the types of models in s_surf_model_t (using an union)
712     - Embeed fields of common_public directly into s_surf_model_t
713     - Rename model methods:
714       action_free ~> action_unref
715       action_change_state ~> action_state_set
716       action_get_state    ~> action_state_get
717     - Change model methods into functions :
718       (model)->common_public->action_use  ~> surf_action_ref
719
720   * Implement a generic resource; use it as ancestor to specific ones
721     (allows to kill duplicated code in models)
722     Drawback: timer command don't need no name nor properties;
723               workstation_CLM03 don't need no properties
724     (but I guess we can live with those few bytes wasted)
725
726   * Improve the action object model
727     - implement a constructor avoiding dupplicated code about field
728       initialization in generic_action part.
729
730   * Kill the SDP model: it has an external dependency, is deprecated
731     in flavor of modern lmm models, and didn't compile since a while
732
733  SIMIX:
734   * Relocation of the context module from XBT to SIMIX.
735     (the context were decoupled from the simix processes, duplicating a lot of code)
736     => a lot of code was factorized
737     - less overhead is introduced during scheduling
738     - simpler API for the context factory
739     - the logic for process creation,destruction and manipulation was simplified
740   * Simplification of the s_smx_process_t data structure.
741     => accesing the simix level data associated to a process is faster now,
742        and the code is a lot more readable.
743
744  SMPI:
745   * Implement some more MPI primitives:
746     MPI_Bcast, MPI_Waitany, MPI_Waitall, MPI_Reduce, MPI_Allreduce, MPI_Scatter, MPI_Sendrecv, MPI_Alltoall
747     -implementation: Bcast: flat or 2-ary tree (default),
748                      Barrier: 4-ary tree,
749                      Reduce: flat tree
750                      Allreduce: Reduce then Bcast
751                      Alltoall: "basic_linear" if data per proc < 3Kb, "otherwise pairwise".
752                                Not yet implemented: "Bruck" for data per proc < 200b and comm size > 12
753                      Alltoallv: flat tree, like ompi
754                      Scatter: flat tree
755   * Add support for optimized collectives (Bcast is now binomial by default)
756   * Port smpirun and smpicc to OS X
757
758  SimDag:
759   * Kill SD_link_get_properties: hard to maintain and makes very little sense
760     Shout out if you used it.
761
762  GRAS:
763   * Display the list of still queued messages in SG mode when existing
764     the process.
765
766  XBT:
767   * Add xbt_set_get_by_name_or_null() [Silas De Munck]
768   * Add xbt_graph_node_get_outedges() [Silas De Munck]
769   * Add xbt_str_from_file(FILE*)
770   * Add xbt_dict_get_key achieving a linear reverse search
771   * Remove the context module
772
773  Portability report of this version:
774   * Main portability targets:
775     - Linux(debian)/x86/context
776     - Linux(debian)/x86/pthreads
777     - Linux(debian)/amd64/context
778     - Linux(debian)/amd64/pthreads
779     On these, we still have the eratic breakages of gras/pmm and
780       amok/saturate_sg reported in previous version. We still think
781       that the tests are the cause of the fault, not the tested code.
782
783     - Mac OSX Leopard/x86/context
784     Still false negative in tesh autotesting.
785     Smpi still fails, but this time because readlink does not accept -f
786     Everything seems to work properly beside of that.
787
788   * Exotic platforms:
789     - AIX version 5.3 (only tested contexts this time)
790       Smpi still fails there because mktemp is not installed.
791       Everything seems to work properly beside of that.
792     - OpenSolaris 11
793       I managed to compile it for the first time, but several breakages.
794       Won't delay the release for this exotic platform.
795
796   * Windows: it's still lagging behind. If you want to help, please
797     stand up.
798
799  Timing report of this version:
800   This version seem to be more than 5% faster than 3.3.1 (on linux
801     64bits with contextes). The gain is less than expected, we are
802     investigating this for next release.
803
804  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Wed, 19 Aug 2009 17:07:12 +0200
805
806 SimGrid (3.3.1) stable; urgency=low
807
808  OVERALL CHANGES:
809   * Implement a --cfg-help to show existing configuration variables
810   * Build chain do not require doxygen in maintainer mode
811
812  GRAS:
813   * fix a bug on struct sizeof computation, which prevented the
814     exchange of arrays of structs in some conditions
815     - added a regression test about this in datadesc_usage
816   * Allow the exchange of 0-long dynamic vectors.
817     - for that, use -1 as indicator of dynamic size instead of 0
818     - This implied to change any size from unsigned long to long,
819       reducing a bit communication abilities, but I guess that with
820       64bits being quite common, this is more than enough.
821     - This also induce a protocol change, thus bumping network protocol
822       version from 0 to 1 (if we have external users, we have to get
823       clean on that point too ;)
824     - added two regression tests about this in datadesc_usage
825   * Be more verbose when propagating local exceptions
826     This helps debugging.
827   * Display the status of simulated processes when receiving SIGINT in
828     simulation mode
829
830  MSG:
831   * Allow to control the simulation from a trace file.
832     New functions MSG_action_register() and MSG_action_trace_run()
833     The first one allows to associate a function execution to each
834      kind of action while the second one parses a trace file and
835      triggers the corresponding actions within the system.
836     For now, only a toy example is provided in examples/msg/actions
837   * Add an exemple of process migration in examples/msg/migration
838   * Fix a bug in task exchange which broke MSG_task_get_sender()
839     Add a teshsuite regression test for that.
840     [Bug: if MSG_task_get_sender() is called after sender exit,
841      bad things happen]
842   * Fix a bug which prevented suspend/resume to work properly
843   * Display the status of simulated processes when receiving SIGINT
844     This fixes a regression of v3.3. due to the introduction of SIMIX
845   * Bug fixing in failure management:
846     - trace could not start by a failure at time 0
847     - failure during communications were not working
848
849  SIMIX:
850   * Add SIMIX_process_set_name() to change the name of the current
851     process in the log messages.
852   * Store smx_hosts in a dict since we only retrieve them by name
853   * Move the configuration infrastructure to surf
854
855  SIMDAG:
856   * Move the configuration infrastructure to surf
857
858  SMPI:
859   * Massive internal cleanups:
860     - Store internal structures on processes instead of hosts (allows
861       to have more than one process per host, in addition of being more
862       logical)
863     - Cleanup the initialization/finalization process
864     - Kill a whole bunch of unneeded synchronization:
865       processes run in exclusive manner within the simulator
866     - Move queues from global tables to process data fields
867   * Improve smpirun:
868     - now accept -platform and -hostfile arguments
869     - Pass the right rank value to processes according to the hostfile
870   * Compile the examples by default, and use them as regression tests
871   * Implement MPI_Wtime()
872   * Change the reference speed to a command line option
873
874  SURF:
875   * TCP_gamma can now be specified as command line option using
876     --cfg=TCP_gamma:10000000.0
877   * Change the --surf-path cmd line option into --cfg=path:
878
879  XBT:
880   * Also include strbuff from xbt.h public header
881   * xbt_ex_display(): do not free the exception after displaying
882     This allows to do more with the given exception afterward.
883     Users should call xbt_ex_free() themselves.
884
885
886
887  Portability report of this version:
888   * Main portability targets:
889     - Linux(debian)/x86/context
890     - Linux(debian)/x86/pthreads
891     - Linux(debian)/amd64/context
892     - Linux(debian)/amd64/pthreads
893     These targets fail about 1/10 of times on gras/pmm, but we believe
894       that this is because of the test, not because of simgrid.
895     amok/saturate_sg fails even more rarely, and the test may not be
896       the problem.
897
898     - Mac OSX Leopard/x86/context
899     The test suite still spits tons of errors because some obscure
900       force prevents us from removing the temporary directories
901       arguing that they still contain some metadata I've never heard of.
902     Smpi fails because seq is not installed.
903     Everything seems to work properly beside of that.
904
905   * Exotic platforms:
906     - AIX version 5.3 (both contexts and pthread)
907       Smpi still fails there because mktemp is not installed.
908       XML inclusions seems rosty on AIX.
909
910   * Windows: it's still lagging behind. If you want to help, please
911     stand up.
912
913  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Sat, 27 Jun 2009 00:14:30 +0200
914
915 SimGrid (3.3) stable; urgency=high
916
917  OVERALL CHANGES:
918
919   * JAVA BINDINGS for MSG (you dreamt of them? We made them)
920     [Malek Cherier & Mt]
921
922   * Introduce the SIMIX module: factorize code between MSG and GRAS.
923     [Bruno Donassolo]
924
925     Until now, GRAS were using MSG as an interface to SURF. It was
926     quite difficult because both interface have several differences
927     (MSG channels vs GRAS sockets were the most notable point).
928
929     This also opens the gate to SMPI (which should occur soon) and speed
930     up simulations by to 40% (even if it were not the main goal).
931
932     **************************************
933     *DO NOT MIX 3.2 RESULTS WITH 3.3 ONES* Simix may changes simulations!
934     **************************************
935     The point is that events occuring at the exact same timestamp are
936     not scheduled in the same order with the old and new version. This
937     may be enough to completely change the execution of simulations in
938     some cases. Sorry for the inconvenience.
939
940   * Cleanup and upgrade the XML format to push further scalability
941     issues (check http://hal.inria.fr/inria-00256883/ for more info)
942
943   * Improve the testing infrastructure with tesh. Now a very large part of
944     the code is tested not only by being run but also by checking that the
945     output match an expected output [Mt].
946
947   * Move on to FleXML v1.7 for the embeeded XML parsers. This version
948     is really less memory-demanding, which should allow you to use
949     larger files in SimGrid [AL].
950
951   * Inform valgrind about our contextes, so that it becomes usable
952     with the default (and more effecient) version of SimGrid
953     [contributed by Sékou Diakite, many thanks]
954
955  GRAS:
956   * Introduce a listener thread in charge of receiving incomming
957     messages from the network. It allows to overlap communication and
958     computation but most notably, it removes some stupid deadlocks due
959     to the fact that so far, a process could not send and receive at
960     the same time. This made most non trivial communication schema
961     impossible.
962   * Convert the PIDs from long int to int to match the MSG ones (and
963     linux ones too) [Mt]
964   * New function: gras_agent_spawn() to launch a new process on
965     current host. Only working in simulation for now. [Mt]
966   * New function: gras_os_hostport() returning a constant form (ie,
967     not needing to be freed) of "gras_os_hostname():gras_os_myport()"
968
969  XBT:
970   * Make the backtrace of exceptions more human readable [Mt]
971   * New module: xbt/str [Mt]
972     a ton of string utility functions (split, join, printf to a newly
973     allocated buffer, trim, etc)
974   * New module: xbt/hash [Mt]
975     SHA1 hashing algorithm (more to come if needed)
976   * New module: xbt/synchro [Mt]
977     synchronization tools (mutex and conditions) working the same way
978     in simulation and in real life (mainly useful for GRAS, but not
979     only).
980   * New module: xbt/queue [Mt]
981     classical producer/consumer synchronization scheme
982   * xbt_dynar_new_sync() creates a synchronized dynar. All access
983     (using the classical functions will get serialized) [Mt]
984   * Make dictionary internal table dynamic. No need to specify its size
985     anymore; functions xbt_dict_new_ext() and xbt_dict_hashsize_set()
986     thus dropped. [Mt].
987   * Make sure the log channels are organized as a tree under windows
988     (because of ANSI C compatibility issue, any channel were child of
989      root directly) [Mt].
990
991  SURF:
992   * Cleaned many thing in surf and fixed a few bugs [AL].
993   * Add a nice command line configuration mechanism to compose models [AL].
994   * Add a new model for parallel tasks (ptask_L07) that is less buggy than
995     the previous one (KCCFLN05). It relies on something that looks like
996     a max-min sharing mechanism but cannot be written as such. A new solver
997     was thus designed [AL].
998   * Add a new solver to lmm. Based on Lagrange optimization and
999     gradient-based descent, it enables to efficiently maximise systems s.a
1000
1001      sum f_i(x_i) s.t Ax<= b  with A_{i,j}>=0 and f_i a concave function.
1002
1003     This solver enables to propose two new network models for TCP Reno and
1004     TCP Vegas based on Low's work. These models still need to be fully
1005     tested though [Pedro Velho].
1006
1007  SIMDAG [AL]:
1008   * Bug fix in SD_simulate. Now the time bound given as argument is
1009     used.
1010   * Use the new parallel task model (ptask_L07) as default.
1011   * Use the SURF command line configuration mechanism.
1012   * 0-size tasks (for synchronization) should now work.
1013
1014  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Sun Apr 12 05:20:36 CEST 2009
1015
1016 SimGrid (3.2) stable; urgency=high
1017
1018   OVERALL CHANGES:
1019    * Port to windows.
1020      We still experience issues on this platform, but we believe that at
1021      least MSG is usable.
1022
1023   GRAS API BREAKAGE (for simplification purpose, sorry):
1024    * the gras_msgtype_by_name is not used anymore. Instead of
1025        gras_msg_send(toserver, gras_msgtype_by_name("request"), &request);
1026      you can write (and must)
1027        gras_msg_send(toserver, "request", &request);
1028    - If you still want to pass a gras_msgtype_t to the function (to cache
1029      the type and avoid the lookup time), use the gras_msg_send_() variant.
1030    - Impacted functions:
1031      gras_cb_register, gras_cb_unregister, gras_msg_send, gras_msg_wait,
1032      gras_msg_rpccall, gras_msg_rpc_async_call, gras_msg_wait_ext
1033    * The callbacks are now expected to return 0 when everything went well
1034      (just like the main() function)
1035
1036   GRAS new features and improvements:
1037   * New module mecanism where user code can use per process globals [Mt]
1038     This is similar to gras_userdata_*() functions, but for libraries. It
1039       factorize some code developped over and over in the examples and AMOK.
1040     It has still to be documented and used (only amok/peermanagement is
1041       converted for now).
1042   * Fix a vicious bug in the TCP buffering mecanism which leaded to message
1043     loss when they were small enough to fit into the buffer and sent quickly
1044     enough so that they can all get received in one shoot.
1045   * gras_datadesc_by_name and gras_msgtype_by_name: now raise an exception
1046     if not found. Use the *_or_null() variant for the old semantic.
1047   * In gras_msg_handle, do not discard messages without callback.
1048     They are probably messages to be explicitly awaited later (ie, proofs of
1049     mis-synchronization in userland since they are sent before being awaited)
1050     No big deal usually.
1051   * gras_socket_meas_send/recv: semantic changed!
1052     The numerical arguments used to be (1) the total amount of data to send
1053     and (2) msg_size. This was changed to (1) msg_size and (2) amount of
1054     messages. This was need for the fool willing to send more than MAXINT
1055     bytes on quite fat pipes.
1056         
1057   AMOK:
1058   * Do really rename the hostmanagement module to peermanagement. [Mt]
1059     Ie, rename functions from amok_hm_* to amok_pm_*. This breaks the API,
1060     but this is rather new and this was documented in the module
1061     documentation (poor excuses, I admit)
1062   * Bandwidth measurement semantic changed! This follows the changes to
1063     gras_socket_meas_send/recv explained above.
1064
1065   SIMDAG:
1066   * A sequential mode has been added to the workstations. When a workstation
1067     is in sequential mode, it can execute only one task, and the other tasks
1068     are waiting in a FIFO. [Christophe Thiery]
1069
1070   SURF:
1071   * The KCCFLN05 workstation model now handles parallel tasks. It is the
1072     model for SIMDAG. [Christophe Thiery]
1073   * Bug fix in the maxmin solver: Some values were close to 0 instead of
1074     equal to 0, which caused some bad behaviors in
1075     saturated_constraint_set_update. I now use a threshold mechanism like in
1076     surf. [AL]
1077
1078   XBT:
1079   * When running manually src/testall, you select specific units [Mt]
1080     testall is the result of our cunit mecanism, and should replace all
1081     the scripty thingy around since bash don't run easily on billware.
1082
1083   * A mallocator system has been added. [Christophe Thiery]
1084     Mallocators allow you to recycle your unused objects instead of freeing them
1085     and allocating new ones.
1086
1087   Documentation update:
1088   * FAQ reworking + New FAQs:
1089     - "Valgrind spits tons of errors!" [Mt]
1090     - "How to repport bugs" [Mt]
1091     - "Cross-compiling a Windows DLL of SimGrid from Linux" [Mt]
1092     - "What is the difference between MSG, SimDag, and GRAS?" [Mt]
1093     - Communication time measurement within MSG [AL]
1094     - I experience weird communication times when I change the latency [AL]
1095   * GRAS tutorial [Mt]
1096     It contains:
1097      - an introduction to the framework and to the used communication model
1098      - an initiatic tour introducing the most proheminent features:
1099        o Part 1: Bases
1100          . Lesson 0: Installing GRAS
1101          . Lesson 1: Setting up your own project
1102        o Part 2: Message passing
1103          . Lesson 2: Exchanging simple messages
1104          . Lesson 3: Passing arguments to the processes (in SG)
1105          . Lesson 4: Attaching callbacks to messages
1106          . Lesson 5: Using globals in processes
1107          . Lesson 6: Logging informations properly
1108          . Lesson 7: Using internal timers
1109          . Lesson 8: Handling errors through exceptions
1110          . Lesson 9: Exchanging simple data
1111          . Lesson 10: Remote Procedure Calling (RPC)
1112          . Lesson 11: Explicitely waiting for messages
1113          . Recapping of message passing features in GRAS
1114      - A HOWTO section containing:
1115        o HOWTO design a GRAS application
1116        More are due, of course. They will come latter. In the meanwhile, you can
1117        check the examples which are still here.
1118
1119  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Fri Mar 16 21:11:46 CET 2007
1120
1121 SimGrid (3.1) stable; urgency=high
1122
1123   General:
1124   * Port to gcc 4.x
1125     There was a stack corruption somewhere, visible only when optimizing
1126     with these versions. [Vince]
1127
1128   SIMDAG:
1129   * This is a NEW module! SimDAG (SD for short) is a revival of the old SG
1130     module that enabled to play with Directed Acyclic Graphs. It is built
1131     directly on top of SURF and provides an API rather close to the old
1132     SG. Some old codes using SG are currently under rewrite to check that
1133     all needful functions are provided. [Christophe Thiery]
1134         
1135   SURF:
1136   * Complete rewrite of the KCCFLN05 workstation model. It is now an
1137     extension of the classical CLM03 model that gracefully handles
1138     failures. This is now the default model for MSG and GRAS. It doesn't
1139     handle parallel tasks yet though. [AL]
1140   * Bug fix: Weights were not correctly set in the network part.
1141     WARNING: This may have resulted in incorrect results with simulations
1142     where there are more than one flow on a given link. [AL]
1143
1144   SURF, MSG, GRAS:
1145   * After a (long ?) discussion on simgrid-devel, we have decided that the
1146     convention we had on units was stupid. That is why it has been decided
1147     to move from (MBits, MFlops, seconds) to (Bits, Flops, seconds).
1148     WARNING : This means that all previous platform files will not work as
1149     such with this version! A warning is issued to ask users to update
1150     their files. [AL]
1151     A conversion script can be found in the contrib module of the CVS, under
1152     the name contrib/platform_generation/surfxml_update.pl [MQ]
1153
1154   MSG,GRAS:
1155   * Bug fix: Processes were started in reverse order, wrt deployment file.
1156     WARNING: if your code relies on this bug, please fix it.    [AL]
1157   * Bug fix: Add a test in MSG_task_execute to stop whenever a task is
1158     being executed on two different locations.                  [AL]
1159   * Bug fix: Failures are now better supported thanks to Derrick's tests
1160     (there was many failure situations I hadn't thought of and that weren't
1161     correctly handled). [AL]
1162   * New function: MSG_host_is_avail indicates you whether a given m_host_t
1163     is up or down. [AL]
1164
1165   GRAS:
1166   * New! a real RPC mecanism, as it ought to be since too long. [MQ]
1167       Exception occurring on server-side are propagated back to client (!).
1168
1169     API CHANGE: the callback changed their prototype. Change:
1170         int my_handler(gras_socket_t expeditor, void *payload_data) {
1171       to:
1172         int my_handler(gras_msg_cb_ctx_t ctx  , void *payload_data) {
1173           gras_socket_t expeditor=gras_msg_cb_ctx_from(ctx);
1174       and you're set.
1175   * New! function: gras_msg_handleall to deal with all messages arriving
1176       within a given period.
1177   * New! function: gras_socket_server_range to get a server socket in a
1178     range of port numbers (ease to avoid port number conflicts) [MQ]
1179   * New! gras processes display their backtrace when they get a SIGUSR1
1180       or when Ctrl-C is pressed. Use Ctrl-C Ctrl-C to exit.
1181       Sweet to debug RL processes [MQ]
1182
1183   AMOK:
1184   * Bandwidth module:
1185     - Do not force experiment sizes to be expressed in kb, or it becomes
1186       impossible to measure the latency this way (needs one byte-long tests)
1187     WARNING: this changes the amok_bw_* function semantic. [MQ]
1188     - Implements the link saturation stuff. [MQ]
1189   * Peer management module:
1190     New! module factorizing code that we wrote over and over [MQ].
1191
1192   XBT:
1193   * New module: cunit (my jUnit implementation in ansi C) [MQ]
1194     - Test units are placed directly into the library code, they get extracted
1195       automatically and placed into the src/testall binary.
1196     - Convert most of the XBT tests to this system.
1197   * New functions: xbt_dynar_getfirst_as() and xbt_dynar_getlast_as() [MQ]
1198   * XML parsing: rewrote parts of flexml to enable multiple xml parsers to
1199     live in the same C code. This required to change a little bit the API
1200     of surfxml parsing but shouldn't be an issue for end-users. [AL]
1201   * New module: sparse graph structure with basic algorithms (this is work
1202     in progress and the API is not considered to be frozen yet). [AL]
1203   * Display more information on backtraces: source line & function names are
1204     now displayed just like valgrind does (rely on addr2line tool) [MQ]
1205   * New function: xbt_backtrace_display(). Sweet while debuging [MQ]
1206   * Reworked a little bit some #include statements to load only required
1207     headers. Some user code that relied on SimGrid to include stdlib or
1208     stdio may need to include it by themselves. [AL]
1209   * Fixed xbt/log.h. A missing SG_BEGIN_DECL prevented compilation with
1210     g++. [AL]
1211   * Renamed xbt_host_t into xbt_peer_t since it betterly describes what I
1212     meant. This breaks the API of AMOK and of xbt/config. Sorry about this,
1213     but I guess that almost nobody used those parts. [MQ]
1214
1215  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr> Fri, 14 Jul 2006 01:32:27 +0200
1216
1217 SimGrid (3.0.1) stable; urgency=low
1218
1219   XBT:
1220   * Unfortunately, I had missed 5 misnamed functions:
1221       xbt_fifo_item_t xbt_fifo_newitem(void);
1222       void xbt_fifo_freeitem(xbt_fifo_item_t);
1223       xbt_fifo_item_t xbt_fifo_getFirstItem(xbt_fifo_t l);
1224       xbt_fifo_item_t xbt_fifo_getNextItem(xbt_fifo_item_t i);
1225       xbt_fifo_item_t xbt_fifo_getPrevItem(xbt_fifo_item_t i);
1226     They're now deprecated. Please use their new versions:
1227       xbt_fifo_item_t xbt_fifo_new_item(void);
1228       void xbt_fifo_free_item(xbt_fifo_item_t);
1229       xbt_fifo_item_t xbt_fifo_get_first_item(xbt_fifo_t l);
1230       xbt_fifo_item_t xbt_fifo_get_next_item(xbt_fifo_item_t i);
1231       xbt_fifo_item_t xbt_fifo_get_prev_item(xbt_fifo_item_t i);
1232     [AL]
1233   * Bugfix: really disconnect fifo items which are remove_item()ed [AL]
1234   * Documentation: xbt_log module unmercifully reworked [MQ]
1235   * Bugfix: there was a problem with the ending of contexts with
1236     the pthread backend. It caused some weird deadlock or behavior
1237     depending on the pthread implementation. [AL]
1238   * Bugfix: get the exceptions raised in the simulator repport where
1239     and why they come from when they are not catched in time [AL, MQ]
1240
1241   SURF:
1242   * Bugfix: Do repport the error when two non-connected hosts try to
1243     exchange data (Thanks to Flavien for stumbling into this one) [AL]
1244
1245   SURF:
1246   * Add additionnal checkings on communications. Assert that two
1247     communicating hosts are connected by a set of links... [AL]
1248         
1249   MSG:
1250   * Add additionnal checkings on channel values in communication [AL]
1251   * New: MSG_task_get_source to see on which host a task was generated [HC]
1252   * New: int MSG_task_probe_from_host(int channel, m_host_t host): returns
1253     the number of tasks waiting to be received on channel and sent
1254     by host. [AL]
1255   * New: MSG_error_t MSG_task_get_from_host(m_task_t * task, int channel, m_host_t host);
1256     waits for the first task coming from a given host.. [AL]
1257         
1258   GRAS new functionnalities: [MQ]
1259   * Enhance the parsing macro to allow the size of multidimentional objects
1260     to be given thru annotations.
1261   * New example (and documentation): Matrix Multiplication a la RPC
1262     (as when I was young!) and fix a bunch of bugs found on the way.
1263
1264   GRAS performance improvements: [MQ]
1265   [DataDesc]
1266   * Reduce the amount of cbps creation/destruction by making it static to
1267     datadesc_send/recv() and using a (newly created) cbps_reset (based on
1268     dynar_reset ())
1269   [Virtu]
1270   * Change libdata to a set so that we can search for stuff by ID (and thus
1271     reduce the insane amount of dict lookups)
1272
1273   [Transport]
1274   * Actually implement gras_datadesc_copy() so that we don't have to mimick
1275     RL communication on top of SG since it's so uneffective.
1276     It may also be used for inter-thread communication in RL, one day.
1277   * Use gras_datadesc_copy() to exchange messages on top of SG
1278     Allows to:
1279     - improve message exchange performance on top of SG
1280     - deprecate transport_plugin_sg.c:gras_trp_sg_chunk_send() & recv()
1281   * Don't exchange on the network the size of the used part of buffer,
1282     instead, specify the possible buffer size to read().
1283     Advantages:
1284      - reduces the amount of read/write calls (one pair per exchange)
1285      - reduces the amount of exchanged data (the size)
1286      - allows to retrieve all arrived data on receiver side, if we don't need
1287        it right now (subsequent read will peek the buffer)
1288      - allows the receiver to proceed with the begining of the stream before
1289        everything is arrived
1290      - make it possible to build an iov transport (using readv/writev)
1291     Extra difficulty:
1292      - take care of the data with non-stable storage (like stacked data),
1293        and bufferize them.
1294   * If possible, TCP send uses vector I/O (when writev() is here)
1295      - Don't use it for receive since we send data sizes and data on the
1296        same stream, so we wouldn't be able to chain large amount of chunks
1297        before having to flush the stuff to read the size.
1298   * Rework the transport plugin mecanism to simplify it and reduce the
1299     amount of pointer dereferencement when searching for the right function
1300     to use.
1301
1302   * I guess that now, we do almost as few system calls as possible while
1303     doing as few data copy as possible.
1304
1305     To improve it further, we could try to send all the sizes first and then
1306     all the data (to use iov on receiving size), but it's only a partial
1307     solution: when you have 2 dimensional data, the sizes of the second
1308     dimension is data of the first dimension, so you need 3 streams.
1309
1310     I'm not sure the potential performance gains justify the coding burden.
1311
1312  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Fri, 21 Oct 2005 14:42:20 +0200
1313
1314 SimGrid (3.00) stable; urgency=high
1315
1316  SURF:
1317   * New! Give the possibility to hijack the surf parser and thus bypass
1318     MSG_create_environment and MSG_launch_application. Have a look at
1319     examples/msg/msg_test_surfxml_bypassed.c to see how it can be done.
1320         
1321  -- Arnaud Legrand <simgrid-devel@lists.gforge.inria.fr>  Sat, 20 Aug 2005 23:25:25 -0700
1322
1323 SimGrid (2.96) unstable; urgency=low
1324
1325   AKA SimGrid 3 rc 2.
1326
1327   XBT:
1328   * New! Exception handling with setjmp or such (code from OSSP ex) [MQ]
1329     This deprecates the xbt_error_t mecanisms.
1330     It modifies (simplifies) all XBT and GRAS API.
1331     MSG API keeps unchanged (exceptions raised by XBT are catched from
1332      within MSG and masked with existing error handling facilities)
1333
1334   SURF:
1335   * New! Add a FATPIPE model. [AL]
1336   * New! Add a parallel task model. [AL]
1337   * New! Add automatically a loopback interface (in the default
1338     network model) if none was precised.
1339
1340   MSG
1341   * Bugfix: MSG_process_resume now works with the current running process.
1342     [AL]
1343   * New! Add MSG_parallel_task_create and MSG_parallel_task_execute. [AL]
1344   * Modification of MSG_task_get_compute_duration. Once a task has been
1345     processed, the value returned by this function is now equal to 0. [AL]
1346   * New! Add double MSG_task_get_remaining_computation(m_task_t task) and
1347     MSG_error_t MSG_task_cancel(m_task_t task). Add a state
1348     (MSG_TASK_CANCELLED) to MSG_error_t corresponding to the cancelation
1349     of a m_task. For now, MSG_task_cancel only works with computation
1350     tasks. [AL]
1351   * New! Add double MSG_get_host_speed(m_host_t h) that returns the speed
1352     of the processor (in Mflop/s) regardless of the current load on the
1353     machine. [AL]
1354   * API Change: use proper naming convention for MSG_getClock and
1355     MSG_process_isSuspended: MSG_get_clock and MSG_process_is_suspended.
1356     [AL]
1357   * New! Add void MSG_task_set_priority(m_task_t task, double priority).
1358     This function changes the priority of a computation task. This priority
1359     doesn't affect the transfer rate. A priority of 2 will make a task
1360     receive two times more cpu power than the other ones. This function
1361     has been added to suit the needs of Nguyen The Loc and hasn't been that
1362     much tested yet. So if it fails, please report it and send me your code.
1363     [AL]
1364   * API Change: removed all functions and types that were marked "deprecated"
1365     since many months. Renamed MSG_global_init_args to MSG_global_init.
1366
1367  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Mon,  8 Aug 2005 17:58:47 -0700
1368
1369 SimGrid (2.95) unstable; urgency=low
1370
1371   XBT
1372   * Steal some nice code to GNU pth to fix context detection and usage [AL]
1373   * Cleanup in the xbt_config API; add configuration callbacks. [MQ]
1374   * Cleanup in the initialization API: the unused "defaultlog" is dead. [MQ]
1375
1376   SURF
1377   * Bugfix: Allow absolute paths for platform description files [MQ]
1378   * Bugfix: do free the variables after use. Leads to drastic performance
1379     improvement [AL]
1380   * Implement max_duration (ie, timeouts) on resources [AL]
1381
1382   MSG
1383   * Implement MSG_config to configure MSG at runtime. xbt_cfg test on a real
1384     case ;) [MQ]
1385   * Implement MSG_channel_select_from() to help GRAS now that SURF provide
1386     the needed support (timeouts) [AL]
1387
1388   GRAS (new features)
1389   * Implement measurement sockets. You can now get the bandwidth between two
1390     hosts thanks to AMOK (see below). [MQ]
1391   * gras_datadesc_dynar() builds a dynar type descriptor, allowing to send
1392     dynar over the network (yeah) [MQ]
1393   * Real (even if simplistic) implementation of gras_os_myname() on RL [MQ]
1394   * simple/static token-ring example. [Alexandre Colucci and MQ]
1395   * Use MSG_channel_select_from() and remove the *slow* hack we had to put
1396     in place before [MQ]
1397
1398   GRAS (bug fixes)
1399   * Differentiate the types "char[22]" and "unsigned char[22]" in automatic
1400     type parsing. "short" and "long" modifiers were also ignored; other
1401     modifier (such as reference level) are still ignored. [MQ]
1402   * Embeed the buffer size within the buffer itself on SG. [MQ]
1403     That way, send() are atomic and cannot get intermixed anymore (at least
1404     the ones which are less than 100k; bigger messages still have the issue)
1405   * Array size pushed by the field, not by the field type (or each
1406     and every long int will push stuff to the cbps) [MQ]
1407   * use select() to sleep since it allows to portably sleep less than one
1408     second. [MQ]
1409
1410   GRAS (minor cleanups)
1411   * <project>.Makefile.local (generated from gras_stub_generator) |MQ]:
1412     - Do clean .o files
1413     - Compile with -g
1414   * Type Callbacks now receive the gras_datadesc_type_t they work on as argument.
1415   * type category 'ignored' killed as it was never used and were difficult
1416     to transmit.
1417   * whether a type can cycle or not is now a flag, leaving room for more
1418     flags (as "ignored", if we feel the need one day ;)
1419   * Rename raw sockets to measurement sockets since "raw" has another
1420     meaning in networking community.
1421
1422   AMOK
1423   * Advanced Metacomputing Overlay Kit introduction. It is based over GRAS
1424     and offers features not belonging to GRAS but that most applications
1425     need. One day, it may be a set of plugins loadable at runtime.
1426   * New module: bandwidth
1427     bandwidth measurement between arbitrary nodes running this module. [MQ]
1428
1429  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Thu, 30 Jun 2005 16:29:20 -0700
1430
1431 SimGrid (2.94) unstable; urgency=low
1432
1433   The first beta release of SimGrid 3 !
1434
1435   >>>Arnaud<<<
1436   (documentation)
1437   * Update the main page and the FAQ. Adding references to gforge.
1438
1439   (gras)
1440   * Add a gras_os_getpid function.
1441
1442   (msg)
1443   * Add MSG_task_get_compute_duration() and MSG_task_get_data_size()
1444   * Extend the logs so that they also print PID, hostname, date, ... if
1445     available.
1446   * Convert the MSG example to the use of xbt_logs instead of PRINT_MESSAGE,
1447     and kill the old version which were in testsuite/
1448   * Rewrite tools/MSG_visualization/colorize.pl for using with logs instead
1449     of PRINT_MESSAGE
1450
1451   (xbt)
1452   * Add xbt_os_time(). As the rest of xbt/portability, this is not public
1453     for users. Instead, each programming environment (GRAS, MSG,...) use it
1454     when needed to provide such a feature to users.
1455     Don't shortcut the mecanism or you will also shortcut the virtualization
1456     you need on the simulator.
1457
1458   >>>Martin<<<
1459   (infrastructure)
1460   * Cleanups in configury with regard to compile optimization/warning flags.
1461     Also add -fno-loop-optimize to any powerpc since it's the optimization
1462     killing gcc (< 3.4.0).
1463   * Doxygen cleanups: move MSG examples, kill the second Doxygen phase
1464     needed by MSG examples complications
1465   * Borrow configury beautifications from PHP
1466
1467   (xbt)
1468   * Bugfix: XBT_LOG_NEW_DEFAULT_CATEGORY now compiles without compiler
1469     warning (thanks loris for stumbling into this one).
1470   * Bugfix: stop loading private headers (gras_config.h) from the public
1471     ones (xbt/swag.h).
1472
1473   (gras)
1474   * Change SIMGRID_INSTALL_PATH to GRAS_ROOT in Makefiles generated for user.
1475   * Rename gras_get_my_fqdn to gras_os_myname and implement it in the simulator
1476     RL would imply a DNS resolver, which is *hard* to do in a portable way
1477     (and therefore delayed).
1478   * Implement a real timer mecanism and use it in timing macros. This allows
1479     to avoid rounding errors and get a 0.000005 sec precision in timing
1480     macros. While I was at it, various cleanups:
1481      - allow to declare more than one timed section per file (fix a stupid bug)
1482      - move some private declaration to the right place
1483      - merge conditional execution and timing macros into emulation module
1484      - document the module
1485      - make sure the module cleanups its mess on gras_exit
1486   * Documentation improvements:
1487      - (new) how to compile applications using GRAS
1488      - (new) emulation support (timing macros)
1489
1490  -- Da SimGrid team <simgrid-devel@lists.gforge.inria.fr>  Fri, 13 May 2005 10:49:31 +0200
1491
1492 SimGrid (2.93) unstable; urgency=low
1493
1494   Alpha 4 on the path to SimGrid 3 (aka the "neuf-trois" version)
1495
1496   [Arnaud]
1497    - Use Paje properly where used. Still to be sanitized properly.
1498    - Portability fix: Add an implementation of the contexts using pthread
1499
1500   [Martin]
1501   (misc)
1502    - Add xbt_procname(): returns the name of the current process.
1503      Use it to show the current process's name in all logging.
1504   (infrastructure)
1505    - fix detection of older flex version and the reaction, since we do
1506      depend on modern ones (we use lex_destroy)
1507    - Better separation of SG and RL in the libs: remove all simulation code
1508      from libgras. As a result, this lib is now only 200k when stripped.
1509      Some of the xbt modules may also be duplicated (two sets and such) and
1510      should be cleaned/killed before SG3.
1511    - Insist on using xlC on AIX because of weird problems involving gcc there.
1512    - Cleanup the make remote stuff. This is now done by scripts
1513      tools/graspe-{master,slave} (GRAS Platform Expender). This is still
1514      mainly for our private use, but we're working on changing them to user
1515      tools, too.
1516   (gras)
1517    - Bugfix: flush the socket on close only if there is some *output*.
1518    - Bugfix: flush idempotent when there's nothing to send (don't send size=0)
1519   (msg)
1520    - Add MSG_task_get_name. The task names are mainly for debugging purpose,
1521      but anyway.
1522
1523  -- SimGrid team <simgrid2-users@listes.ens-lyon.fr>  Fri,  4 Mar 2005 14:32:37 -0800
1524
1525 SimGrid (2.92) unstable; urgency=low
1526
1527   Alpha 3 on the path to SimGrid 3
1528
1529   [Arnaud]
1530   (gras)
1531    - New! First try of benchmarking macros.
1532    - New! First try so that gras_stub_generator generate deployment and
1533      remote compilation helpers.
1534   (msg)
1535    - Bugfix: Initialization fix in msg_test.
1536
1537   [Martin]
1538   (surf)
1539    - Bugfix: applied patch to lexer so that it doesn't need a huge heap.
1540   (xbt)
1541    - Bugfix: let dicts work with NULL content (_foreach didn't) and cleanups
1542   (gras)
1543    - API Change: gras_os_sleep to take the amount of seconds as a double.
1544      Accepting an int was error prone since it was the only location where
1545      seconds were coded as such. It leaded to damn rounding errors.
1546    - Bugfix: Hard to belive that timers ever worked before this.
1547
1548  -- SimGrid team <simgrid2-users@listes.ens-lyon.fr>  Wed, 23 Feb 2005 22:09:21 +0100
1549
1550 SimGrid (2.91) unstable; urgency=low
1551
1552   Alpha 2 on the path to SimGrid 3
1553
1554   [Arnaud]
1555   (surf)
1556    - Bug fix in the lmm_solver.
1557   (msg)
1558    - New! Interface to Paje (see http://www-id.imag.fr/Logiciels/paje/)
1559      through the function MSG_paje_output.
1560    - New! Introducing two new functions MSG_process_kill() and MSG_process_killall().
1561    - It is possible to bound the rate of a communication in MSG with
1562      MSG_task_put_bounded() (was already in the previous version but I had forgotten
1563      to write it in the changelog).
1564    - Bug fix to let GRAS run on top of MSG until we move it directly on top
1565      of the SURF.
1566
1567   [Martin]
1568   (infrastructure)
1569    - Various cleanups to the autotools stuff
1570    - Begin to move Gras examples to examples/gras/
1571    - Let make distcheck work again (yeah!)
1572   (documentation)
1573    - documentation overhauled using doxygen.
1574      gtk-doc-tools is dead in SimGrid now.
1575    - Automatically extract all existing logging categories, and add the list
1576      to the documentation (long standing one, to say the less)
1577   (gras)
1578    - Cleanup the known architecture table. Reorder the entries to group what
1579      should be, and use a more consistent naming scheme.
1580      (some of the test dataset are still to be regenerated)
1581    - New! Allow library to register globals on each process just as userdata
1582      does.
1583       This is implemented using a xbt_dict and not a xbt_set, so we loose the
1584        lookup time (for now).
1585       Use it in msg and trp.
1586       This cleans a lot the internals and helps enforcing privacy of the
1587        headers between the gras components.
1588    - New! Add a timer mechanism, not unlike cron(8) and at(1).
1589    - Bugfix: gras_os_time was delirious in RL.
1590    - Bugfix: gras_trp_select/RL don't run into the wall when asked to select
1591      onto 0 sockets.
1592    - Reenable GRAS now that it works.
1593
1594  -- Arnaud Legrand <Arnaud.Legrand@imag.fr>  Mon, 14 Feb 2005 14:02:13 -0800
1595
1596 SimGrid (2.90) unstable; urgency=low
1597
1598   Alpha 1 on the path to SimGrid 3
1599
1600   * It is a long time since the last release of SimGrid. I'm sorry about
1601     that but as I had told you, I was rewriting a lot of things. I apologize
1602     to those who had been reporting bugs to me and that I had not answered.
1603     If your bug is still in the new version, please tell me. Here is a
1604     summary of the main changes.
1605
1606   * REVOLUTION 1: The SimGrid project has merged with the GRAS project
1607     lead by Martin Quinson. As a consequence SimGrid gains a lot in
1608     portability, speed, and a lot more but you'll figure it out later.
1609     SimGrid now comprises 3 different projects : MSG, GRAS and SMPI.
1610     I wanted to release the new MSG as soon as possible and I have
1611     broken GRAS, which is the reason why, for now, only MSG is fully
1612     functional. A laconic description of these projects is available
1613     in the documentation.
1614
1615   * REVOLUTION 2: I have removed SG and I am now using a new simulation
1616     kernel optimized for our needs (called SURF but only the developers
1617     should use it). Hence, MSG is now roughly 30 times faster and I think
1618     that by rewriting a little bit MSG, I could event speed it up a little
1619     bit more. Beside the gain in speed, it is also much easier to encode a
1620     new platform model with SURF than it was with SG. More to come...
1621
1622   * REVOLUTION 3: I have tried to change a little as possible the API of
1623     MSG but a few things really had to disappear. The main differences
1624     with the previous version are :
1625        1) no more m_links_t and the corresponding functions. Platforms are
1626          directly read from a XML description and cannot be hard-coded
1627          anymore. The same format is used for application deployment
1628          description. The new format is described in the documentation.
1629          Have a look in tools/platform_generation. There is a tiny script
1630          that converts from the old platform format to the new one. Concerning
1631          the application deployment format, parsing the old one is tricky.
1632          I think most of you should however be able to convert your files.  If
1633          it is really an issue, I can write a C code that does the conversion.
1634          Let me know.
1635        2) the toolbox tbx does not exist anymore. We now have a library
1636           with much more data-structures but without the hash-tables (we have
1637           dictionaries that are much faster).
1638
1639  -- Arnaud Legrand <Arnaud.Legrand@imag.fr>  Mon, 31 Jan 2005 10:45:53 -0800
1640
1641 *****************************************************************************
1642 * Follows the old GRAS changelog. It does not follow the same syntax, but I *
1643 * don't feel like converting the oldies. (Mt)                                *
1644 *****************************************************************************
1645
1646 2005-01-31 Arnaud
1647   Version 2.90: "the long awaited one"
1648   - Finished rewriting and debugging MSG. Rewrote the documentation.
1649   - disable GRAS for now since it needs to be ported to the newest SG
1650
1651 2004-12-16 Martin
1652   - Finish the port to windows (using mingw32 for cross-compile)
1653
1654 2004-11-28 Arnaud
1655   - Main loop and datastructures of SURF. A cpu resource object is
1656     functional. Surf can thus be used to create cpu's with variable
1657     performance on which you can execute some actions.
1658         
1659 2004-11-15 Martin Quinson
1660   - Port to ARM. Simply added the alignment and size descriptions. Should
1661     work, but the ARM machines are so slow that I didn't had the opportunity
1662     to 'make check' over there yet.
1663
1664 2004-11-15 Arnaud Legrand
1665   - Trace manager now written. It uses a heap structure and is therefore
1666     expected to be efficient. It may however be speeded up (particularly
1667     when many events occur at the same date) by using red and black
1668     trees. One day maybe...
1669   - Max-min linear system solver written. It uses a sparse matrix
1670     structure taking advantage of its expected use. Most operations are
1671     O(1) and free/calloc are called as few as possible. The computation of
1672     the minimum could however be improved by using a red and black tree
1673     (again ! ;).
1674
1675 2004-11-03 Arnaud Legrand
1676   - Rename every gras_* function that was in xbt/ to its xbt_
1677     counterpart.
1678   - Add a heap and a doubly-linked list to xbt
1679   - Added a dichotomy to the dictionaries. make check works as well before
1680     so I assume that the patch is correct. I do not know however if things
1681     run effectively faster than before now. :)
1682
1683   Inclusion of the SimGrid tree in the GRAS one. The archive is renamed to
1684   SimGrid, and the version number is bumped to 2.x
1685
1686 2004-10-29 Martin Quinson
1687   - Introduction of the remote errors.
1688     They are the result of a RMI/RPC on the remote machine.
1689     ErrCodes being scalar values, you can't get the host on which those
1690     errors did happen. Extending the error mechanism as in Gnome is possible.
1691     No idea yet whether it is a good idea.
1692
1693 2004-10-28 Martin Quinson
1694   - Interface revolution: the Starred Structure Eradication.
1695     I used to do typedef struct {} toto_t; and then handle *toto_t.
1696     Arnaud (and Oli) didn't like it, and I surrendered. Now, you have:
1697       - ???_t is a valid type (builded with typedef)
1698       - s_toto_t is a structure (access to fields with .)
1699       - s_toto   is a structure needing 'struct' keyword to be used
1700       - e_toto_t is an enum
1701       -   toto_t is an 'object' (struct*)
1702     Exemple:
1703       typedef struct s_toto {} s_toto_t, *toto_t;
1704       typedef enum {} e_toto_t;
1705     Moreover, only toto_t (and e_toto_t) are public. The rest (mainly
1706      s_toto_t) is private.
1707
1708   - While I was at it, all gras_<obj>_free() functions want a gras_<obj>_t*
1709     so that it can set the variable to NULL. It was so for dicts and sets,
1710     it changed for dynars.
1711
1712   - Fix a bunch of memleaks in dict_remove
1713   - Fix a bug in sg/server_socket opening: it failed all the time.
1714
1715 2004-10-07 Martin Quinson
1716   - Speed up dynar lookup operation a bit.
1717
1718     gras_dynar_get is dead.
1719
1720     Now, you can choose between gras_dynar_get_cpy (the old gras_dynar_get
1721     but should be avoided for efficiency reasons) and gras_dynar_get_ptr
1722     (which gives you the address of the stored data).
1723
1724     gras_dynar_get_as is an helpful macro which allows you to retrieve a
1725     copy of the data using an affectation to do the job and not a memcpy.
1726
1727     int toto = gras_dynar_get_as(dyn,0,int); rewrites itself to
1728     int toto = *(int*)gras_dynar_get_ptr(dyn,0);
1729
1730     It does not really speedup the dynar test because they are
1731     setting elements all the time (and look them seldom). But the dict does
1732     far more lookup than setting.
1733
1734     So, this brings the dict_crash test from ~33s to ~25s (200000 elms).
1735
1736 2004-10-05 Martin Quinson
1737   - Allow to (en/dis)able the cycle detection at run time.
1738
1739     Whether we should check for cycle or not is now a property of each
1740     datatype. When you think there may be some cycle, use datadesc_cycle_set.
1741     datadesc_cycle_unset allow to remove this property when previously set.
1742
1743     Note that the cycle detection is off by default since it impacts the
1744     performance. Watch the data you feed GRAS with ;)
1745
1746     This property is hereditary. Any element embedded in a structure having it
1747     set have it set for the time of this data exchange.
1748
1749     You should set it both on sender and receiver side. If you don't set it on
1750     sender side, it will enter an endless loop. If you forget on receiver
1751     side, the cycles won't be recreated after communication.
1752
1753   - Header reorganization.
1754     Kill gras_private.h, each submodule must load the headers it needs.
1755
1756 2004-10-04 Martin Quinson
1757   - Interface revolution: do not try to survive to malloc failure.
1758
1759     Now, gras_malloc and friends call gras_abort() on failure.
1760     As a conclusion, malloc_error is not a valid error anymore, and all
1761       functions for which it was the only gras_error_t return value are
1762       changed. They now return void, or there result directly.
1763     This simplify the API a lot.
1764
1765 2004-09-29 Martin Quinson
1766   - Re-enable raw sockets.
1767     Created by gras_socket_{client,server}_ext;
1768     Used with gras_raw_{send,recv}
1769     No select possible.
1770
1771     It should allow to kill the last bits of gras first version soon.
1772
1773     This is not completely satisfactory yet (duplicate code with
1774      chunk_{send,recv}; a bit out of the plugin mechanism), but it should
1775      work.
1776
1777   - Simplify transport plugin (internal) interface by not passing any
1778     argument to _server and _client, but embedding them in the socket
1779     struct directly.
1780
1781 2004-09-28 Martin Quinson
1782   - Finish the port to AIX.
1783     autoconf was my problem (segfault within the malloc replacement
1784     function. No idea why)
1785
1786 2004-09-16 Martin Quinson
1787   - Fix some size_t madness on 64bit architectures.
1788
1789 2004-09-08 Martin Quinson
1790   - Reduce the number of system headers loaded, overload some more system
1791     calls (such as malloc to cast the result of the system one, and work
1792     properly on AIX)
1793   - Fix and reintroduce the config support
1794
1795 2004-09-07 Martin Quinson
1796   - Source code reorganization to allow Arnaud to surf all over there.
1797   - Allow to document the logging categories.
1798   - Remove all uppercase from logging categories and useless cleanup in names.
1799
1800 2004-08-18 Martin Quinson
1801   Version 0.6.2 (protocol not changed; API changed)
1802   - Interface cleanup: gras_msgtype_by_name returns the type (instead of a
1803      gras_error_t), and NULL when not found. Functions expecting a msgtype
1804      as argument (msg_wait; msg_send) deal with NULL argument by providing a
1805      hopefully usefull message.
1806   - Portability to prehistoric sparcs again
1807
1808 2004-08-17 Martin Quinson
1809   Version 0.6.1 (protocol not changed; ABI not changed)
1810   - prealloc some buffers to speed things up
1811
1812 2004-08-11 Martin Quinson
1813   Version 0.6 (protocol not changed; ABI expended)
1814   - The parsing macro can deal with the references, provided that you add
1815     the relevant annotations (using GRAS_ANNOTE(size,field_name))
1816
1817 2004-08-09 Martin Quinson
1818   Version 0.5 (protocol not changed; ABI changed)
1819   - Allow to off turn the cycle detection code in data exchange at
1820     compilation time. It should be at run time, but I'm short of time (and
1821     the config stuff is still broken). That way, we keep dict out of the
1822     critical path, which is good because the performance is poor:
1823      - search not dichotomial yet
1824      - dynar give no way to access their content and memcpy everytime
1825   - In composed data description (struct, ref and so on), stop foolness of
1826     keeping the subtype's ID, but store the type itself. This keeps sets out
1827     of the critical path, which is good since they rely on dynar and
1828     dictionnaries. The only loose of that is that we cannot detect the
1829     redeclaration of a structure/union with another content (but I'm not sure
1830     the code detected well this error before anyway). We still can detect
1831     the redefinition discrepancy for the other types.
1832   - Use a whole bunch of optimisation flags (plus -fno-strict-aliasing since
1833     it breaks the code because of type-punning used all over the place).
1834     This breaks on all non-gcc architectures (for now).
1835
1836   All those changes (plus the buffer of last time) allow me to gain 2 order
1837   of magnitude on cruel tests consisting of 800000 array of integers on two
1838   level of a hierarchical structure (200 secondes -> 4 secondes)
1839
1840   API change:
1841     - the selector of reference must now return the type it points to, not
1842       the ID of this type.
1843
1844 2004-08-06 Martin Quinson
1845   Version 0.4 (protocol changed; ABI not changed)
1846   - Allow to pass --gras-log argument to processes in simulation mode. Really.
1847   - New debugging level: trace (under debug) to see effect of GRAS_IN/OUT
1848   - Implement a buffer transport, and use it by default (it relies on tcp in
1849      real life and on sg in simulation).
1850     That's a bit hackish since I had a new field to the structure to store
1851      its data without interfering with the subtype ones. Inheritance
1852      is tricky in C. And that's a kind of reverse inheritance with one class
1853      derivating two classes. Or maybe a game with java interfaces. Anyway,
1854      that's damn hard in C (at least).
1855     Moreover, I got tired while trying to ensure plugin separation and
1856      genericity in SG mode. MSG wants me to do weird things, so let's go for
1857      cruel hacks (temporarily of course ;).
1858      See comment in transport_private.h:71
1859   - do not include all the _interface headers in private but in the files
1860     which really need them (to cut the compilation time when they are
1861     modified)
1862
1863 2004-07-26 Martin Quinson
1864   Version 0.3 (protocol not changed; ABI changed)
1865   - Major overhault of the datadesc interface to simplify it:
1866     - shorted the function names:
1867       s/gras_datadesc_declare_struct/gras_datadesc_struct/ and so on
1868     - add a trivial way to push/pop integers into the cbps without malloc.
1869       This allows to make really generic sub_type description, which simply
1870         pop their size of the stack.
1871     - add a function gras_datadesc_ref_pop_arr() which does what users want
1872       most of the time: Declare a dynamic array (which pops its size of the
1873       stack) and declare a reference to it. Poor name, but anyway.
1874     - kill the post-send callback, add a post-receive one
1875
1876 2004-07-23 Martin Quinson
1877   Version 0.2 (protocol changed; ABI changed)
1878   - add some testing for cpbs in the test cases, and fix some more bugs.
1879     This invalidate again the little64 data file, since I cannot regenerate
1880     it myself.
1881   - remove an awfull optimization in the logging stuff, allowing me to:
1882     - understand it again
1883     - learn gcc how to check that the argument match the provided format
1884     - fix all errors revealed by gcc after that
1885   - internal keys of dict are not \0 terminated. Deal with it properly in
1886     loggings instead of segfaulting when the user want to see the logs :-/
1887
1888 2004-07-22 Martin Quinson
1889   - Fix some stupid bug preventing cbps (callback postit) from working
1890
1891 2004-07-21 Martin Quinson
1892   - Some documentation cleanups
1893   - remove the useless last argument of msgtype_declare
1894   - rename the Virtu functions to fit into the 'os' namespace
1895   - move headers src/include -> src/include/gras/ and stop fooling with
1896     gras -> . symbolic link
1897   - make distcheck is now successful
1898
1899 2004-07-19 Martin Quinson
1900   Version 0.1.1
1901   - Build shared library also
1902   - Install html doc to the right location
1903   - stop removing maintainer files in make clean
1904   - build tests only on make check
1905
1906 2004-07-13 Martin Quinson
1907   version 0.1
1908   - No major issue in previous version => change versionning schema
1909   - Re-enable little64 convertion test now that Abdou kindly regenerated the
1910     corresponding dataset.
1911
1912 2004-07-11 Martin Quinson
1913   version 0.0.4
1914   - Get it working with any kind of structure (we can compute the padding
1915     bytes remotely for all the architectures I have access to)
1916   - Implement the structure parsing macro (still not quite robust/complete)
1917   - Improvement to the remote testing toysuite
1918
1919 2004-07-10 Martin Quinson
1920  [autoconf mechanism]
1921   - get ride of a bunch of deprecated macros
1922   - actually run the test for two-compliment, not only compile it :-/
1923   - test whether the structures get packed (and bail out if yes. Damn.
1924     Alignment is a serious matter)
1925   - test whether the structures get compacted (but respecting the alignment
1926     constraints of each types)
1927   - test whether the array fields of structures can straddle alignment boundaries
1928  [base]
1929   - Damnit, double are bigger than float (typo in creation of 'double' datadesc)
1930     (took me 2 hours to find that bug, looking at the wrong place)
1931   - Add gras_datadesc_declare_{union,struct}_close(). They must be used
1932     before sending/receiving and are used to compute the offsets of fields
1933   - Given that padding size depend even on compiler options, keep track of
1934     alignment and aligned_size only for the current architecture. Not a big
1935     deal since we send structure fields one after the other (seems
1936     reasonable).
1937   - Add the datastructure used for IEEE paper by the PBIO guys to the test
1938     program, let it work on linux/gcc/little32. portability todo.
1939
1940 2004-07-08 Martin Quinson
1941   - import and improve remote compilation support from FAST
1942   - make sure make check works on half a dozen of machines out there
1943
1944 2004-07-07 Martin Quinson
1945  Let's say it's version 0.0.3 ;)
1946   - Implement conversions (yuhu!)
1947   - Let it work on solaris (beside conversion, of course)
1948   - Stupid me, using rand() to generate the conversion datatests in not wise.
1949
1950 2004-07-06 Martin Quinson
1951   - Let make dist work, since I'm gonna need it to compile on remote hosts
1952   - Let Tests/datadesc_usage write the architecture on which the file was
1953     generated as first byte.
1954   - Add PowerPC (being also IRIX64), SPARC (also power4) and ALPHA
1955     architecture descriptions.
1956   - Add datadesc_usage.{i386,ppc,sparc} files being the result of execution
1957     on those architectures.
1958   - Optimization: send/recv array of scalar in one shoot
1959
1960 2004-07-05 Martin Quinson
1961   - YEAH! GRAS/SG and GRAS/RL are both able to run the ping example !
1962
1963   - Plug a whole bunch of memleaks
1964   - each process now have to call gras_{init,exit}. One day, their log
1965     settings will be separated
1966   - Continue the code factorisation between SG, RL and common in Transport.
1967
1968 2004-07-04 Martin Quinson
1969  [Transport]
1970   - Redistribution between SG and RL.
1971     We wanna have to accept in SG, so move accepted related parts of RL in
1972     the common part. (more precisely, the dynar of all known sockets is no
1973     more a static in transport.c, but part of the process_data)
1974  [Core/module.c]
1975  [gras_stub_generator]
1976   - Bug fix: Do call gras_process_init from gras_init (wasnt called in RL).
1977
1978 2004-07-03 Martin Quinson
1979   - Create a new log channel tbx containing dict, set, log, dynar (to shut
1980     them all up in one shot)
1981  [DataDesc]
1982   - Fix the ugly case of reference to dynamic array.
1983   - New (semi-public) function gras_datadesc_size to allow the messaging
1984     layer to malloc the needed space for the buffer.
1985  [Transport]
1986   - gras_socket_close now expect the socket to close (and not its address to
1987     put NULL in it after it). This is because the socket passed to handlers
1988     is one of their argument (=> not writable).
1989  [Messaging]
1990   - propagate the interface cleanup from last week in datadesc, ie remove a
1991     superfluous level of indirection. User pass adress of variable
1992     containing data (both when sending and receiving), and not of a variable
1993     being a pointer to the data. Let's say that I like it better ;)
1994       The price for that is constructs like "int msg=*(int*)payload" in
1995     handlers, but it's a fine price, IMHO.
1996  [examples/ping]
1997   - Let it work in RL (yuhu)
1998
1999 2004-06-21 Martin Quinson
2000  [Transport]
2001    - porting SG plugin and SG select to new standards (works almost).
2002    - plug memleaks and fix bugs around.
2003
2004  [DataDesc]
2005    - cleanup the prototype of data recv and force users to specify when they
2006      want to handle references to objects. Test case working even for cycles.
2007    - plug memleaks. Valgrind is perfectly ok with this.
2008
2009 2004-06-12 Martin Quinson
2010  [Transport]
2011    - cleanup the separation between plugin and main code in plugin creation
2012
2013 2004-06-11 Martin Quinson
2014  [Transport]
2015    - Reput hook for raw sockets, needed for BW experiments
2016    - kill a few lines of dead code
2017  [Data description] Interface cleanup
2018    - gras_datadesc_by_name returns the searched type or NULL.
2019      That way, no variable is needed to use a type desc once, which makes
2020       the code clearer.
2021    - gras_datadesc_declare_[struct|union]_append_name is removed. The last
2022       two parameters were strings (field name, type name), leading to
2023       common errors.
2024  [Dicos] Interface cleanup
2025    - gras_dico_retrieve -> gras_dico_get ; gras_dico_insert -> gras_dico_set
2026      This is consistant with the dynar API.
2027
2028 2004-04-21 Martin Quinson
2029  [Messaging]
2030    - Porting to new standards.
2031  [Data description]
2032    - interface cleanup.
2033      There is no bag anymore, no need to take extra provision to mask the
2034        pointers behind "ID".
2035      Better splitup of functions between files create/exchange/convert.
2036        This is still a bit artificial since convert and receive are so
2037        interleaved, but anyway.
2038  [Virtu(process)]
2039    - add a queued message list to procdata (the ones not matching criteria
2040      in msg_wait)
2041    - factorize some more code between SG and RL wrt procdata
2042  [Tests]
2043    - use gras_exit in example to track memleaks
2044    - get rid of gs_example now that GS is properly integrated into gras
2045    - update run_test to integrate the lastest tests (datadesc)
2046  [Logging]
2047    - rename WARNINGn macros to WARNn since it prooved error-prone
2048
2049 2004-04-19 Martin Quinson
2050  [Data description]
2051    - register init/exit functions within gras module mechanism
2052    - send/receive function.
2053    Convertion is not implemented, but short-cutted if not needed.
2054    struct/array elements are sent one by one (instead of block-wise), but
2055      nobody really cares (yet). Get a prototype before optimizing.
2056    - tests (using a file socket) for DD send/receive on:
2057      - base types: int, float
2058      - array: fixed size, string (ie ref to dynamic string)
2059      - structure: homogeneous, heterogeneous
2060      - chained list, graph with cycle
2061    Believe it or not, valgrind is not too unhappy with the results. The
2062     cycle happily segfaults, but the others are ok. And I'm sick of pointers
2063     for now.
2064  [Transport]
2065    [File plugin]
2066      - Bugfix when using a filename explicitely (instead of '-')
2067
2068 2004-04-09 Martin Quinson
2069  [Transport plugins]
2070    - factorize more code between RL and SG in socket creation
2071    - Complete the implementation and tests of:
2072      o TCP
2073      o file (only in RL, and mainly for debugging)
2074
2075      I lost 3 days to design a portable address resolver, and then decided
2076        that the prototype mainly have to run on my box.
2077      Addressing portability too early may be like optimizing too early :-/
2078  [Tests]
2079    - use gras_init in the Tests instead of the crappy parse_log_opt
2080      (the latter function is removed)
2081  [Conditional execution]
2082    - New functions: gras_if_RL/gras_if_SG (basic support for this)
2083  [Code reorganisation]
2084   - Get rid of libgrasutils.a since it makes more trouble than it solves.
2085     Build examples against the RL library, since there is no way to disable
2086     its creation for now.
2087
2088 For information, the beginning of coding on GRAS was back in june
2089 2003. I guess that every line has been rewritten at least twice since
2090 then.