Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
A few more tiers file and a convenient perl script for the alnem project. I
[simgrid.git] / TODO
1 ###
2 ### Ongoing stuff
3 ###
4 /* FIXME: better place? */
5 int vasprintf  (char **ptr, const char *fmt, va_list ap);
6 char *bprintf(const char*fmt, ...) _XBT_GNUC_PRINTF(1,2);
7
8 Module renamings:
9  - rename SWAG to RING?
10  - Rename cursor to iterator
11
12 log.h still contains @name which break doxygen:
13 xbt/log.h:/** \name DEBUG
14 xbt/log.h:/** \name VERB
15 xbt/log.h:/** \name INFO
16 xbt/log.h:/** \name WARN
17 xbt/log.h:/** \name ERROR
18 xbt/log.h:/** \name CRITICAL
19
20
21 ###
22 ### Planned
23 ###
24
25 *
26 * Infrastructure
27 ****************
28
29 [autoconf]
30   * Check the gcc version on powerpc. We disabled -floop-optimize on powerpc,
31     but versions above 3.4.0 should be ok.
32   * check whether we have better than jmp_buf to implement exceptions, and
33     use it (may need to generate a public .h, as glib does)
34
35 *
36 * XBT
37 *****
38
39 [doc]
40   * graphic showing:
41     (errors, logs ; dynars, dicts, hooks, pools; config, rrdb)
42
43 [portability layer]
44   * Mallocators and/or memory pool so that we can cleanly kill an actor
45
46 [errors/exception]
47   * Better split casual errors from programing errors.
48     The first ones should be repported to the user, the second should kill
49     the program (or, yet better, only the msg handler)
50   * Allows the use of an error handler depending on the current module (ie,
51     the same philosophy as log4c using GSL's error functions)
52
53 [logs]
54   * Hijack message from a given category to another for a while (to mask
55     initializations, and more)
56   * Allow each actor to have its own setting
57   * a init/exit mecanism for logging appender
58   * Several appenders; fix the setting stuff to change the appender
59   * more logging appenders (take those from Ralf in l2)
60
61 [dict]
62   * speed up the cursors, for example using the contexts when available
63
64 [modules]
65   * better formalisation of what modules are (amok deeply needs it)
66     configuration + init() + join() + exit() + leave() + dependencies
67     init and exit are run only once
68     join and leave are run for each process.
69   * allow to load them at runtime
70     check in erlang how they upgrade them without downtime
71
72 [other modules]
73   * we may need a round-robin database module, and a statistical one
74   * a hook module *may* help cleaning up some parts. Not sure yet.
75   * Some of the datacontainer modules seem to overlap. Kill some of them?
76     - replace fifo with dynars
77     - replace set with SWAG
78
79 *
80 * GRAS
81 ******
82
83 [doc]
84   * implement the P2P protocols that macedon does. They constitute great
85     examples, too
86
87 [transport]  
88   * Spawn threads handling the communication
89     - Data sending cannot be delegated if we want to be kept informed
90       (*easily*) of errors here.
91       - Actor execution flow shouldn't be interrupted
92       - It should be allowed to access (both in read and write access) 
93         any data available (ie, referenced) from the actor without 
94         requesting to check for a condition before.
95         (in other word, no mutex or assimilated)
96       - I know that enforcing those rules prevent the implementation of
97         really cleaver stuff. Keeping the stuff simple for the users is more
98         important to me than allowing them to do cleaver tricks. Black magic
99         should be done *within* gras to reach a good performance level.
100
101     - Data receiving can be delegated (and should)
102       The first step here is a "simple" mailbox mecanism, with a fifo of
103         messages protected by semaphore.
104       The rest is rather straightforward too.
105
106   * use poll(2) instead of select(2) when available. (first need to check
107     the advantage of doing so ;)
108
109     Another idea we spoke about was to simulate this feature with a bunch of
110     threads blocked in a read(1) on each incomming socket. The latency is
111     reduced by the cost of a syscall, but the more I think about it, the
112     less I find the idea adapted to our context.
113
114   * timeout the send/recv too (hard to do in RL)
115   * Adaptative timeout
116   * multiplex on incoming SOAP over HTTP (once datadesc can deal with it)
117
118   * The module syntax/API is too complex. 
119     - Everybody opens a server socket (or almost), and nobody open two of
120       them. This should be done automatically without user intervention.
121     - I'd like to offer the possibility to speak to someone, not to speak on
122       a socket. Users shouldn't care about such technical details. 
123     - the idea of host_cookie in NWS seem to match my needs, but we still
124       need a proper name ;)
125     - this would allow to exchange a "socket" between peer :)
126     - the creation needs to identify the peer actor within the process
127
128   * when a send failed because the socket was closed on the other side, 
129     try to reopen it seamlessly. Needs exceptions or another way to
130     differentiate between the several system_error.
131   * cache accepted sockets and close the old ones after a while. 
132     Depends on the previous item; difficult to achieve with firewalls
133
134 [datadesc]
135   * Implement gras_datadesc_cpy to speedup things in the simulator
136     (and allow to have several "actors" within the same unix process).
137     For now, we mimick closely the RL even in SG. It was easier to do
138       since the datadesc layer is unchanged, but it is not needed and
139       hinders performance.
140     gras_datadesc_cpy needs to provide the size of the corresponding messages, so
141      that we can report it into the simulator.
142   * Add a XML wire protocol alongside to the binary one (for SOAP/HTTP)
143   * cbps:
144     - Error handling
145     - Regression tests
146   * Inter-arch conversions
147     - Port to ARM
148     - Convert in the same buffer when size increase
149     - Exchange (on net) structures in one shoot when possible.
150     - Port to really exotic platforms (Cray is not IEEE ;)
151   * datadesc_set_cste: give the value by default when receiving. 
152     - It's not transfered anymore, which is good for functions pointer.
153   * Parsing macro
154     - Cleanup the code (bison?)
155     - Factorize code in union/struct field adding
156     - Handle typedefs (needs love from DataDesc/)
157     - Handle unions with annotate
158     - Handle enum
159     - Handle long long and long double
160     - Forbid "char", allow "signed char" and "unsigned char", or user code won't be 
161       portable to ARM, at least.
162     - Handle struct/union/enum embeeded within another container 
163       (needs modifications in DataDesc, too)
164  
165     - Check short a, b;
166     - Check short ***
167     - Check struct { struct { int a } b; } 
168
169   * gras_datadesc_import_nws?
170
171 [Messaging]
172   * Other message types than oneway & RPC are possible:
173      - forwarding request, group communication
174   * Message priority
175   * Message forwarding
176   * Group communication
177   * Message declarations in a tree manner (such as log channels)?
178   
179 [GRASPE] (platform expender) 
180   * Tool to visualize/deploy and manage in RL
181   * pull method of source diffusion in graspe-slave
182
183 [Actors] (parallelism in GRAS)
184   * An actor is a user process. 
185     It has a highly sequential control flow from its birth until its death. 
186     The timers won't stop the current execution to branch elsewhere, they
187     will be delayed until the actor is ready to listen. Likewise, no signal
188     delivery. The goal is to KISS for users.
189   * You can fork a new actor, even on remote hosts. 
190   * They are implemented as threads in RL, but this is still a distributed
191     memory *model*. If you want to share data with another actor, send it
192     using the message interface to explicit who's responsible of this data.
193   * data exchange between actors placed within the same UNIX process is  
194     *implemented* by memcopy, but that's an implementation detail.
195
196 [Other, more general issues]
197   * watchdog in RL (ie, while (1) { fork; exec the child, wait in father })
198   * Allow [homogeneous] dico to be sent
199   * Make GRAS thread safe by mutexing what needs to be
200
201 *
202 * AMOK
203 ******
204
205 [bandwidth]
206   * finish this module (still missing the saturate part)
207   * add a version guessing the appropriate datasizes automatically
208 [other modules]
209   * provide a way to retrieve the host load as in NWS
210   * log control, management, dynamic token ring
211   * a way using SSH to ask a remote host to open a socket back on me
212