Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
moved a line for comprehension
[simgrid.git] / src / smpi / mpi / smpi_datatype.cpp
1 /* smpi_datatype.cpp -- MPI primitives to handle datatypes                  */
2 /* Copyright (c) 2009-2020. The SimGrid Team. All rights reserved.          */
3
4 /* This program is free software; you can redistribute it and/or modify it
5  * under the terms of the license (GNU LGPL) which comes with this package. */
6
7 #include "private.hpp"
8 #include "simgrid/modelchecker.h"
9 #include "smpi_datatype_derived.hpp"
10 #include "smpi_op.hpp"
11 #include "src/instr/instr_private.hpp"
12 #include "src/smpi/include/smpi_actor.hpp"
13
14 #include <string>
15
16 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(smpi_datatype, smpi, "Logging specific to SMPI (datatype)");
17
18 static std::unordered_map<std::string, simgrid::smpi::Datatype*> id2type_lookup;
19
20 #define CREATE_MPI_DATATYPE(name, id, type)                                                                            \
21   static simgrid::smpi::Datatype _XBT_CONCAT(mpi_, name)((char*)_XBT_STRINGIFY(name), (id), sizeof(type), /* size */   \
22                                                          0,                                               /* lb */     \
23                                                          sizeof(type), /* ub = lb + size */                            \
24                                                          DT_FLAG_BASIC /* flags */                                     \
25                                                          );                                                            \
26   const MPI_Datatype name = &_XBT_CONCAT(mpi_, name);
27
28 #define CREATE_MPI_DATATYPE_NULL(name, id)                                                                             \
29   static simgrid::smpi::Datatype _XBT_CONCAT(mpi_, name)((char*)_XBT_STRINGIFY(name), (id), 0, /* size */              \
30                                                          0,                                    /* lb */                \
31                                                          0,                                    /* ub = lb + size */    \
32                                                          DT_FLAG_BASIC                         /* flags */             \
33                                                          );                                                            \
34   const MPI_Datatype name = &_XBT_CONCAT(mpi_, name);
35
36 // Predefined data types
37 CREATE_MPI_DATATYPE(MPI_CHAR, 2, char)
38 CREATE_MPI_DATATYPE(MPI_SHORT, 3, short)
39 CREATE_MPI_DATATYPE(MPI_INT, 1, int)
40 CREATE_MPI_DATATYPE(MPI_LONG, 4, long)
41 CREATE_MPI_DATATYPE(MPI_LONG_LONG, 7, long long)
42 CREATE_MPI_DATATYPE(MPI_SIGNED_CHAR, 8, signed char)
43 CREATE_MPI_DATATYPE(MPI_UNSIGNED_CHAR, 9, unsigned char)
44 CREATE_MPI_DATATYPE(MPI_UNSIGNED_SHORT, 10, unsigned short)
45 CREATE_MPI_DATATYPE(MPI_UNSIGNED, 11, unsigned int)
46 CREATE_MPI_DATATYPE(MPI_UNSIGNED_LONG, 12, unsigned long)
47 CREATE_MPI_DATATYPE(MPI_UNSIGNED_LONG_LONG, 13, unsigned long long)
48 CREATE_MPI_DATATYPE(MPI_FLOAT, 5, float)
49 CREATE_MPI_DATATYPE(MPI_DOUBLE, 0, double)
50 CREATE_MPI_DATATYPE(MPI_LONG_DOUBLE, 14, long double)
51 CREATE_MPI_DATATYPE(MPI_WCHAR, 15, wchar_t)
52 CREATE_MPI_DATATYPE(MPI_C_BOOL, 16, bool)
53 CREATE_MPI_DATATYPE(MPI_BYTE, 6, int8_t)
54 CREATE_MPI_DATATYPE(MPI_INT8_T, 17, int8_t)
55 CREATE_MPI_DATATYPE(MPI_INT16_T, 18, int16_t)
56 CREATE_MPI_DATATYPE(MPI_INT32_T, 19, int32_t)
57 CREATE_MPI_DATATYPE(MPI_INT64_T, 20, int64_t)
58 CREATE_MPI_DATATYPE(MPI_UINT8_T, 21, uint8_t)
59 CREATE_MPI_DATATYPE(MPI_UINT16_T, 22, uint16_t)
60 CREATE_MPI_DATATYPE(MPI_UINT32_T, 23, uint32_t)
61 CREATE_MPI_DATATYPE(MPI_UINT64_T, 24, uint64_t)
62 CREATE_MPI_DATATYPE(MPI_C_FLOAT_COMPLEX, 25, float _Complex)
63 CREATE_MPI_DATATYPE(MPI_C_DOUBLE_COMPLEX, 26, double _Complex)
64 CREATE_MPI_DATATYPE(MPI_C_LONG_DOUBLE_COMPLEX, 27, long double _Complex)
65 CREATE_MPI_DATATYPE(MPI_AINT, 28, MPI_Aint)
66 CREATE_MPI_DATATYPE(MPI_OFFSET, 29, MPI_Offset)
67
68 CREATE_MPI_DATATYPE(MPI_FLOAT_INT, 30, float_int)
69 CREATE_MPI_DATATYPE(MPI_LONG_INT, 31, long_int)
70 CREATE_MPI_DATATYPE(MPI_DOUBLE_INT, 32, double_int)
71 CREATE_MPI_DATATYPE(MPI_SHORT_INT, 33, short_int)
72 CREATE_MPI_DATATYPE(MPI_2INT, 34, int_int)
73 CREATE_MPI_DATATYPE(MPI_2FLOAT, 35, float_float)
74 CREATE_MPI_DATATYPE(MPI_2DOUBLE, 36, double_double)
75 CREATE_MPI_DATATYPE(MPI_2LONG, 37, long_long)
76
77 CREATE_MPI_DATATYPE(MPI_REAL, 38, float)
78 CREATE_MPI_DATATYPE(MPI_REAL4, 39, float)
79 CREATE_MPI_DATATYPE(MPI_REAL8, 40, double)
80 CREATE_MPI_DATATYPE(MPI_REAL16, 41, long double)
81 CREATE_MPI_DATATYPE_NULL(MPI_DATATYPE_NULL, -1)
82 CREATE_MPI_DATATYPE(MPI_COMPLEX8, 42, float_float)
83 CREATE_MPI_DATATYPE(MPI_COMPLEX16, 43, double_double)
84 CREATE_MPI_DATATYPE(MPI_COMPLEX32, 44, double_double)
85 CREATE_MPI_DATATYPE(MPI_INTEGER1, 45, int)
86 CREATE_MPI_DATATYPE(MPI_INTEGER2, 46, int16_t)
87 CREATE_MPI_DATATYPE(MPI_INTEGER4, 47, int32_t)
88 CREATE_MPI_DATATYPE(MPI_INTEGER8, 48, int64_t)
89 CREATE_MPI_DATATYPE(MPI_INTEGER16, 49, integer128_t)
90
91 CREATE_MPI_DATATYPE(MPI_LONG_DOUBLE_INT, 50, long_double_int)
92
93 CREATE_MPI_DATATYPE_NULL(MPI_UB, 51)
94 CREATE_MPI_DATATYPE_NULL(MPI_LB, 52)
95 CREATE_MPI_DATATYPE(MPI_PACKED, 53, char)
96 // Internal use only
97 CREATE_MPI_DATATYPE(MPI_PTR, 54, void*)
98 CREATE_MPI_DATATYPE(MPI_COUNT, 55, long long)
99
100
101 namespace simgrid{
102 namespace smpi{
103
104 std::unordered_map<int, smpi_key_elem> Datatype::keyvals_; // required by the Keyval class implementation
105 int Datatype::keyval_id_=0; // required by the Keyval class implementation
106 Datatype::Datatype(int ident, int size, MPI_Aint lb, MPI_Aint ub, int flags) : Datatype(size, lb, ub, flags)
107 {
108   id = std::to_string(ident);
109 }
110
111 Datatype::Datatype(int size, MPI_Aint lb, MPI_Aint ub, int flags) : size_(size), lb_(lb), ub_(ub), flags_(flags)
112 {
113 #if SIMGRID_HAVE_MC
114   if(MC_is_active())
115     MC_ignore(&(refcount_), sizeof(refcount_));
116 #endif
117 }
118
119 // for predefined types, so refcount_ = 0.
120 Datatype::Datatype(char* name, int ident, int size, MPI_Aint lb, MPI_Aint ub, int flags)
121     : name_(name), id(std::to_string(ident)), size_(size), lb_(lb), ub_(ub), flags_(flags), refcount_(0)
122 {
123   id2type_lookup.insert({id, this});
124 #if SIMGRID_HAVE_MC
125   if(MC_is_active())
126     MC_ignore(&(refcount_), sizeof(refcount_));
127 #endif
128 }
129
130 Datatype::Datatype(Datatype* datatype, int* ret)
131     : size_(datatype->size_), lb_(datatype->lb_), ub_(datatype->ub_), flags_(datatype->flags_)
132 {
133   *ret = this->copy_attrs(datatype);
134 }
135
136 Datatype::~Datatype()
137 {
138   xbt_assert(refcount_ >= 0);
139
140   if(flags_ & DT_FLAG_PREDEFINED)
141     return;
142
143   //if still used, mark for deletion
144   if(refcount_!=0){
145       flags_ |=DT_FLAG_DESTROYED;
146       return;
147   }
148
149   cleanup_attr<Datatype>();
150   delete contents_;
151   xbt_free(name_);
152 }
153
154 int Datatype::copy_attrs(Datatype* datatype){
155   flags_ &= ~DT_FLAG_PREDEFINED;
156   int ret = MPI_SUCCESS;
157     
158   if (not datatype->attributes()->empty()) {
159     int flag=0;
160     void* value_out;
161     for (auto const& it : *(datatype->attributes())) {
162       smpi_key_elem elem = keyvals_.at(it.first);
163       if (elem != nullptr){
164         if( elem->copy_fn.type_copy_fn != MPI_NULL_COPY_FN && 
165             elem->copy_fn.type_copy_fn != MPI_TYPE_DUP_FN)
166           ret = elem->copy_fn.type_copy_fn(datatype, it.first, elem->extra_state, it.second, &value_out, &flag);
167         else if ( elem->copy_fn.type_copy_fn_fort != MPI_NULL_COPY_FN &&
168                   (*(int*)*elem->copy_fn.type_copy_fn_fort) != 1){
169           value_out=(int*)xbt_malloc(sizeof(int));
170           elem->copy_fn.type_copy_fn_fort(datatype, it.first, elem->extra_state, it.second, value_out, &flag, &ret);
171         }
172         if (ret != MPI_SUCCESS) {
173           break;
174         }
175         if(elem->copy_fn.type_copy_fn == MPI_TYPE_DUP_FN || 
176           ((elem->copy_fn.type_copy_fn_fort != MPI_NULL_COPY_FN) && (*(int*)*elem->copy_fn.type_copy_fn_fort == 1))){
177           elem->refcount++;
178           attributes()->insert({it.first, it.second});
179         } else if (flag){
180           elem->refcount++;
181           attributes()->insert({it.first, value_out});
182         }
183       }
184     }
185   }
186   contents_ = new Datatype_contents(MPI_COMBINER_DUP, 0, nullptr, 0, nullptr, 1, &datatype);
187   return ret;
188 }
189
190 int Datatype::clone(MPI_Datatype* type){
191   int ret;
192   *type = new Datatype(this, &ret);
193   return ret;
194 }
195
196 void Datatype::ref()
197 {
198   refcount_++;
199
200 #if SIMGRID_HAVE_MC
201   if(MC_is_active())
202     MC_ignore(&(refcount_), sizeof(refcount_));
203 #endif
204 }
205
206 void Datatype::unref(MPI_Datatype datatype)
207 {
208   if (datatype->refcount_ > 0)
209     datatype->refcount_--;
210
211   if (datatype->refcount_ == 0 && not(datatype->flags_ & DT_FLAG_PREDEFINED))
212     delete datatype;
213
214 #if SIMGRID_HAVE_MC
215   if(MC_is_active())
216     MC_ignore(&(datatype->refcount_), sizeof(datatype->refcount_));
217 #endif
218 }
219
220 void Datatype::commit()
221 {
222   flags_ |= DT_FLAG_COMMITED;
223 }
224
225 bool Datatype::is_valid(){
226   return (flags_ & DT_FLAG_COMMITED);
227 }
228
229 bool Datatype::is_basic()
230 {
231   return (flags_ & DT_FLAG_BASIC);
232 }
233
234 bool Datatype::is_replayable()
235 {
236   return (simgrid::instr::trace_format == simgrid::instr::TraceFormat::Ti) &&
237          ((this == MPI_BYTE) || (this == MPI_DOUBLE) || (this == MPI_INT) || (this == MPI_CHAR) ||
238           (this == MPI_SHORT) || (this == MPI_LONG) || (this == MPI_FLOAT));
239 }
240
241 MPI_Datatype Datatype::decode(const std::string& datatype_id)
242 {
243   return id2type_lookup.find(datatype_id)->second;
244 }
245
246 void Datatype::addflag(int flag){
247   flags_ &= flag;
248 }
249
250 int Datatype::extent(MPI_Aint * lb, MPI_Aint * extent){
251   *lb = lb_;
252   *extent = ub_ - lb_;
253   return MPI_SUCCESS;
254 }
255
256 void Datatype::get_name(char* name, int* length){
257   if(name_!=nullptr){
258     *length = strlen(name_);
259     strncpy(name, name_, *length+1);
260   }else{
261     *length = 0;
262   }
263 }
264
265 void Datatype::set_name(const char* name){
266   if(name_!=nullptr &&  (flags_ & DT_FLAG_PREDEFINED) == 0)
267     xbt_free(name_);
268   name_ = xbt_strdup(name);
269 }
270
271 int Datatype::pack(const void* inbuf, int incount, void* outbuf, int outcount, int* position, const Comm*)
272 {
273   if (outcount - *position < incount*static_cast<int>(size_))
274     return MPI_ERR_OTHER;
275   Datatype::copy(inbuf, incount, this, static_cast<char*>(outbuf) + *position, outcount, MPI_CHAR);
276   *position += incount * size_;
277   return MPI_SUCCESS;
278 }
279
280 int Datatype::unpack(const void* inbuf, int insize, int* position, void* outbuf, int outcount, const Comm*)
281 {
282   if (outcount*static_cast<int>(size_)> insize)
283     return MPI_ERR_OTHER;
284   Datatype::copy(static_cast<const char*>(inbuf) + *position, insize, MPI_CHAR, outbuf, outcount, this);
285   *position += outcount * size_;
286   return MPI_SUCCESS;
287 }
288
289 int Datatype::get_contents (int max_integers, int max_addresses,
290                             int max_datatypes, int* array_of_integers, MPI_Aint* array_of_addresses,
291                             MPI_Datatype *array_of_datatypes)
292 {
293   if(contents_==nullptr)
294     return MPI_ERR_ARG;
295   if(max_integers<contents_->number_of_integers_)
296     return MPI_ERR_COUNT;
297   for(int i=0; i<contents_->number_of_integers_; i++){
298     array_of_integers[i]=contents_->integers_[i];
299   }
300   if(max_addresses<contents_->number_of_addresses_)
301     return MPI_ERR_COUNT;
302   for(int i=0; i<contents_->number_of_addresses_; i++){
303     array_of_addresses[i]=contents_->addresses_[i];
304   }
305   if(max_datatypes<contents_->number_of_datatypes_)
306     return MPI_ERR_COUNT;
307   for(int i=0; i<contents_->number_of_datatypes_; i++){
308     array_of_datatypes[i]=contents_->datatypes_[i];
309     contents_->datatypes_[i]->ref();
310   }
311   return MPI_SUCCESS;
312 }
313
314 int Datatype::get_envelope (int* num_integers, int* num_addresses,
315                             int* num_datatypes, int* combiner)
316 {
317   if(contents_==nullptr){
318     *num_integers = 0;
319     *num_addresses = 0;
320     *num_datatypes = 0;
321     *combiner = MPI_COMBINER_NAMED;
322   }else{
323     *num_integers = contents_->number_of_integers_;
324     *num_addresses = contents_->number_of_addresses_;
325     *num_datatypes = contents_->number_of_datatypes_;
326     *combiner = contents_->combiner_;
327   }
328   return MPI_SUCCESS;
329 }
330
331 int Datatype::copy(const void* sendbuf, int sendcount, MPI_Datatype sendtype, void* recvbuf, int recvcount,
332                    MPI_Datatype recvtype)
333 {
334   // FIXME Handle the case of a partial shared malloc.
335
336   if (smpi_cfg_privatization() == SmpiPrivStrategies::MMAP) {
337     smpi_switch_data_segment(simgrid::s4u::Actor::self());
338   }
339   /* First check if we really have something to do */
340   size_t offset = 0;
341   std::vector<std::pair<size_t, size_t>> private_blocks;
342   if(smpi_is_shared(sendbuf,private_blocks,&offset)
343        && (private_blocks.size()==1
344        && (private_blocks[0].second - private_blocks[0].first)==(unsigned long)(sendcount * sendtype->get_extent()))){
345     XBT_VERB("sendbuf is shared. Ignoring copies");
346     return 0;
347   }
348   if(smpi_is_shared(recvbuf,private_blocks,&offset)
349        && (private_blocks.size()==1
350        && (private_blocks[0].second - private_blocks[0].first)==(unsigned long)(recvcount * recvtype->get_extent()))){
351     XBT_VERB("recvbuf is shared. Ignoring copies");
352     return 0;
353   }
354
355   if (recvcount > 0 && recvbuf != sendbuf) {
356     sendcount *= sendtype->size();
357     recvcount *= recvtype->size();
358     int count = sendcount < recvcount ? sendcount : recvcount;
359     XBT_DEBUG("Copying %d bytes from %p to %p", count, sendbuf, recvbuf);
360     if (not(sendtype->flags() & DT_FLAG_DERIVED) && not(recvtype->flags() & DT_FLAG_DERIVED)) {
361       if (not smpi_process()->replaying())
362         memcpy(recvbuf, sendbuf, count);
363     } else if (not(sendtype->flags() & DT_FLAG_DERIVED)) {
364       recvtype->unserialize(sendbuf, recvbuf, count / recvtype->size(), MPI_REPLACE);
365     } else if (not(recvtype->flags() & DT_FLAG_DERIVED)) {
366       sendtype->serialize(sendbuf, recvbuf, count / sendtype->size());
367     } else {
368       void * buf_tmp = xbt_malloc(count);
369
370       sendtype->serialize( sendbuf, buf_tmp,count/sendtype->size());
371       recvtype->unserialize( buf_tmp, recvbuf,count/recvtype->size(), MPI_REPLACE);
372
373       xbt_free(buf_tmp);
374     }
375   }
376
377   return sendcount > recvcount ? MPI_ERR_TRUNCATE : MPI_SUCCESS;
378 }
379
380 //Default serialization method : memcpy.
381 void Datatype::serialize(const void* noncontiguous_buf, void* contiguous_buf, int count)
382 {
383   char* contiguous_buf_char = static_cast<char*>(contiguous_buf);
384   const char* noncontiguous_buf_char = static_cast<const char*>(noncontiguous_buf)+lb_;
385   memcpy(contiguous_buf_char, noncontiguous_buf_char, count*size_);
386 }
387
388 void Datatype::unserialize(const void* contiguous_buf, void *noncontiguous_buf, int count, MPI_Op op){
389   const char* contiguous_buf_char = static_cast<const char*>(contiguous_buf);
390   char* noncontiguous_buf_char = static_cast<char*>(noncontiguous_buf)+lb_;
391   int n=count;
392   if(op!=MPI_OP_NULL)
393     op->apply( contiguous_buf_char, noncontiguous_buf_char, &n, this);
394 }
395
396 int Datatype::create_contiguous(int count, MPI_Datatype old_type, MPI_Aint lb, MPI_Datatype* new_type){
397   if(old_type->flags_ & DT_FLAG_DERIVED){
398     //handle this case as a hvector with stride equals to the extent of the datatype
399     return create_hvector(count, 1, old_type->get_extent(), old_type, new_type);
400   }
401   if(count>0)
402     *new_type = new Type_Contiguous(count * old_type->size(), lb, lb + count * old_type->size(),
403                                    DT_FLAG_DERIVED, count, old_type);
404   else
405     *new_type = new Datatype(count * old_type->size(), lb, lb + count * old_type->size(),0);
406   return MPI_SUCCESS;
407 }
408
409 int Datatype::create_vector(int count, int block_length, int stride, MPI_Datatype old_type, MPI_Datatype* new_type)
410 {
411   int retval;
412   if (block_length<0)
413     return MPI_ERR_ARG;
414   MPI_Aint lb = 0;
415   MPI_Aint ub = 0;
416   if(count>0){
417     lb=old_type->lb();
418     ub=((count-1)*stride+block_length-1)*old_type->get_extent()+old_type->ub();
419   }
420   if(old_type->flags() & DT_FLAG_DERIVED || stride != block_length){
421     *new_type = new Type_Vector(count * (block_length) * old_type->size(), lb, ub,
422                                    DT_FLAG_DERIVED, count, block_length, stride, old_type);
423     retval=MPI_SUCCESS;
424   }else{
425     /* in this situation the data are contiguous thus it's not required to serialize and unserialize it*/
426     *new_type = new Datatype(count * block_length * old_type->size(), 0, ((count -1) * stride + block_length)*
427                          old_type->size(), DT_FLAG_CONTIGUOUS);
428     int ints[3] = {count, block_length, stride};
429     (*new_type)->contents_ = new Datatype_contents(MPI_COMBINER_VECTOR, 3, ints, 0, nullptr, 1, &old_type);
430     retval=MPI_SUCCESS;
431   }
432   return retval;
433 }
434
435
436 int Datatype::create_hvector(int count, int block_length, MPI_Aint stride, MPI_Datatype old_type, MPI_Datatype* new_type)
437 {
438   int retval;
439   if (block_length<0)
440     return MPI_ERR_ARG;
441   MPI_Aint lb = 0;
442   MPI_Aint ub = 0;
443   if(count>0){
444     lb=old_type->lb();
445     ub=((count-1)*stride)+(block_length-1)*old_type->get_extent()+old_type->ub();
446   }
447   if(old_type->flags() & DT_FLAG_DERIVED || stride != block_length*old_type->get_extent()){
448     *new_type = new Type_Hvector(count * (block_length) * old_type->size(), lb, ub,
449                                    DT_FLAG_DERIVED, count, block_length, stride, old_type);
450     retval=MPI_SUCCESS;
451   }else{
452     /* in this situation the data are contiguous thus it's not required to serialize and unserialize it*/
453     *new_type = new Datatype(count * block_length * old_type->size(), 0, count * block_length * old_type->size(), DT_FLAG_CONTIGUOUS);
454     int ints[2] = {count, block_length};
455     (*new_type)->contents_ = new Datatype_contents(MPI_COMBINER_HVECTOR, 2, ints, 1, &stride, 1, &old_type);
456     retval=MPI_SUCCESS;
457   }
458   return retval;
459 }
460
461 int Datatype::create_indexed(int count, const int* block_lengths, const int* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
462   int size = 0;
463   bool contiguous=true;
464   MPI_Aint lb = 0;
465   MPI_Aint ub = 0;
466   if(count>0){
467     lb=indices[0]*old_type->get_extent();
468     ub=indices[0]*old_type->get_extent() + block_lengths[0]*old_type->ub();
469   }
470
471   for (int i = 0; i < count; i++) {
472     if (block_lengths[i] < 0)
473       return MPI_ERR_ARG;
474     size += block_lengths[i];
475
476     if(indices[i]*old_type->get_extent()+old_type->lb()<lb)
477       lb = indices[i]*old_type->get_extent()+old_type->lb();
478     if(indices[i]*old_type->get_extent()+block_lengths[i]*old_type->ub()>ub)
479       ub = indices[i]*old_type->get_extent()+block_lengths[i]*old_type->ub();
480
481     if ( (i< count -1) && (indices[i]+block_lengths[i] != indices[i+1]) )
482       contiguous=false;
483   }
484   if(old_type->flags_ & DT_FLAG_DERIVED)
485     contiguous=false;
486
487   if (not contiguous) {
488     *new_type = new Type_Indexed(size * old_type->size(),lb,ub,
489                                  DT_FLAG_DERIVED|DT_FLAG_DATA, count, block_lengths, indices, old_type);
490   }else{
491     Datatype::create_contiguous(size, old_type, lb, new_type);
492   }
493   return MPI_SUCCESS;
494 }
495
496 int Datatype::create_hindexed(int count, const int* block_lengths, const MPI_Aint* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
497   int size = 0;
498   bool contiguous=true;
499   MPI_Aint lb = 0;
500   MPI_Aint ub = 0;
501   if(count>0){
502     lb=indices[0] + old_type->lb();
503     ub=indices[0] + block_lengths[0]*old_type->ub();
504   }
505   for (int i = 0; i < count; i++) {
506     if (block_lengths[i] < 0)
507       return MPI_ERR_ARG;
508     size += block_lengths[i];
509
510     if(indices[i]+old_type->lb()<lb)
511       lb = indices[i]+old_type->lb();
512     if(indices[i]+block_lengths[i]*old_type->ub()>ub)
513       ub = indices[i]+block_lengths[i]*old_type->ub();
514
515     if ( (i< count -1) && (indices[i]+block_lengths[i]*(static_cast<int>(old_type->size())) != indices[i+1]) )
516       contiguous=false;
517   }
518   if (old_type->flags_ & DT_FLAG_DERIVED || lb!=0)
519     contiguous=false;
520
521   if (not contiguous) {
522     *new_type = new Type_Hindexed(size * old_type->size(),lb,ub,
523                                    DT_FLAG_DERIVED|DT_FLAG_DATA, count, block_lengths, indices, old_type);
524   }else{
525     Datatype::create_contiguous(size, old_type, lb, new_type);
526   }
527   return MPI_SUCCESS;
528 }
529
530 int Datatype::create_struct(int count, const int* block_lengths, const MPI_Aint* indices, const MPI_Datatype* old_types, MPI_Datatype* new_type){
531   size_t size = 0;
532   bool contiguous=true;
533   size = 0;
534   MPI_Aint lb = 0;
535   MPI_Aint ub = 0;
536   if(count>0){
537     lb=indices[0] + old_types[0]->lb();
538     ub=indices[0] + block_lengths[0]*old_types[0]->ub();
539   }
540   bool forced_lb=false;
541   bool forced_ub=false;
542   for (int i = 0; i < count; i++) {
543     if (block_lengths[i]<0)
544       return MPI_ERR_ARG;
545     if (old_types[i]->flags_ & DT_FLAG_DERIVED)
546       contiguous=false;
547
548     size += block_lengths[i]*old_types[i]->size();
549     if (old_types[i]==MPI_LB){
550       lb=indices[i];
551       forced_lb=true;
552     }
553     if (old_types[i]==MPI_UB){
554       ub=indices[i];
555       forced_ub=true;
556     }
557
558     if (not forced_lb && indices[i] + old_types[i]->lb() < lb)
559       lb = indices[i];
560     if (not forced_ub && indices[i] + block_lengths[i] * old_types[i]->ub() > ub)
561       ub = indices[i]+block_lengths[i]*old_types[i]->ub();
562
563     if ( (i< count -1) && (indices[i]+block_lengths[i]*static_cast<int>(old_types[i]->size()) != indices[i+1]) )
564       contiguous=false;
565   }
566   if (not contiguous) {
567     *new_type = new Type_Struct(size, lb,ub, DT_FLAG_DERIVED|DT_FLAG_DATA,
568                                 count, block_lengths, indices, old_types);
569   }else{
570     Datatype::create_contiguous(size, MPI_CHAR, lb, new_type);
571   }
572   return MPI_SUCCESS;
573 }
574
575 int Datatype::create_subarray(int ndims, const int* array_of_sizes,
576                              const int* array_of_subsizes, const int* array_of_starts,
577                              int order, MPI_Datatype oldtype, MPI_Datatype *newtype){
578   MPI_Datatype tmp;
579
580   for (int i = 0; i < ndims; i++) {
581     if (array_of_subsizes[i] > array_of_sizes[i]){
582       XBT_WARN("subarray : array_of_subsizes > array_of_sizes for dim %d",i);
583       return MPI_ERR_ARG;
584     }
585     if (array_of_starts[i] + array_of_subsizes[i] > array_of_sizes[i]){
586       XBT_WARN("subarray : array_of_starts + array_of_subsizes > array_of_sizes for dim %d",i);
587       return MPI_ERR_ARG;
588     }
589   }
590
591   MPI_Aint extent = oldtype->get_extent();
592
593   int i;
594   int step;
595   int end;
596   if( order==MPI_ORDER_C ) {
597       i = ndims - 1;
598       step = -1;
599       end = -1;
600   } else {
601       i = 0;
602       step = 1;
603       end = ndims;
604   }
605
606   MPI_Aint size = (MPI_Aint)array_of_sizes[i] * (MPI_Aint)array_of_sizes[i+step];
607   MPI_Aint lb = (MPI_Aint)array_of_starts[i] + (MPI_Aint)array_of_starts[i+step] *(MPI_Aint)array_of_sizes[i];
608
609   create_vector( array_of_subsizes[i+step], array_of_subsizes[i], array_of_sizes[i],
610                                oldtype, newtype );
611
612   tmp = *newtype;
613
614   for( i += 2 * step; i != end; i += step ) {
615       create_hvector( array_of_subsizes[i], 1, size * extent,
616                                     tmp, newtype );
617       unref(tmp);
618       lb += size * array_of_starts[i];
619       size *= array_of_sizes[i];
620       tmp = *newtype;
621   }
622
623   MPI_Aint lbs[1] = {lb * extent};
624   int sizes [1]={1};
625   //handle LB and UB with a resized call
626   create_hindexed( 1, sizes, lbs, tmp, newtype);
627   unref(tmp);
628
629   tmp = *newtype;
630   create_resized(tmp, 0, extent, newtype);
631
632   unref(tmp);
633   return MPI_SUCCESS;
634 }
635
636 int Datatype::create_resized(MPI_Datatype oldtype,MPI_Aint lb, MPI_Aint extent, MPI_Datatype *newtype){
637   int blocks[3]         = {1, 1, 1};
638   MPI_Aint disps[3]     = {lb, 0, lb + extent};
639   MPI_Datatype types[3] = {MPI_LB, oldtype, MPI_UB};
640
641   *newtype = new simgrid::smpi::Type_Struct(oldtype->size(), lb, lb + extent, DT_FLAG_DERIVED, 3, blocks, disps, types);
642
643   (*newtype)->addflag(~DT_FLAG_COMMITED);
644   return MPI_SUCCESS;
645 }
646
647 Datatype* Datatype::f2c(int id)
648 {
649   return static_cast<Datatype*>(F2C::f2c(id));
650 }
651 } // namespace smpi
652 } // namespace simgrid