Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
support MPI_CXX types.
[simgrid.git] / src / smpi / mpi / smpi_datatype.cpp
1 /* smpi_datatype.cpp -- MPI primitives to handle datatypes                  */
2 /* Copyright (c) 2009-2021. The SimGrid Team. All rights reserved.          */
3
4 /* This program is free software; you can redistribute it and/or modify it
5  * under the terms of the license (GNU LGPL) which comes with this package. */
6
7 #include "private.hpp"
8 #include "simgrid/modelchecker.h"
9 #include "smpi_datatype_derived.hpp"
10 #include "smpi_op.hpp"
11 #include "src/instr/instr_private.hpp"
12 #include "src/smpi/include/smpi_actor.hpp"
13
14 #include <algorithm>
15 #include <array>
16 #include <functional>
17 #include <string>
18 #include <complex>
19
20 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(smpi_datatype, smpi, "Logging specific to SMPI (datatype)");
21
22 static std::unordered_map<std::string, simgrid::smpi::Datatype*> id2type_lookup;
23
24 #define CREATE_MPI_DATATYPE(name, id, type)                                                                            \
25   simgrid::smpi::Datatype _XBT_CONCAT(smpi_MPI_, name)((char*)"MPI_"#name, (id), sizeof(type), /* size */   \
26                                                          0,                                               /* lb */     \
27                                                          sizeof(type), /* ub = lb + size */                            \
28                                                          DT_FLAG_BASIC /* flags */                                     \
29                                                          );
30
31 #define CREATE_MPI_DATATYPE_NULL(name, id)                                                                             \
32   simgrid::smpi::Datatype _XBT_CONCAT(smpi_MPI_, name)((char*)"MPI_"#name, (id), 0, /* size */              \
33                                                          0,                                    /* lb */                \
34                                                          0,                                    /* ub = lb + size */    \
35                                                          DT_FLAG_BASIC                         /* flags */             \
36                                                          );
37
38 // Predefined data types
39 CREATE_MPI_DATATYPE_NULL(DATATYPE_NULL, -1)
40 CREATE_MPI_DATATYPE(DOUBLE, 0, double)
41 CREATE_MPI_DATATYPE(INT, 1, int)
42 CREATE_MPI_DATATYPE(CHAR, 2, char)
43 CREATE_MPI_DATATYPE(SHORT, 3, short)
44 CREATE_MPI_DATATYPE(LONG, 4, long)
45 CREATE_MPI_DATATYPE(FLOAT, 5, float)
46 CREATE_MPI_DATATYPE(BYTE, 6, int8_t)
47 CREATE_MPI_DATATYPE(LONG_LONG, 7, long long)
48 CREATE_MPI_DATATYPE(SIGNED_CHAR, 8, signed char)
49 CREATE_MPI_DATATYPE(UNSIGNED_CHAR, 9, unsigned char)
50 CREATE_MPI_DATATYPE(UNSIGNED_SHORT, 10, unsigned short)
51 CREATE_MPI_DATATYPE(UNSIGNED, 11, unsigned int)
52 CREATE_MPI_DATATYPE(UNSIGNED_LONG, 12, unsigned long)
53 CREATE_MPI_DATATYPE(UNSIGNED_LONG_LONG, 13, unsigned long long)
54 CREATE_MPI_DATATYPE(LONG_DOUBLE, 14, long double)
55 CREATE_MPI_DATATYPE(WCHAR, 15, wchar_t)
56 CREATE_MPI_DATATYPE(C_BOOL, 16, bool)
57 CREATE_MPI_DATATYPE(INT8_T, 17, int8_t)
58 CREATE_MPI_DATATYPE(INT16_T, 18, int16_t)
59 CREATE_MPI_DATATYPE(INT32_T, 19, int32_t)
60 CREATE_MPI_DATATYPE(INT64_T, 20, int64_t)
61 CREATE_MPI_DATATYPE(UINT8_T, 21, uint8_t)
62 CREATE_MPI_DATATYPE(UINT16_T, 22, uint16_t)
63 CREATE_MPI_DATATYPE(UINT32_T, 23, uint32_t)
64 CREATE_MPI_DATATYPE(UINT64_T, 24, uint64_t)
65 CREATE_MPI_DATATYPE(C_FLOAT_COMPLEX, 25, float _Complex)
66 CREATE_MPI_DATATYPE(C_DOUBLE_COMPLEX, 26, double _Complex)
67 CREATE_MPI_DATATYPE(C_LONG_DOUBLE_COMPLEX, 27, long double _Complex)
68 CREATE_MPI_DATATYPE(AINT, 28, MPI_Aint)
69 CREATE_MPI_DATATYPE(OFFSET, 29, MPI_Offset)
70
71 CREATE_MPI_DATATYPE(FLOAT_INT, 30, float_int)
72 CREATE_MPI_DATATYPE(LONG_INT, 31, long_int)
73 CREATE_MPI_DATATYPE(DOUBLE_INT, 32, double_int)
74 CREATE_MPI_DATATYPE(SHORT_INT, 33, short_int)
75 CREATE_MPI_DATATYPE(2INT, 34, int_int)
76 CREATE_MPI_DATATYPE(2FLOAT, 35, float_float)
77 CREATE_MPI_DATATYPE(2DOUBLE, 36, double_double)
78 CREATE_MPI_DATATYPE(2LONG, 37, long_long)
79
80 CREATE_MPI_DATATYPE(REAL, 38, float)
81 CREATE_MPI_DATATYPE(REAL4, 39, float)
82 CREATE_MPI_DATATYPE(REAL8, 40, double)
83 CREATE_MPI_DATATYPE(REAL16, 41, long double)
84 CREATE_MPI_DATATYPE(COMPLEX8, 42, float_float)
85 CREATE_MPI_DATATYPE(COMPLEX16, 43, double_double)
86 CREATE_MPI_DATATYPE(COMPLEX32, 44, double_double)
87 CREATE_MPI_DATATYPE(INTEGER1, 45, int)
88 CREATE_MPI_DATATYPE(INTEGER2, 46, int16_t)
89 CREATE_MPI_DATATYPE(INTEGER4, 47, int32_t)
90 CREATE_MPI_DATATYPE(INTEGER8, 48, int64_t)
91 CREATE_MPI_DATATYPE(INTEGER16, 49, integer128_t)
92
93 CREATE_MPI_DATATYPE(LONG_DOUBLE_INT, 50, long_double_int)
94 CREATE_MPI_DATATYPE(CXX_BOOL, 51, bool)
95 CREATE_MPI_DATATYPE(CXX_FLOAT_COMPLEX, 52, std::complex<float>)
96 CREATE_MPI_DATATYPE(CXX_DOUBLE_COMPLEX, 53, std::complex<double>)
97 CREATE_MPI_DATATYPE(CXX_LONG_DOUBLE_COMPLEX, 54, std::complex<long double>)
98
99 CREATE_MPI_DATATYPE_NULL(UB, 55)
100 CREATE_MPI_DATATYPE_NULL(LB, 56)
101 CREATE_MPI_DATATYPE(PACKED, 57, char)
102 // Internal use only
103 CREATE_MPI_DATATYPE(PTR, 58, void*)
104 CREATE_MPI_DATATYPE(COUNT, 59, long long)
105 MPI_Datatype MPI_PTR = &smpi_MPI_PTR;
106
107
108 namespace simgrid{
109 namespace smpi{
110
111 std::unordered_map<int, smpi_key_elem> Datatype::keyvals_; // required by the Keyval class implementation
112 int Datatype::keyval_id_=0; // required by the Keyval class implementation
113 Datatype::Datatype(int ident, int size, MPI_Aint lb, MPI_Aint ub, int flags) : Datatype(size, lb, ub, flags)
114 {
115   id = std::to_string(ident);
116 }
117
118 Datatype::Datatype(int size, MPI_Aint lb, MPI_Aint ub, int flags) : size_(size), lb_(lb), ub_(ub), flags_(flags)
119 {
120   this->add_f();
121 #if SIMGRID_HAVE_MC
122   if(MC_is_active())
123     MC_ignore(&(refcount_), sizeof(refcount_));
124 #endif
125 }
126
127 // for predefined types, so refcount_ = 0.
128 Datatype::Datatype(const char* name, int ident, int size, MPI_Aint lb, MPI_Aint ub, int flags)
129     : name_(name), id(std::to_string(ident)), size_(size), lb_(lb), ub_(ub), flags_(flags), refcount_(0)
130 {
131   id2type_lookup.insert({id, this});
132 #if SIMGRID_HAVE_MC
133   if(MC_is_active())
134     MC_ignore(&(refcount_), sizeof(refcount_));
135 #endif
136 }
137
138 Datatype::Datatype(Datatype* datatype, int* ret)
139     : size_(datatype->size_), lb_(datatype->lb_), ub_(datatype->ub_), flags_(datatype->flags_)
140 {
141   this->add_f();
142   *ret = this->copy_attrs(datatype);
143 }
144
145 Datatype::~Datatype()
146 {
147   xbt_assert(refcount_ >= 0);
148
149   if(flags_ & DT_FLAG_PREDEFINED)
150     return;
151   //prevent further usage
152   flags_ &= ~ DT_FLAG_COMMITED;
153   F2C::free_f(this->c2f());
154   //if still used, mark for deletion
155   if(refcount_!=0){
156       flags_ |=DT_FLAG_DESTROYED;
157       return;
158   }
159   cleanup_attr<Datatype>();
160 }
161
162 int Datatype::copy_attrs(Datatype* datatype){
163   flags_ &= ~DT_FLAG_PREDEFINED;
164   int ret = MPI_SUCCESS;
165     
166   if (not datatype->attributes()->empty()) {
167     int flag=0;
168     void* value_out;
169     for (auto const& it : *(datatype->attributes())) {
170       smpi_key_elem elem = keyvals_.at(it.first);
171       if (elem != nullptr){
172         if( elem->copy_fn.type_copy_fn != MPI_NULL_COPY_FN && 
173             elem->copy_fn.type_copy_fn != MPI_TYPE_DUP_FN)
174           ret = elem->copy_fn.type_copy_fn(datatype, it.first, elem->extra_state, it.second, &value_out, &flag);
175         else if ( elem->copy_fn.type_copy_fn_fort != MPI_NULL_COPY_FN &&
176                   (*(int*)*elem->copy_fn.type_copy_fn_fort) != 1){
177           value_out=(int*)xbt_malloc(sizeof(int));
178           elem->copy_fn.type_copy_fn_fort(datatype, it.first, elem->extra_state, it.second, value_out, &flag, &ret);
179         }
180         if (ret != MPI_SUCCESS) {
181           break;
182         }
183         if(elem->copy_fn.type_copy_fn == MPI_TYPE_DUP_FN || 
184           ((elem->copy_fn.type_copy_fn_fort != MPI_NULL_COPY_FN) && (*(int*)*elem->copy_fn.type_copy_fn_fort == 1))){
185           elem->refcount++;
186           attributes()->insert({it.first, it.second});
187         } else if (flag){
188           elem->refcount++;
189           attributes()->insert({it.first, value_out});
190         }
191       }
192     }
193   }
194   set_contents(MPI_COMBINER_DUP, 0, nullptr, 0, nullptr, 1, &datatype);
195   return ret;
196 }
197
198 int Datatype::clone(MPI_Datatype* type){
199   int ret;
200   *type = new Datatype(this, &ret);
201   return ret;
202 }
203
204 void Datatype::ref()
205 {
206   refcount_++;
207
208 #if SIMGRID_HAVE_MC
209   if(MC_is_active())
210     MC_ignore(&(refcount_), sizeof(refcount_));
211 #endif
212 }
213
214 void Datatype::unref(MPI_Datatype datatype)
215 {
216   if (datatype->refcount_ > 0)
217     datatype->refcount_--;
218
219 #if SIMGRID_HAVE_MC
220   if(MC_is_active())
221     MC_ignore(&(datatype->refcount_), sizeof(datatype->refcount_));
222 #endif
223
224   if (datatype->refcount_ == 0 && not(datatype->flags_ & DT_FLAG_PREDEFINED))
225     delete datatype;
226 }
227
228 void Datatype::commit()
229 {
230   flags_ |= DT_FLAG_COMMITED;
231 }
232
233 bool Datatype::is_valid() const
234 {
235   return (flags_ & DT_FLAG_COMMITED);
236 }
237
238 bool Datatype::is_basic() const
239 {
240   return (flags_ & DT_FLAG_BASIC);
241 }
242
243 bool Datatype::is_replayable() const
244 {
245   return (simgrid::instr::trace_format == simgrid::instr::TraceFormat::Ti) &&
246          ((this == MPI_BYTE) || (this == MPI_DOUBLE) || (this == MPI_INT) || (this == MPI_CHAR) ||
247           (this == MPI_SHORT) || (this == MPI_LONG) || (this == MPI_FLOAT));
248 }
249
250 MPI_Datatype Datatype::decode(const std::string& datatype_id)
251 {
252   return id2type_lookup.find(datatype_id)->second;
253 }
254
255 void Datatype::addflag(int flag){
256   flags_ &= flag;
257 }
258
259 int Datatype::extent(MPI_Aint* lb, MPI_Aint* extent) const
260 {
261   *lb = lb_;
262   *extent = ub_ - lb_;
263   return MPI_SUCCESS;
264 }
265
266 void Datatype::get_name(char* name, int* length) const
267 {
268   *length = static_cast<int>(name_.length());
269   if (not name_.empty()) {
270     name_.copy(name, *length);
271     name[*length] = '\0';
272   }
273 }
274
275 void Datatype::set_name(const char* name)
276 {
277   name_ = name;
278 }
279
280 int Datatype::pack(const void* inbuf, int incount, void* outbuf, int outcount, int* position, const Comm*)
281 {
282   if (outcount - *position < incount*static_cast<int>(size_))
283     return MPI_ERR_OTHER;
284   Datatype::copy(inbuf, incount, this, static_cast<char*>(outbuf) + *position, outcount, MPI_CHAR);
285   *position += incount * size_;
286   return MPI_SUCCESS;
287 }
288
289 int Datatype::unpack(const void* inbuf, int insize, int* position, void* outbuf, int outcount, const Comm*)
290 {
291   if (outcount*static_cast<int>(size_)> insize)
292     return MPI_ERR_OTHER;
293   Datatype::copy(static_cast<const char*>(inbuf) + *position, insize, MPI_CHAR, outbuf, outcount, this);
294   *position += outcount * size_;
295   return MPI_SUCCESS;
296 }
297
298 int Datatype::get_contents(int max_integers, int max_addresses, int max_datatypes, int* array_of_integers,
299                            MPI_Aint* array_of_addresses, MPI_Datatype* array_of_datatypes) const
300 {
301   if(contents_==nullptr)
302     return MPI_ERR_ARG;
303   if (static_cast<unsigned>(max_integers) < contents_->integers_.size())
304     return MPI_ERR_COUNT;
305   std::copy(begin(contents_->integers_), end(contents_->integers_), array_of_integers);
306   if (static_cast<unsigned>(max_addresses) < contents_->addresses_.size())
307     return MPI_ERR_COUNT;
308   std::copy(begin(contents_->addresses_), end(contents_->addresses_), array_of_addresses);
309   if (static_cast<unsigned>(max_datatypes) < contents_->datatypes_.size())
310     return MPI_ERR_COUNT;
311   std::copy(begin(contents_->datatypes_), end(contents_->datatypes_), array_of_datatypes);
312   std::for_each(begin(contents_->datatypes_), end(contents_->datatypes_), std::mem_fn(&Datatype::ref));
313   return MPI_SUCCESS;
314 }
315
316 int Datatype::get_envelope(int* num_integers, int* num_addresses, int* num_datatypes, int* combiner) const
317 {
318   if(contents_==nullptr){
319     *num_integers = 0;
320     *num_addresses = 0;
321     *num_datatypes = 0;
322     *combiner = MPI_COMBINER_NAMED;
323   }else{
324     *num_integers  = contents_->integers_.size();
325     *num_addresses = contents_->addresses_.size();
326     *num_datatypes = contents_->datatypes_.size();
327     *combiner = contents_->combiner_;
328   }
329   return MPI_SUCCESS;
330 }
331
332 int Datatype::copy(const void* sendbuf, int sendcount, MPI_Datatype sendtype, void* recvbuf, int recvcount,
333                    MPI_Datatype recvtype)
334 {
335   // FIXME Handle the case of a partial shared malloc.
336
337   if (smpi_cfg_privatization() == SmpiPrivStrategies::MMAP) {
338     smpi_switch_data_segment(simgrid::s4u::Actor::self());
339   }
340   /* First check if we really have something to do */
341   size_t offset = 0;
342   std::vector<std::pair<size_t, size_t>> private_blocks;
343   if(smpi_is_shared(sendbuf,private_blocks,&offset)
344        && (private_blocks.size()==1
345        && (private_blocks[0].second - private_blocks[0].first)==(unsigned long)(sendcount * sendtype->get_extent()))){
346     XBT_VERB("sendbuf is shared. Ignoring copies");
347     return 0;
348   }
349   if(smpi_is_shared(recvbuf,private_blocks,&offset)
350        && (private_blocks.size()==1
351        && (private_blocks[0].second - private_blocks[0].first)==(unsigned long)(recvcount * recvtype->get_extent()))){
352     XBT_VERB("recvbuf is shared. Ignoring copies");
353     return 0;
354   }
355
356   if (recvcount > 0 && recvbuf != sendbuf) {
357     sendcount *= sendtype->size();
358     recvcount *= recvtype->size();
359     int count = sendcount < recvcount ? sendcount : recvcount;
360     XBT_DEBUG("Copying %d bytes from %p to %p", count, sendbuf, recvbuf);
361     if (not(sendtype->flags() & DT_FLAG_DERIVED) && not(recvtype->flags() & DT_FLAG_DERIVED)) {
362       if (not smpi_process()->replaying() && count > 0)
363         memcpy(recvbuf, sendbuf, count);
364     } else if (not(sendtype->flags() & DT_FLAG_DERIVED)) {
365       recvtype->unserialize(sendbuf, recvbuf, count / recvtype->size(), MPI_REPLACE);
366     } else if (not(recvtype->flags() & DT_FLAG_DERIVED)) {
367       sendtype->serialize(sendbuf, recvbuf, count / sendtype->size());
368     } else {
369       void * buf_tmp = xbt_malloc(count);
370
371       sendtype->serialize( sendbuf, buf_tmp,count/sendtype->size());
372       recvtype->unserialize( buf_tmp, recvbuf,count/recvtype->size(), MPI_REPLACE);
373
374       xbt_free(buf_tmp);
375     }
376   }
377
378   return sendcount > recvcount ? MPI_ERR_TRUNCATE : MPI_SUCCESS;
379 }
380
381 //Default serialization method : memcpy.
382 void Datatype::serialize(const void* noncontiguous_buf, void* contiguous_buf, int count)
383 {
384   auto* contiguous_buf_char          = static_cast<char*>(contiguous_buf);
385   const auto* noncontiguous_buf_char = static_cast<const char*>(noncontiguous_buf) + lb_;
386   memcpy(contiguous_buf_char, noncontiguous_buf_char, count*size_);
387 }
388
389 void Datatype::unserialize(const void* contiguous_buf, void *noncontiguous_buf, int count, MPI_Op op){
390   const auto* contiguous_buf_char = static_cast<const char*>(contiguous_buf);
391   auto* noncontiguous_buf_char    = static_cast<char*>(noncontiguous_buf) + lb_;
392   int n=count;
393   if(op!=MPI_OP_NULL)
394     op->apply( contiguous_buf_char, noncontiguous_buf_char, &n, this);
395 }
396
397 int Datatype::create_contiguous(int count, MPI_Datatype old_type, MPI_Aint lb, MPI_Datatype* new_type){
398   if(old_type->flags_ & DT_FLAG_DERIVED){
399     //handle this case as a hvector with stride equals to the extent of the datatype
400     return create_hvector(count, 1, old_type->get_extent(), old_type, new_type);
401   }
402   if(count>0)
403     *new_type = new Type_Contiguous(count * old_type->size(), lb, lb + count * old_type->size(),
404                                    DT_FLAG_DERIVED, count, old_type);
405   else
406     *new_type = new Datatype(count * old_type->size(), lb, lb + count * old_type->size(),0);
407   return MPI_SUCCESS;
408 }
409
410 int Datatype::create_vector(int count, int block_length, int stride, MPI_Datatype old_type, MPI_Datatype* new_type)
411 {
412   int retval;
413   if (block_length<0)
414     return MPI_ERR_ARG;
415   MPI_Aint lb = 0;
416   MPI_Aint ub = 0;
417   if(count>0){
418     lb=old_type->lb();
419     ub=((count-1)*stride+block_length-1)*old_type->get_extent()+old_type->ub();
420   }
421   if(old_type->flags() & DT_FLAG_DERIVED || stride != block_length){
422     *new_type = new Type_Vector(count * (block_length) * old_type->size(), lb, ub,
423                                    DT_FLAG_DERIVED, count, block_length, stride, old_type);
424     retval=MPI_SUCCESS;
425   }else{
426     /* in this situation the data are contiguous thus it's not required to serialize and unserialize it*/
427     *new_type = new Datatype(count * block_length * old_type->size(), 0, ((count -1) * stride + block_length)*
428                          old_type->size(), DT_FLAG_CONTIGUOUS);
429     const std::array<int, 3> ints = {{count, block_length, stride}};
430     (*new_type)->set_contents(MPI_COMBINER_VECTOR, 3, ints.data(), 0, nullptr, 1, &old_type);
431     retval=MPI_SUCCESS;
432   }
433   return retval;
434 }
435
436
437 int Datatype::create_hvector(int count, int block_length, MPI_Aint stride, MPI_Datatype old_type, MPI_Datatype* new_type)
438 {
439   int retval;
440   if (block_length<0)
441     return MPI_ERR_ARG;
442   MPI_Aint lb = 0;
443   MPI_Aint ub = 0;
444   if(count>0){
445     lb=old_type->lb();
446     ub=((count-1)*stride)+(block_length-1)*old_type->get_extent()+old_type->ub();
447   }
448   if(old_type->flags() & DT_FLAG_DERIVED || stride != block_length*old_type->get_extent()){
449     *new_type = new Type_Hvector(count * (block_length) * old_type->size(), lb, ub,
450                                    DT_FLAG_DERIVED, count, block_length, stride, old_type);
451     retval=MPI_SUCCESS;
452   }else{
453     /* in this situation the data are contiguous thus it's not required to serialize and unserialize it*/
454     *new_type = new Datatype(count * block_length * old_type->size(), 0, count * block_length * old_type->size(), DT_FLAG_CONTIGUOUS);
455     const std::array<int, 2> ints = {{count, block_length}};
456     (*new_type)->set_contents(MPI_COMBINER_HVECTOR, 2, ints.data(), 1, &stride, 1, &old_type);
457     retval=MPI_SUCCESS;
458   }
459   return retval;
460 }
461
462 int Datatype::create_indexed(int count, const int* block_lengths, const int* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
463   int size = 0;
464   bool contiguous=true;
465   MPI_Aint lb = 0;
466   MPI_Aint ub = 0;
467   if(count>0){
468     lb=indices[0]*old_type->get_extent();
469     ub=indices[0]*old_type->get_extent() + block_lengths[0]*old_type->ub();
470   }
471
472   for (int i = 0; i < count; i++) {
473     if (block_lengths[i] < 0)
474       return MPI_ERR_ARG;
475     size += block_lengths[i];
476
477     if(indices[i]*old_type->get_extent()+old_type->lb()<lb)
478       lb = indices[i]*old_type->get_extent()+old_type->lb();
479     if(indices[i]*old_type->get_extent()+block_lengths[i]*old_type->ub()>ub)
480       ub = indices[i]*old_type->get_extent()+block_lengths[i]*old_type->ub();
481
482     if ( (i< count -1) && (indices[i]+block_lengths[i] != indices[i+1]) )
483       contiguous=false;
484   }
485   if(old_type->flags_ & DT_FLAG_DERIVED)
486     contiguous=false;
487
488   if (not contiguous) {
489     *new_type = new Type_Indexed(size * old_type->size(),lb,ub,
490                                  DT_FLAG_DERIVED|DT_FLAG_DATA, count, block_lengths, indices, old_type);
491   }else{
492     Datatype::create_contiguous(size, old_type, lb, new_type);
493   }
494   return MPI_SUCCESS;
495 }
496
497 int Datatype::create_hindexed(int count, const int* block_lengths, const MPI_Aint* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
498   int size = 0;
499   bool contiguous=true;
500   MPI_Aint lb = 0;
501   MPI_Aint ub = 0;
502   if(count>0){
503     lb=indices[0] + old_type->lb();
504     ub=indices[0] + block_lengths[0]*old_type->ub();
505   }
506   for (int i = 0; i < count; i++) {
507     if (block_lengths[i] < 0)
508       return MPI_ERR_ARG;
509     size += block_lengths[i];
510
511     if(indices[i]+old_type->lb()<lb)
512       lb = indices[i]+old_type->lb();
513     if(indices[i]+block_lengths[i]*old_type->ub()>ub)
514       ub = indices[i]+block_lengths[i]*old_type->ub();
515
516     if ( (i< count -1) && (indices[i]+block_lengths[i]*(static_cast<int>(old_type->size())) != indices[i+1]) )
517       contiguous=false;
518   }
519   if (old_type->flags_ & DT_FLAG_DERIVED || lb!=0)
520     contiguous=false;
521
522   if (not contiguous) {
523     *new_type = new Type_Hindexed(size * old_type->size(),lb,ub,
524                                    DT_FLAG_DERIVED|DT_FLAG_DATA, count, block_lengths, indices, old_type);
525   }else{
526     Datatype::create_contiguous(size, old_type, lb, new_type);
527   }
528   return MPI_SUCCESS;
529 }
530
531 int Datatype::create_struct(int count, const int* block_lengths, const MPI_Aint* indices, const MPI_Datatype* old_types, MPI_Datatype* new_type){
532   size_t size = 0;
533   bool contiguous=true;
534   size = 0;
535   MPI_Aint lb = 0;
536   MPI_Aint ub = 0;
537   if(count>0){
538     lb=indices[0] + old_types[0]->lb();
539     ub=indices[0] + block_lengths[0]*old_types[0]->ub();
540   }
541   bool forced_lb=false;
542   bool forced_ub=false;
543   for (int i = 0; i < count; i++) {
544     if (block_lengths[i]<0)
545       return MPI_ERR_ARG;
546     if (old_types[i]->flags_ & DT_FLAG_DERIVED)
547       contiguous=false;
548
549     size += block_lengths[i]*old_types[i]->size();
550     if (old_types[i]==MPI_LB){
551       lb=indices[i];
552       forced_lb=true;
553     }
554     if (old_types[i]==MPI_UB){
555       ub=indices[i];
556       forced_ub=true;
557     }
558
559     if (not forced_lb && indices[i] + old_types[i]->lb() < lb)
560       lb = indices[i];
561     if (not forced_ub && indices[i] + block_lengths[i] * old_types[i]->ub() > ub)
562       ub = indices[i]+block_lengths[i]*old_types[i]->ub();
563
564     if ( (i< count -1) && (indices[i]+block_lengths[i]*static_cast<int>(old_types[i]->size()) != indices[i+1]) )
565       contiguous=false;
566   }
567   if (not contiguous) {
568     *new_type = new Type_Struct(size, lb,ub, DT_FLAG_DERIVED|DT_FLAG_DATA,
569                                 count, block_lengths, indices, old_types);
570   }else{
571     Datatype::create_contiguous(size, MPI_CHAR, lb, new_type);
572   }
573   return MPI_SUCCESS;
574 }
575
576 int Datatype::create_subarray(int ndims, const int* array_of_sizes,
577                              const int* array_of_subsizes, const int* array_of_starts,
578                              int order, MPI_Datatype oldtype, MPI_Datatype *newtype){
579   MPI_Datatype tmp;
580
581   for (int i = 0; i < ndims; i++) {
582     if (array_of_subsizes[i] > array_of_sizes[i]){
583       XBT_WARN("subarray : array_of_subsizes > array_of_sizes for dim %d",i);
584       return MPI_ERR_ARG;
585     }
586     if (array_of_starts[i] + array_of_subsizes[i] > array_of_sizes[i]){
587       XBT_WARN("subarray : array_of_starts + array_of_subsizes > array_of_sizes for dim %d",i);
588       return MPI_ERR_ARG;
589     }
590   }
591
592   MPI_Aint extent = oldtype->get_extent();
593
594   int i;
595   int step;
596   int end;
597   if( order==MPI_ORDER_C ) {
598       i = ndims - 1;
599       step = -1;
600       end = -1;
601   } else {
602       i = 0;
603       step = 1;
604       end = ndims;
605   }
606
607   MPI_Aint size = (MPI_Aint)array_of_sizes[i] * (MPI_Aint)array_of_sizes[i+step];
608   MPI_Aint lb = (MPI_Aint)array_of_starts[i] + (MPI_Aint)array_of_starts[i+step] *(MPI_Aint)array_of_sizes[i];
609
610   create_vector( array_of_subsizes[i+step], array_of_subsizes[i], array_of_sizes[i],
611                                oldtype, newtype );
612
613   tmp = *newtype;
614
615   for( i += 2 * step; i != end; i += step ) {
616       create_hvector( array_of_subsizes[i], 1, size * extent,
617                                     tmp, newtype );
618       unref(tmp);
619       lb += size * array_of_starts[i];
620       size *= array_of_sizes[i];
621       tmp = *newtype;
622   }
623
624   const MPI_Aint lbs = lb * extent;
625   const int sizes    = 1;
626   //handle LB and UB with a resized call
627   create_hindexed(1, &sizes, &lbs, tmp, newtype);
628   unref(tmp);
629
630   tmp = *newtype;
631   create_resized(tmp, 0, extent, newtype);
632
633   unref(tmp);
634   return MPI_SUCCESS;
635 }
636
637 int Datatype::create_resized(MPI_Datatype oldtype,MPI_Aint lb, MPI_Aint extent, MPI_Datatype *newtype){
638   const std::array<int, 3> blocks         = {{1, 1, 1}};
639   const std::array<MPI_Aint, 3> disps     = {{lb, 0, lb + extent}};
640   const std::array<MPI_Datatype, 3> types = {{MPI_LB, oldtype, MPI_UB}};
641
642   *newtype = new simgrid::smpi::Type_Struct(oldtype->size(), lb, lb + extent, DT_FLAG_DERIVED, 3, blocks.data(),
643                                             disps.data(), types.data());
644
645   (*newtype)->addflag(~DT_FLAG_COMMITED);
646   return MPI_SUCCESS;
647 }
648
649 Datatype* Datatype::f2c(int id)
650 {
651   return static_cast<Datatype*>(F2C::f2c(id));
652 }
653
654 } // namespace smpi
655 } // namespace simgrid