Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
Remove the stateful model-checking from the archive. It's not working anymore
[simgrid.git] / src / smpi / mpi / smpi_datatype.cpp
1 /* smpi_datatype.cpp -- MPI primitives to handle datatypes                  */
2 /* Copyright (c) 2009-2023. The SimGrid Team. All rights reserved.          */
3
4 /* This program is free software; you can redistribute it and/or modify it
5  * under the terms of the license (GNU LGPL) which comes with this package. */
6
7 #include "private.hpp"
8 #include "simgrid/modelchecker.h"
9 #include "smpi_datatype_derived.hpp"
10 #include "smpi_op.hpp"
11 #include "src/instr/instr_private.hpp"
12 #include "src/smpi/include/smpi_actor.hpp"
13
14 #include <algorithm>
15 #include <array>
16 #include <functional>
17 #include <string>
18 #include <complex>
19
20 XBT_LOG_NEW_DEFAULT_SUBCATEGORY(smpi_datatype, smpi, "Logging specific to SMPI (datatype)");
21
22 static std::unordered_map<std::string, simgrid::smpi::Datatype*> id2type_lookup;
23
24 #define CREATE_MPI_DATATYPE(name, id, type, flag)                                                                            \
25   simgrid::smpi::Datatype _XBT_CONCAT(smpi_MPI_, name)((char*)"MPI_"#name, (id), sizeof(type), /* size */   \
26                                                          0,                                               /* lb */     \
27                                                          sizeof(type), /* ub = lb + size */                            \
28                                                          DT_FLAG_BASIC | flag /* flags */                                     \
29                                                          );
30
31 #define CREATE_MPI_DATATYPE_NULL(name, id)                                                                             \
32   simgrid::smpi::Datatype _XBT_CONCAT(smpi_MPI_, name)((char*)"MPI_"#name, (id), 0, /* size */              \
33                                                          0,                                    /* lb */                \
34                                                          0,                                    /* ub = lb + size */    \
35                                                          DT_FLAG_BASIC                         /* flags */             \
36                                                          );
37
38 // Predefined data types
39 CREATE_MPI_DATATYPE_NULL(DATATYPE_NULL, -1)
40 CREATE_MPI_DATATYPE(DOUBLE, 0, double, DT_FLAG_FP)
41 CREATE_MPI_DATATYPE(INT, 1, int, DT_FLAG_C_INTEGER)
42 CREATE_MPI_DATATYPE(CHAR, 2, char, DT_FLAG_C_INTEGER)
43 CREATE_MPI_DATATYPE(SHORT, 3, short, DT_FLAG_C_INTEGER)
44 CREATE_MPI_DATATYPE(LONG, 4, long, DT_FLAG_C_INTEGER)
45 CREATE_MPI_DATATYPE(FLOAT, 5, float, DT_FLAG_FP)
46 CREATE_MPI_DATATYPE(BYTE, 6, int8_t, DT_FLAG_BYTE)
47 CREATE_MPI_DATATYPE(LONG_LONG, 7, long long, DT_FLAG_C_INTEGER)
48 CREATE_MPI_DATATYPE(SIGNED_CHAR, 8, signed char, DT_FLAG_C_INTEGER)
49 CREATE_MPI_DATATYPE(UNSIGNED_CHAR, 9, unsigned char, DT_FLAG_C_INTEGER)
50 CREATE_MPI_DATATYPE(UNSIGNED_SHORT, 10, unsigned short, DT_FLAG_C_INTEGER)
51 CREATE_MPI_DATATYPE(UNSIGNED, 11, unsigned int, DT_FLAG_C_INTEGER)
52 CREATE_MPI_DATATYPE(UNSIGNED_LONG, 12, unsigned long, DT_FLAG_C_INTEGER)
53 CREATE_MPI_DATATYPE(UNSIGNED_LONG_LONG, 13, unsigned long long, DT_FLAG_C_INTEGER)
54 CREATE_MPI_DATATYPE(LONG_DOUBLE, 14, long double, DT_FLAG_FP)
55 CREATE_MPI_DATATYPE(WCHAR, 15, wchar_t, DT_FLAG_BASIC)
56 CREATE_MPI_DATATYPE(C_BOOL, 16, bool, DT_FLAG_LOGICAL)
57 CREATE_MPI_DATATYPE(INT8_T, 17, int8_t, DT_FLAG_C_INTEGER)
58 CREATE_MPI_DATATYPE(INT16_T, 18, int16_t, DT_FLAG_C_INTEGER)
59 CREATE_MPI_DATATYPE(INT32_T, 19, int32_t, DT_FLAG_C_INTEGER)
60 CREATE_MPI_DATATYPE(INT64_T, 20, int64_t, DT_FLAG_C_INTEGER)
61 CREATE_MPI_DATATYPE(UINT8_T, 21, uint8_t, DT_FLAG_C_INTEGER)
62 CREATE_MPI_DATATYPE(UINT16_T, 22, uint16_t, DT_FLAG_C_INTEGER)
63 CREATE_MPI_DATATYPE(UINT32_T, 23, uint32_t, DT_FLAG_C_INTEGER)
64 CREATE_MPI_DATATYPE(UINT64_T, 24, uint64_t, DT_FLAG_C_INTEGER)
65 CREATE_MPI_DATATYPE(C_FLOAT_COMPLEX, 25, float _Complex, DT_FLAG_COMPLEX)
66 CREATE_MPI_DATATYPE(C_DOUBLE_COMPLEX, 26, double _Complex, DT_FLAG_COMPLEX)
67 CREATE_MPI_DATATYPE(C_LONG_DOUBLE_COMPLEX, 27, long double _Complex, DT_FLAG_COMPLEX)
68 CREATE_MPI_DATATYPE(AINT, 28, MPI_Aint, DT_FLAG_MULTILANG)
69 CREATE_MPI_DATATYPE(OFFSET, 29, MPI_Offset, DT_FLAG_MULTILANG)
70
71 CREATE_MPI_DATATYPE(FLOAT_INT, 30, float_int, DT_FLAG_REDUCTION)
72 CREATE_MPI_DATATYPE(LONG_INT, 31, long_int, DT_FLAG_REDUCTION)
73 CREATE_MPI_DATATYPE(DOUBLE_INT, 32, double_int, DT_FLAG_REDUCTION)
74 CREATE_MPI_DATATYPE(SHORT_INT, 33, short_int, DT_FLAG_REDUCTION)
75 CREATE_MPI_DATATYPE(2INT, 34, int_int, DT_FLAG_REDUCTION)
76 CREATE_MPI_DATATYPE(2FLOAT, 35, float_float, DT_FLAG_REDUCTION)
77 CREATE_MPI_DATATYPE(2DOUBLE, 36, double_double, DT_FLAG_REDUCTION)
78 CREATE_MPI_DATATYPE(2LONG, 37, long_long, DT_FLAG_REDUCTION)
79
80 CREATE_MPI_DATATYPE(REAL, 38, float, DT_FLAG_FP)
81 CREATE_MPI_DATATYPE(REAL4, 39, float, DT_FLAG_FP)
82 CREATE_MPI_DATATYPE(REAL8, 40, double, DT_FLAG_FP)
83 CREATE_MPI_DATATYPE(REAL16, 41, long double, DT_FLAG_FP)
84 CREATE_MPI_DATATYPE(COMPLEX8, 42, float_float, DT_FLAG_COMPLEX)
85 CREATE_MPI_DATATYPE(COMPLEX16, 43, double_double, DT_FLAG_COMPLEX)
86 CREATE_MPI_DATATYPE(COMPLEX32, 44, double_double, DT_FLAG_COMPLEX)
87 CREATE_MPI_DATATYPE(INTEGER1, 45, int, DT_FLAG_F_INTEGER)
88 CREATE_MPI_DATATYPE(INTEGER2, 46, int16_t, DT_FLAG_F_INTEGER)
89 CREATE_MPI_DATATYPE(INTEGER4, 47, int32_t, DT_FLAG_F_INTEGER)
90 CREATE_MPI_DATATYPE(INTEGER8, 48, int64_t, DT_FLAG_F_INTEGER)
91 CREATE_MPI_DATATYPE(INTEGER16, 49, integer128_t, DT_FLAG_F_INTEGER)
92
93 CREATE_MPI_DATATYPE(LONG_DOUBLE_INT, 50, long_double_int, DT_FLAG_REDUCTION)
94 CREATE_MPI_DATATYPE(CXX_BOOL, 51, bool, DT_FLAG_LOGICAL)
95 CREATE_MPI_DATATYPE(CXX_FLOAT_COMPLEX, 52, std::complex<float>, DT_FLAG_COMPLEX)
96 CREATE_MPI_DATATYPE(CXX_DOUBLE_COMPLEX, 53, std::complex<double>, DT_FLAG_COMPLEX)
97 CREATE_MPI_DATATYPE(CXX_LONG_DOUBLE_COMPLEX, 54, std::complex<long double>, DT_FLAG_COMPLEX)
98
99 CREATE_MPI_DATATYPE_NULL(UB, 55)
100 CREATE_MPI_DATATYPE_NULL(LB, 56)
101 CREATE_MPI_DATATYPE(PACKED, 57, char, DT_FLAG_PREDEFINED)
102 // Internal use only
103 CREATE_MPI_DATATYPE(PTR, 58, void*, DT_FLAG_PREDEFINED)
104 CREATE_MPI_DATATYPE(COUNT, 59, long long, DT_FLAG_MULTILANG)
105 MPI_Datatype MPI_PTR = &smpi_MPI_PTR;
106
107 namespace simgrid::smpi {
108
109 std::unordered_map<int, smpi_key_elem> Datatype::keyvals_; // required by the Keyval class implementation
110 int Datatype::keyval_id_=0; // required by the Keyval class implementation
111 Datatype::Datatype(int ident, int size, MPI_Aint lb, MPI_Aint ub, int flags) : Datatype(size, lb, ub, flags)
112 {
113   id = std::to_string(ident);
114 }
115
116 Datatype::Datatype(int size, MPI_Aint lb, MPI_Aint ub, int flags) : size_(size), lb_(lb), ub_(ub), flags_(flags)
117 {
118   this->add_f();
119 }
120
121 // for predefined types, so refcount_ = 0.
122 Datatype::Datatype(const char* name, int ident, int size, MPI_Aint lb, MPI_Aint ub, int flags)
123     : name_(name), id(std::to_string(ident)), size_(size), lb_(lb), ub_(ub), flags_(flags), refcount_(0)
124 {
125   id2type_lookup.try_emplace(id, this);
126 }
127
128 Datatype::Datatype(Datatype* datatype, int* ret)
129     : size_(datatype->size_), lb_(datatype->lb_), ub_(datatype->ub_), flags_(datatype->flags_), duplicated_datatype_(datatype)
130 {
131   this->add_f();
132   datatype->ref();
133   *ret = this->copy_attrs(datatype);
134 }
135
136 Datatype::~Datatype()
137 {
138   xbt_assert(refcount_ >= 0);
139
140   if(flags_ & DT_FLAG_PREDEFINED)
141     return;
142   //prevent further usage
143   flags_ &= ~ DT_FLAG_COMMITED;
144   if(duplicated_datatype_ != MPI_DATATYPE_NULL)
145     unref(duplicated_datatype_);
146   F2C::free_f(this->f2c_id());
147   //if still used, mark for deletion
148   if(refcount_!=0){
149       flags_ |=DT_FLAG_DESTROYED;
150       return;
151   }
152   cleanup_attr<Datatype>();
153 }
154
155 int Datatype::copy_attrs(Datatype* datatype){
156   flags_ &= ~DT_FLAG_PREDEFINED;
157
158   set_contents(MPI_COMBINER_DUP, 0, nullptr, 0, nullptr, 1, &datatype);
159   for (auto const& [key, value] : datatype->attributes()) {
160     auto elem_it = keyvals_.find(key);
161     xbt_assert(elem_it != keyvals_.end(), "Keyval not found for Datatype: %d", key);
162
163     smpi_key_elem& elem = elem_it->second;
164     int ret             = MPI_SUCCESS;
165     int flag            = 0;
166     void* value_out     = nullptr;
167     if (elem.copy_fn.type_copy_fn == MPI_TYPE_DUP_FN) {
168       value_out = value;
169       flag      = 1;
170     } else if (elem.copy_fn.type_copy_fn != MPI_NULL_COPY_FN) {
171       ret = elem.copy_fn.type_copy_fn(datatype, key, elem.extra_state, value, &value_out, &flag);
172     }
173     if (ret != MPI_SUCCESS)
174       return ret;
175
176     if (elem.copy_fn.type_copy_fn_fort != MPI_NULL_COPY_FN) {
177       value_out = xbt_new(int, 1);
178       if (*(int*)*elem.copy_fn.type_copy_fn_fort == 1) { // MPI_TYPE_DUP_FN
179         memcpy(value_out, value, sizeof(int));
180         flag = 1;
181       } else { // not null, nor dup
182         elem.copy_fn.type_copy_fn_fort(datatype, key, elem.extra_state, value, value_out, &flag, &ret);
183       }
184       if (ret != MPI_SUCCESS) {
185         xbt_free(value_out);
186         return ret;
187       }
188     }
189     if (flag) {
190       elem.refcount++;
191       attributes().try_emplace(key, value_out);
192     }
193   }
194   return MPI_SUCCESS;
195 }
196
197 int Datatype::clone(MPI_Datatype* type){
198   int ret;
199   *type = new Datatype(this, &ret);
200   return ret;
201 }
202
203 void Datatype::ref()
204 {
205   refcount_++;
206 }
207
208 void Datatype::unref(MPI_Datatype datatype)
209 {
210   if (datatype->refcount_ > 0)
211     datatype->refcount_--;
212
213   if (datatype->refcount_ == 0 && not(datatype->flags_ & DT_FLAG_PREDEFINED))
214     delete datatype;
215 }
216
217 void Datatype::commit()
218 {
219   flags_ |= DT_FLAG_COMMITED;
220 }
221
222 bool Datatype::is_valid() const
223 {
224   return (flags_ & DT_FLAG_COMMITED);
225 }
226
227 bool Datatype::is_basic() const
228 {
229   return (flags_ & DT_FLAG_BASIC);
230 }
231
232 MPI_Datatype Datatype::decode(const std::string& datatype_id)
233 {
234   return id2type_lookup.find(datatype_id)->second;
235 }
236
237 void Datatype::addflag(int flag){
238   flags_ &= flag;
239 }
240
241 int Datatype::extent(MPI_Aint* lb, MPI_Aint* extent) const
242 {
243   *lb = lb_;
244   *extent = ub_ - lb_;
245   return MPI_SUCCESS;
246 }
247
248 void Datatype::get_name(char* name, int* length) const
249 {
250   *length = static_cast<int>(name_.length());
251   if (not name_.empty()) {
252     name_.copy(name, *length);
253     name[*length] = '\0';
254   }
255 }
256
257 void Datatype::set_name(const char* name)
258 {
259   name_ = name;
260 }
261
262 int Datatype::pack(const void* inbuf, int incount, void* outbuf, int outcount, int* position, const Comm*)
263 {
264   if (outcount - *position < incount*static_cast<int>(size_))
265     return MPI_ERR_OTHER;
266   Datatype::copy(inbuf, incount, this, static_cast<char*>(outbuf) + *position, outcount, MPI_CHAR);
267   *position += incount * size_;
268   return MPI_SUCCESS;
269 }
270
271 int Datatype::unpack(const void* inbuf, int insize, int* position, void* outbuf, int outcount, const Comm*)
272 {
273   if (outcount*static_cast<int>(size_)> insize)
274     return MPI_ERR_OTHER;
275   Datatype::copy(static_cast<const char*>(inbuf) + *position, insize, MPI_CHAR, outbuf, outcount, this);
276   *position += outcount * size_;
277   return MPI_SUCCESS;
278 }
279
280 int Datatype::get_contents(int max_integers, int max_addresses, int max_datatypes, int* array_of_integers,
281                            MPI_Aint* array_of_addresses, MPI_Datatype* array_of_datatypes) const
282 {
283   if(contents_==nullptr)
284     return MPI_ERR_ARG;
285   if (static_cast<unsigned>(max_integers) < contents_->integers_.size())
286     return MPI_ERR_COUNT;
287   std::copy(begin(contents_->integers_), end(contents_->integers_), array_of_integers);
288   if (static_cast<unsigned>(max_addresses) < contents_->addresses_.size())
289     return MPI_ERR_COUNT;
290   std::copy(begin(contents_->addresses_), end(contents_->addresses_), array_of_addresses);
291   if (static_cast<unsigned>(max_datatypes) < contents_->datatypes_.size())
292     return MPI_ERR_COUNT;
293   std::copy(begin(contents_->datatypes_), end(contents_->datatypes_), array_of_datatypes);
294   for (auto& datatype : contents_->datatypes_)
295     datatype->ref();
296   return MPI_SUCCESS;
297 }
298
299 int Datatype::get_envelope(int* num_integers, int* num_addresses, int* num_datatypes, int* combiner) const
300 {
301   if(contents_==nullptr){
302     *num_integers = 0;
303     *num_addresses = 0;
304     *num_datatypes = 0;
305     *combiner = MPI_COMBINER_NAMED;
306   }else{
307     *num_integers  = contents_->integers_.size();
308     *num_addresses = contents_->addresses_.size();
309     *num_datatypes = contents_->datatypes_.size();
310     *combiner = contents_->combiner_;
311   }
312   return MPI_SUCCESS;
313 }
314
315 int Datatype::copy(const void* sendbuf, int sendcount, MPI_Datatype sendtype, void* recvbuf, int recvcount,
316                    MPI_Datatype recvtype)
317 {
318   // FIXME Handle the case of a partial shared malloc.
319
320   smpi_switch_data_segment(simgrid::s4u::Actor::self());
321
322   /* First check if we really have something to do */
323   size_t offset = 0;
324   std::vector<std::pair<size_t, size_t>> private_blocks;
325   if(smpi_is_shared(sendbuf,private_blocks,&offset)
326        && (private_blocks.size()==1
327        && (private_blocks[0].second - private_blocks[0].first)==(unsigned long)(sendcount * sendtype->get_extent()))){
328     XBT_VERB("sendbuf is shared. Ignoring copies");
329     return 0;
330   }
331   if(smpi_is_shared(recvbuf,private_blocks,&offset)
332        && (private_blocks.size()==1
333        && (private_blocks[0].second - private_blocks[0].first)==(unsigned long)(recvcount * recvtype->get_extent()))){
334     XBT_VERB("recvbuf is shared. Ignoring copies");
335     return 0;
336   }
337
338   if (recvcount > 0 && recvbuf != sendbuf) {
339     sendcount *= sendtype->size();
340     recvcount *= recvtype->size();
341     int count = sendcount < recvcount ? sendcount : recvcount;
342     XBT_DEBUG("Copying %d bytes from %p to %p", count, sendbuf, recvbuf);
343     if (not(sendtype->flags() & DT_FLAG_DERIVED) && not(recvtype->flags() & DT_FLAG_DERIVED)) {
344       if (not smpi_process()->replaying() && count > 0)
345         memcpy(recvbuf, sendbuf, count);
346     } else if (not(sendtype->flags() & DT_FLAG_DERIVED)) {
347       recvtype->unserialize(sendbuf, recvbuf, count / recvtype->size(), MPI_REPLACE);
348     } else if (not(recvtype->flags() & DT_FLAG_DERIVED)) {
349       sendtype->serialize(sendbuf, recvbuf, count / sendtype->size());
350     } else if(sendtype->size() != 0 && recvtype->size() != 0){
351       void * buf_tmp = xbt_malloc(count);
352       sendtype->serialize( sendbuf, buf_tmp,count/sendtype->size());
353       recvtype->unserialize( buf_tmp, recvbuf,count/recvtype->size(), MPI_REPLACE);
354       xbt_free(buf_tmp);
355     }
356   }
357
358   return sendcount > recvcount ? MPI_ERR_TRUNCATE : MPI_SUCCESS;
359 }
360
361 //Default serialization method : memcpy.
362 void Datatype::serialize(const void* noncontiguous_buf, void* contiguous_buf, int count)
363 {
364   auto* contiguous_buf_char          = static_cast<char*>(contiguous_buf);
365   const auto* noncontiguous_buf_char = static_cast<const char*>(noncontiguous_buf) + lb_;
366   memcpy(contiguous_buf_char, noncontiguous_buf_char, count*size_);
367 }
368
369 void Datatype::unserialize(const void* contiguous_buf, void *noncontiguous_buf, int count, MPI_Op op){
370   const auto* contiguous_buf_char = static_cast<const char*>(contiguous_buf);
371   auto* noncontiguous_buf_char    = static_cast<char*>(noncontiguous_buf) + lb_;
372   int n=count;
373   if(op!=MPI_OP_NULL)
374     op->apply( contiguous_buf_char, noncontiguous_buf_char, &n, this);
375 }
376
377 int Datatype::create_contiguous(int count, MPI_Datatype old_type, MPI_Aint lb, MPI_Datatype* new_type){
378   if(old_type->flags_ & DT_FLAG_DERIVED){
379     //handle this case as a hvector with stride equals to the extent of the datatype
380     return create_hvector(count, 1, old_type->get_extent(), old_type, new_type);
381   }
382   if(count>0)
383     *new_type = new Type_Contiguous(count * old_type->size(), lb, lb + count * old_type->size(),
384                                    DT_FLAG_DERIVED, count, old_type);
385   else
386     *new_type = new Datatype(count * old_type->size(), lb, lb + count * old_type->size(),0);
387   return MPI_SUCCESS;
388 }
389
390 int Datatype::create_vector(int count, int block_length, int stride, MPI_Datatype old_type, MPI_Datatype* new_type)
391 {
392   int retval;
393   if (block_length<0)
394     return MPI_ERR_ARG;
395   MPI_Aint lb = 0;
396   MPI_Aint ub = 0;
397   if(count>0){
398     lb=old_type->lb();
399     ub=((count-1)*stride+block_length-1)*old_type->get_extent()+old_type->ub();
400   }
401   if(old_type->flags() & DT_FLAG_DERIVED || stride != block_length){
402     *new_type = new Type_Vector(old_type->size() * block_length * count, lb, ub, DT_FLAG_DERIVED, count, block_length,
403                                 stride, old_type);
404     retval=MPI_SUCCESS;
405   }else{
406     /* in this situation the data are contiguous thus it's not required to serialize and unserialize it*/
407     *new_type =
408         new Datatype(old_type->size() * block_length * count, 0,
409                      old_type->size() * ((count - 1) * stride + block_length), DT_FLAG_CONTIGUOUS | DT_FLAG_DERIVED);
410     const std::array<int, 3> ints = {{count, block_length, stride}};
411     (*new_type)->set_contents(MPI_COMBINER_VECTOR, 3, ints.data(), 0, nullptr, 1, &old_type);
412     retval=MPI_SUCCESS;
413   }
414   return retval;
415 }
416
417
418 int Datatype::create_hvector(int count, int block_length, MPI_Aint stride, MPI_Datatype old_type, MPI_Datatype* new_type)
419 {
420   int retval;
421   if (block_length<0)
422     return MPI_ERR_ARG;
423   MPI_Aint lb = 0;
424   MPI_Aint ub = 0;
425   if(count>0){
426     lb=old_type->lb();
427     ub=((count-1)*stride)+(block_length-1)*old_type->get_extent()+old_type->ub();
428   }
429   if(old_type->flags() & DT_FLAG_DERIVED || stride != block_length*old_type->get_extent()){
430     *new_type = new Type_Hvector(old_type->size() * block_length * count, lb, ub, DT_FLAG_DERIVED, count, block_length,
431                                  stride, old_type);
432     retval=MPI_SUCCESS;
433   }else{
434     /* in this situation the data are contiguous thus it's not required to serialize and unserialize it*/
435     *new_type = new Datatype(old_type->size() * block_length * count, 0, old_type->size() * block_length * count,
436                              DT_FLAG_CONTIGUOUS | DT_FLAG_DERIVED);
437     const std::array<int, 2> ints = {{count, block_length}};
438     (*new_type)->set_contents(MPI_COMBINER_HVECTOR, 2, ints.data(), 1, &stride, 1, &old_type);
439     retval=MPI_SUCCESS;
440   }
441   return retval;
442 }
443
444 int Datatype::create_indexed(int count, const int* block_lengths, const int* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
445   int size = 0;
446   bool contiguous=true;
447   MPI_Aint lb = 0;
448   MPI_Aint ub = 0;
449   if(count>0){
450     lb=indices[0]*old_type->get_extent();
451     ub=indices[0]*old_type->get_extent() + block_lengths[0]*old_type->ub();
452   }
453
454   for (int i = 0; i < count; i++) {
455     if (block_lengths[i] < 0)
456       return MPI_ERR_ARG;
457     size += block_lengths[i];
458
459     if(indices[i]*old_type->get_extent()+old_type->lb()<lb)
460       lb = indices[i]*old_type->get_extent()+old_type->lb();
461     if(indices[i]*old_type->get_extent()+block_lengths[i]*old_type->ub()>ub)
462       ub = indices[i]*old_type->get_extent()+block_lengths[i]*old_type->ub();
463
464     if ( (i< count -1) && (indices[i]+block_lengths[i] != indices[i+1]) )
465       contiguous=false;
466   }
467   if(old_type->flags_ & DT_FLAG_DERIVED)
468     contiguous=false;
469
470   if (not contiguous) {
471     *new_type = new Type_Indexed(size * old_type->size(),lb,ub,
472                                  DT_FLAG_DERIVED|DT_FLAG_DATA, count, block_lengths, indices, old_type);
473   }else{
474     Datatype::create_contiguous(size, old_type, lb, new_type);
475   }
476   return MPI_SUCCESS;
477 }
478
479 int Datatype::create_hindexed(int count, const int* block_lengths, const MPI_Aint* indices, MPI_Datatype old_type, MPI_Datatype* new_type){
480   int size = 0;
481   bool contiguous=true;
482   MPI_Aint lb = 0;
483   MPI_Aint ub = 0;
484   if(count>0){
485     lb=indices[0] + old_type->lb();
486     ub=indices[0] + block_lengths[0]*old_type->ub();
487   }
488   for (int i = 0; i < count; i++) {
489     if (block_lengths[i] < 0)
490       return MPI_ERR_ARG;
491     size += block_lengths[i];
492
493     if(indices[i]+old_type->lb()<lb)
494       lb = indices[i]+old_type->lb();
495     if(indices[i]+block_lengths[i]*old_type->ub()>ub)
496       ub = indices[i]+block_lengths[i]*old_type->ub();
497
498     if ((i < count - 1) && (indices[i] + static_cast<MPI_Aint>(old_type->size()) * block_lengths[i] != indices[i + 1]))
499       contiguous=false;
500   }
501   if (old_type->flags_ & DT_FLAG_DERIVED || lb!=0)
502     contiguous=false;
503
504   if (not contiguous) {
505     *new_type = new Type_Hindexed(size * old_type->size(),lb,ub,
506                                    DT_FLAG_DERIVED|DT_FLAG_DATA, count, block_lengths, indices, old_type);
507   }else{
508     Datatype::create_contiguous(size, old_type, lb, new_type);
509   }
510   return MPI_SUCCESS;
511 }
512
513 int Datatype::create_struct(int count, const int* block_lengths, const MPI_Aint* indices, const MPI_Datatype* old_types, MPI_Datatype* new_type){
514   size_t size = 0;
515   bool contiguous=true;
516   size = 0;
517   MPI_Aint lb = 0;
518   MPI_Aint ub = 0;
519   if(count>0){
520     lb=indices[0] + old_types[0]->lb();
521     ub=indices[0] + block_lengths[0]*old_types[0]->ub();
522   }
523   bool forced_lb=false;
524   bool forced_ub=false;
525   for (int i = 0; i < count; i++) {
526     if (block_lengths[i]<0)
527       return MPI_ERR_ARG;
528     if (old_types[i]->flags_ & DT_FLAG_DERIVED)
529       contiguous=false;
530
531     size += block_lengths[i]*old_types[i]->size();
532     if (old_types[i]==MPI_LB){
533       lb=indices[i];
534       forced_lb=true;
535     }
536     if (old_types[i]==MPI_UB){
537       ub=indices[i];
538       forced_ub=true;
539     }
540
541     if (not forced_lb && indices[i] + old_types[i]->lb() < lb)
542       lb = indices[i];
543     if (not forced_ub && indices[i] + block_lengths[i] * old_types[i]->ub() > ub)
544       ub = indices[i]+block_lengths[i]*old_types[i]->ub();
545
546     if ((i < count - 1) &&
547         (indices[i] + static_cast<MPI_Aint>(old_types[i]->size() * block_lengths[i]) != indices[i + 1]))
548       contiguous=false;
549   }
550   if (not contiguous) {
551     *new_type = new Type_Struct(size, lb,ub, DT_FLAG_DERIVED|DT_FLAG_DATA,
552                                 count, block_lengths, indices, old_types);
553   }else{
554     Datatype::create_contiguous(size, MPI_CHAR, lb, new_type);
555   }
556   return MPI_SUCCESS;
557 }
558
559 int Datatype::create_subarray(int ndims, const int* array_of_sizes,
560                              const int* array_of_subsizes, const int* array_of_starts,
561                              int order, MPI_Datatype oldtype, MPI_Datatype *newtype){
562   MPI_Datatype tmp;
563
564   for (int i = 0; i < ndims; i++) {
565     if (array_of_subsizes[i] > array_of_sizes[i]){
566       XBT_WARN("subarray : array_of_subsizes > array_of_sizes for dim %d",i);
567       return MPI_ERR_ARG;
568     }
569     if (array_of_starts[i] + array_of_subsizes[i] > array_of_sizes[i]){
570       XBT_WARN("subarray : array_of_starts + array_of_subsizes > array_of_sizes for dim %d",i);
571       return MPI_ERR_ARG;
572     }
573   }
574
575   MPI_Aint extent = oldtype->get_extent();
576
577   int i;
578   int step;
579   int end;
580   if( order==MPI_ORDER_C ) {
581       i = ndims - 1;
582       step = -1;
583       end = -1;
584   } else {
585       i = 0;
586       step = 1;
587       end = ndims;
588   }
589
590   MPI_Aint size = (MPI_Aint)array_of_sizes[i] * (MPI_Aint)array_of_sizes[i+step];
591   MPI_Aint lb = (MPI_Aint)array_of_starts[i] + (MPI_Aint)array_of_starts[i+step] *(MPI_Aint)array_of_sizes[i];
592
593   create_vector( array_of_subsizes[i+step], array_of_subsizes[i], array_of_sizes[i],
594                                oldtype, newtype );
595
596   tmp = *newtype;
597
598   for( i += 2 * step; i != end; i += step ) {
599       create_hvector( array_of_subsizes[i], 1, size * extent,
600                                     tmp, newtype );
601       unref(tmp);
602       lb += size * array_of_starts[i];
603       size *= array_of_sizes[i];
604       tmp = *newtype;
605   }
606
607   const MPI_Aint lbs = lb * extent;
608   const int sizes    = 1;
609   //handle LB and UB with a resized call
610   create_hindexed(1, &sizes, &lbs, tmp, newtype);
611   unref(tmp);
612
613   tmp = *newtype;
614   create_resized(tmp, 0, extent, newtype);
615
616   unref(tmp);
617   return MPI_SUCCESS;
618 }
619
620 int Datatype::create_resized(MPI_Datatype oldtype,MPI_Aint lb, MPI_Aint extent, MPI_Datatype *newtype){
621   const std::array<int, 3> blocks         = {{1, 1, 1}};
622   const std::array<MPI_Aint, 3> disps     = {{lb, 0, lb + extent}};
623   const std::array<MPI_Datatype, 3> types = {{MPI_LB, oldtype, MPI_UB}};
624
625   *newtype = new simgrid::smpi::Type_Struct(oldtype->size(), lb, lb + extent, DT_FLAG_DERIVED, 3, blocks.data(),
626                                             disps.data(), types.data());
627
628   (*newtype)->addflag(~DT_FLAG_COMMITED);
629   return MPI_SUCCESS;
630 }
631
632 Datatype* Datatype::f2c(int id)
633 {
634   return static_cast<Datatype*>(F2C::f2c(id));
635 }
636
637 } // namespace simgrid::smpi