Logo AND Algorithmique Numérique Distribuée

Public GIT Repository
reduce size of message sent ..
authorAugustin Degomme <degomme@wasabi>
Wed, 6 Feb 2019 09:40:04 +0000 (10:40 +0100)
committerAugustin Degomme <degomme@wasabi>
Tue, 19 Feb 2019 10:31:18 +0000 (11:31 +0100)
For collectives we have to allocate fake buffers, and these ones may be a bit too large for some small systems (arm)

examples/smpi/replay_multiple_manual_deploy/coll/actions0.txt
examples/smpi/replay_multiple_manual_deploy/coll/actions1.txt
examples/smpi/replay_multiple_manual_deploy/replay_multiple_manual_coll1.tesh
examples/smpi/replay_multiple_manual_deploy/replay_multiple_manual_coll2_st_sr_noise.tesh

index 53c4fd5..c2a90da 100644 (file)
@@ -1,7 +1,7 @@
 0 init
 0 compute 1e9
 0 bcast 1 0 1
 0 init
 0 compute 1e9
 0 bcast 1 0 1
-0 alltoall 134217728 134217728 26 26
+0 alltoall 13421772 13421772 26 26
 0 barrier
 0 reduce 16 0 0 26
 0 finalize
 0 barrier
 0 reduce 16 0 0 26
 0 finalize
index 315e201..5b4789c 100644 (file)
@@ -1,6 +1,6 @@
 1 init
 1 bcast 1 0 1
 1 init
 1 bcast 1 0 1
-1 alltoall 134217728 134217728 26 26
+1 alltoall 13421772 13421772 26 26
 1 barrier
 1 reduce 16 0 0 26
 1 finalize
 1 barrier
 1 reduce 16 0 0 26
 1 finalize
index 72d3cd4..13f842d 100644 (file)
@@ -13,11 +13,11 @@ $ ./replay_multiple_manual ${platfdir}/small_platform_with_routers.xml  ${srcdir
 > [   0.000000] (job_0000@Bourassa) Executing job 0 (smpi_app 'alone')
 > [   0.000000] (rank_0_0@Bourassa) Replaying rank 0 of job 0 (smpi_app 'alone')
 > [   0.000000] (rank_0_1@Fafard) Replaying rank 1 of job 0 (smpi_app 'alone')
 > [   0.000000] (job_0000@Bourassa) Executing job 0 (smpi_app 'alone')
 > [   0.000000] (rank_0_0@Bourassa) Replaying rank 0 of job 0 (smpi_app 'alone')
 > [   0.000000] (rank_0_1@Fafard) Replaying rank 1 of job 0 (smpi_app 'alone')
-> [ 590.549375] (rank_0_0@Bourassa) Simulation time 590.549375
-> [ 590.549375] (rank_0_0@Bourassa) Finished replaying rank 0 of job 0 (smpi_app 'alone')
-> [ 590.549375] (rank_0_1@Fafard) Finished replaying rank 1 of job 0 (smpi_app 'alone')
-> [ 591.549375] (job_0000@Bourassa) Finished job 0 (smpi_app 'alone')
-> [ 591.549375] (maestro@) Simulation finished! Final time: 591.549
+> [  77.645196] (rank_0_0@Bourassa) Simulation time 77.645196
+> [  77.645196] (rank_0_0@Bourassa) Finished replaying rank 0 of job 0 (smpi_app 'alone')
+> [  77.645196] (rank_0_1@Fafard) Finished replaying rank 1 of job 0 (smpi_app 'alone')
+> [  78.645196] (job_0000@Bourassa) Finished job 0 (smpi_app 'alone')
+> [  78.645196] (maestro@) Simulation finished! Final time: 78.6452
 
 p Workload with one coll job (with noise)
 ! timeout 120
 
 p Workload with one coll job (with noise)
 ! timeout 120
@@ -29,10 +29,10 @@ $ ./replay_multiple_manual ${platfdir}/small_platform_with_routers.xml  ${srcdir
 > [   0.000000] (job_0000@Bourassa) Executing job 0 (smpi_app 'alone')
 > [   0.000000] (rank_0_0@Bourassa) Replaying rank 0 of job 0 (smpi_app 'alone')
 > [   0.000000] (rank_0_1@Fafard) Replaying rank 1 of job 0 (smpi_app 'alone')
 > [   0.000000] (job_0000@Bourassa) Executing job 0 (smpi_app 'alone')
 > [   0.000000] (rank_0_0@Bourassa) Replaying rank 0 of job 0 (smpi_app 'alone')
 > [   0.000000] (rank_0_1@Fafard) Replaying rank 1 of job 0 (smpi_app 'alone')
-> [ 590.549375] (rank_0_0@Bourassa) Simulation time 590.549375
-> [ 590.549375] (rank_0_0@Bourassa) Finished replaying rank 0 of job 0 (smpi_app 'alone')
-> [ 590.549375] (rank_0_1@Fafard) Finished replaying rank 1 of job 0 (smpi_app 'alone')
-> [ 591.549375] (job_0000@Bourassa) Finished job 0 (smpi_app 'alone')
-> [ 591.549375] (maestro@) Simulation finished! Final time: 591.549
+> [  77.645196] (rank_0_0@Bourassa) Simulation time 77.645196
+> [  77.645196] (rank_0_0@Bourassa) Finished replaying rank 0 of job 0 (smpi_app 'alone')
+> [  77.645196] (rank_0_1@Fafard) Finished replaying rank 1 of job 0 (smpi_app 'alone')
+> [  78.645196] (job_0000@Bourassa) Finished job 0 (smpi_app 'alone')
+> [  78.645196] (maestro@) Simulation finished! Final time: 78.6452
 
 $ rm -f ${srcdir:=.}/workload_coll1
 
 $ rm -f ${srcdir:=.}/workload_coll1
index 3b996ed..6ae0a9f 100644 (file)
@@ -19,13 +19,13 @@ $ ./replay_multiple_manual ${srcdir:=.}/../../platforms/small_platform_with_rout
 > [   0.000000] (job_0001@Bourassa) Executing job 1 (smpi_app 'job1')
 > [   0.000000] (rank_1_0@Bourassa) Replaying rank 0 of job 1 (smpi_app 'job1')
 > [   0.000000] (rank_1_1@Fafard) Replaying rank 1 of job 1 (smpi_app 'job1')
 > [   0.000000] (job_0001@Bourassa) Executing job 1 (smpi_app 'job1')
 > [   0.000000] (rank_1_0@Bourassa) Replaying rank 0 of job 1 (smpi_app 'job1')
 > [   0.000000] (rank_1_1@Fafard) Replaying rank 1 of job 1 (smpi_app 'job1')
-> [1181.064896] (rank_0_0@Bourassa) Simulation time 1181.064896
-> [1181.064896] (rank_1_0@Bourassa) Finished replaying rank 0 of job 1 (smpi_app 'job1')
-> [1181.064896] (rank_0_0@Bourassa) Finished replaying rank 0 of job 0 (smpi_app 'job0')
-> [1181.064896] (rank_1_1@Fafard) Finished replaying rank 1 of job 1 (smpi_app 'job1')
-> [1181.064896] (rank_0_1@Fafard) Finished replaying rank 1 of job 0 (smpi_app 'job0')
-> [1182.064896] (job_0000@Bourassa) Finished job 0 (smpi_app 'job0')
-> [1182.064896] (job_0001@Bourassa) Finished job 1 (smpi_app 'job1')
-> [1182.064896] (maestro@) Simulation finished! Final time: 1182.06
+> [ 155.256538] (rank_0_0@Bourassa) Simulation time 155.256538
+> [ 155.256538] (rank_0_0@Bourassa) Finished replaying rank 0 of job 0 (smpi_app 'job0')
+> [ 155.256538] (rank_0_1@Fafard) Finished replaying rank 1 of job 0 (smpi_app 'job0')
+> [ 155.256538] (rank_1_0@Bourassa) Finished replaying rank 0 of job 1 (smpi_app 'job1')
+> [ 155.256538] (rank_1_1@Fafard) Finished replaying rank 1 of job 1 (smpi_app 'job1')
+> [ 156.256538] (job_0000@Bourassa) Finished job 0 (smpi_app 'job0')
+> [ 156.256538] (job_0001@Bourassa) Finished job 1 (smpi_app 'job1')
+> [ 156.256538] (maestro@) Simulation finished! Final time: 156.257
 
 $ rm -f ${srcdir:=.}/workload_coll2_same_time_and_resources
 
 $ rm -f ${srcdir:=.}/workload_coll2_same_time_and_resources