|
Ublas : |
Subject: Re: [ublas] [PATCH 3/3] boost::ublas increasing the range of BLAS level 3 benchmarks
From: palik imre (imre_palik_at_[hidden])
Date: 2016-03-20 04:09:10
Sent request to https://github.com/uBLAS/ublas/tree/feature/ublas00004_simd_gemm
Why doesn't it gets sent to the mailing list like the one about the week equality check?
--------------------------------------------
On Mon, 14/3/16, Nasos Iliopoulos <nasos_i_at_[hidden]> wrote:
Subject: Re: [ublas] [PATCH 3/3] boost::ublas increasing the range of BLAS level 3 benchmarks
To: ublas_at_[hidden]
Date: Monday, 14 March, 2016, 16:12
Only in exceptional cases we make pull requests or
changes in the
master . Master only merges off develop ( that in turn
merges off
feature/bug branches). So the
https://github.com/uBLAS/ublas/tree/feature/ublas00004_simd_gemm
is
the correct branch to request a pull.
Pull requests go to https://github.com/uBLAS/ublas
and NOT
https://github.com/boostorg/ublas).
I see the pull request in the
boostorg repo, so please perform it in the ublas repo. I
need to
clarify this in the wiki because probably it is not very
obvious.
-Nasos
On 03/13/2016 02:26 PM,
palik imre
wrote:
A bit of confusion here.
I created
a
fork of the feature branch you sent, as I
didn't have the
rights to push there. Then I sent a pull request
for that.
Should I
fork the master instead?
Thanks,
Imre
On
Sunday, 13
March 2016, 19:03, palik imre
<imre_palik_at_[hidden]>
wrote:
Results
for low dimmension. More data
would exceed
mailing list limits:
#Â
m original: t1Â Â MFLOPS original:
t1Â Â Â MFLOPSÂ Â
Diff nrm3Â gemm:Â Â t2Â Â Â
MFLOPSÂ Â Diff nrm4
mixed:Â Â t2Â Â Â MFLOPSÂ Â Diff
nrm5
 1  2.1263e-07  9.40601Â
1.32802e-07Â Â Â Â
15.06Â Â Â Â Â Â Â Â Â Â 0
1.36006e-07Â Â
14.7052Â Â Â Â Â Â Â Â Â Â 0
6.31318e-07Â Â
3.16798Â Â Â Â Â Â Â Â Â Â 0
 2 2.28189e-07  70.1173Â
1.37767e-07Â Â
116.138Â Â Â Â Â Â Â Â Â Â 0
1.59801e-07Â Â
100.125Â Â Â Â Â Â Â Â Â Â 0Â Â
6.653e-07Â Â
24.0493Â Â Â Â Â Â Â Â Â Â 0
 3   2.649e-07  203.851 Â
1.5541e-07Â Â
347.468Â Â Â Â Â Â Â Â Â Â 0
1.54267e-07Â Â
350.042Â Â Â Â Â Â Â Â Â Â 0
6.98766e-07Â Â
77.2791Â Â Â Â Â Â Â Â Â Â 0
 4 3.35269e-07  381.783 Â
2.4183e-07Â Â
529.297Â Â Â Â Â Â Â Â Â Â 0
2.12891e-07Â Â
601.247Â Â Â Â Â Â Â Â Â Â 0
6.65688e-07Â Â
192.282Â Â Â Â Â Â Â Â Â Â 0
 5 3.53868e-07  706.478Â
2.30977e-07Â Â
1082.36Â Â Â Â Â Â Â Â Â Â 0
2.53215e-07Â Â
987.303Â Â Â Â Â Â Â Â Â Â 0
7.07933e-07Â Â
353.141Â Â Â Â Â Â Â Â Â Â 0
 6  4.2987e-07  1004.95Â
2.59713e-07Â Â
1663.37Â Â Â Â Â Â Â Â Â Â 0
2.54867e-07Â Â Â Â Â
1695Â Â Â Â Â Â Â Â Â Â 0
8.17448e-07Â Â 528.474Â Â Â Â Â Â Â Â Â Â
0
 7 5.39621e-07  1271.26Â
4.51043e-07Â Â
1520.92 7.98975e-09 5.12948e-07Â Â
1337.37
7.98975e-09 8.76363e-07Â Â
782.781Â Â Â Â Â Â Â Â Â Â 0
 8 6.18993e-07   1654.3Â
6.38988e-07Â Â
1602.53 4.17673e-09 6.37931e-07Â Â
1605.19
4.17673e-09 8.92556e-07Â Â
1147.27Â Â Â Â Â Â Â Â Â Â 0
 9 7.73683e-07  1884.49Â
7.26336e-07Â Â
2007.34 3.30697e-09 8.00656e-07Â Â
1821.01
3.30697e-09 1.09762e-06Â Â
1328.33Â Â Â Â Â Â Â Â Â Â 0
 10 9.27569e-07  2156.17Â
8.31827e-07Â Â
2404.35 1.94317e-09 8.72131e-07Â Â
2293.23
1.94317e-09 1.16572e-06Â Â
1715.68Â Â Â Â Â Â Â Â Â Â 0
 11 1.13882e-06   2337.5Â
1.03275e-06Â Â
2577.58 1.27501e-09 1.08775e-06Â Â
2447.25
1.27501e-09 1.16439e-06Â Â
2286.17Â Â Â Â Â Â Â Â Â Â 0
 12 1.26427e-06  2733.59Â
1.40013e-06Â Â
2468.34 8.50076e-10 1.39562e-06Â Â
2476.32
8.50076e-10 1.01202e-06Â Â
3414.97Â Â Â Â Â Â Â Â Â Â 0
 13  1.5751e-06  2789.66Â
1.64811e-06Â Â
2666.09 5.39864e-10 1.66862e-06Â Â
2633.32
5.39864e-10 1.61517e-06Â Â
2720.45Â Â Â Â Â Â Â Â Â Â 0
 14 1.79595e-06  3055.77Â
1.89937e-06Â Â
2889.37 4.08632e-10Â 1.6485e-06Â Â
3329.09Â Â Â Â Â Â Â Â Â Â 0
1.65016e-06Â Â
3325.73Â Â Â Â Â Â Â Â Â Â 0
 15 2.14056e-06  3153.37Â
2.24248e-06Â Â
3010.06 2.73316e-10Â 1.6875e-06Â Â
3999.99Â Â Â Â Â Â Â Â Â Â 0
1.80164e-06Â Â
3746.59Â Â Â Â Â Â Â Â Â Â 0
 16 2.38996e-06  3427.67Â
2.63386e-06Â Â
3110.27 2.30152e-10 1.74627e-06Â Â
4691.14Â Â Â Â Â Â Â Â Â Â 0
1.91648e-06Â Â
4274.49Â Â Â Â Â Â Â Â Â Â 0
 17 2.93315e-06  3349.98Â
3.08031e-06Â Â
3189.94 1.85538e-10 2.17697e-06Â Â
4513.62Â Â Â Â Â Â Â Â Â Â 0
2.13505e-06Â Â
4602.23Â Â Â Â Â Â Â Â Â Â 0
 18  3.3771e-06  3453.85Â
3.23863e-06Â Â
3601.52 1.20251e-10 2.23225e-06Â Â
5225.23Â Â Â Â Â Â Â Â Â Â 0
2.36877e-06Â Â
4924.07Â Â Â Â Â Â Â Â Â Â 0
 19 4.19699e-06  3268.53Â
4.02621e-06Â Â
3407.17 1.07796e-10
2.29651e-06Â Â Â
5973.4Â Â Â Â Â Â Â Â Â Â 0
2.44714e-06Â Â
5605.72Â Â Â Â Â Â Â Â Â Â 0
 20 4.27777e-06  3740.27Â
4.86115e-06Â Â Â
3291.4 8.37665e-11 2.26798e-06Â Â
7054.74Â Â Â Â Â Â Â Â Â Â 0
2.44016e-06Â Â
6556.96Â Â Â Â Â Â Â Â Â Â 0
 21 5.58038e-06  3319.13Â
5.51606e-06Â Â
3357.83 5.93714e-11 2.61705e-06Â Â
7077.43Â Â Â Â Â Â Â Â Â Â 0
2.90197e-06Â Â
6382.56Â Â Â Â Â Â Â Â Â Â 0
 22 5.46208e-06  3898.88Â
5.50258e-06Â Â
3870.19 5.76987e-11 2.85448e-06Â Â
7460.56Â Â Â Â Â Â Â Â Â Â 0
3.09923e-06Â Â
6871.39Â Â Â Â Â Â Â Â Â Â 0
 23 7.26813e-06  3348.04Â
6.48407e-06Â Â
3752.89 4.47169e-11 3.03986e-06Â Â
8004.98Â Â Â Â Â Â Â Â Â Â 0
3.16566e-06Â Â
7686.86Â Â Â Â Â Â Â Â Â Â 0
 24 6.56421e-06  4211.93Â
7.20581e-06Â Â Â
3836.9 3.61275e-11 2.84288e-06Â Â
9725.35Â Â Â Â Â Â Â Â Â Â 0
2.81577e-06Â Â
9818.99Â Â Â Â Â Â Â Â Â Â 0
 25 7.97135e-06  3920.29Â
7.80654e-06Â Â
4003.06 3.02957e-11 4.04575e-06Â Â
7724.16Â Â Â Â Â Â Â Â Â Â 0
4.15001e-06Â Â
7530.11Â Â Â Â Â Â Â Â Â Â 0
 26 8.59272e-06   4090.9Â
8.46934e-06Â Â Â
4150.5 2.53217e-11Â 4.1795e-06Â Â
8410.58Â Â Â Â Â Â Â Â Â Â 0
4.36958e-06Â Â
8044.71Â Â Â Â Â Â Â Â Â Â 0
 27 1.05527e-05  3730.41Â
9.66865e-06Â Â
4071.51 1.97479e-11 4.24268e-06Â Â
9278.57Â Â Â Â Â Â Â Â Â Â 0
4.64476e-06Â Â
8475.37Â Â Â Â Â Â Â Â Â Â 0
 28 9.77679e-06  4490.63 Â
1.0918e-05Â Â
4021.26 1.71505e-11 4.41728e-06Â Â
9939.14Â Â Â Â Â Â Â Â Â Â 0
4.55165e-06Â Â
9645.73Â Â Â Â Â Â Â Â Â Â 0
 29 1.23574e-05  3947.28Â
1.15308e-05Â Â
4230.22 1.54399e-11 4.96383e-06Â Â
9826.69Â Â Â Â Â Â Â Â Â Â 0
5.27042e-06Â Â
9255.05Â Â Â Â Â Â Â Â Â Â 0
 30 1.25312e-05  4309.24Â
1.23192e-05Â Â Â
4383.4 1.38837e-11 5.36616e-06Â Â
10063.1Â Â Â Â Â Â Â Â Â Â 0
5.57707e-06Â Â
9682.51Â Â Â Â Â Â Â Â Â Â 0
 31 1.41019e-05  4225.11Â
1.41554e-05Â Â
4209.15 1.12822e-11 5.56749e-06Â Â
10701.8Â Â Â Â Â Â Â Â Â Â 0
5.87983e-06Â Â
10133.3Â Â Â Â Â Â Â Â Â Â 0
 32 1.44935e-05  4521.76Â
1.74419e-05Â Â
3757.38Â 9.5502e-12 5.91291e-06Â Â
11083.5Â Â Â Â Â Â Â Â Â Â 0
6.07622e-06Â Â
10785.7Â Â Â Â Â Â Â Â Â Â 0
 33 1.68922e-05  4254.86Â
1.62224e-05Â Â
4430.55 8.00562e-12 6.51645e-06Â Â
11029.6Â Â Â Â Â Â Â Â Â Â 0
6.62821e-06Â Â
10843.7Â Â Â Â Â Â Â Â Â Â 0
 34 1.73001e-05   4543.8Â
1.68924e-05Â Â
4653.46 7.54927e-12 6.83433e-06Â Â
11501.9Â Â Â Â Â Â Â Â Â Â 0
6.95343e-06Â Â
11304.9Â Â Â Â Â Â Â Â Â Â 0
 35 2.07166e-05   4139.2Â
2.15962e-05Â Â
3970.61 6.52939e-12 7.06462e-06Â Â
12137.9Â Â Â Â Â Â Â Â Â Â 0
7.53811e-06Â Â
11375.5Â Â Â Â Â Â Â Â Â Â 0
 36 1.98326e-05  4704.97Â
2.13473e-05Â Â
4371.14 5.68874e-12Â Â
6.703e-06Â Â
13920.9Â Â Â Â Â Â Â Â Â Â 0
6.99365e-06Â Â
13342.4Â Â Â Â Â Â Â Â Â Â 0
 37  2.3838e-05  4249.78Â
2.23655e-05Â Â
4529.56 5.11318e-12 8.87253e-06Â Â
11417.9Â Â Â Â Â Â Â Â Â Â 0
9.13862e-06Â Â
11085.5Â Â Â Â Â Â Â Â Â Â 0
 38 2.35903e-05  4652.09Â
2.48122e-05Â Â
4422.99 4.71306e-12
9.24238e-06Â Â Â Â
11874Â Â Â Â Â Â Â Â Â Â 0
9.27922e-06Â Â
11826.9Â Â Â Â Â Â Â Â Â Â 0
 39 2.79913e-05  4238.39Â
2.64576e-05Â Â
4484.09 4.20714e-12 9.68511e-06Â Â
12249.5Â Â Â Â Â Â Â Â Â Â 0
9.95689e-06Â Â
11915.2Â Â Â Â Â Â Â Â Â Â 0
 40 2.60131e-05   4920.6 Â
2.9098e-05Â Â
4398.93 3.42002e-12 9.80308e-06Â Â
13057.1Â Â Â Â Â Â Â Â Â Â 0
1.04198e-05Â Â
12284.3Â Â Â Â Â Â Â Â Â Â 0
 41 3.13419e-05  4398.01Â
3.03942e-05Â Â
4535.14 3.13757e-12 1.07587e-05Â Â
12812.2Â Â Â Â Â Â Â Â Â Â 0
1.10016e-05Â Â
12529.3Â Â Â Â Â Â Â Â Â Â 0
 42 3.10015e-05  4779.64Â
3.20343e-05Â Â
4625.54 2.91245e-12 1.09989e-05Â Â
13471.9Â Â Â Â Â Â Â Â Â Â 0
1.16031e-05Â Â
12770.4Â Â Â Â Â Â Â Â Â Â 0
 43  3.6527e-05  4353.33Â
3.49908e-05Â Â
4544.46 2.71446e-12 1.13164e-05Â Â
14051.7Â Â Â Â Â Â Â Â Â Â 0
1.20516e-05Â Â
13194.4Â Â Â Â Â Â Â Â Â Â 0
 44 3.36654e-05  5060.62Â
3.86435e-05Â Â
4408.71 2.49076e-12 1.16151e-05Â Â
14667.8Â Â Â Â Â Â Â Â Â Â 0
1.21377e-05Â Â
14036.2Â Â Â Â Â Â Â Â Â Â 0
 45 3.95282e-05  4610.63Â
3.98562e-05Â Â
4572.69 2.12037e-12 1.26784e-05Â Â
14374.8Â Â Â Â Â Â Â Â Â Â 0
1.32723e-05Â Â
13731.6Â Â Â Â Â Â Â Â Â Â 0
 46 3.96351e-05   4911.6Â
4.17105e-05Â Â
4667.22 1.96734e-12 1.27302e-05Â Â
15292.2Â Â Â Â Â Â Â Â Â Â 0
1.34346e-05Â Â
14490.3Â Â Â Â Â Â Â Â Â Â 0
 47 4.63424e-05  4480.69Â
4.50811e-05Â Â
4606.05 1.77515e-12 1.33133e-05Â Â
15596.9Â Â Â Â Â Â Â Â Â Â 0
1.39354e-05Â Â
14900.7Â Â Â Â Â Â Â Â Â Â 0
 48 4.31748e-05  5122.99 Â
5.0325e-05Â Â
4395.11 1.75073e-12 1.32491e-05Â Â
16694.3Â Â Â Â Â Â Â Â Â Â 0Â
1.3501e-05Â Â
16382.8Â Â Â Â Â Â Â Â Â Â 0
 49 4.93001e-05  4772.77Â
5.11402e-05Â Â
4601.03 1.48788e-12Â 1.6222e-05Â Â
14504.9Â Â Â Â Â Â Â Â Â Â 0
1.72531e-05Â Â Â Â
13638Â Â Â Â Â Â Â Â Â Â 0
First
group is legacy axpy_prod(), second
group is
legacy prod(), third group is legacy
prod for
low dimensions, and gemm() for high
dimmension.
fourth group is gemm().
As
the legacy version is expression
template based,
it can possibly provide some further
advantages
when the operations are
chained.
I
put some defines in place, that
would make
possible to force the legacy version
as the
default, as opposed to the runtime
switched
version.
Imre
On Friday, 11
March 2016, 14:21, Nasos
Iliopoulos
<nasos_i_at_[hidden]>
wrote:
Regardless, these are
great figures.
Can you please run them
comparing
the simple uBlas
implementation for
matrices from 2 to 100
with the gemm
based one with a signle
thread? I
wonder when the control
statement
starts to play a
role.
What do you think should
be the plan
to switch from
multi-core to to
single-threaded so as to
not get all
the communication hit
for smaller
matrices?
- Nasos
_______________________________________________
ublas mailing list
ublas_at_[hidden]
http://lists.boost.org/mailman/listinfo.cgi/ublas
Sent to: imre_palik_at_[hidden]
_______________________________________________
ublas mailing list
ublas_at_[hidden]
http://lists.boost.org/mailman/listinfo.cgi/ublas
Sent to: athanasios.iliopoulos.ctr.gr_at_[hidden]
-----Inline Attachment Follows-----
_______________________________________________
ublas mailing list
ublas_at_[hidden]
http://lists.boost.org/mailman/listinfo.cgi/ublas
Sent to: imre_palik_at_[hidden]