Una vez creado el archivo, se procede a correr la prueba:
# mpirun -np 17 ./xhpl
El número de procesos debe ser suficiente para incluir al número dado por las matrices de proceso.
La prueba generará los resultados para los problemas especificados, enviando bloques de información como sigue:
T/V N NB P Q Time Gflops ---------------------------------------------------------------------------- W10L2L2 1000 16 17 1 164.65 4.058e-03 --VVV--VVV--VVV--VVV--VVV--VVV--VVV--VVV--VVV--VVV--VVV--VVV--VVV--VVV--VVV- Max aggregated wall time rfact . . . : 77.71 + Max aggregated wall time pfact . . : 77.61 + Max aggregated wall time mxswp . . : 77.49 Max aggregated wall time update . . : 105.31 + Max aggregated wall time laswp . . : 86.77 Max aggregated wall time up tr sv . : 0.67 ---------------------------------------------------------------------------- ||Ax-b||_oo / ( eps * ||A||_1 * N ) = 0.9621179 ...... PASSED ||Ax-b||_oo / ( eps * ||A||_1 * ||x||_1 ) = 0.0233519 ...... PASSED ||Ax-b||_oo / ( eps * ||A||_oo * ||x||_oo ) = 0.0056416 ...... PASSED
Los datos de interés son N, NB, P y Q que indican las características del problema a resolver; el tiempo de ejecución, y el desempeño en GFLOPS.
Tras realizar las pruebas con los valores especificados, se obtuvieron las siguientes tablas:
Dimensión | Nodos | P | Q | Tiempo (s) | GFLOPS |
650 | 1 | 1 | 1 | 4.97 | 3.698e-02 |
650 | 16 | 2 | 8 | 19.56 | 9.392e-03 |
650 | 16 | 4 | 4 | 22.69 | 8.098e-03 |
650 | 17 | 1 | 17 | 31.95 | 5.750e-03 |
1000 | 1 | 1 | 1 | 127.73 | 5.231e-03 |
1000 | 16 | 2 | 8 | 45.04 | 1.484e-02 |
1000 | 16 | 4 | 4 | 49.47 | 1.351e-02 |
1000 | 17 | 1 | 17 | 73.20 | 9.128e-03 |