Para cada tamaño de problema se tienen, entonces, 4 juegos de resultados, indicando tiempo de resolución y desempeño en GFLOPS.
Para la matriz de coeficientes de , se aprecia que el
mejor tiempo y mejor desempeño se obtienen con un solo
procesador. Esto sugiere, nuevamente, que la complejidad de la
realización del cálculo a este tamaño de problema niega la ventaja de
utilizar más nodos. El mejor desempeño para este tamaño de problema es
de 36.98 MFLOPS. Nótese que, entre las soluciones que emplearon 16 y
17 nodos, la más rápida fue la que utiliza una matriz de procesos de
, siendo incluso más rápida que emplear 17 nodos. Esto
permite ver que la correcta organización de la matriz de procesos es
importante para tener un mejor desempeño, y da la idea de que, para
esta configuración particular, la matriz de
es la que dará
mejor rendimiento.
Con una matriz de coeficientes de
, la situación
cambia radicalmente. En este caso la solución con un procesador es la
más lenta y la que reporta menor rendimiento, y el mejor resultado se
obtiene con 16 nodos en matriz de
, alcanzando para este
problema un rendimiento de 14.84 MFLOPS. Este rendimiento es casi 3
veces superior al alcanzado con un solo procesador, que es de 5.23
MFLOPS.
Cabe mencionar nuevamente que utilizando 17 nodos, debido a la organización menos eficiente de la matriz de procesos, el rendimiento fue menor, únicamente de 9.12 MFLOPS.
En este momento resulta de interés comentar que, comparando el
desempeño de la computadora más rápida del mundo, a 7226 GFLOPS,
contra el mejor resultado obtenido por el cluster, de 14.84
MFLOPS, resulta que el cluster es 486927 veces más lento que
la computadora ASCI White. Esta comparación se realizó utilizando el
tamaño de matriz de
, que es el utilizado en
http://www.top500.org para comparar el desempeño de las
supercomputadoras más rápidas.
Si bien la diferencia de desempeño es casi cómica, es también de interés el hecho de que efectivamente la solución se obtiene más rápidamente usando todo el cluster que utilizando sólo un nodo. Esto sugiere, nuevamente, que el uso del cluster proporciona un rendimiento mejor para problemas relativamente grandes.