Una vez conocidas las dimensiones de la matriz resultado, para obtener cada elemento de la misma se procede como sigue:
Para obtener el elemento en la columna
del producto
,
se selecciona el
ésimo renglón de
y la
ésima columna de
,
y se suman los productos de sus elementos correspondientes, iniciando
en el extremo izquierdo y la parte superior, respectivamente. Así:
Se observa que la multiplicación de matrices es un problema muy fácilmente paralelizable; de hecho, se encuentra en la categoría de problemas conocidos como ``vergonzosamente paralelizables''4.1. Esto es porque cada nodo que participe en el cálculo únicamente necesita conocer, antes de iniciar, los valores de las dos matrices a multiplicar; y en ningún momento requerirá comunicarse con los demás nodos para realizar su trabajo. Como se verá más adelante, la implementación más sencilla involucra comunicación con un proceso ``maestro'' o ``padre'' que recoge y consolida los resultados parciales de los nodos, pero en ningún momento se requerirá que los nodos detengan su cálculo para esperar información de otro nodo.