Continuamos hablando de operaciones con matrices. Hoy hablamos del producto de matrices. Vamos a ver que la multiplicación de matrices, a primera vista, parece algo... peculiar. Voy a tratar de explicaros una manera intuitiva de introducirla. Por supuesto, no es la única manera que hay de hacerlo.
Fijaos que la suma y el producto de una matriz por un número tienen definiciones bastantes naturales, con propiedades muy familiares.
El producto de matrices, como vamos a ver, no siempre es posible; y cuando es posible veremos que se obtienen, según el orden en que pongas los factores, matrices de diferentes dimensiones.
Más aún, aunque los resultados fuesen de las mismas dimensiones, no tienen por qué coincidir...
El producto de dos matrices cuadradas del mismo orden no es, en general, conmutativo (!).
Este detalle es, probablemente, lo que más llama la atención a la gente.😉
PRODUCTO DE UNA MATRIZ FILA $1\times n$ POR UNA MATRIZ COLUMNA $n\times 1$
Sean un vector fila (una matriz $1\times n$) $\vec{a}=\left(\begin{matrix}a_1 & a_2 &...& a_n \end{matrix}\right)$ y un vector columna (una matriz $n\times 1$) $\vec{b}=\left(\begin{matrix}b_1\\b_2 \\...\\ b_n \end{matrix}\right)$ (dados por sus componentes), ambos de la misma dimensión $n$.
Se define el producto escalar $\vec{a} \cdot \vec{b}$ como el número real obtenido multiplicando las componentes término a término y sumando los resultados:
$$\left(\begin{matrix}a_1 & a_2 &...& a_n \end{matrix}\right) \cdot \left(\begin{matrix}b_1\\b_2 \\...\\ b_n \end{matrix}\right) =a_1 b_1 + a_2 b_2 + ...+a_n b_n.$$
(véanse los ejemplos resueltos de la página 57 del libro).
Esta definición permite interpretar una ecuación lineal con $n$ incógnitas como un producto escalar del vector fila formado por los coeficientes de las incógnitas por el vector columna formado por las incógnitas, por ejemplo:
la ecuación lineal $-3x+2y+7z=4$ se puede escribir como producto escalar ($=4$) entre el vector fila $\vec{a}=\left(\begin{matrix}-3 & 2 & 7 \end{matrix}\right)$ y el vector columna de las incógnitas $\vec{x}=\left(\begin{matrix}x\\y \\ z \end{matrix}\right)$:
$$\left(\begin{matrix}-3 & 2 & 7 \end{matrix}\right) \cdot \left(\begin{matrix}x\\y \\z \end{matrix}\right) =4.$$
Podemos ir un poco más lejos con esta interpretación y pensar que escribir un sistema de tres ecuaciones lineales con tres incógnitas como éste:
$$\left\{\begin{array}{ccc}
{\displaystyle x+2y+3z=2}
\\
{\displaystyle x-y+z=0}
\\
{\displaystyle x+3y-z=-2}
\end{array} \right.$$
es equivalente a escribir:
$$\left(\begin{matrix} \vec{a_1} \cdot \vec{x} \\ \vec{a_2} \cdot \vec{x} \\ \vec{a_3} \cdot \vec{x} \end{matrix}\right)=\left(\begin{matrix}2 \\ 0 \\ -2 \end{matrix}\right)$$
donde $\vec{a_1}=\left(\begin{matrix}1 & 2 & 3 \end{matrix}\right)$; $\vec{a_2}=\left(\begin{matrix}1 & -1 & 1 \end{matrix}\right)$; $\vec{a_3}=\left(\begin{matrix}1 & 3 & -1 \end{matrix}\right)$ y $\vec{x}=\left(\begin{matrix}x\\y \\ z \end{matrix}\right).$
Observa que la expresión
$$\left(\begin{matrix} \vec{a_1} \\ \vec{a_2} \\ \vec{a_3} \end{matrix}\right)$$ escrita en forma de tabla, no es otra cosa que la matriz $A$ de coeficientes del sistema de ecuaciones:
$$A=\left(\begin{matrix} 1 & 2 & 3 \\ 1 & -1 & 1 \\ 1 & 3 & -1 \end{matrix}\right).$$
Por tanto esto sugiere una definición provisional de producto de matrices, en este caso de una matriz $3 \times 3$ (la $A$) por una matriz $3 \times 1$ (la $\vec{x}$) para dar como resultado una matriz $3 \times 1$ (el vector columna $\vec{b}=\left(\begin{matrix}2 \\ 0 \\ -2 \end{matrix}\right)$).
Así, en vez de poner $$\left(\begin{matrix} \vec{a_1} \cdot \vec{x} \\ \vec{a_2} \cdot \vec{x} \\ \vec{a_3} \cdot \vec{x} \end{matrix}\right)=\vec{b} \rightarrow \left(\begin{matrix} \vec{a_1} \\ \vec{a_2} \\ \vec{a_3} \end{matrix}\right) \vec{x}=\vec{b}$$
podemos poner $$A\vec{x}=\vec{b}.$$
En resumen, la expresión (que se llama "ecuación matricial")
$$\left(\begin{matrix} 1 & 2 & 3 \\ 1 & -1 & 1 \\ 1 & 3 & -1 \end{matrix}\right) \left(\begin{matrix}x\\y \\ z \end{matrix}\right)=\left(\begin{matrix}2 \\ 0 \\ -2 \end{matrix}\right)$$
sugiere que para multiplicar una matriz por otra, el número de columnas de la primera tiene que coincidir con el número de filas de la segunda.
En efecto, si el sistema propuesto hubiese sido de 2 ecuaciones con 3 incógnitas (tomando como nuevo ejemplo, las dos primeras ecuaciones del ejemplo anterior):
$$\left\{\begin{array}{ccc}
{\displaystyle x+2y+3z=2}
\\
{\displaystyle x-y+z=0}
\end{array} \right.$$
un argumento análogo al anterior conduce al siguiente producto de matrices, una ecuación matricial:
$$\left(\begin{matrix} 1 & 2 & 3 \\ 1 & -1 & 1 \end{matrix}\right) \left(\begin{matrix}x\\y \\ z \end{matrix}\right)=\left(\begin{matrix}2 \\ 0 \end{matrix}\right)$$
Una matriz $2\times3$ multiplicada por una matriz $3\times1$ da como resultado una matriz $2\times1$.
Observa que, según lo dicho, si cambiásemos el orden de los factores, NO sería posible efectuar la multiplicación porque el primer factor tendría $1$ columna y el segundo $2$ filas: no coinciden. Por tanto, el orden de los factores es muy importante.
Vale. De acuerdo pero, si el segundo factor tuviese más de una columna ¿Cómo se multiplicarían una matriz $2\times3$ por otra matriz $3\times4$?
Muy fácil, se aplicaría lo mismo de arriba a cada columna adicional del segundo factor. El resultado sería una matriz $2\times4$.
No debería extrañarte esto, pues como habrás leído en la página 3 del primer resumen, el algoritmo
de Gauss-Jordan es muy conveniente para resolver simultáneamente varios sistemas que comparten la misma matriz $A$ de coeficientes. Para ello simplemente se añaden nuevas columnas correspondientes a los diversos sistemas: por cada columna añadida, una nueva solución.
Espero que, con estos argumentos, no te resulte ya tan extraña la siguiente definición (ya, la definitiva) de multiplicación de matrices:
PRODUCTO DE UNA MATRIZ $A$ POR OTRA MATRIZ $B$
La multiplicación de matrices sólo se define si el número de columnas de la primera matriz coincide con el número de filas de la segunda matriz. Si $A \in \mathcal{M}_{m\times n}(\mathbb{R}) $ y $B \in \mathcal{M}_{n\times p}(\mathbb{R}) $ entonces $AB \in \mathcal{M}_{m\times p}(\mathbb{R}).$
El elemento $(AB)_{ij}$ de la matriz-producto $AB$ se obtiene haciendo el producto escalar habitual de la fila $i$ de la matriz $A$ por la columna $j$ de la matriz $B$, es decir:
$$(AB)_{ij}=A_{i1}B_{1j}+A_{i2}B_{2j}+...+A_{in}B_{nj}\equiv \sum_{k=1}^{n}A_{ik}B_{kj}.$$
- Ejemplo:
Si $A=\left(\begin{matrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{matrix}\right)$ y $B=\left(\begin{matrix} 0 & 0 \\ -1 & 0 \\ -2 & 1 \end{matrix}\right)$; entonces:
una matriz $2\times3$ por otra $3\times2$ dará una matriz $2\times2$, luego
$$AB=\left(\begin{matrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{matrix}\right) \left(\begin{matrix} 0 & 0 \\ -1 & 0 \\ -2 & 1 \end{matrix}\right)=\left(\begin{matrix} -8 & 3 \\ -17 & 6 \end{matrix}\right) $$
(compruébalo)
y además, una matriz $3\times2$ por otra $2\times3$ dará una matriz $3\times3$:
$$BA=\left(\begin{matrix} 0 & 0 \\ -1 & 0 \\ -2 & 1 \end{matrix}\right) \left(\begin{matrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{matrix}\right)=
\left(\begin{matrix} 0 & 0 & 0 \\ -1 & -2 & -3 \\ 2 & 1 & 0 \end{matrix}\right)$$
(compruébalo)
Como puedes ver, $AB \neq BA$. Ni siquiera tienen las mismas dimensiones.
- Ejemplo:
Si $A=\left(\begin{matrix} 1 & 2 \end{matrix}\right)$ y $B=\left(\begin{matrix} 0 & 0 & 1 \\ -1 & 0 & 2 \end{matrix}\right)$; entonces:
una matriz $1\times2$ por otra $2\times3$ dará una matriz $1\times3$, luego
$$AB=\left(\begin{matrix} 1 & 2 \end{matrix}\right) \left(\begin{matrix} 0 & 0 & 1 \\ -1 & 0 & 2 \end{matrix}\right)= \left(\begin{matrix} -2 & 0 & 5 \end{matrix}\right)$$
(compruébalo)
En cambio, el producto $BA$ no es posible: una matriz $2\times3$ por otra $1\times2$ no da ninguna matriz. Aquí no es cierto que $AB \neq BA$ y tampoco es cierto que $AB = BA$ (de hecho, $BA$ no existe).
- Ejemplo:
Si $A$ y $B$ son matrices cuadradas del mismo orden, las matrices $AB$ y $BA$ existen y son también del mismo orden que los factores, pero en general NO conmutan, es decir: $AB \neq BA$.
Pongamos por caso que $A=\left(\begin{matrix} 1 & 0 \\ -1 & -3 \end{matrix}\right)$ y que $B$ dependa de un parámetro real libre $\lambda$: $B=\left(\begin{matrix} -3 & 0 \\ 2 & \lambda \end{matrix}\right)$, entonces:
$$AB=\left(\begin{matrix} 1 & 0 \\ -1 & -3 \end{matrix}\right) \left(\begin{matrix} -3 & 0 \\ 2 & \lambda \end{matrix}\right)= \left(\begin{matrix} -3 & 0 \\ -3 & -3\lambda \end{matrix}\right)$$
y
$$BA=\left(\begin{matrix} -3 & 0 \\ 2 & \lambda \end{matrix}\right) \left(\begin{matrix} 1 & 0 \\ -1 & -3 \end{matrix}\right)= \left(\begin{matrix} -3 & 0 \\ 2-\lambda & -3\lambda \end{matrix}\right).$$
Por tanto,
$$AB=BA \Longleftrightarrow 2-\lambda=-3 \Longleftrightarrow \lambda=5.$$
PROPIEDADES BÁSICAS DE LA MULTIPLICACIÓN DE MATRICES
--El producto de matrices NO es conmutativo. (Ya lo sabemos de sobra)
--El producto de matrices SÍ es asociativo (!). Esta propiedad nos permite prescindir de paréntesis cuando multipliquemos varias matrices (siempre que, por sus dimensiones, cada una sea "multiplicable" por la siguiente): $(AB)C=A(BC)=ABC$.
--Si $A, B, C, D$ son matrices cuyas dimensiones permiten efectuar las operaciones que se indican, se cumplen las siguientes propiedades distributivas:
$$A(B+C)=AB+AC \qquad (B+C)D=BD+CD.$$
--Con respecto a la suma y al producto, la transposición cumple:
$$(A+B)^{t}=A^{t}+B^{t} \qquad (AB)^{t}=B^{t}A^{t}.$$ (nótese el orden)
--El producto de dos matrices no-nulas puede dar una matriz nula (!).💀 Ésta, más que una propiedad, es una advertencia para aquellos que creen que si el producto de dos cantidades es nulo, entonces alguna de las dos cantidades también debe de ser nula. Con matrices es mentira.
En efecto:
$$\left(\begin{matrix} 1 & 2 & 3 \\ 1 & -1 & 1 \end{matrix}\right) \left(\begin{matrix}5\\2 \\ -3 \end{matrix}\right)=\left(\begin{matrix}0 \\ 0 \end{matrix}\right).$$
(compruébalo)
Estas propiedades son útiles para operar algebraicamente con matrices, por ejemplo:
Si $A$ y $B$ son dos matrices cuadradas del mismo orden, es fácil obtener el "producto notable siguiente":
$$(A+B)^2 \equiv (A+B)(A+B)=(A+B)A+(A+B)B=A^2+BA+AB+B^2$$
Sería un error escribir $2AB$ en vez de $BA+AB$; como sabemos, $AB$ no tiene por qué dar lo mismo que $BA$.
De manera análoga, se puede ver que $(A-B)^2 =A^2-BA-AB+B^2$ y también que
$(A+B)(A-B) =A^2+BA-AB-B^2$ y por supuesto no es lo mismo hacer $(A+B)(A-B)$ que $(A-B)(A+B).$
Os dejo los siguientes vídeos para que os ayuden a ganar soltura: Vídeo1 , Vídeo2, Vídeo3 y Vídeo4.
Para finalizar la importante entrada de hoy, os recomiendo que leáis atentamente los ejercicios resueltos (y hagáis los propuestos) de las páginas 57, 58, 59, 61, 65, 70 y 71 del libro.
Las soluciones están aquí. No hagas trampa y resuélvelos tú antes de mirar...
Cuidaos mucho.