机器学习—矩阵乘法的规则
有一个2×3的矩阵A,有两行三列,把这个矩阵的列想象成三个向量a1,a2,a3,用一个转置,把它相乘,首先,什么是转置,把一个矩阵进行行变列,列变行的操作,所以这些行现在是一个转置,有一个矩阵W,把W看作向量,现在计算转置乘以w,使用了略有不同深浅的橙色表示,相同的阴影对应,组合在一起形成了一个向量,相同的阴影用于指示转置的不同行,因为转置的不同行是一个转置,以类似的方式用不同的深浅来表示W的不同列,数字都是蓝色的,是那些被组合在一起形成向量的,w的第一列对应于z的第一列,以此类推,转置一是第一行,一个转置对应Z的第一行中的值,以此类推,这将是一个3×4的矩阵,所以左上角的元素,这是第一列中的第一行,与最浅的橙色和最浅的蓝色相对应,计算的方法是抓住转置的第一行和W的第一列,取它们的内积或点积,所以这个数字是1×3+2×4,下边的数字与此计算方法类似。
转置是一个3×2的矩阵,W是一个2×4的矩阵,两个矩阵相乘的一个要求,离得近的两个数字必须匹配,这是因为在相同长度的向量之间只能取点积,所以你可以取两个数字得向量之间的点积是因为你可以取长度为2得向量之间的内积。只有当第一个矩阵的列数在这里是转置的等于第二个矩阵的行数,所以在这个过程中使用点积时,用同样大小的向量做点积,另一个观察是输出z等于转置w,z是3×4的矩阵,所以这个乘法的输出将具有与x相同的行数,转置和W相同的列数,这也是矩阵乘法的另一个性质。