机器学习 — 什么是张量?

发布于
# 机器学习

张量(tensor)是一个数学概念,表示在不同向量空间之间的线性映射。在物理学和工程学中,张量通常用于描述物体的形状、力学和电磁场等性质。它可以看作是一种多维数组,具有特定的变换规律和运算法则,例如加法、乘法和缩并等。

张量(tensor)是一种数学对象,它可以用来表示多维数组或向量。在计算机科学和机器学习中,张量通常用于表示数据集、神经网络的权重和偏差等数据结构。张量的阶数(rank)指的是它所包含的维度数量,例如,一个标量(scalar)是一个零阶张量,向量(vector)是一个一阶张量,矩阵(matrix)是一个二阶张量,三阶张量将包含3个索引以此类推。

一阶张量是一个具有一个下标的张量,通常表示为一个向量。以下是一些一阶张量(向量)的示例:

速度向量:描述物体在某个方向上的速度大小和方向。

力向量:描述物体施加在其他物体上的力的大小和方向。

电场强度向量:描述在某个点的电场强度大小和方向。

磁感应强度向量:描述在某个点的磁场强度大小和方向。

位移向量:描述物体从一个位置到另一个位置的位移大小和方向。

一个三阶张量可以看作是一个元素为标量值的三维数组,这个数组可以表示为一个立方体或者一个矩阵序列。以下是一些三阶张量的示例:

RGB 图像可以被表示成一个 $n X m X 3$ 的三阶张量。其中 $n$ 和 $m$ 分别代表图像的高和宽,而第三个轴则对应着红、绿、蓝三种颜色通道。

一个含有 $n$ 个样本、每个样本包含 $m$ 个特征的数据集可以被表示成一个 $n X m X p$ 的三阶张量。其中 $p$ 是一个超参数,用来控制数据集的维度。

空间中的物理场可以被表示成一个 $n X m X l$ 的三阶张量,其中 $n$、$m$、$l$ 对应于空间中三个方向的离散采样点。这种表示方法在计算流体力学和固体力学等领域得到广泛应用。

找到 0 条评论