AdaBoost与前向分步算法

1. 加性模型的定义

在AdaBoost算法中，我们可以将其视为一种加性模型。加性模型是指由多个基模型的线性组合构成的模型。图中的公式 (10-9) 描述了加性模型的形式：
$\sum_{t=1}^T \alpha_t b(x; \gamma_t)$

其中：

$\gamma_t)$ 表示第 $t$ 个基模型，参数 $\gamma_t$ 是模型的参数。
$\alpha_t$ 是基模型的系数，表示每个基模型的权重。
$T$ 是基模型的数量。

加性模型的目标是最小化损失函数 $L (y, f (x))$ ，通过逐步优化每个基模型的参数和权重，逐渐逼近目标值。

2. 加性模型的目标函数

对于给定的训练集 $\{(x_1, y_1), (x_2, y_2), \dots, (x_N, y_N)\}$ ，其中 $x_i \in \mathbb{R}^n$ ， $y_i \in \{-1, +1\}$ ，我们可以定义加性模型的目标函数为：
$\min_{\alpha_t, \gamma_t} \sum_{i=1}^N L\left(y_i, \sum_{t=1}^T \alpha_t b(x_i; \gamma_t)\right)$

即在所有基模型的权重 $\alpha_t$ 和参数 $\gamma_t$ 上最小化损失函数。

由于这个优化问题非常复杂，难以一次性求解所有参数，所以可以采用前向分步算法来进行逐步优化。

3. 前向分步算法的思想

前向分步算法的核心思想是：逐步优化。每一步仅优化一个基模型的参数和权重，将其加入到模型中，逐渐逼近目标值。

每一步的优化目标可以用公式 (10-11) 表示为：
$\min_{\alpha_t, \gamma_t} \sum_{i=1}^N L(y_i, f_{t-1}(x_i) + \alpha_t b(x_i; \gamma_t))$

其中：

$f_{t-1}(x)$ 表示前 $t - 1$ 步构建的模型。
$\alpha_t$ 和 $\gamma_t$ 是第 $t$ 个基模型的参数，需要通过最小化损失函数来确定。

4. 前向分步算法在AdaBoost中的应用

在AdaBoost中，前向分步算法的思想体现在逐步增加弱分类器，并为每个弱分类器分配权重，以最小化整个模型的损失函数。

具体步骤如下：

(1) 初始化模型

首先，将模型初始化为常数值 $f_0(x) = 0$ ，即模型初始时没有任何分类能力。

(2) 迭代构建模型

对于每一轮 $\dots, T$ ：

选择基模型：选择一个基模型 $\gamma_t)$ 和对应的参数 $\gamma_t$ 以及权重 $\alpha_t$ ，使得当前损失函数最小化。这一步可以通过公式 (10-12) 来表示：
$(\alpha_t, \gamma_t) = \arg \min_{\alpha, \gamma} \sum_{i=1}^N L(y_i, f_{t-1}(x_i) + \alpha b(x_i; \gamma))$
更新模型：将新的基模型加入到当前模型中，更新后的模型为：
$f_t(x) = f_{t-1}(x) + \alpha_t b(x; \gamma_t)$