Archive - Page 12

2025

163 posts

Homework 3

September 18, 2025 525 words • 3 min read

> Let $f_{X\mid Y=C_i}(x) \sim \mathcal{N}(\mu _i,\sigma^2)$ for a two-class, one-dimensional ($d = 1$) classiﬁcation problem with classes $C_1$ and $C_2$, $P(Y = C_1) = P(Y = C_2) = 1/2$, and...

#Ma-Le #Probability

Homework 2

September 17, 2025 939 words • 5 min read

> Concisely, $\Sigma = E[(Z − \mu )(Z − \mu )^{⊤}]$, where $\mu $ is the mean value of the (column) vector $Z$. Show that the covariance matrix is always positive semidefinite (PSD)...

#Ma-Le

决策理论

September 17, 2025 2812 words • 15 min read

在我们前面讲解的 SVM 分类器中，我们试图找到**一个明确的边界（超平面）来分隔不同类别的数据**。但现实世界中，数据往往是模糊和重叠的。这就引出了概率分类器的需求：我们不再给出一个“是”或“否”的确定性答案，而是**给出一个属于某个类别的概率**。我们使用贝叶斯定理来知道我们的决策。首先定义如下的概念： - 决策规则 (Decision Rule)...

#Ma-Le #Probability #Data Science

特征向量与多元正态分布

September 17, 2025 2376 words • 12 min read

特征向量的定义如下：给定一个矩阵 $A$，如果有某个向量 $v$ 满足 $Av=\lambda v$，那么 $v$ 就是 $A$ 的特征向量。特征向量的几何意义如下：它把矩阵 $A$ 的变换转换成了一个伸缩变换 $\lambda$ 下面我们讲解一下如何**从指定的特征向量和特征值，反向构造出一个对称矩阵 $A$**：首先，我们构造一个特殊的坐标系（Orthonormal...

#Linear Algebra #Ma-Le

LDA & QDA 补充

September 17, 2025 971 words • 5 min read

我们假定类别 $K$ 的数据符合正态分布： $$ f_k(x)=\frac{1}{\sqrt{2\pi}\,\sigma_k}\exp\. \left(-\frac{(x-\mu _k)^2}{2\sigma_k^2}\right) $$ 根据贝叶斯公式： $$ P(Y=k\mid X=x)=\frac{\pi_k f_k(x)}{\sum_{l=1}^{K}\pi_l f_l(x)}...

#Ma-Le #Probability

Matplot 绘图技巧

September 16, 2025 22 words • 1 min read

下面例子的 $X$ 是二维的。 ```python ```...

#Plot

Homework 1

September 15, 2025 609 words • 4 min read

> Show the Equation $$ \max_{\lambda_i \ge 0}\; \min_{w,\alpha}\; \|w\|^2 - \sum_{i=1}^n \lambda_i\bigl(y_i(\mathbf{x}_i\cdot \mathbf{w} + \alpha) - 1\bigr) \tag{3} $$ > can be rewritten as the...

#Ma-Le

线性分类器

September 15, 2025 476 words • 3 min read

- 提供 $n$ 个样本，每个样本具有 $d$ 个特征。这些样本表示为 $d$ 维空间的特征向量。 - 决策边界：我们的分类器划分出的边界，将属于这个类别的样本和不属于这个边界的样本划分开。 - 决策函数：一个将 $x$ 映射到标量的函数 $f(x)$： $$ \begin{cases} f(x)>0, & x\in C,\\[4pt] f(x)\le 0, & x\notin C. ...

#Ma-Le

最大间隔分类器

September 15, 2025 630 words • 4 min read

线性分类器的间隔 (Margin) 是**决策边界与离它最近的训练样本点之间的距离**。在最大间隔分类器 (Maximum Margin Classifiers) 中，我们试着让这个间隔尽可能地宽。因为直觉上，一条位于“正中间”的、间隔最大的分界线，对于新出现的数据点会有更好的判断力。因为它没有偏向任何一边，所以更“公平”，也更不容易因为训练数据中微小的扰动而产生巨大的变化。...

#Ma-Le

感知机算法

September 15, 2025 502 words • 3 min read

为了便于后面的计算，我们定义： - 对每个样本，标签 $y_i$： $$ y_i= \begin{cases} 1, & X_i\in C,\\[6pt] -1, & X_i\notin C. \end{cases} $$ 我们的目标是找到 **权重向量 $w$** 使得： $$ X_i\cdot w \begin{cases} \ge 0, & \text{if }...

#Ma-Le