软边界分类器 September 15, 2025 1037 words • 6 min read 我们之前讲的最大间隔分类器有如下的弊端: 1. 对非线性可分的数据无效。最大间隔分类器是基于线性分类器的,如果数据非线性可分的话,最大分类器就失效了。 2... #Ma-Le
支持向量机 September 15, 2025 1810 words • 10 min read 在详细讲解支持向量机相关概念的推导前,我们先详细讲讲一些重要的数学方法。 拉格朗日乘数法适用于下面的问题: $$ \min_{x_1,\dots,x_n} f(x_1, \dots, x_n) \quad \text{s. }\; g(x_1, \dots,x_n)=0 $$ 拉格朗日乘数法基于下面的定理:**在取到最值的地方,$f(x_1, \dots, x_n)$ 和 $g(x_1,... #Ma-Le
Homework 4 September 14, 2025 2024 words • 11 min read 这一部分实现了分类特征分布的计算。我们创建一个 $X, Y$ 的联合分布表,然后对每个特征标签 `y_label`,统计这一部分对应的 $X$ 的次数和总的 $Y$ 的类别的比值,这个结果就是对应的概率分布。 ```python @mugrade. local_tests class CategoricalDistribution: def __init__(self, X, Y, alpha=1... #Ma-Le
机器学习基础 September 9, 2025 8743 words • 44 min read > 本笔记是对 [CMU Pratical Data Science Course](https://www. datasciencecourse... #Ma-Le