Posts tagged with #NLP

23 posts found

Homework 3

> 由于本人刚刚接触数据科学,对 numpy 之类的库的使用不是很熟练,因此会写的琐碎一些。 > In this homework, we are going to apply linear regression to the problem of predicting developer satisfaction based upon information about their...

GPT2 实现笔记(2)-LoRA微调

> 该笔记是对 Stanford CS224-n 的 hw5 的 LoRA 微调部分的整理,用于整理本人实现的对特定任务的 LoRA 微调实现以及对特定下游任务的处理。 我们采用和原有GPT2模型实现类似的架构实现带LoRA微调的GPT2模型,详细架构如下: ```mermaid graph TD %% --- Style Definitions --- classDef model...

GPT2 实现笔记(1)

> 该笔记是对 Stanford CS224-n 的 hw5 基础部分的整理,用于整理 GPT2 模型的基本实现。 我们先初始化好注意力模块中的组件: * $Q$,$K$,$V$层和 dropout 层 * 注意力头数量等配置 ```python self. num_attention_heads = config...

LoRA

> 生成:Gemini-2. 5-pro, 整理:fyerfyer LoRA 的核心假设是:模型在适应新任务时,其权重的“变化量”($\Delta W$)本身具有“低内在秩”(low intrinsic rank)。 这意味着,这个代表变化的、巨大的权重矩阵,可以用两个非常小的、瘦长的矩阵相乘来近似模拟。这就好比一个复杂的变换,其实可以分解为几个简单的、低维度的变换组合而成。...

ReFT

> 生成:Gemini-2. 5-pro, 整理:fyerfyer 传统的参数高效微调(PEFT)方法,如 LoRA,其核心思路是**修改模型的“大脑结构”**,即通过更新或添加少量权重参数来让模型适应新任务。 而表征微调(Representation Finetuning,...

迁移学习

> 生成:Gemini-2. 5-pro, 整理:fyerfyer 为了解决传统微调的参数效率问题,论文提出了一种替代方案,叫做**适配器模块 (Adapter Modules)**。 适配器的核心思想是:在为下游任务调整模型时,我们**完全冻结 (freeze)...

词语表示法

> 生成:Gemini-2. 5-pro, 整理:fyerfyer 在自然语言处理中,我们首先要区分两个基本概念: * **词符 (Word Token)**:指在文本中**实际出现的一个具体的词**。它是词的一个“实例”。 * **词型 (Word Type)**:指一个**抽象的、独特的词**。它是词的“原型”或“类别”。 > 例如,在句子“我爱北京,我爱中国。”中: > * **词符...

适配层

GPT-3/4 这样的大型语言模型,展现出了一种惊人的新能力: 1. 零样本学习 (Zero-shot):不需要给它任何范例,**只需用自然语言清晰地描述任务**,它就能直接执行。 2...

assignment 4

注意力权重 $α_i$ 是通过对 $k_i^T q$ 的点积结果进行 softmax 计算得到的。要让 $α_j$ 几乎承载所有权重,查询向量 $q$ 和键向量 $k_j$ 的点积 $k_j^T q$ 远大于所有其他点积 $k_i^T q$($i ≠ j$)。 根据 $i$ 的结论,我们有 $α_j \approx 1$ 且对于所有 $i ≠ j,α_i ≈ 0$。此时: $$ c...

微调

指令微调是收集大量**覆盖不同任务的 (指令, 输出) 数据对**,然后用这些数据去微调一个已经预训练好的语言模型(LM)。 > 一个重要的发现是,我们可以利用一个非常强大的模型(如GPT-4)来生成大量的指令和回答,然后用这些生成的数据去微调一个规模小一些的开源模型。 > 对齐,“少即是多” (Less Is More for...