RLQuantization

Sun, 12 Apr 2026 16:38:07 +0800

量化（quantization）

把神经网络里原本高精度（如 32 位浮点数）的参数和激活值，用更少位数、更简单的数值来表示的技术。

1-bit LLMs 就是极致量化的模型这里把参数限制在 {−1, 0, 1} 三个值，叫三值量化（ternary quantization）

目的:

Wed, 08 Apr 2026 00:00:00 +0000

序列到序列模型

包含:

在这些早期的序列到序列模型中，编码器和解码器通常使用循环神经网络（RNN）来实现。

里面既有确定性部分（像 GRU 一样的又有随机性隐状态

应该算作 Stochastic