观点

理解自由度

LOSSES ‧ 2026-03-10

这个概念几乎被所有大学统计老师给讲坏了。

一个简单的常识，三元一次方程组必须要有三行算式（条件）才有机会获得唯一解。如果待求解参数比条件数还多，那么我们就会面对一个拥有无穷解的情况。

另外一个你可能没太注意，但早有概念的事情：独立信息，三元一次方程组必须要有三行独立的算式才有机会获得唯一解，如果其中两行方程其实在说同一件事（比如公式一模一样，或者左右都乘了个二就当新条件），那它们加在一起也只算一条条件，这不是独立信息。

这两点可以被延伸到假设检验体系，在这个体系里面，待求解的未知数成了「模型的参数」、条件变成了数据量（样本量）。在样本量比参数个数多的时候，这个系统被称作超定方程组，而样本数量比参数个数少的时候，这个系统被称作欠定方程组。

但是在延伸的时候需要注意，假设检验体系处理的数据是有噪音的（比如你研究摄入热量和体重关系的时候，你不可能穷尽所有变量，比如菜是谁种的、调料加多少、在哪里吃的、吃冷的吃热的、吃的时候开不开心等等）。我们永远都是在通过样本尝试推断总体的某个特征，但永远得不到精确解，我们只是在尝试找到最优解，这和解一般方程组有本质差异。

在大多数情况下，如果你的样本数量比参数个数还少，那么传统假设检验体系就会彻底崩溃（但注意，机器学习领域有它自己的妙妙小方法）。

因此，自由度可以被视作是一种代币，它告诉你最大的参数可容纳空间被怎样分配到了整个模型当中。

在超定方程组中，我们在做的是在一个噪声系统中找到未知参数的最优解。换言之，你在做的大多数数据分析过程都是在一个噪声系统中找到信号的线索。这时候就会冒出信噪比之类的概念。这事情比较好理解，你的数据量（样本量）必须比参数量大到某种程度，（如大多数分析方法假设的、遵循正态分布的）噪声才会被充分叠加相互抵消掉，才能暴露出信号的真实样态。

因此，在进行统计分析的时候，你必须报告自由度信息，因为他能告诉你数据冗余有多大，这个冗余可以用来权衡整个模型被过拟合的风险有多高（过拟合就是你把噪声当信号给拟合到模型里了），你到底有没有通过暴力增加参数来 hack R square。

整数自由度的前提，是你能清楚地数出「这批数据里有多少条独立信息」。但在混合效应模型这类情况下，数据结构本身就很复杂（比如同一个人被反复测量，班级里的学生彼此相似）这导致你根本无法直接清点「独立信息有几条」，因为数据点之间存在相关性，它们不是一人一票，而是有的信息值半票，有的值 0.8 票。

既然没办法整数地清点，统计学家就用一套公式反推出一个「等效的」信息量，这个等效值大概率不是整数，于是自由度就变成了小数。它不是精确计算出来的，而是「如果这批数据是来自某个理想的简单情况，它大概等价于多少条独立观测」的一个估算。

「可以自由变换数据的数量」是一种不直观的，甚至容易产生歧义的解释方法，尽管意义正确，但正确得没有什么价值，因为纯粹数学专业之外几乎没有人能理解其含义。

Comments

Loading comments...

男性，自我性别认同男，并为之自豪，不幸的是常被小朋友误认为阿姨。自我感觉非常良好，认为四舍五入自己可以算是美女。对吃药特别有一套，是一个 Podcast 主播。

技能树点得枝繁叶茂，主要节点包括用户体验设计、前端开发、社会认知神经科学、心理学、教育学、频率学派统计学、写作、书法、设计、中国传统绘画、素描与速写、萨克斯。

自己教的忠实信徒，并且希望你了解一下这个超酷的宗教。

加入自己教

Ukraine

螺莉莉的数据中心全体作者坚定的支持乌克兰。

我们反对以任何形式发起的战争，反对以任何形式合理化战争。

我们主张，如个体没有主动寻求解脱，任何集体和个人都不应剥夺其生命。如个体精神状态良好，任何人集体和个人都不应剥夺其自由。

我们鼓励每一位向往自由、尊重生命的读者为乌克兰提供捐助。

Ni preĝas por libereco, ni preĝas por paco.

To→Witter

RORIRI • 1 day ago

Linux 人在 UX 领域基本是瞎的，并且可以把任何东西覆盖在 UX 之上，缔造了 Linux 最难用的不败神话。当然，Windows 持续作死给 Linux Desktop 提供了一线生机。一个很有毛病的逻辑，遇到任何问题和 UX 冲突的时候不是做 UX Research 而是先把 UX 杀了解决问题，不知道这个思维惯性是打哪里来的。
RORIRI • 1 week ago

我觉得有想法的时候立刻就写下来，立刻就发了很重要。因为转瞬即逝的灵感是很容易消散的。人会容易把自己没有的东西当成重要的东西，那些你曾经有的灵感，如果不固定下来，很快就会变成你从来没拥有过的东西。所以，先写，写完立刻发。这又不是印刷品，发完还可以改，你改一百次都不会有人跟你抱怨。
RORIRI • 1 week ago

两团粘菌可以粘在一起重新合并成一个个体并因此而共享知识，合并的时候会有喜报破裂导致液体渗出。Consider 如果这件事情可以在人类世界发生，俩人情投意合决定合二为一，啪一下子一地血两个人变成了一个人，新的个体上有了双倍的经验和记忆，好的坏的事情全都 Double 了。虽然诡异而黑暗，但也有一种说不出的浪漫。
RORIRI • 1 week ago

ˊ_>ˋ 翻了一下博客 Archive 列表，从前往后看，有一种感慨，现在竟然能写出这么厉害的文章了，真了不起啊你这家伙，掐腰（
RORIRI • 1 week ago

ZH-Hans、TH-HanT、ZH-YUE、ZH-MIN、我相信大家都已经很熟悉了，但是有一个隐藏版本，最近真的很流行：ZH-Kenya，甚至所有语言都冒出了自己的 Kenya 版本，破真文化大和谐了（ry

もっと！もっと！