正态分布 · SKILL.md
元数据
---
核心定义
What:什么是正态分布?
正态分布(又称高斯分布、钟形曲线)是自然界和社会现象中最常见的概率分布。其特征是:大多数数据集中在平均值附近,离平均值越远的数据越少见。 数学表达式: ``` f(x) = (1/σ√(2π)) × e^(-(x-μ)²/(2σ²))其中:
Why:为什么重要?
1. 中心极限定理:大量独立随机变量的和趋于正态分布 2. 自然界的常态:身高、体重、智商、测量误差等都近似正态 3. 统计推断基础:t检验、ANOVA、回归分析都假设正态性 4. 风险管理工具:六西格玛质量管理的核心How:如何应用?
核心操作流程: 1. 识别正态性:数据是否近似正态分布? 2. 估计参数:计算样本均值和标准差 3. 概率计算:利用68-95-99.7法则快速估算 4. 异常检测:超出3σ的数据点视为异常---
应用场景
场景1:质量控制
情境:生产线产品尺寸检测 应用:场景2:人才评估
情境:员工绩效评估 应用:场景3:投资风险管理
情境:股票投资组合风险评估 应用:---
常见误区
| 误区 | 正确理解 | |------|---------| | 万物皆正态 | 收入、地震强度、网络链接等服从幂律分布 | | 忽视肥尾 | 金融市场中极端事件比正态预测更常见 | | 样本偏差 | 小样本可能无法反映真实的正态性 | | 强行正态化 | 非正态数据强行套用正态方法会失真 |
---
关联模型
---
核心金句
> "正态分布是自然的默认设置,但默认不等于唯一。"
> "理解分布的形状,比记住公式更重要。"
---