本科 → 概率与统计 ↓

人物

统计学是数学的一个分支，涉及数据的收集、分析、解释、呈现和组织。在概率和统计的背景下，它主要关注基于样本数据对整个群体做出预测或推断。统计在从商业到科学的每个领域中都用于做出明智决策。

什么是数据？

数据是指为参考或分析而收集的信息。在统计学中，数据至关重要，因为它代表了人们感兴趣的观察或测量。数据可以分为：

定性数据：这些是描述性项目，如名称、标签或类别。常见的例子有颜色、城市名称和音乐类型。
定量数据：这种类型的数据是指可以测量或计数的数值信息。例子包括身高、体重和温度。

统计学的类型

在统计学中，主要有两种类型：

描述性统计：这涉及数据的总结和呈现。使用均值、中位数、众数和标准差等度量来提供数据集主要特征的概况。
推断统计：这是关于基于样本数据对总体进行概括或预测。包括使用假设检验、置信区间和回归分析等技术。

描述性统计

含义

均值是一组值的平均值。它是通过将所有数字加起来然后除以数字的数量来计算的。

均值 = （所有数据点之和）/（数据点的数量）

例如，如果你有一组数据：2、4、6、8 和 10，平均值为：

均值 = (2 + 4 + 6 + 8 + 10) / 5 = 6

中位数

中位数是当数据点按升序排列时的中间值。如果观察数量是偶数，则中位数是两个中间数字的平均值。

例如，在数据集：3、5、7、9 中，中位数为：

中位数 = (5 + 7) / 2 = 6

方法

众数是数据集中出现最频繁的数字。一个数据集可能有一个众数、多个众数或没有众数。

例如，数据集：3、3、5、7、9 的众数是：

众数 = 3

标准差

标准差是数据集中变异或分散范围的度量。低标准差意味着数据点接近均值，而高标准差意味着数据点分布在更大的范围内。

标准差 (σ) = √[(Σ(Xi - μ)²) / N]

这里，Σ 表示总和，Xi 是单个数据点，μ 是数据的均值，N 是数据点的数量。

推断统计

推断统计使用样本数据对总体进行推断、决策、预测或其他概括。主要方法包括：

假设检验

这是一种用于做出有关假设的决策的统计方法。原假设表示现状，备择假设代表我们要证明的内容。主要成分包括：

原假设 (H0)：假设没有显著差异或影响。
备择假设 (H1)：假设有显著差异或影响。
p 值：确定如果原假设为真，那么观察到样本结果的概率。小的 p 值（< 0.05）表明对原假设有很强的反证。

置信区间

置信区间是用于估计总体参数真实值的一组值。它是一个区间估计，给出了我们期望真实参数所在的范围。

置信区间 = 统计量 ± 误差范围

对于 95% 的置信水平，有 95% 的概率从样本计算的区间包含真实总体参数。

回归分析

回归分析是一种用于检查两个或多个变量之间关系的统计方法。它让我们理解当任何一个自变量发生变化时，因变量的特定值如何变化。

y = mx + c

这里，y 表示因变量，m 是斜率，x 是自变量，c 是 y 截距。

统计学的应用

统计的应用非常广泛。它在一些主要领域起着重要作用，包括：

商业：决策、市场分析和财务绩效测量严重依赖于趋势和回归分析等统计方法。
医疗保健：预测疾病爆发、治疗效果和患者人口统计。
科学和研究：实验数据分析、调查样本分析和研究研究设计。
体育：绩效分析、改进体育策略和训练技术。

结论

统计是一种强大的工具，用于从数据中提取信息。广泛的技术和方法在各种领域中都有用，因为它有助于总结、分析和得出关于信息的结论。统计的基础，如集中趋势、离散度和推断技术，准备个体理解数据故事并做出明智的决策。

标记为已读

本科 → 6.2

username

完成于本科

人物

什么是数据？

统计学的类型

描述性统计

含义

中位数

方法

标准差

推断统计

假设检验

置信区间

回归分析

统计学的应用

结论

评论

人物