统计和度量的基本概念

标签

学习/心理学

字数

3826 字

阅读时间

15 分钟

本章指南

本章从心理学的学科性质谈起，并介绍一些心理学的研究方法，以及心理统计学的基本概念和符号，为后面的学习做铺垫。

学习要点

将统计方法和心理学研究情境相结合；
重视概念；
循序渐进，弄懂一个概念后再学下一个；
规范答题，按照推荐的格式解题。

实验设计

实验研究

实验研究的目标是要确定两个不同变量之间的因果关系，即一个变量的变化是不是由另一个变量的变化引起的。

实验研究一般有两个特征：

研究者需要变化其中一个变量，也就是自变量 (independent variable)，来观察另一个变量，也就是因变量 (dependent variable) 的变化。
研究者在改变自变量时，需要对实验中的其他无关变量进行控制，确保它们不会影响实验的结果。

准实验研究

在实验研究之外，还有一种介于实验研究与非实验研究的之间的一种研究，叫做准实验研究 (quasi-experimental research)。其对无关变量的控制好于非实验研究，但又不像真实验研究那般严格。在真实的实验中，我们不可能完全控制不同对照组之间的无关变量相等，因此为了获取有用的信息，我们不得不采取折中的办法使用准实验研究。

非实验研究

最后即为非实验研究，在无关变量的控制上更为不严格的一种研究，一般用于考察自然存在的变量之间的关系。非实验研究能控制的因素更少，相比准实验研究也没有对照组进行比较。

总体、样本和随机取样

总体

定义：
1. 具有某些共同的、可观测特征的一类事物的总体；
2. 心理学研究中，指特定研究所关注的所有个体的集合。
基本单元：个体。
例子：想要统计北京市大学生的身高，那么总体就是北京市大学生。

样本

定义：从总体中选出来作为真正研究对象的个体的集合。
特征：总体的子集。
诞生的原因：由于人力、财力的限制，难以统计到每一个人，只能从总体中抽取一些个体作为研究对象。
取样偏差：样本越大，越接近总体，对总体的代表性越强；样本小，可能造成取样偏差，对总体的代表性差。
取样的优点：
1. 节约时间、开支；
2. 抽样恰当的样本具有较强的代表性。
例子：想要统计北京市大学生的身高，可以在每个高校中随机取样一部分个体作为样本。

随机取样

定义：从总体抽取样本时，要求总体中每一个个体被抽到的机会均等。
用随机取样法得到的样本叫做随机样本。
具体方法：分层取样（按照年龄、性别比抽取）等。

描述统计和推论统计

描述统计

定义：描述统计是指用来整理、概括、简化数据的统计方法，侧重于描述一组数据的全貌，刻画一件事物的性质。
常用的描述统计有求平均值、标准差等。
描述统计常利用图、表的方式来表示。

推论统计

定义：推论统计是指用一系列数学方法，将从样本数据中获得的结果推广到样本所在的总体。
由于现实条件的限制，实际研究中可能无法逐一考察总体中的每一个个体，只能利用有代表性的样本来推测总体的情况。进行推论统计的关键在于所抽取的样本要能够尽量接近所要研究的总体，使得产生的取样误差最小。

参数、统计量和取样误差

参数

参数是用于描述总体特征的数值，我们可以从一次测量中获得参数，也可以从一系列对总体的测量中推论得到。

统计量

统计量是用于描述样本特征的数值，我们可以从一次测量中获得统计量，也可以从一系列对样本的测量中推论得到。

可以看到对于参数和统计量的定义有着相似的形式，但是这二者之间同样有着差异。在对一组样本的测量过程中，统计量是确定的，但是当我们更换样本再次进行测量，统计量的值就可能改变，也就是说，统计量的值是不定的，会随着样本的选取而变化，而参数则是一个固定的值。在研究中，我们常常用样本统计量来估计总体参数，但样本作为总体的子集，并不能完全等同于总体，在样本统计量和总体参数之间多少存在差异。

取样误差

取样误差是指样本统计量和样本所对应的总体参数之间的差异。

我们并不能彻底避免取样误差的出现，因为样本和总体之间总是存在差异，基于有限的信息做出的推论也许并不准确，而我们能做的只有运用正确的方法尽量减少取样误差，或是将其保持在研究允许的范围内。

离散型变量和连续型变量

离散型随机变量

定义：由分离的、不可分割的范畴组成，在邻近范畴之间没有值存在的变量。
举例：
1. 计数数字：掷骰子得到的1和2之间没有其他值存在；不同类别：人格障碍分类；
2. 时间、长度、质量……

连续型随机变量

定义：在任意两个观测值之间都存在无限多个可能值，可以分割成无限多个组成部分的变量。
表示方式：一般可以用一条连续的实数直线表示，在实数直线上存在无数个点，在任意两个相邻点之间依然可以找到无数个点。
精确界限：在说到一个连续型变量的某个观测值时，往往指实数直线上的一个区间，构成这个区间的边界被称为精确界限。例如，23代表的区间是从22.5到23.5，22.5是精确下限，23.5是精确上限。

连续型变量与离散型变量的关系

当离散型变量取值空间较大，取值点比较密集时，也可以视为连续型变量。将连续型变量分组，可以作为离散型变量处理。

变量的测度等级

收集数据需要我们对所观察的现象进行测量，包括定性测量和定量测量。即，我们用变量来量化地描述概念。

不同的变量能够被量化的程度有所不同，变量的测度等级按照这种被量化的程度可以分为以下四类：

命名测度 (nominal scale)：也称名义测度等级，是最低的一种测度等级，由一系列具有不同名称的类型组成。命名测度对观察结果进行标定和分类，但数据没有大小之分。命名测度等级也可以用数字表示，不过这些数字仅可定性，并不反映定量信息，也不可比较，如样本代号和数字、编码等。命名数据不支持四则运算，仅支持等于或不等于、是或不是。

顺序测度 (ordinal scale)：量化水平高于命名测度等级，由一系列按顺序排列的范畴组成。将观察所得结果按其大小或数量排定秩次 (rank)，可以提供不同个体之间的顺序差异。顺序数据点之间可进行大小比较，但其本质依旧是定性而非定量的，因此不支持四则运算，也无法体现数据点之间差异的大小及程度。

等距测度 (interval scale)：也称间距测度等级，沿数字刻度测量，拥有更高的量化水平。相较于顺序测度，规定每两个相邻范畴之间距离相等。一般是采用一定单位的实际测量值，可以用加减运算得到数值之间的差或和，反映大小差距。但缺少物理意义上的绝对零点，因此乘除运算没有意义。一些心理量表，如 Likert 5点等级量表和是/否的两点量表就是常见的等距量表。

比例测度 (ratio scale)：是最高的测度等级，除等距测度的特征外，还拥有绝对零点,可以表示差异的比率。可以进行乘除运算，反映数量间的比例关系。

特征表

测度等级	变量类型	单位	零点	可采用的数学运算	是否等距	变量是否可比较
命名测度	离散型	不相等	/	$=, \neq$	/	不可以
顺序测度	离散型	不相等	/	$>, <$	否	可以
等距测度	可以是连续型	相等	相对零点	$+, -$	是	可以
比例测度	可以是连续型	相等	绝对零点	$+, -, \times, \div$	是	可以

例子

命名测度：

性别、血型、职业、十二星座、各种人格、不同颜色；
血型（ABO 分类）：每个样本都具有 A、B、O、AB 四种标签中的某一种，既不能没有血型，也不能拥有两种及以上的血型。不同被试之间只可以比较血型的相同和不同。

顺序测度：

游戏段位、（病情等）轻/中/重、（绩效评定）优/良/及格/不及格、学历、Likert 5 等级量表（不同程度之间不等距）；
游戏段位：每个样本都具有特定的、互不相容的段位，段位之间有高低之分，但不同段位的差别不相等，也不能从某几个段位通过加减运算得到另一个段位。

等距测度：

IQ/意愿倾向/能力分数等等距量表、疼痛程度、温度（摄氏或华氏温标）；
IQ（离差智商）：每个样本具有特定的 IQ 得分，IQ 之间有高低之分，每两个相邻 IQ 值之间的差别相等，但 IQ 为 0 不表示不存在 IQ。

比例测度：

长度、距离、质量（体重）、心率、收入、年龄、温度（热力学温标）。
长度：每个样本具有特定的长度，长度有大小之分，可以连续、均匀地变化，长度为 0 表示长度不存在。

统计方法的选择

各种测量类型的局限性直接关系到统计分析方法的选取，因此在开始收集实验数据之前，应格外注意。

命名测度

描述统计：可以使用频率分布和模式、百分比、次数、众数等；
假设检验：可以进行非参数的统计检验，如卡方独立性检验和 Fisher 检验。
绘图：条形图、饼状图。

顺序测度

描述统计：可以使用频率分布和模式、中位数、序列、百分位数、等级相关系数等；
假设检验：可以进行非参数的统计检验，如卡方检验和 Fisher 检验，肯德尔和谐系数检验。
绘图：条形图、饼状图、折线图，此外可以使用数据的四分位数（上四分位数、下四分位数）、中位数、最值绘制箱型图。

等距测度

描述统计：可以使用频率分布和模式、中位数、平均数、序列、标准差、方差、等级相关、积差相关。
假设检验：可以进行参数的统计检验，如 t 检验、F 检验，以及线性回归。
绘图：条形图、饼状图、折线图、直方图、箱型图、散点图。

比例测度

描述统计：可以使用频率分布和模式、中位数、平均数、序列、标准差、方差、几何平均数、变异系数等；
假设检验：可以进行参数的统计检验，如方差分析、线性回归，以及其他等距量表可以使用的方法。
绘图：条形图、饼状图、折线图、直方图、箱型图、散点图、小提琴图、山脊图等。

常用的基本统计符号

常用基本统计符号

由于统计符号往往都是参数与统计量成对出现，因此将这些相对应的符号列表如下所示：

	参数（总体）	统计量（样本）
群体大小	$N$	$n$
平均数	$μ$	$\overset{―}{X}$
标准差	$σ$	$S$
方差	$σ^{2}$	$S^{2}$
相关系数	$ρ$	$r$

在统计中许多计算需要将一系列的分数相加，因此使用希腊字母 $Σ$ 来表示一系列分数的和。例如， $\sum X$ 表示对变量 $X$ 的所有值求和。

贡献者

芷沐沐

页面历史

最后编辑于大约 1 小时前

查看完整历史

统计和度量的基本概念 ​

本章指南 ​

学习要点 ​

实验设计 ​

实验研究 ​

准实验研究 ​

非实验研究 ​

总体、样本和随机取样 ​

总体 ​

样本 ​

随机取样 ​

描述统计和推论统计 ​

描述统计 ​

推论统计 ​

参数、统计量和取样误差 ​

参数 ​

统计量 ​

取样误差 ​

离散型变量和连续型变量 ​

离散型随机变量 ​

连续型随机变量 ​

连续型变量与离散型变量的关系 ​

变量的测度等级 ​

特征表 ​

例子 ​

统计方法的选择 ​

命名测度 ​

顺序测度 ​

等距测度 ​

比例测度 ​

常用的基本统计符号 ​

常用基本统计符号 ​

贡献者