社会统计学知识(2020.05.29)

2022-12-08 17:27:12 文档大全网 [ 字体：小中大 ] [ 阅读： ]

【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《社会统计学知识(2020.05.29)》，欢迎阅读！
统计学,2020.05,社会,知识,29
社会统计学知识

1. 定类变量：当变量值的含义仅表示个体的不同类别，而不能说明个体的大小、程度等其

他特征时，这种变量称为定类变量。P7

2. 定序变量：当变量值的含义不仅表示个体的不同类别，还可以区分个体之间的大小、程

度等序次差异时，这种变量称为定序变量。P8 3. 定距变量：当变量值不仅可以将个体区分为不同类别并进行排序，而且可以确定不同类

别之间的数量差别和间隔差距时，这种变量称为定距变量。P8

4. 定比变量：当变量除了具有定类、定序、定距这三种变量的全部特征外，还可以计算两

个变量之间的比值时，这样的变量称为定比变量。P9 5. 离散变量：如果一个变量的变量值是间断的，可以一一列举的，这种变量称为离散变量。 6. 连续变量：如果一个变量的变量值是连续不断的，即可以取无限多个数值，这种变量称

为连续变量。P10

7. 自变量：把能引起其他变量变化的变量，称为自变量。P10

8. 因变量：把由其他变量的变化而导致自身发生变化的变量称为因变量。 P10 9. 总体：是指构成它的所有个体的集合，P11 10. 个体：是指构成总体的最基本单位。P11

11. 样本：是指从总体中按照一定方法抽取的一部分个体的集合。P11 12. 抽样单位：是指一次直接的抽样所使用的基本单位。P11

13. 抽样框：是指一次直接抽样时样本中所有抽样单位的名单。P11 14. 普查：是指对总体中所有的个体进行的一次全面调查。P12 15. 抽样调查：是指从总体中按照一定方法抽取的一部分个体组成一个样本进行调查的方式，

再根据调查结果推断总体特征。

16. 归纳法：是从特殊到一般，也就是从一组具体的观察结果推导出一般性的规律或法则； 17. 演绎法：是从一般到特殊，也就是研究者从想要检验的一般性理论开始，然后去观察、

收集资料，通过这些资料来检验这个理论。 18. 组距：各组上限值与下限值的差。P45

19. 频数：就是某个类别或某个小组中的数据个数，也叫次数。P49

20. 频率：就是一个样本中某一类别或某一小组中数据个数占总数据个数的比重。 21. 比率：就是各个不同类别或小组的数值之间的比值。 22. 众数：是一组数据中出现频数最多的数值。

23. 中位数：是对中心趋势的一种测量，是将一组数据排序后，处于中间位置的变量值。 24. 均值：是集中趋势中最主要的测量值，它是将全部数据进行加总然后除以数据的总个数，

也称为算术平均数。P78 25. 均值的作用：（1）作为一个代表值；（2）用来进行比较研究；（3）可以用来反映现象的

变化情况；（4）均值可以作为抽样推断的依据。 26. 均值的特点：（1）各数据之和等于均值的N倍；（2）各变量值与均值之差的总和等于

零；（3）各变量值与均值的离差的平方和最小。 27. 众数、中位数、均值三者之间的关系：（1）对称分布情况下，众数＝中位数＝均值（2）

左偏分布下，均值＜中位数＜众数；（3）右偏分布下，众数＜中位数＜均值。 28. 极差：是一组数据中最大值与最小值的差值；P88 29. 平均差：是一组数据中每一个数据与这组数据均值之差的绝对值之和的平均，也称为平

均离差。P92

30. 平均差的特点：全面、准确地反映一组数据的离散状况；P93

31. 方差：是各数值与均值离差的平方的平均数，这是数值型数据离散趋势最主要的测量工

具；

32. 标准差：是方差的平方根，用于测量数值型数据离散趋势。

33. 离散系数：是一组数据的标准差与该组数据均值之比，也称变导系数。P100 34. 离散系数的主要作用：是比较不同总体或样本数据的离散程度。P100 35. 正态分布参数特点：当均值相等时，标准差越大，峰值越小，覆盖范围越大，即峰越宽；

反之，标准差越小，峰值越大，覆盖范围越小，即峰越窄。P105

36. 假如正态曲线下面的面积为1，在正负一；个标准差内的面积为0.6827；在正负二个标

准差内的面积为0.9545；在正负三个标准差内的面积为0.9973。P105

37. 标准正态分布：在正态分布中，当均值为0，而标准差为1时，称为标准正态分布。 38. Z值：又称为标准分数。它是以平均数为参照点、以标准差为单位、描述原始数据在总

体中相对位置的量数。（通过计算Z值将一般正态分布转换为标准正态分布。）Z值的求法：用每一个样本中的每一个数据减去均值的差除以标准差的商，即为标准分数。 39. Z值说明了一组数据中各数值的相对位置。例如，某个数值的Z值为-1.5，则说明这个

数低于均值1.5倍的标准差。

40. 当Z值落在正负一个标准差内时，数据落在区间内的概率为68.26%； 41. 当Z值落在正负二个标准差内时，数据落在区间内的概率为95.45%； 42. 当Z值落在正负三个标准差内时，数据落在区间内的概率为99.73%； 43. 点估计：就是直接用估计量作为总体参数的估值。 44. 区间估计：就是根据统计量的抽样分布的特点进行估计，同时给出总体参数落入这一区

间的可能性大小。

45. 置信区间：是在区间估计中，由样本统计量所构造的总体参数的估计区间，它由估计量

加减抽样误差构成，我们将区间的最小值称为置信下限，区间的最大值称为置信上限。 46. 置信水平：是将构造置信区间的步聚重复很多次，置信区间包含总体参数真值的次数所

占的比例。P135 47. 假设检验：首先对总体参数建立一个假设，然后根据样本信息去检验这一假设是否正确。 48. 虚无假设：将需要通过样本信息来推断其正确与否的命题称为虚无假设； 49. 替换假设：如果虚无假设不成立，我们就拒绝虚无假设，需要在另一个假设中进行选择，

这就是替换假设。P141

50. 二维列联表：二维表就是行列交叉的表格，将两个变量一个分行排放，一个分列排放，

行列交叉处就是同属于两个变量的不同类的数据，也称为列联表。 51. 相关关系：是指各变量之间存在一定的依赖或影响，但是一个变量的值不能由另一个或

另几个变量的值唯一确定，即当一个或多个变量取某个值时，另一个变量的值并不唯一确定的。

52. 正线相关：如果两个变量的变动方向一致，即一个变量增加，另一个变量也随之增加，

或者一个变量减少，另一个变量也随之减少，就称为正线相关。P165

53. 负线相关：如果两个变量的变动方向相反，即一个变量增加，另一个变量减少，或者一

个变量减少，另一个变量增加，就称为负线相关。P165