kl800.com省心范文网

《统计学》第二章 统计数据的搜集、整理(1)


第二章 统计数据的搜 集、整理和显示
第一节 第二节 第三节 第四节 统计数据的搜集 数据整理 频数分布 数据显示

第一节 统计数据的 搜集

一、统计数据搜集的基本理论
(一)定义
1.根据统计研究 根据统计研究预定的目的要求和 根据统计研究 任务,运用相应的科学的调查方法 与手段,有计划、有组织地向客观 实际搜集数字(原始)资料。 2.搜集数据的途径:调查与实验 搜集数据的途径: 搜集数据的途径

(二)调查数据与实验数据
1.调查数据 2.实验数据,自然科学

(三)统计调查的方案设计PLAN 统计调查的方案设计
1.确定调查目的. 2.确定调查对象和调查单位(P22) 调查对象:要调查的现象总体,该总体 是由许多性质相同的调查单位组成的。 调查单位:所要调查的具体单位,是进 行调查登记的标志的承担者 报告单位/填报单位:负责向上报告调 查内容,提交统计资料的单位 3.确定调查项目:标志。 4.调查表格和问卷的设计。 5.确定调查时间(时期,时点)和调查 期限. 6.统计调查的组织实施计划

例: 1,要对某企业的生产设备的实际生产能力进 行调查,则该企业的生产设备是( ) A调查对象 B调查单位 C调查项目 D报告单位 2,调查某市工业企业资产负债的分布状况, 则工业企业是( ) A调查对象和报告单位 B调查单位和报告单位 C报告单位和填报单位 D填报单位和调查对象

二、统计调查的组织形式
(一)全面调查与非全面调查
1.全面调查是对调查对象的所有单位 全面调查是对调查对象的所有单位 一一进行调查。 一一进行调查。 1)普查 )普查census 普查是专门组织的一种全面调查,它 普查 主要是用以调查某些不能或不宜用定 期的全面报表搜集的统计资料。

普查的主要特点: 普查的主要特点: 第一,它是一次性(非连续性)的调 查,一般间隔较长时间。 第二,它是一种全面调查,可获得大 量详细、全面的资料。 例如,人口普查,经济普查

2)全面统计报表制度 全面统计报表制度 statistical yearbook A) 定义 :自上而下…自下而上… B)统计报表的主要特点: 第一,资料来源于各个基层单位的原始 第一 记录。 第二,逐级上报和汇总的。 第二 第三,属于经常性(连续性)调查,调 第三 查项目相对稳定,有利于积累资料,并 进行动态对比分析。

2.非全面调查 : 对调查对象其中的一部分单 非全面调查: 非全面调查 位进行调查。 1) 抽样调查 ) 抽样调查sampling, 是从调查对象中抽 , 取一部分单位作为样本进行观察,然后根据 所获得的样本数据,对调查对象总体特征作 出具有一定可靠程度的推算或对总体进行了 解。 A)特点: 特点: 特点 第一,按随机原则抽取样本。 , 第二, 第二 , 根据部分调查的实际资料对调查对象 总体的数量特征作出估计(统计推断)。 第三, 第三,抽样误差可以事先计算并加以控制。

B)适用范围: 适用范围: 适用范围 第一,不可能或不必要进行全面调 第一 查的社会现象。例如,破坏性的产 品质量检查 第二,对普查资料进行必要的修正。 第二

2)重点调查 ) 重点调查:是指在调查对象中,只选 重点调查 择一部分重点单位进行的非全面调查。 3)典型调查 ) 典型调查是一种专门组织的非全面调 典型调查 查。根据调查的目的,在对所研究的 对象进行初步分析的基础上,有意识 地选取若干具有代表性的单位进行调 查和研究,借以认识事物发展变化的 规律。

(二)连续性调查与非连续性调 查
统计调查按时间标志 按时间标志可分为连续性(经 按时间标志 常性)和不连续性(一次性)调查两大 类。 1.连续性 连续性(经常性)调查:是指随着研 连续性 究现象的变化,连续不断地进行调查登 记。 2.不连续性 不连续性(一次性)调查:是指间隔 不连续性 一段较长的时间对事物的变化进行一次 性调查。

( 三)定期报表形式与专门调查 1.定期报表制度 定期报表制度是按国家统一规定的表 定期报表制度 式和内容,定期地向各级领导机构报送 统计资料的一种调查形式。 2.专门调查 专门调查是为某一专题研究而组织 专门调查 的专项调查。

三、统计调查体系
建立以必要的周期性的普查为基础, 经常性的抽样调查为主体,同时辅之 以重点调查、科学推算和少量的全面 报表综合运用的统计调查方法体系 统计调查方法体系。 统计调查方法体系

四、统计调查误差error 统计调查误差

第二节 数据整理

一、数据整理的内容与程序
1.统计数据整理的内容 统计数据整理的内容: 统计数据整理的内容 统计分组和统计指标是统计整理的中心 统计分组和统计指标是统计整理的中心 工作。 工作。 2.数据整理的程序。 数据整理的程序。 数据整理的程序

二、统计分组
(一)统计分组的概念与种类
1.统计分组的概念 统计分组的概念 组内一致性, 组内一致性,组间差异性 2.统计分组的原则 统计分组的原则 穷尽原则:不漏 互斥原则:不重

3.统计分组的种类 统计分组的种类 1)按分组标志的多少 标志的多少,可分为简单 标志的多少 分组和复合分组。 2)按分组的标志的性质 标志的性质不同,分为 标志的性质 品质分组(或称属性分组)和数量分 组(或称变量分组)。 3)按分组的作用和任务 作用和任务不同,分为 作用和任务 类型分组、结构分组和分析分组。

(二)统计分组的方法
1.品质分组的方法 品质分组的方法 2.数量分组的方法 数量分组的方法 1)应注意的问题: )应注意的问题: A)分组时各组数量界限的确定必须能反 映事物质的差别。 B)应根据被研究的现象总体的数量特征, 采用适当的分组形式,确定相宜的组距、 组限。

2)单项式分组与组距式分组 ) A)单项式分组 B)组距式分组: 连续型变量或者变动范围较大的离散型 变量,适宜采用组距式分组。 3)间断组距式分组和连续组距式分组 ) 主要概念: 主要概念:下限和上限、组距、组限 间断组距式分组: 间断组距式分组 : 组限不相连的组距式 分组

连续组距式分组: 连续组距式分组 : 组限相连(或称相 重叠的),即以同一数值作为相邻两 组的共同界限的组距式分组。 上限在不内” 原则: “ 上限在不内 ” 原则 : 在连续组距式 分组中,以同一个数值作为相邻两组 共同的界限,我国统计制度规定,凡 是总体某一个单位的变量值是相邻两 组的界限值,这一个单位归入作为下 限值的那一组内。 (六十分万岁!)

4)等距分组与异距分组 ) 等距分组: 等距分组 : 标志值在各组保持相等的 组距,即各组的标志值变动都限于相 同的范围。 异距分组: 异距分组:各组的组距不相等。

5)组距与组中值的计算 ) 连续式分组的组距计算公式: distance组距=本组上限–本组下限 间断式分组的组距计算公式: 组距=本组上限–本组下限+1 开口组的组距:以相邻组的组距为本 组的组距。 上限 + 下限 组中值 = 2

6)组数的计算: )组数的计算: 组数=全距/组距 斯特杰斯Sturges经验公式(P31): 组数=1+3.3 Lg N 由此推出,组距=(最大变量值-最小 变量值)/(1+3.3Lg N )

三、统计指标Index, Indicator 统计指标
(一)指标的定义 总体的数量特征 描述总体的数量特征。标志是描述个体 描述总体的数量特征。标志是描述个体 的。 (二)指标的分类 1.数量指标:GDP 数量指标: 数量指标 2.质量指标 CPI,Engel coefficient系 质量指标: 质量指标 , 系 数 (三)指标体系 (四)国民经济活动的主要统计指标

多选题
1,学龄前儿童按年龄分组为:未满1 岁,1-2岁,3-6岁。这里( ) A年龄是分组标志 B年龄是离散型变量 C儿童是分组标志 D第一组的组中值是0.5岁 E第二组的组中值是1.5岁

2,以下哪些是相对指标( ) A生猪出栏率 B恩格尔系数 C企业劳动生产率 D股票平均价格 E人口增长率

3,在第五次全国人口普查中,( ) A国籍是可变标志 B全国人口数是统计指标 C每个中国公民是调查对象 D人口年龄是变量 E全国女性人数是品质标志

第三节 频数分布

一、频数分布的基本概念
1.频数分布 频数分布 frequency distribution 2.分布数列的两个要素 分布数列的两个要素 1)总体按某标志x所分的组。 2)各组所出现的单位数,即频 数f,亦称次数。

二、变量数列的编制
1.编制方法(P36,例2-1)。 编制方法( 编制方法 , )。 2.频率的性质 频率的性质 1)频率是界于0和1之间的一个分 数, 2)各组频率之和等于1。 3.(异距分组 频数密度: 异距分组)频数密度 异距分组 频数密度: 频数密度=频数/组距 频率密度=频率/组距

三、cumulative累计频数与累计频率 累计频数与累计频率 1.向上累计频数(或频率)分布:先 向上累计频数(或频率)分布: 向上累计频数 列出各组的上限,然后由标志值低的 组向标志值高的组依次累计。 2.向下累计频数(或频率)分布:先 向下累计频数(或频率)分布: 向下累计频数 列出各组的下限,然后由标志值高的 组向标志值低的组依次累计。 例题2-2,P37

3.累计频数分布特点 累计频数分布特点 4.累计频数(频率)分布图P47,2-6 累计频数(频率)分布图 累计频数 , 累计频数(频率)分布图分为向上累 计频数(频率)分布图和向下累计频 数(频率)分布图。 以分组变量为横轴,以累计频数(频 率)为纵轴。

四、频数分布的类型
1.钟型分布:bell-shaped distribution 钟型分布: 钟型分布

( Ⅰ ) 对称

( Ⅱ )
正偏,右

( Ⅲ )
负偏,左

钟型分布示意图

如图(Ⅰ)所示,其分布特征是以变量 的平均数为对称轴,左右两侧对称,两 侧变量值分布的次数随着与其平均值距 离的增大而渐次减少。在统计学中,称 这种分布为正态分布。 其中的(Ⅱ)(Ⅲ)为非对称分布,它们 各有不同方向的偏态。图(Ⅱ)曲线是 正偏(右偏)分配,图(Ⅲ)曲线是负 偏(左偏)分配。

正态分布Normal Distribution
Gaussian distribution 在高斯Gauss的一切科学贡献中,其对人类 文明影响最大者,就是这一项。 正态分布有极其广泛的实际背景,生产与科 学实验中很多随机变量的概率分布都可以近 似地用正态分布来描述。 例如,在生产条件不变的情况下,产品的强 力、抗压强度、口径、长度等指标;同一种 生物体的身长、体重等指标;同一种种子的 重量;测量同一物体的误差;弹着点沿某一 方向的偏差;某个地区的年降水量;以及理 想气体分子的速度分量,等等。

一般来说,如果一个量是由许多微小 的独立随机因素影响的结果,那么就 可以认为这个量具有正态分布(中心 极限定理)。从理论上看,正态分布 具有很多良好的性质 ,许多概率分布 可以用它来近似;还有一些常用的概 率分布是由它直接导出的,例如对数 正态分布、t分布、F分布等。

2、U型分布 、 型分布
50

某地区人口 死亡率

死 亡 率
(‰)

40 30 20 10 0

10 20 30 40 50 60 70 80

年龄

图2 - 4 U型分布示意图 型分布示意图

3、J型分布 、 型分布
正J型图

反J型图

J型分布示意图 型分布示意图

第四节 数据显示 统计表和统计图

一、统计表
(一)统计表的定义和结构 1.统计表的定义 统计表的定义 作用:清楚地、有条理地显示统计资料, 作用 直观地Intuitionally, Intuitively反映统 计分布特征,是统计分析的一种重要 工具。 。

2.统计表的结构 统计表的结构(P41,表2-5) 统计表的结构 , 1) 从表式上看 ) 从表式上看,表格包括总标题、 横行标题、纵栏标题和指标数值四 个部分。 2 ) 从内容上看,统计表由主词栏和 2) 从内容上看 宾词栏两个部分组成。

(二)统计表的分类
1.按主词的结构分类 按主词的结构分类 1)简单表list 2)分组表 3)复合表 2. 按宾词设计分类 1)宾词简单排列表 2)宾词分组平行排列表。

(三)统计表的设计
统计表的设计应注意如下事项: 统计表的设计应注意如下事项: 1. 线条的绘制,粗,细,开口。 线条的绘制, 开口。 2. 合计栏的设置。 合计栏的设置。 3. 标题设计。以简练而又准确的文字 标题设计。 表述统计资料的内容、资料所属的 空间和时间范围。

4.指标数值的填写。 指标数值的填写。 指标数值的填写 5.计量单位。 计量单位。 计量单位 6. note注解或资料来源。在统计表下, 注解或资料来源。 注解或资料来源 应注明资料来源。

二、统计图
1、直方图 、直方图histogram:用直方形的宽度 : 和高度来表示次数分布的图形。绘制 直方图时,横轴表示各组组限,纵轴 表示次数(一般标在左方)和比率 (或频率,一般标在右方)。 2、折线图 、折线图line chart:折线图可以在直 : 方图的基础上,用折线将各组次数高 度的坐标连接而成,也可以用组中值 与次数求坐标点连接而成。 3、曲线图:用平滑曲线连接各组次数坐 、曲线图: 标点即得分布曲线。

4.洛伦茨曲线 洛伦茨曲线Lorenz curve 洛伦茨曲线 绘制方法如下: 绘制方法如下: 1)将分配的对象和接受分配者的数量均 化成结构相对数并进行向上累计; 2)纵轴和横轴均为百分比尺度,纵轴自 下而上,用以测定分配的对象,横轴由 左向右用以测定接受分配者。 3)根据计算所得的分配对象和接受分配 者的累计百分数,在图中标出相应的绘 示点,连接各点并使其smoothing平滑 化,所得曲线即所要求的洛伦茨曲线。

利用洛伦茨曲线对收入分配状况分析 根据实际收入分配线与绝对平等线或 绝对不平等线进行比较,衡量不平等 程度。离绝对平等线越远分配越不平 等;反之,越靠近绝对平等线分配越 平等。 基尼系数Gini coefficient:实际收入 分配曲线与绝对平等线围成的面积对 比总面积。基尼系数系数越大说明分 配越不公平。

收 入 (%

100

)

80

60

40
绝对不 平等曲线

20

0

20

40

60

80

100

人口(%)

洛伦茨曲线示意图

Gini Coefficient 基尼系数
按照联合国UN有关组织规定: 若低于0.2表示收入绝对平均; 0.2-0.3表示比较平均; 0.3-0.4表示相对合理; 0.4-0.5表示收入差距较大; 0.5以上表示收入差距悬殊。

通常把0.4作为收入分配差距的“警戒线”, 根据黄金分割律,其准确值应为0.382。一 般发达国家的基尼指数在0.24到0.36之间, 美国偏高,为0.4。 中国大陆基尼系数2010年超过0.5,贫富差距 较大。总人口中20%的最低收入人口占收入 的份额仅为4.7%,而总人口中20%的最高收 入人口占总收入的份额高达50%。 世界银行发表了一份数据,最高收入的20% 人口的平均收入和最低收入20%人口的平均 收入,这两个数字的比在中国是10.7倍,而 美国是8.4倍,俄罗斯是4.5倍,印度是4.9倍, 最低的是日本,只有3.4倍。

课后作业题
思考题5,8,9,15,16

P52,计算题22,书面作业


赞助商链接

《统计学》期末重点复习题(1-8章)附答案 (2)

《统计学》期末重点复习题(1-8章)附答案 (2)_工学_高等教育_教育专区。第...第二章 统计资料的收集整理 一、填空题 1、对统计调查的基本要求是 资料的...

第一章 统计学与统计数据

1 教学 目的 2. 3. 4. 5. 理解统计学的含义 ...学 习第一《统计总论 ; 第一统计数据与...★统计学是研究如何搜集整理、分析和解释统计数据...

《统计学》习题(1-8章)

第二章 统计资料的收集整理 、填空题 1、统计调查的基本要求是 和。 2...《统计学》练习题 第 2 页共 29 页 6 、通过统计分组,使现象总体的各个组...

《统计学》期末复习材料(2014-2015学年(1))

1统计学的发展史 统计学派 政治算术学派 产生时间 17 世纪 代表人物...统计工作(统计活动):利用各种科学方法对社会经济现象的数量方面 进行搜集整理和...

2014秋东北财经大学《统计学》在线作业一(随机1)及答案

数据搜集 ?数据整理 ?数据分析 ?数据核算 【3】在当前情况下,描述统计学已经不重要了。() 2014 秋东北财经大学《统计学》在线作业一(随机 1)及答案 A:正确:...

统计学第一章整理

章、总论 、什么是统计学 ? 统计的含义与本质:用数字说明现象的本质 1.统计活动 2.统计数据 3.统计学 统计的含义及关系 政府统计 统计活动 (工作过程)...

统计学(第一章)

(六)教学内容 第一章 绪论 第二章 统计数据的搜集整理 第三章 数据分布...第八章 统计指数 (七)参考教材 1、袁卫、庞皓、曾五一、贾俊平:《统计学》,...

《统计学》习题(1-8章)有答案

《统计学》习题(1-8章)有答案_理学_高等教育_教育专区。第一章 总论 一、填空...) 第二章 统计资料的收集整理 一、填空题 1、对统计调查的基本要求是 资...

2018统计学习题(1-10)(1)(1)

2018统计学习题(1-10)(1)(1) - 一章 总论 一、判断题 1.统计学是一门关于如何搜集整理、分析和解释数据并从数据中得出结论的方法论 科学。 () 2....

统计学答案1

统计学答案1_教育学_高等教育_教育专区。统计学第五...(4)参数 (5)推断统计方法。 第二章数据的搜集 1...数据的图表搜集 3.2 分类数据和顺序数据的整理和...