kl800.com省心范文网

统计学原理 第二章 统计数据收集


? 统计数据是统计分析的基础和前提,准确、及

时、有效地进行统计数据的收集是统计活动的 起点,科学的、规范的数据收集方法是统计学 研究的重要内容之一。

第二章 统计数据收集
? 2.1 统计数据的来源 ? 2.2 统计调查设计 ? 2.3 统计数据质量

2.1 统计数据的来源
? 从统计数据的观测登记方式和统计数据本身的

属性来看,统计数据存在着两种不同的来源: ? 专门组织的统计调查 ? 科学实验和生产试验的观测数据

? 从使用者的角度看,统计数据存在两种不同的

来源。 ? 一是直接的来源,使用者所应用是由自己亲 自观测登记获得的统计数据,属于第一手的统 计数据,称为初级数据; ? 二是间接的来源,使用者所应用是由他人观 测登记获得的统计数据,属于第二手的统计数 据,称为次级数据。

? 任何第二手统计数据都是来源于他人观测登记

所获得的第一手统计数据。归根到底,专门组 织的统计调查,科学试验和生产实验的观测数 据是统计数据的来源所在,是第一性的,决定 着统计数据的质量。

? 间接来源 ? (1)各类专业期刊、报纸、书籍所提供的文

献资料 ? (2) 统计部门和各级政府部门公布的资料: 定期发布的统计公报,定期出版的统计年鉴以 及未公开出版的统计数据 ? (3)各类经济信息中心、信息咨询机构、专 业调查机构、各行业协会和联合会提供的市场 信息和行业发展的数据情报。

? (4)各种会议,如博览会、展销会、交易会

及专业性、学术性研讨会上交流的有关资料 ? (5) 互联网或图书馆查阅到的有关资料 ? (6) 业务资料,如与业务经营活动有关的各 种单据、记录;经营活动过程中的各种统计报 表;各种财务、会计核算和分析资料

统计数据的来源
从观测登记方式看
专门组织的统计调查 科学试验、生产实验和交易 活动

统计数据的来源

从使用者的角度看

统计调查、试验、实验和 交易活动 (直接的统计数据) 别人调查或登记的数据

(间接的统计数据)

? 二手数据的优点:搜集方便、数据采集快、采

集成本低 ? 二手数据的缺点:相关性、可信度、时效性

2.1 统计数据的来源
? 一手数据:经济现象的数据、人的行为数据、

生产经营活动数据 ? 一手数据的特点:搜集成本高、准确性、相关 性、可信度、时效性

2.1 统计数据的来源
? 2.1.1 统计调查 ? 2.1.2 数据的搜集方法

? 2.1.1 统计调查 ? 统计数据调查的主要方法有普查、抽样调查和

统计报表。 ? 我国政府统计调查工作是“以必要的周期性普 查为基础,经常性的抽样调查为主体,重点调 查、科学推断等为补充的多种方法综合运用的 国家统计调查方法体系。” —国务院1994年 42号文

? 1.普查 ?

普查(Census)是为了特定目的而专门组 织的一次性或周期性的全面调查,调查在某一 标准时间上的社会经济现象的总量。




总体单位 调查单位

对全部单位进 行的调查。

? 普查具有以下特点: ? (1)普查是一种全面调查。 ? (2)普查是一种一次性或周期性的调查。

? (3)普查是一种调查在某一标准时间上的社

会经济现象总量的调查。

? (1)普查是一种全面调查。 ? 需耗费大量人力、物力和时间,成本较高。 ? 普查往往需要临时征用大量调查人员,同时进

行大规模的实地调查登记和数据处理工作,由 于调查人员专业素质参差不齐,调查任务过于 繁重,调查时间比较紧张,普查容易导致各类 登记性误差。 ? 不存在由部分样本推断总体参数的估计误差。

? ? ? ?

我国的普查 1994年方案 人口 农业 工业 第三产业 普查年份 0 7 3 5 (尾数) 基本单位 1,6

?

我国的普查 人口 0 农业 7 工业 3 第三产业 5 基本单位 1,6 建筑业

1994年方案 普查年份 (尾数)

2003年方案 普查年份 (尾数)

人口 0

农业 6

经济普查 3,8

? 《第二次全国基本单位普查办法》是为搞好

2001年进行第二次全国基本单位普查,特制定 的办法。普查的目的是摸清我国各类单位的底 数,掌握全国基本单位的组织形式、经济构成、 规模结构和生产要素的配置以及行业分布、地 区分布等情况,逐步建立和完善覆盖全国的部 门间相互衔接、互为补充、信息共享且能动态 更新的基本单位名录库系统,为规范市场秩序、 加强社会监管、调整经济结构、优化产业政策、 规划城乡建设等提供基础信息,并为开展其他 普查和各类抽样调查奠定基础。

? (3)普查是一种调查在某一标准时间上的社会经济现

象总量的调查。 ? 根据国家普查项目和周期安排的有关规定,国务院决 定于2010年开展第六次全国人口普查。此次人口普查 标准时点为11月1日零时,人口普查主要调查人口和住 户的基本情况,内容包括:性别、年龄、民族、受教 育程度、行业、职业、迁移流动、社会保障、婚姻生 育、死亡、住房情况等。人口普查的对象是在中华人 民共和国(不包括香港、澳门和台湾地区)境内居住 的自然人。 ? 2011年4月28日,国家统计局局长马建堂发布2010年 第六次人口普查登记(已上报户口)的全国总人口为: 1 339 724 852人。

? 普查的目的: ? 在于搜集那些不能够或不适宜用其它统计调查

方式搜集的统计数据,以搞清重要的国情、国 力,为经常性的抽样调查提供抽样框和其它辅 助数据。

? 抽样框(Sampling Frame) ? 进行抽样调查时抽取样本的有序数据库。 ? 为了降低抽样调查的系统性偏误,抽样框数据

与总体的客观存在应尽量保持一致。抽样框的 原始数据只能来自于对总体的全面调查,借助 周期性的普查来不断更新抽样框数据,是科学 地实施抽样调查的基本要求。

? 2.抽样调查 ? 抽样调查(Sampling Survey)是根据随机原

则和具体的抽样技术的要求,从总体中抽取部 分个体构成样本,并依据样本信息推断总体数 量特征的非全面调查。

抽样调查
总体单位 调查单位

按随机原则抽取部 分单位进行的调查。

? (1)抽样调查是一种按照随机原则抽取样本

的调查。 ? (2)抽样调查是一种可以事先估计和控制抽 样误差的调查。 ? (3)抽样调查是一种非全面调查。抽样调查 仅对总体中部分被随机抽中的个体进行登记, 因此可以显著地提高调查的时效性,降低调查 的人力、物力、财力投入,抽样调查是一种经 济的调查方法。

? (4)抽样调查是一种准确性高的调查。 ? 基于抽样调查的随机原则,可以事先估计和控

制抽样误差;同时抽样调查仅对总体中被随机 抽中的个体进行调查,调查工作量大幅减少, 可以运用具备丰富经验的专业人员,在相对充 裕的调查时间里,高质量地进行数据采集和数 据处理,有效地降低调查的登记性误差。所以, 抽样调查是对普查等统计调查中存在的登记性 误差进行检查和校正的主要方法。

? (5)抽样调查是一种具有广泛适用性的调查。 ? 抽样调查可以用于破坏性检验场合的调查和推

断。对于具有破坏性的调查,例如对一些产品 的使用寿命、抗压、防震等能力的检验,以及 对一次性使用物品的检验等,只有采用非全面 调查方法。 ? 抽样调查可以用于较大规模总体或无限总体的 调查和抽样。在总体单位数无限或虽然有限却 无法一一观察的情况下,要研究总体的数量特 征,就难以进行全面调查,而只能以抽样调查 方法推断总体。

? 抽样调查可以用于检查和补充全面调查数据。 ? 抽样调查可以用于企业的全面质量控制。

? 自1953年起,我国政府统计部门相继成立了全

国农产量调查总队和各省、市、自治区农产量 调查队。1982年以后,我国又设立了全国城市 抽样调查队和企业调查队,最近又组建全国的 抽样调查局系统。已经形成了一个自上而下的 全国抽样调查网络体系。

? 3.统计报表 ? 统计报表(Statistical Report Forms)是指按照统

一的表式,统一的报送时间和报送程序,自上而下统 一布置,自下而上逐级上报,逐级汇总,提供基本统 计数据的统计调查方式。 ? 统计报表分为国家正式报表和企业内部报表。国家正 式报表是指按照国家有关法规规定,由统计主管部门 正式核准的,所有单位和公民都必须依法填写和报送 的统计报表。企业内部报表是现代企业管理信息采集 和经营决策分析的重要工具之一,由企业按照内部核 算要求和填报国家正式报表需要,自行制定,自我管 理。

? 【课后作业】 ? 搜集某一统计报表,了解报表结构,报表填报

指南。

? 4.重点调查 ? 重点调查是在调查对象中选择一部分重点单位

所进行的一种非全面调查。 ? 所谓重点单位是指在总体中举足轻重的那些单 位,这些单位的数目不能太多,但这些单位的 标志值之和却占总体标志总量的绝大比重,通 过对这些重点单位的调查,就可以了解总体的 基本情况。但是,重点调查不能推断总体。

重点调查
总体单位 调查单位
对重点单位(个数 不多,但其标志量占 标志总量比重较大的 单位)进行的调查。

? 重点调查的应用条件是在总体中必须客观存在

这样的重点单位,从而可以通过对总体内少量 重点单位的调查,来实现对总体基本情况的了 解,达到进行统计调查的目的。 ? 重点调查的意义就在于当总体内客观存在重点 单位时,我们能够利用较少的费用和较短的时 间,通过对少量重点单位的统计调查,来获得 能够反映总体全貌的数量特征的基本资料。

? 5.典型调查 ? 典型调查就是根据调查目的和调查对象的特点

从调查对象中有意识地选取若干有代表性的单 位(即典型单位)进行的调查方法。

典型调查
总体单位 调查单位

有意识地选择部 分典型单位进行的 调查。

? 5.典型调查 ? 典型单位根据调查的目的不同,一般有三种不

同选取办法。 ? 一是近似地估算总体的数值,可采用“划类选 典”方法。 ? 二是了解总体的一般数量表现,可采用“择中 选典”方法。 ? 三是研究成功的经验或失败的教训,可采用 “优劣选典”方法。

? 调查单位是根据调查的目的,在对调查对象进

行全面分析的基础上有意识地选择出来的。调 查资料不能推断总体。 ? 在一定条件下可用“划类选典”和“择中选典” 的典型调查的资料补充全面调查的不足。典型 调查为非概率抽样,不能计算抽样误差。

? 2.1.2 数据的搜集方法 ? 数据的搜集方法一般可以归纳为询问调查和观

察实验两大类。 ? 1.询问调查 ? 询问调查是调查者与被调查者通过某种方式和 某种工具进行信息交流,以采集和登记调查数 据的方法。

? 询问调查可以分为以下几类: ? (1)访问调查。 ? (2)电话调查。

? (3)邮寄调查。
? (4)计算机辅助调查(网络调查)。 ? (5)座谈会调查。

? (1)访问调查:又称为入户调查,或派员调

查。是专门派出调查人员,前往被调查对象所 在地,直接进行的面对面的信息交流和当场登 记的一种调查方法。

【访问调查】 激励参与意识 现场释疑 适用于对识字率低的群体 问卷结构可复杂 周期较短 ? 成本较高【培训费用,工资,小礼品,交通费 用】 ? 不适用于敏感性问题的调查
? ? ? ? ? ?

? (2)电话调查:调查人员通过电话与被调查

人员进行的信息交流和数据登记的一种调查方 法。

? ? ? ? ? ? ? ? ? ?

【电话调查】 速度快 适用于样本单位分散的情形 成本低 有利于调查督导 计算机辅助电话调查CATI(Computer Assisted Telephone Interview) 必须有电话 时间不能太长 问卷需要简单 不利于激发参与意识

2012-03-02(ZHOUWUWan)

? (3)邮寄调查:是指通过邮政系统邮寄,以

及大众传播媒介发布、专门场所派发和部门单 位内部系统分发等方式将标准化的调查表递送 至被调查对象,由被调查对象按照填表说明自 行填写,然后按照要求寄回到指定的调查数据 回收地址,或投放到指定的调查数据回收场所, 以实现数据采集的一种调查方法。

? 【邮寄调查】或称【自填式】 ? 问卷结构要严谨,有清楚的说明 ? 要求被调查者具有一定的文化素养

? 被调查者可方便地作答【时间,资料,压力】
? 调查成本较低 ? 返回率较低【放弃,丢失,遗忘】

? 周期较长

? 计算机辅助调查:是指采用计算机技术进行问

卷设计、样本抽取、调查登记、数据录入和数 据处理的一种调查方法,多用于与现代信息技 术相结合的场合。例如电话自动应答调查系统、 网络调查系统和短信调查系统等。

? 座谈会调查:是通过召集一组被调查者集中进

行面对面的信息交流和当场登记的一种调查方 法。 ? 座谈会所召集的被调查者一般为有针对性的特 征人群,例如某方面专业人士、某领域专家学 者,某行业实际工作人员,某产品直接消费者 或使用者,等等。 ? 座谈会调查可以用于问卷的预调查。

? 2.观察和实验 ? (1)观察法。 ? (2)实验法。

? 观察法:是调查者单方面观察、采集信息的一

种数据搜集方法。例如: ? 超速检测 ? 路口摄像头:交通路口车流量信息采集 ? 超市监控:超市里消费者购买行为数据采集

? 实验法:是在特定的实验环境下,对参与实验

调查的被调查对象进行实验测量,以取得所需 信息的一种数据搜集方法,例如用拍卖实验研 究消费者对有机食品的支付意愿等。

2.1.2 数据的搜集方法
? 【实验法】 ? (1)不同饲料对牲畜增重的影响 ? (2) 不同元素结合后产生的变化;

? (3) 水分、温度对农作物产量的影响
? (4) 新药的疗效 ? (5) 军事学上的应用:英国海军为了印证缺乏

柑橘类水果是否是导致长期在海上工作的税收 患坏血病的原因。

【实验法】
? 实验组(Experiment Group)与对照组(Control Group) ? 随机原则与自愿原则 ? 匹配 ? 双盲法 ? 心理问题[1924-1933] ? 道德问题 ? 案例:现场试验帮助A公司胜诉

? 参考:贾俊平主编统计学(27-31页)

2012-03-02(ZHOUWUShangWu)

? 【数据搜集方法的选择】 ? 抽样框中的有关信息(目标总体特征,比如地域

是否分散等,被调查者文化程度等) ? 调查访问的内容(难易程度,是否为敏感性问 题等) ? 有形辅助物的使用 ? 实施调查的资源(经费、调查员、调查设备、时 间限制) ? 管理与控制(电话录音) ? 质量要求

搜集数据不同方法特点归纳
自填式 调查时间 调查费用 问卷难度 有形辅助物的使用 调查过程控制 调查员作用的发挥 回答率 慢 低 要求容易 中等使用 简单 无法发挥 最低 面访式 中等 高 可以复杂 充分利用 复杂 充分发挥 较高 电话式 快捷 低 要求容易 无法利用 容易 一般发挥 一般

? 量表( Scale )与问卷(Questionnaire)

2.2 统计调查设计
? 2.2.1 统计调查方案设计 ? 2.2.2 问卷设计 ? 2.2.3敏感问题的随机化处理

? 2.2.1 统计调查方案设计 ?

统计调查是一项复杂细致的系统工程, 为了统一认识、统一内容、统一方法、统一步 调,必须事先编制一个科学的统计调查方案。

? 统计调查方案一般包括以下几方面的内容: ? 1.调查任务和目的 ? 2.调查对象、调查单位和填报单位 ? 3.调查项目和调查指标 ? 4.调查时间 ? 5.调查方法 ? 6.调查误差的控制方法

? 7.调查数据的汇总处理方法
? 8.调查表和调查问卷设计 ? 9.制定调查工作的组织实施计划

? 1.调查任务和目的 ? 调查任务和目的是统计调查的依据。 ? 调查目的决定着调查的对象、内容和方法。

? 以〈第五次全国人口普查办法〉为例 ? 第一条

为了科学地制定国民经济和社会发展 战略与规划,制定人口政策,统筹安排人民的 物质和文化生活,实现人口与资源、环境的协 调发展,国务院决定于2000年进行第五次全国 人口普查。根据《中华人民共和国统计法》, 制定本办法。

? 《住宅销售价格调查方案》 ? 调查任务和目的 ? 调查目的:全面了解和掌握相关城市新建住宅

和二手住宅销售价格及其变动情况,为做好国 民经济核算和房地产市场调控工作、满足社会 公众需要提供基础统计信息。 ? 调查任务:按月调查和收集相关城市新建住宅 和二手住宅销售价格、面积、金额等相关基础 资料并计算价格指数。

? 2.调查对象、调查单位和填报单位 ? 调查对象和调查单位的确定取决于调查任务和

目的。
? 调查对象与统计总体相联系;调查单位与总体

单位相联系。
? 填报单位(又称报告单位)是负责向上级报告

调查内容、提交统计资料的单位。

? 调查对象、调查单位、填报单位 ? 调查城市包括直辖市、省会城市、自治区首府

城市(不含拉萨市)和计划单列市(共35个),以 及唐山、秦皇岛、包头、丹东、锦州、吉林、 牡丹江、无锡、扬州、徐州、温州、金华、蚌 埠、安庆、泉州、九江、赣州、烟台、济宁、 洛阳、平顶山、宜昌、襄樊、岳阳、常德、惠 州、湛江、韶关、桂林、北海、三亚、泸州、 南充、遵义、大理等城市(以下简称“其他35 个城市”)。

? 《第五次全国人口普查办法》 ? 第六条

人口普查的对象是具有中华人民共和

国国籍并在中华人民共和国境内常住的人(全 体为调查对象,每一公民为调查单位)。
? 第八条

人口普查以户为单位进行登记。户分

为家庭户和集体户。(填报单位)

? 调查单位与填报单位有时是一致的,有时不一

致。

? 3.调查项目和调查指标 ? 调查项目就是调查中所要登记的调查单位的标

志及其它有关情况。确定调查项目的依据是事 先设计好的统计指标。确定调查项目时应注意 的主要问题还有以下几点。 ? (1)资料搜集的可行性。 ? (2)项目和指标解释的一致性。 ? (3)保证项目和指标之间的衔接性。 ? (4)保证项目和指标动态可比性。

? 调查指标、调查项目 ? 调查指标:城市的新建住宅(含保障性住房、商

品住宅以及各基本分类)和二手住宅环比、同比、 定基价格指数。

? 调查项目: ? (1) 新建住宅交易的网签数据内容,主要包括:

住宅所在项目(楼盘)名称、项目地址、幢 [zhuàng ]号、总层数、所在层数、住宅结构、 建筑面积、成交总价(合同金额)、签约时间等。 ? (2) 二手住宅销售价格的调查内容为:成交住 宅所在小区或社区名称、位置、住宅类型、住 宅所在区域、住宅所在地段、本月销售面积、 本月销售金额、样本住宅上月销售单价、样本 住宅本月销售单价等。

? 4.调查时间 ? 一是调查资料所属的时间。如果所要调查的是

时期现象,就要明确规定搜集从什么时间开始 到什么时间结束的资料;如果所要调查的是时 点现象,就要明确规定统一的标准时点。
? 二是调查工作的期限。指的是调查工作开始和

结束的具体时间要求。

? 《第五次全国人口普查办法》 ? 第三条

2000年11月1日零时,为第五次全国 人口普查登记的标准时间。 ? 第十九条 人口普查的现场登记工作,从2000 年11月1日开始到11月10日以前结束。

? 5.调查方法 ? 根据调查任务的要求,调查对象的特点,调查

人员业务水平和专业经验,选用合适的方法进 行调查。 ? 可选的调查方法有普查、抽样调查、统计报表、 重点调查、典型调查。 ? 在具体的调查方法确定之后,需要制定调查误 差控制方法、数据处理方法,提出明确的调查 经费概算,组织人员培训,设置调查机构等。

? 6.调查误差的控制方法 ? 根据所采用的不同统计调查方法,对于调查中

可能出现的误差,相应地采取不同的调查误差

控制方法,以提高统计调查资料的质量和可比
性。

? 对于全面调查,一般可以用抽样数据来控制全

面调查中出现的登记性误差。对于抽样调查, 可通过科学地确定必需的样本容量等方法来实

现对抽样误差的有效控制。

? 第二十三条 ? 第二十四条

普查登记的个人资料不得作为行 政管理和表彰、处罚的依据。
人口普查机构和各级普查工作人

员,对各户申报的情况,必须保守秘密,不得
向人口普查机构以外的任何单位和个人提供或 者泄露。严禁公开个人和家庭的登记资料。

? 第二十六条

普查登记结束后,普查指导员应 当组织普查员按照规定的方法进行全面复查, 发现差错,经核实后,予以改正

? 复查工作在2000年11月15日以前完成。 ?

? 第二十七条

复查工作完成后,全国抽取千分之零点

一五的人口进行事后质量抽查。事后质量抽查由国务 院人口普查办公室统一组织进行。抽查人员不得在原

来参加普查的普查区进行质量抽查工作。质量抽查工
作在2000年11月30日以前完成。事后质量抽查结果只 作为评价全国人口普查登记质量的依据,不用于评价

地方人口普查的工作质量。

? 7.调查数据的汇总处理方法 ? 首先是制定调查数据的汇总方法。大多采用分

级汇总与超级汇总相结合的方式。
? 其次是制定调查数据的处理方法。大型的统计

调查可以通过编制专用的调查资料汇总和数据 处理软件来保证这一工作的质量和效率。

? 需要制定各项调查指标的计算口径和计算方法,

调查数据的处理方法[单位、小数点],保证调 查数据在时间上和空间上的可比性。 ? 抽样调查时,需要对样本容量计算,抽样估计 量推断和抽样误差计算的具体方法给予统一规 定。

? 第三十三条

人口普查机构对普查的几项主要 数字,先进行快速汇总。省、自治区、直辖市 人民政府人口普查领导小组办公室将汇总结果 于2000年12月31日以前报送国务院人口普查办 公室。国家统计局和国务院人口普查办公室于 2001年1月31日以前发布公报。

? 第三十四条

人口普查表经复查后,由编码员 在编码指导员的指导下,按照统一规定的标准, 集中在县级进行编码。

? 编码资料经全面复核、验收合格后,方可交付录入。 ? 编码工作于2001年4月30日以前完成。 ? 第三十五条

人口普查表短表、长表,以调查小区为 单位分别装入不同的包装袋。《死亡人口调查表》以 普查区为单位装入相应的包装袋。 人口普查资料由人口普查机构负责进行 电子计算机数据处理。汇总程序由国务院人口普查办 公室统一下发。

? 第三十六条

? 8.调查表和调查问卷设计 ? 把确定的调查项目按照一定顺序排列在表格上,

就形成了调查表。

? 第九条 人口普查表分为普查表短表和普查表

长表两种形式,普查表由国务院第五次全国人 口普查领导小组办公室(以下简称国务院人口 普查办公室)设计。普查表长表根据国家规定 的办法,抽出百分之十的户填报;普查表短表 由其余的户填报。

? 调查问卷设计主要研究问卷设计,调查资料的

数量化处理、调查数据的标准化处理,以及敏 感问题的随机化处理等方面的问题。

本户 住址 姓名 与户 主关 系 2

省,市 自治区 性别 出生 年月 4

人 口 县 市 民族

普 查 乡 街道 常住人口 户口登记 状 况 6

表 镇 居委会 文化 程度 7 行业

村 街巷 职业 就业 状况 10

号 婚姻 状况 11 生育 子女 总数 12

1

3

5

8

9

申报人:

普查员:

填报日期:





户主签名:

? 9.制定调查工作的组织实施计划 ? 在统计调查实施计划中,除了以上介绍的方面

外,还包括:
? 调查工作的组织领导机构的设置和职能
? 调查人员的培训和组织 ? 统计调查的宣传教育 ? 文件印刷 ? 调查经费的管理

? 第十五条

各级宣传部门和新闻媒体,在人口 普查登记前后,应当积极做好人口普查的宣传 工作,动员群众参与人口普查。 ? 第二十八条 人口普查的登记工作,由普查员 承担,普查指导员负有对普查员的工作进行指 导、检查的责任。基层干部和群众积极分子应 当积极协助普查员作好登记工作。 ? 第二十九条 普查员和普查指导员应当由具有 初中以上文化水平、热心社会公益事业、身体 健康、责任心强、能够胜任人口普查工作的人 员担任。

2.2.2 问卷设计
? 1.问卷结构 ? 2.封闭性问题及备选答案 ? 3.问题排列

? 1.问卷结构 ? 问卷结构由问卷的开始,主体和结束三个部分

组成。 ? (1)问卷的开始部分主要包括识别信息,问 候语和填写说明三项内容。 ? (2)问卷的主体部分是调查问卷的核心内容, 包括所有封闭性问题及其备择答案,和开放性 问题。 ? (3)问卷的结束部分一般由被调查者的背景 数据构成。

? (1)问卷的开始部分主要包括识别信息,问

候语和填写说明三项内容。 ? 识别信息一般由问卷标题、问卷编号、调查者 及被调查姓名、地址、电话等基本信息组成、 用于问卷的识别,便于问卷数据的检验、核对、 校正,以及有效进行相关的后续调查。 ? 问候语的内容包括简要介绍调查者的情况,调 查的目的和意义,对被调查者合作的感谢。有 的问卷还要告知被调查者填写问卷后的信息反 馈、报酬和奖励等情况。问候语一定要亲切、 自然、诚恳,文字表述必须简洁清晰。问候语

? 的目的是消除被调查者的疑惑和顾虑,争取被

调查者的认可和认同,积极主动地参与和配合 问卷调查。 ? 填写说明的目的是介绍正确填写问卷的方法。 例如,对于问题类型的说明和识别,对于封闭 性问题中单选题和多选题的回答方式,对于开 放性问题的回答方法等。

? (2)问卷的主体部分是调查问卷的核心内容,

包括所有封闭性问题及其备择答案,和开放性 问题。

? (3)问卷的结束部分 ? 一般由被调查者的背景数据构成。例如被调查

者的性别、年龄、收入状态、受教育水平、职 业类别、家庭人口、居住地区等,以便按照研 究目的进行分类比较分析。被调查者的背景数 据放在问卷的结束部分提出,是一种消除被调 查者顾虑的设计技巧,以避免被调查者在没有 对问卷进行全面了解情况下,就从自我保护的 潜意识出发,排斥问卷调查,拒绝回答问卷, 或提供虚假的回答。

? 2.封闭性问题及备选答案 ? 问卷的主体由若干问题组成,其中主要形式为

封闭性问题。封闭性问题及备选答案的设计是 问卷设计的核心内容。 ? (1)封闭性问题的表达要准确,内容要完整。 一 般 可 以 按 照 6W 原 则 检 查 。 即 按 照 Who (谁),Where(何处),When(何时), Why(为什么),What(是什么),How(如 何)六个方面来判断。

? 避免提一般性的问题(表达不够准确) ? 一般性问题对实际调查工作并无指导意义 ? 例如:“您对某百货商场的印象如何?”这样的

问题过于笼统,很难达到预期效果,可具体提 问:“您认为某百货商场商品品种是否齐全、 营业时间是否恰当、服务态度怎样?”等。

? 避免用不确切的词(表达不够准确) ? 例如“普通”、“经常”、“—些”等,以

及—些形容词,如“美丽”等。这些词语,各 人理解往往不同,在问卷设计中应避免或减少 使用。例如:“你是否经常购买洗发液?”回答 者不知经常是指一周、一个月还是一年,可以 改问:“你上月共购买了几瓶洗发液?”

? 避免使用含糊不清的句子(表达不够准确) ? 例如:“你最近是出门旅游,还是休息?”

? 出门旅游也是休息的一种形式,它和休息并不

存在选择关系,正确的问法是:“你最近是出 门旅游,还是在家休息?”

? (2)封闭性问题备择答案要不重不漏。即保

证封闭性问题备择答案的完备性和周延性。 ? (3)封闭性问题必须使用中性语言和陈述句 式。 ? 要力求杜绝任何可能干扰被调查者的价值判断 和真实状态的表述,不应包含任何的情绪和倾 向,不能使用任何具有感情色彩和价值判断的 表述,也不能使用否定句,反问句,感叹句等, 可能引发某种暗示和诱导效应的封闭性问题构 造方式。

? 例如:您反对这项规定吗? ? (1)是

(2)否 (3)其他 ? 您认为该饮料太甜了吗? ? (1)太甜 (2)适中 (3)不够甜

? 您对这项规定的态度 ? (1)赞成 (2)反对 (3)弃权 ? 您认为该饮料的甜度

? (1)太甜 (2)适中 (3)不够甜

? 避免引导性提问 ? 如果提出的问题不是“执中”的,而是暗示出

调查者的观点和见解,力求使回答者跟着这种 倾向回答,这种提问就是“引导性提问”。 ? 例如:“消费者普遍认为XX牌子的冰箱好,你 的印象如何?” ? 引导性提问会导致两个不良后果:一是被调查 者不加思考就同意所引导问题中暗示的结论;

? 二是由于引导性提问大多是引用权威或大多数

人的态度,被调查者考虑到这个结论既然已经 是普遍的结论,就会产生心理上的顺向反应。 此外,对于一些敏感性问题,在引导性提问下, 不敢表达其他想法等。因此,这种提问是调查 的大忌,常常会引出和事实相反的结论。

? (4)封闭性问题的表述要简洁、通俗。为了

提高问卷的回答率和数据的准确性,封闭性问 题表述要简洁,真正做到一目了然。同时,封 闭性问题表述应通俗易懂,尽量避免专业词汇, 提高问卷的适用性。

问卷设计应注意的几个问题
? 问句要具体 ? 一个问句最好只问一个要点,一个问句中如果

包含过多询问内容,会使回答者无从答起,给 统计处理也带来困难。 ? 例如:“您为何不看电影而看电视”?这个问 题包含了“您为何不看电影?”“您为何要看电 视?”和“什么原因使您改看电视?”等。防止出 现此类问题的办法是分离语句中的提问部分, 使得一个语句只问一个要点。

? (5)封闭性问题的敏感性问题的处理。在一

般问卷调查中必须避免任何的敏感性问题,以 免造成被调查者顾虑或反感,影响到整个问卷 调查的质量。敏感性问题的调查必须通过专门 的调查技术,对敏感问题进行随机化处理之后, 专项组织进行,方可以取得可信的调查数据。

? (6)问句要考虑到时间性 ? 时间过久的问题易使人遗忘。 ? 如:“您去年家庭的生活费支出是多少?用于

食品、衣服分别为多少?”除非被调查者连续记 帐,否则很难回答出来。一般可问:“您家上 月生活费支出是多少?”显然,这样缩小时间范 围可使问题回忆起来较容易,答案也比较准确。

问题设计
直接性问题、间接性问题和假设性问题 ? 直接性问题是指在问卷中能够通过直接提问 方式得到答案的问题。直接性问题通常给回答 者一个明确的范围,所问的是个人基本情况或 意见,比如,“您的年龄”、“您的职业”、 “您最喜欢的洗发水是什么牌子的?”等,这些 都可获得明确的答案。这种提问对统计分析比 较方便,但遇到一些窘迫性问题时,采用这种 提问方式,可能无法得到所需要的答案。
?

问题设计
? 间接性问题是指那些不宜于直接回答,而采用

间接地提问方式得到所需答案的问题。通常是 指那些被调查者因对所需回答的问题产生顾虑, 不敢或不愿真实地表达意见的问题。调查者不 应为得到直接的结果而强迫被调查者,使他们 感到不愉快或难堪。这时,如果采用间接回答 方式,使被调查者认为很多意见已被其他调查 者提出来了,他所要做的只不过是对这些意见 加以评价罢了,这样,就能排除调查者和被调 查者之间的某些障碍,使被调查者有可能对已 得到的结论提出自己不带掩饰的意见。

问题设计
? 例如,“您认为妇女的权力是否应该得到保

障?”大多数人都会回答,“是”或“不是”。 而实际情况则表明许多人对妇女权力有着不同 的看法。如果改问: ? “A:有人认为妇女权力应该得到保障的问题 应该得到重视。” ? “B:另一部分人认为妇女权力问题并不一定 需要特别提出。”
?

? 您认为哪些看法更为正确? ? 对A种看法的意见: ? ①完全同意;②有保留的同意;③不同意。

? 对B种看法的意见:
? ①完全同意;②有保留的同意;3不同意。

? 例如:“有人认为目前的电视广告过多,您的

看法如何?”

问题设计
? 假设性问题是通过假设某一情景或现象存在而

向被调查者提出的问题。例如:“如果在购买 汽车和住宅中您只能选择一种,您可能会选择 哪种?”这个语句属于假设性提问。

? 3.问题排列 ? (1)问题的排列应具有层次性和逻辑性,符

合人们思维习惯。前后相继的问题具有内在联 系,反映事物的因果关系,和递进的思维层次。

? (2)“过滤”性问卷设计的问题排列。“过

滤”性问卷设计要求问题排列构成逻辑的树状 结构。 ? 例:某一项数码产品问卷调查采用了“过滤” 性问卷设计。第一个问题是: ? “您在近2年内购买了 ? □笔记本电脑 □数码摄像机 □数码相机

? 1.若三种产品都没有购买,调查到此结束。 ? 2.若选中了其中一项,调查便继续进行。

? 2.1假设选中了数码相机,接下来是一组有关

数码相机的品牌、认知途径、功能档次、附属 设备、主观评价的问题。其中有一项可能是 “您购买了照片打印机吗?”

? “您购买了照片打印机吗?” ? 1.若是尚未购买,会出现一个问题“您准备在

一年内添置一台照片打印机吗?” ? 2.如果您已经购买了照片打印机,接下来的是 一组有关照片打印机品牌、认知途径、功能档 次、主要耗材、主观评价的问题,其中可以进 行继续深化的分支问题调查,例如有关照片打 印机主要耗材的使用数量、品牌选择、购买方 式等问题。

? 如果你在最初的三个备选中选了两项或三项,

那么一项产品的问题结束之后,会接着开始第 二项,依次再进行第三项的调查。

? (3)问题的排列应先易后难。 ? 将简单、容易、直观的问题放在问卷的前面,

提高被调查者的兴趣,使被调查者比较容易地 进入答题角色,顺利完成问卷中所有问题的回 答。

? (4)开放性问题的排列。 ? 开放性问题属于非标准化问题,其数据需要调

查人员事后进行人工分类整理,才能进行数据 分析。开放性问题的排列要从属于封闭性问题, 有关全局性的开放性问题放在整个问卷主体部 分的末尾;相对某类具体封闭性问题的开放性 问题,放在这类封闭性问题的末尾。

? 2.2.3 敏感问题的随机化处理 ? 所谓敏感问题是指一些涉及个人隐私问题,有

关违规违约,违反社会道德规范,影响个人利 益和人际关系的一些问题。 ? 例如:家庭收入水平、考试作弊现象、偷逃税 款行为、吸毒问题、对领导和同事的个人评估 等等。

? 敏感问题的随机化处理是使这类调查中的回答

在随机状态下进行,调查者无法识别具体被调 查者的个体信息,不能得到被调查者对于敏感 问题的倾向和回答。但是,可以计算出该总体 中对于所调查的敏感问题次数分布的估计量。 在敏感问题的随机化处理下,被调查者个人真 实状况得到完全屏蔽,使被调查者打消了顾虑, 能够真实地回答问卷调查中的敏感问题,从而 随机化处理的问卷调查可以获得普通调查方法 无法取得的敏感问题数据。

? 敏感问题的随机化处理的基本形式为沃纳(Warner)

于1965年提出的沃纳模型。 ? 沃纳模型在进行调查之前需要准备好N个备择答案,并 将这N个备择答案分为“对”和“不对”两类,具体形 式可以两类不同的卡片、彩球等。其中“对”的备择 NA 答案数目为 个,“不对”的备择答案数目为 N?N 个。
A

? 被调查者当场随机抽取其中一个,然后针对具

体的敏感问题和抽中的备择答案回答“是”或 “不是”。由于调查人员不知道被调查者随机 抽取的备择答案为“对”还是“不对”,不可 能仅凭回答“是”或“不是”得知被调查者的 具体情况,以此来保护被调查者的利益,激励 被调查者如实回答。

? 设所调查的总体中

类特征人数的比重为 1- π A ,样本容量为 n,回答 “是”的人数为n1 ;随机抽取的备择答案中为“对” 的比重为P 。则有,回答“是”的人数比例为 n1 ? P ? ? A ? ?1 ? P ??1 ? ? A ? ? ? A ?2 P ? 1? ? ?1 ? P ?
n

A类特征人数的比重为π A ,非A

可由上式解出总体中 A 类特征人数的比重π A 的估 计量的计算公式
? ?A ? n1 1 1? P ? ? n 2P ? 1 2P ? 1
? ?P ? ? 1? ? 2?

2012-03-07(zhousanshangwu)

? 【课后作业】 ? 设计问卷并实施

2.3统计数据质量
? 2.3.1 统计数据的误差种类 ? 数据的误差是指统计数据与客观事实之间的

差距。可以分为登记性误差和代表性误差两类 ? 1.登记性误差 ? 登记性误差是指在调查过程中由于调查者 和被调查者的人为原因形成的误差。

? 例如,调查者的人为原因主要有总体界定错误、

调查单位缺失、计量和测量误差、舍入误差、 记录失误、抄录错误、汇总差错;被调查者的 人为原因主要有有意识地提供虚假数据、无意 识地提供有误数据。从理论上说登记性误差属 于可以消除的误差。

代表性误差
? 调查员误差 ? 调查员粗心、诱导、能力极限 ? 登记性误差解决办法:遴选调查员,调查员的

培训,监督控制【电话录音】、督导员的培训

中国的人口统计数据: “有五六丁之户,仅一人缴纳钱粮,或有 公元2年(汉元始二年) 59594978人 九丁、十丁,亦仅二三人缴纳钱粮” 公元754年(唐天宝十三载) 52880488人 康熙五十一年定“滋生人丁永不加赋” 公元1122年(宋宣和四年) 46734784人 公元1281年(元至元十八年)58830000人 公元1578年(明万历六年) 60692856人 公元1711年(清康熙五十年)24621324人 公元1741年(清乾隆六年) 143411559人 公元1763年(清乾隆二十八年)204209828人 公元1790年(清乾隆五十二年)301487115人 30年间增加近5倍!!! 公元1835年(清道光十五年)401767053人

? 2.代表性误差。 ? 代表性误差是指利用样本数据推断总体参数

时产生的误差。分为随机性误差和系统性误差。 ? (1)随机性误差(抽样误差)是由于随机性 原因形成的代表性误差,它是服从于某一概率 分布的随机变量。随机性误差是不可以消除的 误差,只要利用样本数据推断总体参数,就必 然存在着随机性误差。随机性误差的取值随着 样本容量的增大而减小。

? 总体比率的估计【产品质量检验】 ? 抽样误差的影响因素【样本容量、总体变异程度】 ? 解决方法:增大样本容量

? (2)系统性误差是由于非随机性原因形成的

代表性误差。主要原因有抽样框过于陈旧导致 的抽样框偏误、非随机样本、无回答问题、辅 助数据偏误等。系统性误差属于代表性误差, 也是在利用样本数据推断总体参数时产生的误 差,但是系统性误差不会随着样本容量的增大 而减小,不能通过增大样本容量来实现对系统 性误差的控制。

? 辅助数据是指在主体数据处理中具有辅助作用

的数据。不构成数据处理的主要实体,但有助 于提高数据处理精度。如在遥感数据输入地理 信息系统的过程中,需要对遥感数据进行有效 地分类,在分类过程中借助地理信息系统中的 辅助数据(如该地区高程数据、地面坡度数据、 地表坡向数据及土地利用数据等)的支持,可 改善遥感数据的分类精度,以达到地理信息系 统中数据处理的精度要求。

代表性误差
? (2) 系统性误差 ? 非随机样本 ? 回答误差【理解误差、记忆误差(随机性)、有

意识误差(系统性)】 ? 减小有意识误差的方法:随机化、保密、法制化 ? 无回答误差 ? 辅助数据偏误【青年人时尚用品调查】

代表性误差
? (2)系统性误差 ? 无回答误差 ? 原因:拒绝接受、不在家、地址写错、搬家、

遗忘或丢失 ? 随机性:无回答与调查的内容无关 ? 问卷丢失,没有时间接受调查 ? 解决办法:加大样本量 ? 系统性:【调查收入】 ? 【调查居民对公共交通的看法】 ? 解决办法:再抽取一个样本

2012-03-05(zhouyi3-4)

关于电视收视率的调查
? 您经常看《》电视节目吗? ? (1) 从来不看 ? (2) 偶尔看

? (3) 有时看
? (4) 经常看 ? (5) 天天看

关于电视收视率的调查
? 您经常看《》电视节目吗? ? (1) 从来不看 ? (2) 平均每周少于1次

? (3) 平均每周1次-2次
? (4) 平均每周3次-5次 ? (5) 平均每周6次-7次

1980年的一项实验调查
? A. 你是否认为美国应该让其他共产党国家(如

苏联)的记者到美国来,并把他们看到的新闻发 回去。 ? B. 你是否认为像苏联那样的共产党国家应该让 美国新闻记者入境,并把他们看到新闻发回美 国。

? 调查结果A,B:54.7%,63.7%

B,A:81.9%,74.6%

? 抽样调查是一种利用样本数据推断总体参数的

调查方法,不仅存在代表性误差,而且还会产 生登记性误差。抽样调查大大降低了工作总量, 由经验丰富的专业人员进行的调查,可以将登 记性误差减少到最低水平,同时又可以有效地 控制随机性误差,从而有效地提高调查数据的 质量。

? 2.3.2 统计数据的质量标准 ? 统计数据的搜集是统计活动的基础环节,所

有统计数据的处理和分析都是在这个基础上进 行的。对于统计数据质量的要求,具体可以归 纳为统计数据的时效性,准确性、一致性三个 方面的具体标准。

? 1.统计数据的时效性就是指及时和准时获取

统计数据。 ? 及时获取统计调查资料就是要在规定的统计调 查时间内完成统计调查工作。 ? 准时获取统计调查资料就是要确切地反映出统 计调查对象在规定的调查时点上,或规定的调 查时段中的数量特征。
?

? 2.统计数据的准确性是指确保统计数据的完

整性、真实性和精确性,最大限度地降低统计 数据中的各种偏误。 ? 统计调查的完整性是要保证调查对象中每一个 调查单位的标志特征都要包含在统计调查的实 际登记资料之中,并且仅出现一次。

? 统计调查的真实性是要保证每一个调查单位的

标志特征都要无偏差、无失真、准确无误地反 映在统计调查的登记资料中。 ? 统计调查的精确性是指在抽样调查中,要保证 抽样误差有效地控制在规定的许可范围内。

? 3.统计数据的一致性是指统计数据在时间上

和空间上的连续性和可比性。 ? 统计调查的一致性就是指统计调查的具体方法、 指标设置、调查体系、调查对象等在时间、空 间上的可比性。

? Excel 应用

定类变量与定序变量的数量化处理
? 关于饮料的调查 ? 问题1:在可乐和雪碧中,您更喜欢哪个? ? 问题2:您知道最近新出产一种脱糖的可口可

乐吗?

数据文件
样本单位 1 2 3 4 5 6 7 8 年龄(岁) 20 31 24 38 19 22 40 32 性别 女 男 男 女 男 女 女 男 问题1 雪碧 可乐 可乐 可乐 雪碧 雪碧 可乐 雪碧 问题2 不知道 知道 知道 知道 不知道 知道 知道 不知道

? 定类变量:性别

男——1;女——0 ? 定类变量:饮料 可乐——1;雪碧——0 ? 定类变量:是否知道 知道——1;不知道——0

数据文件【数量化】
样本单位 年龄(岁) 性别 问题1 问题2

1 2 3 4 5 6 7 8

20 31 24 38 19 22 40 32

0 1 1 0 1 0 0 1

0 1 1 1 0 0 1 0

0 1 1 1 0 1 1 0

?

假定在某大学校园对在校本科学生进行一次随机化处理的敏感问题问 卷调查,调查问卷中包括了5个敏感问题。 采用随机抽取卡片的方式进行了随机化处理,事先准备好的卡片注有 “对”与“不对”两种,其为“对”的卡片占卡片总数的比例为0.4。 该次调查一共随机抽取了100个被调查者,针对5个敏感问题和所随机抽 取的卡片回答“是”和“不是” ,来表明自己的态度。调查结果回答 “是”的人数分别为50,48,44,53,57。 试采用(2.2)式来估计在该大学同学对应每个敏感问题的态度为 “对”的总体比例。 n 即有样本容量 n ? 100,回答“是”的人数 i 分别为50,48,44,53, 57;随机抽取备择答案“对”的比重? 0.4 。请计算每个敏感问题为 P ?i “对”的总体比例 的估计值。

Excel 应用
? ?A ?
? 结果为:

n1 1 1? P ? ? n 2P ? 1 2P ? 1

题号 1 2 3 4 5

回答“对”的人数

“是”的比例

50 48 44 53 57

0.50 0.60 0.80 0.35 0.15

? 图 2.4 估计量的计算结果

小结与练习
? 本章介绍了统计数据来源、统计调查方法、统

计调查方案设计、问卷设计技术和统计数据质 量等内容。 ? 本章的重点包括普查和抽样调查的特点、统计 调查方案设计、问卷设计技术、统计数据误差 的种类,和统计数据质量的三点标准等内容。 ? 本章的难点是统计调查方案设计、问卷设计及 其敏感问题的随机化处理方法,以及统计数据 的误差分析。

? 1、简述统计数据的两个来源,及其相互关系。 ? 2、简述普查、抽样调查的特点和联系。 ? 3、统计调查方案设计的主要内容。

? 4、问卷设计的主要内容。
? 5、数据的登记性误差和代表性误差。 ? 6、什么是统计数据质量的三点标准?

END


统计学原理复习重点概述_图文

统计学原理复习重点概述 本课程主要包括三部分知识。 第一部分统计基础知识第一章和第二章数据收集部 分。第二部分描述统计第二章统计数据整理部分(表格与图形法)...

统计学原理

统计学原理_理学_高等教育_教育专区。第一章 一、什么是统计 绪论 三种涵义:...2、变量值:即变量的具体数值,包括标志值和指标数值 第二章 统计数据搜集 ?...

统计学原理复习重点概述

统计学原理复习重点概述_教育学_高等教育_教育专区。大学经管类统计学复习知识点...第二章统计数据搜集统计学中几个基本概念统计数据的计量尺度 统计数据:是对...

统计学原理作业(OK)

统计学原理作业(OK)_社会学_人文社科_专业资料。统计学原理第一章 绪论 1. ...(√) 第二章 统计数据搜集与整理 1. 统计数据的直接来源主要有专门组织的...

第二章 统计数据的收集

统计学原理统计学原理隐藏>> 第二章 统计数据收集第一节 统计数据的来源 一、统计资料的类型: 统计资料的类型: 1、原始资料(未加工整理) 、 原始资料 2、次...

统计学原理复习资料&历年考题加答案

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学收集、分析...按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的...

华南理工 2016网络统计学原理随堂练习(全对版)

华南理工 2016网络统计学原理随堂练习(全对版)_管理学_高等教育_教育专区。统计...√ 第二章数据的收集和整理 判断题 1. 统计数据的直接来源主要有专门组织的...

统计学原理知识点

统计学原理知识点_社会学_人文社科_专业资料。第一章 绪论 12% 一、掌握统计...第二章 统计数据搜集 4% 1.理解统计调查的各种分类;掌握统计调查的主要组织...

统计学原理课程部分复习题

---研语 第3 页 5.什么是统计学?从统计方法的角度,统计学的分类有哪些? 第二章统计数据搜集与整理 一、单项选择题(在每小题的四个备选答案中,选出...

《统计学原理》课程简介

二年级本科生 《统计学原理》是一门搜集、整理和分析统计数据的方法论科学,其...二、主要内容及学时分配: 第一章 总论(5 学时) :统计的产生与发展; 统计...