此文回答了:样本户究竟如何筛选出来;为何要采用抽样方法;样本户数量是怎么决定的;样本户收视数据怎么处理的……,这说明上述问题并不易回答。
一、收视率调查的基本流程
收视率调查的基本流程包括三大环节,即:样本抽取、数据采集、数据处理。
二、样本抽取方法
在收视率调查中,样本抽取一般包括确定调查总体、确定样本容量、抽取样本等环节。
(一)确定调查总体
在收视率调查中,调查总体一般被界定为目标区域内4岁及以上的电视家庭人口。这个界定包括以下三个要素:
目标区域:可以为全国、省、市、县或某一特定区域;
电视家庭人口:没有电视机家庭、集体人口及流动人口被排除在调查总体之外;
年龄下限(4岁):收视调查要求被访者必须具有一定的行为能力。
(二)确定样本容量
1、确定样本量时一般应考虑的因素
调查总体中各单位的差异程度 差异程度越大,样本容量也应该越大;
允许误差 允许误差越小,样本容量就应该越大;
抽样方法 不同的抽样方法具有不同的效率,如分层抽样、系统抽样要比简单随机抽样具有更高的效率,因而在其它条件不变的条件下,分层抽样、系统抽样所需样本量要小于简单随机抽样的样本量;
经费、人力和时间等 样本量越大,经费、人力及时间的投入也越大。
在调查总体及抽样方法一定的条件下,样本量的大小实际上是在抽样精度(抽样误差)与成本之间相平衡的结果。
2、样本量的计算
收视率调查是一种成数(比率)调查,样本量的计算公式为:
n=t2p(1-p)/M2
其中:n为样本量,p 为收视率, M为允许误差, t为概率度,
取P=0.5,此时p(1-p)达到**, 在95%的置信水平(t=1.96)下,样本量n与允许误差M的关系如下图及表:
- 允许误差越小,所需样本量越大;
- 当允许误差小于3%时,再提高精度,所需样本量成倍增加;
- 权衡精度与成本的关系,样本量为1067人(300户)是合理的样本规模。
根据上述理论分析,并参考国际经验,CSM所确定的样本量如下:
城市网(测量仪):300户;
城市网(日记卡):300户;
部分小城市(日记卡):100户;
省网:600户;
全国网(测量仪):2000户。
3、抽样误差与收视率的关系
上述当样本量为1067人(300户)、在95%的置信水平下抽样误差为3%,应当明确,这是此样本规模的**抽样误差,实际的抽样误差要小于3%。因为:
抽样误差的计算公式为:
P:收视率, n:样本量
上述3%的抽样误差是取P=0.5计算出来的, 而由公式看出:当P=0.5时, P(1-P)达到**, 由于实际的收视率一般低于50%,所以实际的抽样误差要小于3%。
抽样误差与收视率的关系
(样本量1067人(300户),置信度95%)
-收视率越低,抽样误差越小;
-当收视率低于12%时,抽样误差小于2%
(三)样本的抽取
下面以CSM为例,来说明收视调查中样本的抽取方法。CSM目前拥有的收视调查网有:
城市收视调查网(日记卡)
城市收视调查网(测量仪)
省级收视调查网(日记卡)
全国收视调查网(测量仪)
举例:各种调查网样本的抽取方法简述如下:
●CSM城市网(测量仪)的抽样方法
调查总体
非农人口比例在45%及以上的市辖区中电视家庭户中4岁及以上的所有人员。
抽样方法
CSM在收视调查网建立前以及建立后每年都要进行一次大样本量的基础调查,因而城市网的抽样方法包括基础调查的抽样方法及固定样组的抽样方法
A 基础调查的抽样方法
基础调查的目的:
- 了解对收视行为有重要影响作用因素的信息,如频道覆盖率、电视机拥有状况、户规模、人口年龄性别结构等;
- 为固定样组的抽取、轮换及控制提供依据,以保证固定样组对总体的代表性。
基础调查的抽样总体
非农人口比例在45%及以上的市辖区中,所有家庭户中常住人口(在本地居住半年以上,且平均每周居住5天以上)。
二阶段、PPS、整群抽样
**阶段:由城市抽居(家、村)委,用PPS抽样抽取a=200个居(家、村)委会;
第二阶段:由居(家、村)委抽样本户,在每个抽中居(家、村)委中,用随机等距抽样方法抽取b=20户家庭户,对于抽中家庭户中的所有常驻人口都进行调查。
样本量为:a×b=200×20=4000户
PPS抽样实例
PPS抽样全称是概率与规模成比例抽样(Sampling with probability proportional to size),它是效率较高的一种抽样方式。具体抽样过程如下:
**步:编制抽样框。 从民政局、统计局或其他单位查抄全市居(家、村)委会名单及户数,所有区、街道及居(家、村)委会按自然标志排列,形成抽样框。见附表。
第二步:计算抽样间距K。抽样间距K=居(家、村)委会总户数/拟抽选居(家、村)委会数。在本例中,某市居民累计总户数=33570, 拟抽选居(家、村)委会数=10 则:k=33570/10=3357。
第三步:确定起点。在0~3357之间选取一随机数,如随机数为3212。
第四步:抽取居(家、村)委会。在附表‘累计户数’一栏找到**个大于等于3212的累计户数,对应的居(家、村)委会即是**个被抽中居(家、村)委。
而后抽取其它样本居委,计算3212+K, 3212+2K, 3212+3K, …, 3212+9K, 分别在‘累计户数’一栏找到**个大于等于上述数的数字的累计户数,则对应的居(家、村)委会即被抽中。
B 固定样组的抽取方法
固定样组规模:300户
首先将基础调查的样本户(4000户),按对收视率有重要影响作用的指标(家庭户规模、是否有线户、电视机台数、家庭户收视时间、家庭户有无子女(14岁以下)、地区分布、日用品主要采购者的年龄及家庭户收入)进行排序后形成抽样框;
然后随机等距抽取多套样本户,**套样户拒访后由备选套中的同号样户代替。
固定样组的70%按入选样本户完成,其余30%样户采用配额抽样完成。
三、数据采集方法
(一)、收视调查中的数据采集方法
常用的收视数据采集方法有三种:
1、电话法:利用电话了解观众的收视情况。
2、日记法:指由样本户中所有4岁及以上的家庭成员,将每天收看电视的频道、时间段随时记录在日记卡上,以获取电视观众收视信息的方法。
3、测量仪法:指用测量仪来详细记录样本户中所有4岁及以上家庭成员收看电视的情况,从而获取收视信息的一种方法
四、数据处理方法
(一)数据处理流程
- 收视调查原始数据输入计算机后,要进行数据的净化,以确保原始数据的完整及合理;
- 净化后的收视数据与样本背景资料库及节目资料库合并形成一个更全面的“收视率资料库”;
- 在这个“收视率资料库”的基础上,以性别、年龄等为加权变量,对原始数据进行各种加权计算,便产生各种收视率数据。
(二)、加权方法
1、加权的目的
对样本结构与总体结构的偏差进行校正,以取得能够准确反映总体收视情况的数据。
2、CSM加权方法
CSM在不同的收视调查网中均采用边际加权方法(Rim Weighting)对收视调查的样本数据进行加权,所不同的是在不同的调查网中加权变量不同。
城市(日记卡):性别、年龄;
城市(测量仪):性别、年龄、户规模;
省网(日记卡):性别、年龄、城乡;
全国网(测量仪):性别、年龄、户规模、层。
(三)、计算收视率
收视率=收看某一频道(节目)的人数/目标观众总体×100%
|