香港特区互联网使用现状报告

2013 年 7 月 11 日4180



第三部分 调查方法

(一)、调查总体
本调查的目标总体有两个,一是全香港有住宅电话的6-84岁常住居民并说中文者(包括广东话、普通话及其它方言,即与CNNIC的总体定义相同);另一个总体是在上述总体中18-74岁的成年人(与我们2000-2003年间调查参照的WIP总体定义相同)。前者用于与CNNIC调查结果相比较、后者则与我们2000-2003年间调查结果相比较。

(二)、抽样方法

样本量:为与CNNIC分省样本量相仿,本调查最后成功调查了1376人,在95%的置信度下,该样本的抽样误差2.6%。

抽样方法:本调查沿用前四次所采用的“随机电话号码拨号”(RDD)的抽样方法。首先通过电脑程序产生出10000余个随机电话号码,拨通查明为住宅电话后,要求在本户6-84岁的常住并说中文的成员中访问一名生日最近者。如被抽中的电话无人接、抽中的被访者不在家或不便接受访问,访问员在不同的日期与不同的时段先后五次回拨。

调查成功率:按美国舆论研究协会(AAPOR)的成功率公式三(RR3)计算(详见AAPOR 网址:http://http://www.zjjv.com///default.asp?page=survey_methods/standards_and_best_practices/standard_definitions#response),本调查的成功率为41%,比我们2000-2003年度调查的结果(分别为38%、35%、36%、33%)有所提高。

加权方法:在统计分析之前,我们以香港2004年6月人口统计资料中性别与年龄的交叉分布为基数、对样本作了加权处理,使得样本与对应总体的性别与年龄的结构相同。

数据预处理:我们在上述报告中使用了一系列平均数,如人均上网时间、电邮账号数、收发电邮数等。众所周知,一组数据中如出现个别极大或极小的异常值,会明显影响该组数据平均数的取值。我们按惯例在计算上述平均数前,先剔除了原始数据中的异常值(定义为大于或小于平均数的三个标准差)。如此修正过的平均数,比原始数据的平均数减小10%-50%不等,但更接近总体的实际情况。

0 0