随机化回答
随机化回答是进行问卷调查的一种特殊手法,可以一方面让研究员搜集到公众在敏感课题的情况或态度,而一方面个别受访者可以保持私隐,是进行敏感课题研究时的一种折衷手法。
起源
随机化回答最先由S.L. Warner在1965年提出1,目的是为了解决进行社会研究时涉及敏感问题才带来的困难。在问卷调查中涉及受访者的犯罪行为、越轨行为或性行为等情况,若使用传统的直接发问方式,例如“请问你有没有试过盗窃?”,不难想像得到的结果会是绝大部份受访者回答“没有”,或拒绝回答;因为没有人愿意直接承认自己曾经盗窃,研究结果的效度大为下降。
Warner提出的解决方法如下。假设总体人口可以分成A和B两类,研究人员若要知道A占人口的比例,可以设计一个划分为两个扇形的圆盘,在扇形上分别写上A和B,圆盘上有一指针,受访者在访问员不知情的情况下转动指针,按指针自然停下的位置给出“是”或“否”的答案(例如:指针停在A位置,受访者是A类人便答“是”,若是B类人则答“否”)。因为访问员不知道指针停留位置,无论受访者回答“是”或“否”,他都不会知道受访者的真正类别,故此受访者的私隐得到保障。
经随机抽样搜集足够资料后,研究人员将知道回答“是”的比例();另一方面,受访者在转盘上转得A的概率和A在转盘上所占的面积比例相等()。假设A类人在人口所占的比例为,则:
- 回答“是”的概率等于A类人把指针转到A的概率加上B类人把指针转到B的概率:
- 重整算式:
- 假设,,代入算式:
- 故求得A类人在人口中占25%。
因为是由研究人员自行设定,可以看到,若设定为0.5,分母将变成0而不能算出之值;若设定为1,则无异于直接发问;若设定在0.5和1之间,则可以计算出。
改良
在Warner的设计中,受访者无论抽到任何一个选项,都需要回答感敏问题;为更有效减低受访者的焦虑,Greenberg在1969年提出了一种现在更常用的随机化回答方法2。在这种方法下,访问员向受访者提供两条问题,一条是敏感问题,另一条是非敏感问题;受访者在访问员不知情下通过抽签方法以决定需要回答哪一条问题,由此保障私隐。这方法可由以下范例展示:
假设研究人员要知道某大学的学生曾有店铺盗窃的比率,可以先在两张纸上各写上一条问题:“你是否试过店铺盗窃?”和“你的学生编号最后一位数字是否1?”。研究人员准备10支木棒,其中7支是尖的,3支是圆的,放在黑布袋里;在访问时向受访者展示两条问题,然后要求受访者伸手进入布袋随手选一支木棒,若抽得尖的木棒便回答有关盗窃的问题,抽得圆的木棒便回答有关学生编号的问题。无论如何受访者只需答“是”或“否”,无需交代抽到什么木棒。
经随机抽样搜集足够资料后,研究人员将知道回答“是”的比例();另一方面,受访者抽得尖木棒的概率为0.7。因为学生编号是顺序分配的,任何一个学生的编号最后一位数字为1的概率是0.1。假设曾店铺盗窃的学生比例为,则:
- 回答“是”的概率等于曾店铺盗窃的学生抽到尖木棒的概率加上学生编号最后一位数字为1的学生抽到圆木棒的概率:
- 重整算式:
- 假设,代入算式:
- 故求得曾店铺盗窃的学生占4%。
实例:港人在内地所生子女人数调查
1999年香港终审法院对港人在内地子女的居港权问题作出判决,香港特区政府为了评估合资格人数,政府统计处同年进行了有关港人内地所生子女数目的调查,当中便采用了随机化回答的方式。
方式是用黑布袋内一定数量的有盖和没有盖胶卷筒(港称菲林筒)。受访者随机抽选胶卷筒,但无须表示抽中有盖或没有盖的胶卷筒。
- 如果抽中有盖的胶卷筒,回答在内地所生的子女数目
- 如果抽中没有盖的胶卷筒,回答过去一星期乘坐的士的次数
因为只有受访者知道自己抽中有盖还是没有盖的胶卷筒,只有受访者知道他的答案,是“在内地所生的子女数目”还是“过去一星期乘坐的士的次数”。
得出结果后,政府根据事前掌握市民乘坐的士习惯的数据,推算另外一个未知变量,即港人在内地所生的子女数目。
政府统计处利用和以上类似的方法得出合资格居港人士达167万之多。统计出的结果带来很大争议,有些是基于对政府动机的猜疑,有些是技术上的挑战。但随著全国人大常委会对有关问题释法,合资格人士数目大减至20多万,统计处结果的准确性已难以证实。345
限制
随机化回答虽然是处理敏感问题的有效手段,但亦有一定限制:
- 方法比较繁复,对教育程度低的受访者可能难以明白过程的意义。
- 当有其它人在场,受访者可能不会如实作答。上述有关店铺盗窃的例子中,若有其它知道受访者学生编号的人在场,受访者为免私隐泄露便可能会无论抽到任何木棒也回答有关学生编号的问题。
- 不能作任何相关分析。因为研究员不知道哪位学生回答哪条问题,便不能作出诸如“店铺盗窃和学业成绩的关系”这类分析。
相关条目
参考资料
^ 注解1: Warner, S. L. (1965). Randomized response: a survey technique for eliminating evasive answer bias. Journal of the American Statistical Association 60, 63--69.
^ 注解2: Greenberg, B. G., et al. (1969). The Unrelated Question Randomized Response Model: Theoretical Framework. Journal of the American Statistical Association 64(326), 520--539.
^ 注解3: 香港电台:何永煊称当年估计居港权人数方法正确 (页面存档备份,存于互联网档案馆)
^ 注解4: 张超雄: 居港权事件对香港社会的影响 (页面存档备份,存于互联网档案馆)
^ 注解5: 香港人权监察:有关居留权的新调查质疑政府的“的士调查方法”调查