常用的抽样方法
常用的抽样方法
发布时间:2017-09-30 21:22:48 来源: 网站内部

抽样方法(Sampling methods) 

抽样调查是社会科学重要的根基,绝大多数社会科学研究都是使用抽样调查所得到的资料,只不过量化研究比较强调及偏重使用由机率抽样方法所得到的数据,而质性研究所根据的是非机率抽样方法所获得的资料。 

抽样调查也是了解民意、社经国情与施政的重要基础。我一直认为美国是一个以抽样调查治国的国家,如果没有抽样调查的技术,这个国家基本上很难运作。比如美国并没有一套准确的全国户口资料,更没有全国一致的国民身分证,就连其国境内有多少合法人口,或国民人数到底有多少,并没有人能够说出一个确切的数目,最好的回答可能是大概三亿加减多少,而这是透过许多现有的文件登记资料(如联邦政府的社会安全号码、各州的驾驶执照人数、医院开出的出生证明等),再加上抽样调查的统计推估所得到的。 

抽样方法分为两大类,第一类是机率抽样(probability sampling),第二类是非机率抽样(non-probability sampling)。机率抽样方法是指母群体中的每一个体都有某种已知的机会(机率)可以被选进研究样本中;非机率抽样方法则是指当这样的条件不存在时所做的抽样,当我们使用非机率抽样方法时,对于样本中的个体从母群体中被抽到的机率完全不得而知。在不知道样本与母群体之间的机率关系的情况下,我们便无法对该份样本的抽样误差进行估算,也就是说我们没有任何概念或数据可以去判断从该样本所得到的推估结果与母群体真正的情况有多接近,或有多大的差别。如果是采用机率抽样,我们便可以根据统计学理论,去获得这些抽样所可能导致的误差程度,知道样本统计值的推估区间与可信赖程度。 

非机率抽样 

虽然学理上机率抽样是比非机率抽样来得理想,可是有时候或有些情况无法让我们进行机率抽样,或者有些研究的目的不在于推论母群体的情况或讲究样本的代表性(representativeness),而是希望获得一组内涵最丰富,对探讨的主题最有帮助的样本数据(richness of data),这时非机率抽样便有其必要性。 

常见的非机率抽样方法有三种:(1)便利抽样(convenience sampling)、(2)立意抽样(purposive sampling)、(3)配额抽样(quota sampling)。顾名思义,便利抽样是指研究者以自己最容易取得的一组样本做为研究的数据。比如某位研究人员想用访谈的方式研究美国医院院长对Obama总统所进行的医疗改革的看法与意见,照理说应该从全美国的医院院长中随机抽样出足够的人数,来进行个别访谈。可是该研究员的时间与研究经费有限,因此就退而求其次,就其目前所在的地区附近二十位认识的医院院长个别进行访谈。这样便可以省去大笔的交通费与往返的时间,并且透过交情也容易征得这些院长们接受访谈的同意。便利抽样有时又称为偶遇抽样(accidental sampling)。 

使用二手数据的研究事实上非常倚重便利抽样的研究样本。在美国进行医院相关的研究,学者经常使用美国医院协会(American Hospital Association, AHA)每年对其会员医院与非会员医院的调查数据库,这个数据库近似美国所有医院的普查数据,涵盖面相当广,可是并不是每一家医院都有填写资料回报,特别是非会员医院的资料相当不齐全。因此严格来说,此数据库中的医院样本并非美国所有医院的一份机率抽样样本,而是一个方便抽样的样本。但是因为其所涵盖的医院样本数很大,有相当程度的代表性,而且资料丰富,方便取得,因此受到研究人员的喜爱。 

立意抽样有时称为专家抽样(expert sampling)、或判断抽样(judgment sampling),是指研究人员根据某种目的,刻意寻找具备某种特质的个体来组成研究样本。全民健保局为管控医院的申报费用,在进行申报案件审查时,大量运用立意抽样的方法,比如健保局先透过计算机系统了解某家医院在哪些治疗项目、科别或医师的申报费用成长最快,然后针对该范围密集抽取案件来做审查。 

立意抽样也是质性研究相当重视的抽样方法,比如在grounded theory的质性研究中,研究资料的取得并非透过随机取样,而是根据资料的丰富性来决定,研究人员所考虑的是哪一些研究对象最能够提供完整且足够的研究资料。比如我们要研究药师给药错误的原因,最好是去访谈曾经给错药的药师,而不是从药局中随机抽出几位药师来做访谈。如果要研究糖尿病人血糖控制不好的原因,理想的访谈对象是血糖控制最不理想的病人,而不是从所有糖尿病人中随机抽样。这里所谓的立意取样是指考虑哪些对象能够提供对理论的建构或了解问题本质最能够提供深入且完整数据与直接的帮助。在运用焦点团体(focus group)的研究中,通常焦点团体的组成是跟据立意抽样的原则,而非机率抽样。 

配额抽样是指根据一定的配额去组成样本。例如我想比较美国公立、非营利与营利这三种属性的医院的效率,而我知道整体来看,全国每十家医院当中,公立医院只占2家,非营利医院约占5家,营利医院约占3家。如果我希望研究样本包括50家医院,那我就照比例配额,去找10家公立医院、25家非营利医院,以及15家营利医院的数据来进行分析。配额抽样可以保证让我们的研究样本中包含我们所感兴趣的各种性质的研究个体,不过因为本质上仍然是非机率抽样的样本,因此我们还是无法做估算及抽样误差与进行统计推论。 

机率抽样 

机率抽样是目前调查研究的主流,其最主要的优势是可以搭配统计理论,用样本去推论母群体某个重要的参数或特征值,并且在某种信赖水平或信心程度上面提供相关的讯息让研究人员了解这样的推论可能的误差范围。 

机率抽样另一个奇妙之处,是当母群体愈庞大时愈能够凸显机率抽样的好处。比如我想分别调查花莲县与全国20岁以上民众对全民健保的满意与否,并使用随机抽样去取得研究样本;假设约有八成的民众对健保满意,其余两成民众不满意,如果我想得到的抽样误差在95%的信赖水平下不超过±3%,在针对花莲县民(假设20岁以上的县民有150,000人)的调查上我必须从所有花莲县民中随机抽出682位来做为研究样本;如果我是针对全国(假设20岁以上的国民有15,000,000位),只要从全国20岁以上的民众中抽出684位就可以达到同样准确度的估算。虽然花莲县与全国的人口数相差很大,可是如果使用随机抽样的话,这两份调查所需要的研究样本数却只有非常小的差距[1](几乎一样)。这表示当母群体中的个体数愈大时,所需样本数也会跟着增加,但是增加的幅度却是快速递减,当母群体个数超过某一个程度时,所需的样本数便都完全一样,这对研究人员来说实在是一大福音。也正是因为如此,社会科学的研究与调查研究才可以用有限的成本与精力,相当准确地估算广大的社会中的各种现象与变化。 

常见的机率抽样方法有四种:(1)简单随机抽样(simple random sampling, SRS)、(2)系统抽样(systematic sampling)、(3)分层抽样(stratified sampling)、(4)群集抽样(cluster sampling)。 

简单随机抽样(SRS)是我们经常接触到的抽样方法,比如摸彩或抽奖,或办公室需要有人出公差去送数据时用抽签决定人选。SRS的特色是母群体中的每一个体都有相同的机会被选中进入样本,这是一种最公平且概念上最简单的抽样法,可以直接套用统计学原理去进行估算与推论。在进行SRS时,我们必须有一份所有母群体个体的名单(sampling frame),然后再随机从中抽出个体来组成样本;常用的方法可以将这个母群体的个体做成签条,放入签筒,加以充分搅散,再去抽签;或者将名单加以编号,用随机数表或随机数生成器去得到所需要数目的随机数,用这些随机数所对应的个体组成样本。 

比如我要随机抽样50间医院,再前往进行个别访谈,来研究台湾所有医院(假设有500家医院)的(非健保)自费收入服务与成果(如自费项目与收入金额),先要制作一份所有医院的名单,并依顺序加以编号(1-500),然后透过Excel中的随机数生成器得到50个介于1~500之间的号码,将对应这些号码的医院从名单中找出来,便成为一份SRS样本。 

不过实际上在很多情况下SRS并不容易进行,甚至是不可能做到,像是如果我们没有完整的医院名单,或者这份研究计划的交通费预算有限,无法让我到由SRS所得到分散在各县市的样本医院去一一做访查,这时SRS便不是一个很实用的抽样方法。 

系统抽样方法是一种简化的随机抽样法,最普遍的做法是从母群体的名单中,按照一定的间隔取出足够的个体组成样本。比如我们可以从这500家医院的名单中,每10间医院取一间来做为样本个体。但首先我们必须先随机决定一个起始的号码,也就是从1-10之间随机选出一个号码,假如选中的是3号,则我们从3号开始,每10号取一家医院做为样本(3, 13, 23, 33,…493)。 

系统抽样适用的情况是当我们有一份医院名单,可是这份名单没有编号(也许因为名单太长无法编号)或没有按顺序编号时,或者没有现成的名单时。比如我想了解在今天马上知道当天门诊病人的就诊满意度,便可以用系统抽样,先决定要抽样的间隔(假设是每10位门诊病人取一位),随机决定一个1~10之间的号码(假设是7号),然后在病人报到柜台,从今天报到的第7位门诊病人开始,每隔10位就抽访一位病人(7, 17, 27,…)进行满意度调查,直到当天门诊结束为止。 

系统抽样如果要得到能够代表母群体,没有偏差的样本,前提是母群体个体的排列方式与我们选取样本的间隔数之间没有关联性,万一这两者之间有某种相关性时,会导致我们所抽出的样本有所偏差。比如这家医院刚好有10间诊间与10位医师在看诊,门诊病人是依照报到顺序被柜台人员指定前往各个诊间给医师诊疗,因此我们所取到的病人样本事实上都是由7号诊间的医师诊疗,而不是平均分散在各诊间的病人,因此无法代表所有今天就诊的病人。当然这样的情况不常见,但是不能不注意。 

分层或分组抽样是一种比SRS更精准的随机抽样法,所用的方法是跟据我们的研究性质,依照相关的条件把母群体中的个体分成不同的层别或组别(strata),再分别从每一层别或组别中的个体随机抽出一定的个体来组成样本。分层抽样可以再分为两种,分别是分层比例抽样(proportionate stratified sampling)与分层非比例抽样(disproportionate stratified sampling)。比如我们将所有医院分为地区医院(假设有400家,占医院总家数的80%)、区域医院(假设有80家,占医院总家数的16%)与医学中心(假设有20家,占医院总家数的4%)三个层别,如果我们是依照各层别医院占医院总家数的比例来分配样本名额,便是分层比例抽样,这时我们从20间医学中心随机抽出2家(50x4%=2),从80间区域医院中抽选出8间(50x16%=8),再从400间地区医院随机选出40间(50x80%=40),来组成共50间医院的样本。 

若采用分层非比例抽样方法,则是须视研究需要决定各层别要抽选的医院家数,比如样本中要有各10间医学中心与区域医院,以及30间地区医院,我们就分别从各层别中随机抽出所被分配的数量,来组成最终的样本。 

这两种方法原则上以分层比例抽样较为理想,这是一种特殊情况的简单随机抽样(因为母群体中的每一个体被选中的机会都一样),事实上透过分层比例抽样所得到的样本比简单随机抽样所得到的样本更有代表性,其抽样误差的程度会等于或小于SRS。不过虽然分层非比例抽样的抽样误差程度比较大,在某些情况下仍相当有必要且有用。这些情况包括:(1)如果调查经费有限,而进行某个层别的医院的调查要比其他层别医院来得容易或成本低时,我们基于经费或人力考虑,可能需要多抽某个层别的医院,而减少另外层别医院的样本;(2)如果某个层别的医院数量很少时,当我们按照比例原则去抽样时,此层别的医院在样本中个体可能会偏低(比如前面用分层比例抽样所得到的医院样本中,医学中心只有两间,有可能不够),这时我们就可以给予这个层别的医院较多的样本名额,以提高该层别在样本中的代表性;(3)有时我们并不是要去估算整体医院的自费服务或收入的情况,而是想去比较这三个层别医院在自费服务方面的发展与成果是否有不同,这时每一层别医院在样本中必须有一定数量,才有足够的比较基。?虼司偷糜玫椒植惴潜壤?檠?椒。 

群集抽样也是跟据某种母群体的特性,将母群体中的个体分成不同的群组(clusters),然后从这些群组中随机抽出部分的群组,再从被选中的群组中随机抽出足够的个体来组成样本。比如我们将500家医院依北区、中区、南区与东区分为四个群组,再随机抽出其中一区,最后从这一区的医院中随机抽出一定数量的医院做为调查样本。 

群集抽样的分类经常是用地理条件来分群组,当我们抽选出特定的群集时,我们也就缩小了样本的范围,这对于面对面的访查工作非常有帮助,因为可以大幅节省调查工作中交通的时间与成本。不过群集抽样若要得到正确的结果,每一个群集中的个体最好差异化越大越好,而且每一个群集之间个体的组成型态愈一致愈好。这是因为我们要用某一个或某些群集中的个体来代表母群体,所以理论上每一个群集中所含的个体最好就是母群体的缩影。前面的例子用北、中、南、东四区来画分医院群集其实对研究医院的自费服务并不是很理想的方式,理由是这四区之间的社会经济形态、人口密度、医院分布与属性都有很明显的差异,这些因素都会影响医院的自费服务发展,所以只用其中某一区的医院来探讨全国医院的自费服务发展情况是会产生严重偏差的。 

回过头来看分层抽样,所需要的理想条件正好与群集抽样的相反。对分层抽样来说,理想的状况是层别中的个体相似性愈高愈好,而不同层别之间的个体相似性愈低愈好。因为在分层抽样中,我们希望各主要类别的医院都能被包含到样本里,使样本有广泛的代表性,所以如果我们能够找到会直接影响研究主题的因素,根据这些因素来区分层别,便能够确保样本中不会漏掉重要的层别。 

这四种机率抽样的方法各有优缺,没有哪一个绝对优于其他方式,而且可以适用任何的状况。各种抽样方法总是在效率/容易执行(efficiency)与精确(precision)这两个目标之间做拉锯战,研究人员必须视实际状况做取舍,选择最适合的抽样策略。 

SRS好处是容易明了及估算,缺点是可能缺乏效率,费工费时,甚至有时候是不可行的,即使抽样作业可行,所得到的样本可能在后续的数据收集上无法执行。系统抽样一般来说比SRS容易执行,不过有潜在的偏差可能性,有时候后续资料收集有实际困难。分层抽样的好处是其样本的代表性与所得到的结果的精确度比其他方法来得理想,但问题在于有时候研究人员缺乏相关的信息去将母群体画分为不同的层别,同时,分层抽样调查一般来说执行成本相当高。最后,群集抽样可能是这些方法中花费成本最低的调查方式,可是研究人员必须冒着某种程度的偏差风险,有时候我们连到底其中的误差风险有多大都不完全能够掌握。 

当然,这四种方法也可以视需要与状况互相结合,比如在系统抽样、分层抽样与群集抽样中也都有部分用到SRS。对于大规模的调查计划,也可以先采用分层抽样或群集抽样,然后再用系统抽样决定最后样本。好处是,只要是用机率抽样方法,统计理论便可以派得上用。?梦颐腔竦糜幸欢ㄗ既烦潭鹊慕峁。 

[1]这是单单比较所需样本数的多寡,并没有考虑对全国抽样与对花莲县抽样以及后续样本的调查方面所需投入的技术难易度、成本、时间的差别。

官方微信