返回首页 进入论坛 基础肿瘤学 肿瘤治疗 肿瘤各论 病例讨论 肿瘤学资源 肿瘤学教育 NCCN指引 肿瘤药物
  
oncology,cancer,clinical & research / 基础肿瘤学 / 医学统计学 / 病例对照研究
病例对照研究
2005-05-02    admin    肿瘤学论坛       打印本文
病例对照研究
一、病例对照研究的概念
   病例对照研究是一种由果及因的回顾性研究。它是先按疾病状态来确定调查对象,分为病例和对照,然后分别了解其既往(发病前)的暴露情况,并进行比较,以推测疾病与暴露之间的联系。病例对照研究从时间上讲,是通过回顾的方法来研究暴露因素,所以过去也称回顾性研究。例如,应用病例对照研究方法研究吸烟和肺癌之间的联系,可以选择一组肺癌病人作病例,再选择一组健康人或患其他疾病的人作对照,分别调查他们过去吸烟情况,如果肺癌病人过去吸烟的比例明显高于对照者,则提示吸烟与肺癌的发生有关。但病例对照研究得到的暴露与疾病之间的联系并不一定是因果联系,即使能除外随机误差和已知的系统误差,还可能有尚未认识的因素会影响这种联系。因为在病例对照研究开始时,疾病已经发生,通过回忆过去的暴露情况来确定所研究的暴露因素与疾病之间是否有联系,它只能就暴露与疾病是否有统计学联系做出判断,而难以得出它们之间因果关系的结论。
   病例对照研究是迄今最常用的一种流行病学研究方法。也是识别罕见疾病危险因素的唯一实际可行的研究方法。虽然病例对照研究应用广泛,但因可能存在某些偏倚,使其应用受到一定限制。一般在病因研究中,病例对照研究只是为进一步进行队列研究奠定基础。但由病例对照研究所获得的信息常可为控制疾病需采取的措施提供依据。

二、病例对照研究的历史回顾
  病例对照研究的历史可追索到很早的时侯,如英国人John Snow于1854年伦敦霍乱流行时,调查了霍乱病例的暴露状态(饮用可疑的污染水),并还调查了未病者的暴露情况,以此来支持霍乱流行与水污染有关的推论。1920年,美国的Broders调查了537例口唇上皮扁平细胞癌病例及500例没有口唇上皮扁平细胞癌的其他疾病病人(对照),认为口唇上皮扁平细胞癌与使用烟草有关。1926年,Lane-Claypon在荷兰、意大利、英格兰进行了一项乳癌与生殖因素关系的病例对照研究,据称这是世界上首例病例对照研究。1946年,Schreck和Lenowitz对在1931~1944年间住院的139例阴茎癌病人与各种对照(各种其它癌症病人和其它疾病病人)进行比较,发现包皮环切及性卫生与阴茎癌有关。1941年,Gregg调查了先天性白内障病例与对照的胎内感染风疹情况,提示孕期风疹感染与婴儿患先天性白内障有关。
  从上个世纪50年代开始,国外病例对照研究的应用增加,特别是1950年Wynder等与1952年Doll-Hill用病例对照方法研究吸烟与肺癌的关系。1953年Cornfield提出了相对危险性与比值比的概念。正式在文章中阐明病例对照研究这种方法的是Doll(1959)、Cornfield与Haenszel(1960)。1959年Mantel─Haenszel提出用分层方法来调整混杂,至今已沿用40余年而不衰。
  60年代以后,病例对照研究的应用更趋普遍,许多疾病与潜在危险因素之间的联系都是先通过病例对照研究知道的。例如,口服避孕药与心肌梗塞、静脉血栓栓塞;低剂量辐射与白血病;早产儿吸入高浓度氧气与婴儿眼晶体后纤维组织增生症;多项危险因素与冠心病;糖精摄入与膀胱癌;母亲早孕期服用反应停(一种镇静剂)与婴儿短肢畸形;使用污染的月经棉与经期中毒性休克综合征;表盘镀镭(含放射性)工人与颌骨癌;母亲早孕期服用雌激素与少女阴道腺癌;接触石棉与间皮瘤;乙型肝炎病毒感染与原发性肝细胞癌;雌激素治疗与子宫内膜癌;空调冷却水被肺炎军团菌污染与军团病;寄生在树上的桑毛虫的毒毛与接触性皮炎;摄食污染的毛蚶与甲型肝炎;一种L-色氨酸制剂与嗜酸性细胞增多─肌痛综合征,等。
   近年来,随着电子计算机技术的普及,大型信息系统(疾病登记、疾病监测)的建立,流行病学家、统计学家(统计方法)、社会学家(现场调查方法)的合作,以及对病例对照研究中偏倚问题的深入了解,病例对照研究方法有了进一步发展。上世纪80年代统计学分析软件在微机上的应用得到推广,多因素分析方法的应用越来越普遍,许多过去无法研究的问题,现在也可以解决了。1979年美国“慢性病杂志”和1994年的“流行病学评论”出版了两期专刊,专门讨论病例对照研究问题。1980年及1982年国外分别出版了两本病例对照研究的专著,1990年国外又出版了一本关于病例对照研究中的多因素logistic回归的专著,这些书都已成为从事病例对照研究者必读的参考书。

三、病例对照研究的用途
   随着病例对照研究的应用范围不断扩大,应用该方法的人也越来越多,方法本身也在不断完善。病例对照研究方法现已广泛用于探索病因及流行因素、危险因素、公共卫生和医学实践中的爆发调查、干预措施的评价、以及项目评价,等。
   病例对照设计适于研究潜隐期长的罕见病、或容易漏诊、误诊疾病的危险因素。特别适用于研究那些必需就医的疾病,如癌症、髋骨骨折等;而对一些不一定需要就医的疾病,则需花费大量的财力和人力资源,才可从人群中找出病例。病例对照研究也适用于多种暴露因素与某一种疾病有联系时,或多种因素之间有交互、协同、或效应修饰作用时。尤其适用于早期的病因研究,那时人们对被调查的疾病知之甚少,这时可根据病例对照研究结果来形成假设。病例对照研究较适合于疾病的第一个症状出现至作出诊断之间间隔时间较短的情况,而对那些发病过程缓慢的疾病,用病例对照研究难以区分致病因素与疾病开始后出现的因素的影响。

四、病例对照研究的设计与实施
  (一)研究目的
   在制定研究计划之前首先应该明确研究的目的。明确本研究是以探讨病因为目的还是以检验病因假设为目的。单纯为了检验某个病因假设的病例对照研究是比较少的,对于有明确病因假设的疾病,一般以检验病因假设为主,同时还可对其他可疑危险因素进行探讨。
  (二)确定研究对象
  1、病例的选择
首先应对所研究疾病的诊断标准做出明确的规定,所有病例都应符合一定的定义。研究的诊断标准应该客观、具体、可操作性强,还应充分考虑诊断的灵敏性和特异性。保证入选的病例对所有患该病的病人具有代表性(所有该病的病人都能被确认、诊断、并收住院)。所有的病例应都有暴露的可能性。并尽可能选用新病例(incident case)。选用新病例的优点在于,有关暴露的回顾较可靠,暴露环境也较均一,并可避免因影响临床预后的因素而引起选择偏倚。例如,有的癌症预后较好,如果研究的病例中包括几年前经过治疗、现仍存活的患者,而未包括未存活的患者,且这种癌症的良好预后与病因有某种联系,则结果就会偏倚。用现患病例(prevalent case)的缺点是,由于间隔时间较长,疾病的诊断方法、记录保存等都会改变,回忆错误的机会增加。另外,病后的暴露状态可能会改变,还有一些预后因素也可影响现患病例的生存。所有的病例应都能合作。
   病例可以选自医院,也可以在社区人群中选择。在医院中选择病例的优点是方便,对于罕见病是唯一可行的方法。病例可以是门诊病人或住院病人,也可以是已经出院甚至死亡的病人。在医院中选择病例的方法通常难以保证病人的代表性。为此,有些研究在社区人群中选择病例,此时可以利用疾病监测资料或居民健康档案选择合格的病例,对于常见病也可以组织专门的调查,从社区居民中发现该病的病例。社区中往往存在各种病程的病人,所以在社区中选择病例能够保证病例的代表性,但工作量比在医院中选择要大得多。
在选择病例时,应该注意有三种不同的病人,即死亡病例、现患病例和新发病例,应该根据研究目的进行选择。新发病例由于刚刚发病,对疾病危险因素的记忆较清晰,提供的信息较准确,所以在病因研究中以选择新发病例为佳。现患病例除受影响发病的因素影响外,还受一些影响病人存活的因素影响。死亡病例的资料主要由家属提供,可靠性较差。
  2、对照的选择
   对照必须是不患所研究疾病的人。对照应来自受所研究疾病危险威胁的人群。也就是说对照应该以无偏的方式选自这样的人群,他们如果发生了所研究的疾病,就可能被入选到病例之中。对照应与病例具有可比性,
   病例对照研究中最困难的是选择对照。对照的定义取决于病例的定义,该定义应能除外病例。确定对照时采用的诊断标准应与病例的诊断标准相同。对照也应有暴露的可能性,但这种暴露既不能增加、也不能减少对照中有关疾病的发生。病例与对照的暴露机会应均等。对照也应有代表性,即能代表一般人群。与疾病有关的外源性变量在病例和对照中的分布应相同(无混杂)。对照也必须能合作。
   对照的形式主要有两种:匹配与不匹配。匹配可以提高研究的效率,在对罕见病的研究中,如果样本含量不足,只能以匹配的形式选择对照。当研究的目的是为了检验某个病因假设时,采用匹配的形式有助于控制混杂因素,保证对照与病例的可比性。但匹配又会增加对照选择的难度,所以如果研究目的仅仅是为了广泛地探索病因,而研究的疾病又非罕见病时,就不一定需采用匹配的形式。
   实用的对照选择方法有以下几种:选择同一个医院患其他疾病的住院病人或门诊病人;选择病例的邻居、同事、同学或亲属;选择同一社区健康检查或专项调查发现的非该病病人或健康人。不同的选择方法各有优缺点,在医院中选择对照简便易行,最常使用。
  (三)样本含量估计
   病例对照研究所需样本含量的大小与对照的形式有关,以匹配的形式选择对照所需样本含量一般相对较少。匹配与非匹配病例对照研究样本含量的估计方法不同,但均取决于以下四个因素:① 研究因素在人群中的估计暴露率,② 所研究因素的估计相对危险度 (relative risk,RR)或比值比(odds ratio,OR),③ 统计学检验的显著性水平,④ 检验效率(把握度)1-。
  1、非匹配的病例对照研究样本含量估计
  研究者通常希望病例组和对照组人数相等,设病例组或对照组人数为n,计算公式为:

 



   

4、估计样本含量时应注意的事项
   样本含量估计只有相对意义,并非绝对精确的数值。因为样本含量估计是有条件的,而这种条件在重复研究中很少一成不变。
实际研究中往往同时探索几个因素,而每个因素都有其各自的OR及p0,这时估计样本大小常以最小的OR和最适的p0 (距50%最远)为准进行估计,以使所有的因素都能获得较高的检验效率。一般,研究多种危险因素时,样本含量的大小近似等于危险因素的数目乘以5~10。病例对照研究样本含量估计中几个参数之间有如下的相互关系:① 对一定的α、β和p0,当OR增大时,所需样本含量减小。② 对一定的α、β和OR来说,当p0为50%时,所需样本含量最小。③ 对一定的β、OR和p0,当α增大时,所需样本含量减小。④ 对一定的α、OR和p0,当β增大时,所需样本含量减小。
   直接从显著性检验公式反推得到的样本含量估计的计算公式存在一定的问题,因为这类公式未考虑β错误概率。如不考虑β错误概率,就是将β错误概率定为0.5,意思是说,如总体指标确有差异的话,在显著性检验中只有(1-β=)50%的机会可获显著性的结果,显然,这样的检验效率是不能令人满意的。病例和对照两组样本含量相等时,检验效率最高。
   应纠正样本越大越好的不正确看法。样本含量过大会影响调查工作的质量,调查工作的方法和要求难以统一,调查者的负担也重,耗时长,受检率和复查率都难达要求。样本过大有时还可产生稀释效应。因此,单纯以增加样本来减少抽样误差往往事倍功半。因为抽样误差与样本含量平方根(不是与样本含量本身)成正比。
   在确定实际样本含量时,还需考虑调查的覆盖率和应答率,作适当调整。
   (四)确定研究的因素
   病例对照研究可以同时探讨疾病与多种危险因素暴露之间的联系,暴露因素的选择直接影响了研究的质量,应根据研究的目的慎重选择。对于一般的常见疾病,可以根据研究的目的使所研究的暴露因素尽可能地详细、具体,但也不宜过多,能够满足研究目的即可。对于一些罕见病或新出现的疾病,病例对照研究的目的是广泛探索病因,因此,在保证调查工作质量的前提下,可以考虑多调查一些暴露因素。对每个所研究的暴露因素或变量均应有明确的定义,暴露因素的测量应该尽可能客观、能够定量。为了统计分析的方便,定性的暴露资料在收集时应该尽可能量化。
   (五)获取暴露信息(暴露测量)
   包括所研究的危险因素、可疑的危险因素、混杂因素、可疑的混杂因素,以及效应修饰因素的暴露来源、特性、程度、时间(长短、首次和最后的暴露时间)、以及暴露是连续的或间断的等。例如,对职业暴露应了解工作(种)名称、行业、具体工作任务等。
流行病学中的暴露包括机体在外环境中接触某些因素(化学、物理、生物学的),以及机体本身具有的特征(生物学、社会、心理等)。
   1、收集暴露信息目的是:(1)评价暴露与疾病之间的联系。(2)估计致癌危险性评价中的阈效应。(3)评价暴露与疾病之间的时间关系(癌的始动与促进因子,累积暴露与癌,孕期暴露与致畸性)。(4)在暴露率低的情况(如职业人群),暴露评价尤为重要。
   2、调查方法:收集暴露信息的方法包括:(1)面询、函询、电话询问、计算机辅助询问、自填问卷。可询问本人或其亲朋友好等代理人(proxy或surrogate)。(2)查阅各种登记、记录(出生、疾病、死亡,以及测量记录)。(3)测量各种指标,如机体和环境的测量,区域监测、个体采样器监测、生物监测;机体的测量,血清和组织库的利用等。(4)现场观察。现场观察是了解暴露情况必不可少的手段,如食物中毒或传染病爆发流行时的现场环境调查。上述各种方法都有其各自的优缺点,如对暴露标准的解释、资料收集的监督、信息的详尽程度和客观性、是否方便等。在收集暴露资料时,质量控制非常重要,故在调查前应该对调查员进行培训和考核。对病例组和对照组的调查方式应该一致(标准化),保证暴露测量的准确性。
   3、暴露评价的注意事项:(1)对病例和对照的调查方法应一致,资料来源和收集方法应相同(准确性可比),以使有最佳的检验效率。最理想是采用盲法,或采用交叉调查的方法。(2)注意控制测量错误,如重复测量、质量控制。(3)对调查员进行培训和监督。(4)注意不同暴露的交互作用,例如环境与遗传易感性的交互作用。(5)注意工作负荷的监测或改变。(6)面询时宜选择适宜的场所,方便问答。

五、资料整理与分析
   病例对照研究通常可同时研究多种暴露因素。资料的整理和分析非常重要。病例对照研究的资料主要分析如下三方面的问题:   ① 病例与对照的暴露比例。② 疾病与暴露之间有无联系及联系的强度。③ 这种联系是否由抽样误差所致。
   (一)资料的整理
   首先应该对收集的资料进行核查,发现调查过程中的错误及可疑之处及时进行修正。随着计算机技术的发展,资料的整理与分析都可采用计算机,现已有多种现成的数据库软件和统计分析软件可敷应用。通过双重录入或逻辑核查可对数据录入进行质量控制。
   (二)结果的描述
   描述研究对象的一般特征,以确定病例与对照之间的均衡性。描述暴露因素在病例与对照中的分布。如果两者的某种或某些暴露因素分布存在显著的差异,则可以认为病例和对照之间不均衡。
   (三)统计学推断
   根据是否匹配设计,病例对照研究资料的分析方法略有不同。
   1、非匹配病例对照研究资料的分析
   (1)病例对照研究的资料可归纳如2。


   比值比的含义与相对危险性相同,比值比的取值范围是从0到无限大的正数。OR>1,表示该暴露因素与疾病为正相关,暴露因素使疾病发生的危险性增加;OR<1,表示暴露因素与疾病为负相关,暴露因素对预防疾病的发生有保护性作用;如果OR接近或等于1,说明暴露与所研究的疾病无关。表3是不同RR或OR所反映的暴露与疾病之间的联系强度。这只是一种人为的划分方法,仅供参考。

   应用比值比这个指标的优点是:① 如果病例和对照都是各自有代表性的样本,且疾病率小于5%(疾病罕见),比值比是相对危险性的极好近似值。② OR不仅可用于病例对照研究,而且也适用于队列研究和横断面研究。③ OR恒等于ad / bc或[p1 /(1-p1)] / [p0 /(1-p0)]。④ 适于进行统计学调整,无论是用分层分析或用多因素分析。⑤ 无论用暴露比值或非暴露比值计算,或以有病比值或无病比值计算,所获得的比值比,其结论都是一致的。

   (4)计算OR的可信区间
   为了进行统计学推断,可以采用2检验(见上述),或计算OR的可信区间 (confiednce interval,CI),即按一定的概率来估计总体OR值的范围,其上、下限的两个点值为可信限(confidence limit)。上、下可信限所包含的区间称作可信区间,一般计算95%或99%的可信区间。可信区间的计算方法很多,本文介绍Woolf法和Miettinen法。

 



 


 



 六、病例对照研究的优缺点
   (一)优点
   1、简便、快速、省费用,效率高。
   2、需调查的对象数目较少。
   3、同一项调查可识别一个以上的危险因素,也易获得个体特征方面的信息,如吸烟、饮食习惯等,故易于检验多个危险因素之间的交互作用。
   4、尤适于研究罕见的、潜伏期长的疾病结局,如阴道腺癌,其在年轻妇女人群中的发生率为1/百万,潜伏期为15~20年。
   5、适于研究药物不良反应,也适于研究一些新出现的疾病,能有效地识别其危险因素,有助于迅速进行公共卫生干预。
   6、职业性病例对照研究尤适于研究一段短时间内局限性暴露的危害,例如,有人研究某石棉材料厂中接触温石棉者的呼吸道癌发病率,并与全国人口的呼吸道癌发病率进行比较,结果未发现明显超额。但该厂有少数工人曾短暂接触过青石棉,用病例对照研究即可发现短时间青石棉暴露与胸膜间皮瘤有显著性联系。
   (二)缺点
   1、不能直接计算疾病率,只能估计相对危险性,虽可为进一步研究提供线索,但无法直接得出因果联系的结论。
   2、易发生各种偏倚,包括选择偏倚、信息偏倚、混杂偏倚。尤其是回忆偏倚,因有关危险因素的信息是靠回顾的方法确认的,而历史资料常常无法核实。如果研究对象选自医院的病例,易发生选择偏倚。
   3、有时难以确定暴露是否发生在疾病之先。
   4、不适用于研究罕见的暴露因素。
   5、常难以找到适当的对照。

七、进行病例对照研究时应注意的事项
   (一)病例和对照的选择应着重于真实性,应规定严格的定义、入选标准、除外标准。
   (二)病例应尽量选用新诊断的病例,如选用现患病例,易发生现患病例偏倚(Neyman's fallacy)。
   (三)病例对照研究的关键是如何选择对照。应注意确保在危险因素的暴露方面,对照是一般人群的代表。对照与病例应有同等的暴露机会。可能时,选择二组或以上不同来源的对照。
   (四)病例和对照的暴露资料来源和暴露资料搜集方法应尽可能相似。
   (五)如果怀疑职业暴露与疾病有关,应调查研究对象的全部职业史,过去的职业比目前的职业更重要,尤对暴露后迟发的疾病更是如此。应尽可能用多种不同来源获取职业史。
   (六)暴露评价十分重要,但不易做好。暴露的定义宜既不太宽、又不太窄。为获最佳效率,所研究的暴露应较常见(人群的暴露率>5%)。
   (七)采用匹配的方法来消除混杂影响时,应注意勿匹配过头。
   (八)如采用队列内病例对照研究(或称套叠式病例对照研究)方法,简便易行,可比性好。

八、偏倚
   (一)偏倚的概念:流行病学研究中,观察性方法远较实验性方法应用普遍。观察是流行病学最基本的研究方法。但观察方法与实验方法不同,实验中,研究人员可主动处理实验条件、确定实验对象的暴露剂量和暴露时间,并可将实验对象随机分组,用盲法观察实验结果,故内部真实性较好。但用观察方法只能观察自然结果,难以控制观察对象或观察条件,因此,或多或少都会存在偏倚。所谓偏倚(bias)是指由抽样误差以外的任何原因引起的误差。要确保流行病学调查研究结果的真实性,不是一件易事。难怪有人称,在迄今已发表的流行病学研究报告中都或多或少存在一些偏倚,尚无一篇是完美无缺的。所谓真实性(validity)是指没有系统误差(即没有非机遇产生的、偏离真实情况的错误),或无偏倚。因为偏倚可歪曲研究结果,如在同样条件下重复研究,会得到同样错误的结论。为使流行病学调查研究的结论真实,并能泛化,必须避免或消除各种偏倚。流行病学研究从设计到得出推论的全过程中,都可能发生偏倚。解决偏倚问题,最重要的是能识别引起偏倚的原因。如能事先知道发生偏倚的原因,则应在设计中注意避免。如在调查研究的中途发现偏倚,用统计方法可在一定程度上予以纠正。但现有的统计方法只能减少或消除已知来源的偏倚,对来源不明的偏倚,尚难消除。
人们对病例对照研究的批评多围绕着其可能发生的系统误差(偏倚)。虽然所有的观察性研究,甚至随机化分组的实验,都可能发生系统误差,但回顾性的病例对照研究特别易于发生偏倚,主要原因是凭借记忆和记录得到的潜在危险因素和可能混杂因素的暴露信息不准确;有时难以确定是暴露致病、或是发病而致暴露;识别和征集有代表性的病例和对照有困难;等。
   (二)分类
   病例对照研究中的偏倚大致可分为选择偏倚、信息偏倚、混杂偏倚三类。
   1、选择偏倚:是指由于研究对象缺乏代表性,或研究对象的选择依赖于某些研究特征而致成的偏倚。流行病学研究分析归根结底是进行比较,各种原因的对照选择不当均可导致偏倚。
   (1)进入率偏倚
   病例对照研究如选用医院病例或医院对照,均可导致选择偏倚,这是因为医院人群无代表性,具有某种暴露因素或没有该因素的病例或对照,其入院率是不一样的,虽然在一般人群中该因素与疾病并无联系,而用医院病例和医院对照进行病例对照研究,可因其入院率不同而致偏倚。这种偏倚称进入率偏倚(admission rate bias或Berkson fallacy)。用医院病例进行病例对照研究时,选择偏倚是一个主要问题。
   (2)Neyman偏倚
   病例对照研究中如选用现患病例作为研究对象,且暴露又与疾病的预后有关,可能发生Neyman偏倚。因为现患病例都是过去新发病例中的幸存者,其暴露特征各异,例如,男性的直结肠癌发病率略高于女性,但女性直结肠癌患者的生存时间明显长于男性,因此,如选用现患病例作为研究对象,则病例中的女性比例就较新诊断的病例中多。又例如,美国白人女性乳癌发病率高,但其存活率也高,而社会经济状况既与乳癌发病有联系,又对其预后有影响。为了除去这种选择性生存(或死亡)的影响,建议采用新诊断(newly-diagnosed)的病例作为研究对象。
   (3)研究对象拒绝参加、或除外某些研究对象,会导致暴露与疾病之间联系的估计错误。例如,用病例对照方法研究服用Aspirin与心肌梗塞的联系时,选择研究对象应除外慢性关节炎、慢性消化性溃疡病人,研究乳癌与服用Reserpine的联系时,如病例中含高血压病人,而对照中无高血压病人,即可能使病例的暴露增加,结果高估了联系。
   (4)无应答偏倚:如入选研究的对象与未应答的人员之间有系统的差异,也可致选择偏倚。下列几种情况都可发生选择偏倚:① 由于就医的限制,有些病例被略去。② 由于报告不全,有些已诊断的病例也被忽略。③ 因为得不到记录,有些已诊断的病例被排除。④ 病人或其主治医师拒绝参加研究。反复招募研究对象,收集其它辅助材料以评价参加者与未参加者的可比性,可使无应答效应减至最小。加强保密性和给予参加者个人一些适当的好处,将有助于增加应答率。
   2、信息偏倚:由于从病例和对照者中获得信息的准确程度不对称,以致研究结果真实性减弱,即为信息偏倚。流行病学研究中的暴露评价是最困难的问题,迄今仍未解决好。其它如分类错误(暴露或疾病分类错误)、回忆偏倚、观察偏倚、原发病偏倚等也需引起注意。
   3、混杂偏倚
   (1)混杂的概念
   两种或以上的暴露因素引起的效应交织在一起、不能分开,即称混杂(confounding)。
混杂是暴露因素与疾病之间一种非因果性联系。这种联系是由于引起混杂的因素在暴露组与非暴露组中的分布不均匀所致。如果研究的效应中混有其它因素的影响,就会歪曲研究因素与疾病之间的联系,使研究结果出现偏倚,称为混杂偏倚。混杂可使实际上不存在的联系成为一种假的联系(正混杂偏倚),或混杂也可掩盖了真实的联系(负混杂偏倚)。引起混杂偏倚的因素称为混杂因素(confounder,或confounding factor),见图1。

   (2)混杂因素
   作为一种混杂因素必须具备以下三项条件:① 是所研究疾病的危险因素;② 与所研究的因素有联系;③ 不是所研究的因素与疾病之间发病机制的中间步骤。
   (三)偏倚的控制
   1、设计阶段:认真做好研究对象的选择,使其有代表性和可比性。
   2、实施阶段:在调查实施过程中,对病例和对照者的观察、调查应一视同仁,尽可能采用交叉、盲法,或询问时采用高度机械的排列结构的调查表,方法应规范化、标准化,观察指标应尽可能客观、能定量,从不同来源对观察资料进行核实,或可采用多种不同来源的对照进行比较。调查员必须经过培训。医院病例可在入院时即予询问、记录。或采用自填式的调查表。
   对病例和对照的询问应注意下列几方面的可比性:① 可疑的暴露时间,② 询问的场合, ③ 询问的程序和结构,④ 提问的方式,⑤ 询问者鼓励、提示的程度,⑥ 研究对象与询问者对暴露─疾病联系假设的知识了解程度。可能的话,应不让研究对象知道暴露─疾病联系的假设,或不让询问者知道研究对象的疾病状态。
   3、分析阶段:调整、标化、或多变量数学模型拟合,但必须事先收集到有关资料。

九、合格的病例对照研究应具备的条件
   1987年Lichtenstein等通过对37位专家的调查,总结出病例对照研究应具备的20项特征,可以认为这是进行病例对照研究的设计,或发表病例对照研究结果时应遵循的指导原则,现将其合并为10项,列述于下。
   (一) 有对所研究问题的阐述:研究的目的和假设是什么?
   (二) 抽样方法的阐述,样本含量的确定。
   (三) 病例来源,病例的诊断方法,是否新发病例或现患病例,病例的除外标准是什么?
   (四) 对照的来源,病例和对照的诊断程序是否一致?对照的除外条件是什么,匹配的信息。
   (五) 资料收集方法,暴露的信息(强度和时间),收集资料时是否用盲法?
   (六) 关于应答率的阐述,有多少失访,如何处理失访?
   (七) 关于混杂变量的信息,处理混杂的方法。
   (八) 关于其它偏倚的信息。
   (九) 分析方法的描述,统计学检验结果的表达方式是否完整,有无可信区间?
   (十) 结论是什么,真实性如何?
责任编辑: 田家园
Copyright © 2003 -2005 oncology,cancer,clinical & research
All rights reserved.
Modified by: UTSpeed HTML phpArticle Version 2.0
页面美化:Nuifu and 田家园.