近年来文献数量显著增加,大量不同主题的Meta分析数量也显著增长。在生物医学领域,Meta分析是多种发表类型中拥有较高被引数的类型。针对Meta分析已经有不少书籍或指南,本文是一篇指导Meta分析的简洁文章,帮助入门者初步了解Meta分析的操作和撰写。
1. 明确Meta分析的主题和类型,
可以使用PICO原则来制定研究问题(详见:如何提出一个好的临床研究问题?)。关键是,要确认这一主题是否已有发表的Meta分析,以避免重复工作。在某些情况下,如果有新的数据产生,可以对该主题的Meta分析进行更新。
可以对多种类型的研究进行Meta分析,例如病例对照研究、队列研究和随机对照试验。由于观察性研究存在偏倚的可能性较大,在对这些类型的研究进行Meta分析时要考虑到这一点。此外,也可以对遗传关联研究,基因表达研究,全基因组关联研究(GWAS)或动物实验数据进行Meta分析。
建议在PROSPERO数据库(https://www.crd.york.ac.uk/Prospero)中预登记系统评价的方案。要知道,越来越多的期刊要求在发表前进行登记。
2. 遵循指南开展不同类型的Meta分析,
有几个常用的指南,例如,QUORUM声明(RCT的Meta分析报告规范),MOOSE声明(观察性研究的Meta分析报告规范),目前广泛使用的是PRISMA声明(系统评价和Meta分析优先报告条目)。
此外,还有一些关于临床研究Meta分析的具体指南(Cochrane手册;https://training.cochrane.org/handbook),以及遗传关联研究(PMID :19260758)、全基因组表达研究(PMID:18767902)、GWAS(PMID:23657481)和动物研究(PMID:24099992)相关Meta分析的指南(感兴趣的可以直接根据PMID去查看相关文献)。
3. 确定纳排标准、定义关键变量,
应该事先确定好纳入(如研究类型、出版语言等)和排除标准(如最小样本量等)。目前共识没有推荐关于发表语言或样本量的严格标准。
你应该清楚定义出需要从每篇文章中提取的变量。广泛的纳入标准会增加研究间的异质性,狭窄的纳入标准可能会难以找到研究,要取得均衡。
4. 在不同的数据库中系统检索,
提取关键数据,
可以在几个数据库中进行系统检索,例如PubMed,Embase,Cochrane数据库,Scopus,Web of Science和Google Scholar。通常情况下,在多个数据库中检索有助于尽可能找全已发表研究。
在某些领域,也需要在专业数据库中进行检索(例如BIOSIS,CINAHL,PsycINFO,Sociological Abstracts和EconLit等)。综述类文章的参考文献,有助于发现更多其他来源的文章(例如学位论文或会议论文)。
从原始文章中充分提取和记录关键数据是进行Meta分析的基础。对纳入研究的质量评估也是一个关键问题,这可以用于确定纳入标准、敏感性分析或研究的差异性加权。例如,Jadad量表经常用于随机对照试验(PMID:8721797);Newcastle–Ottawa量表用于非随机研究(PMID:20652370),QUADAS-2用于诊断准确性研究的质量评估(PMID:22007046)。
建议两名研究人员同时进行这些步骤。但是读者也要知道,这些质量评估也受到诟病,特别是当他们将研究简化到一个单一的“质量”评分时。最重要的是,避免将原始研究报告规范指南作为评估研究质量的量表。
5. 联系原始研究的作者询问缺失数据,
原始研究的正文或者附录文件缺乏关键数据也是很常见的,因此需要联系作者获取缺失的数据。不过,作者的回复率通常没有预期的高。有很多标准可以促进已发表文章中原始数据的可获得性,例如MIAME和STREGA标准。
在一些领域,例如基因学,有可能使用一个研究的整合性统计数据就可以识别出一个人,那么就应对数据共享采用严格的标准,需要得到专门批准。
6. 为你的研究问题选择最佳统计模型,
需要注意,很多情况下,各研究报告的数据形式并不兼容,因此需要进行各种类型的转换。还好的是,如何提取和转换连续变量(PMID:8797521)、四格表(PMID:16025540)、生存数据(PMID:9921604),已经有一些可用方法了。
通常情况下,Meta分析采用的是固定效应模型或随机效应模型。对于更复杂的数据,也有人提出了多元Meta分析的方法。其他统计操作涉及敏感性分析、Meta回归、亚组分析、异质性检验(如Q或I2)。
如果存在异质性,则应解释异质性的可能来源。尽管随机效应模型适用于研究间存在异质性的情况,但仍要确定异质性的来源,并应使用统计检验量化其对效应大小的影响,例如亚组分析或Meta回归。
发表偏倚是一个需要考虑的重要方面,因为在很多情况下,阴性结果文章的发表可能性更低。其他类型的偏倚,例如“赢者诅咒(winner’s curse)”,在遗传学领域较为常见,建议采用累积Meta分析的方法识别出来。
7. 使用规范软件进行统计,
有几个常用的软件可以用于Meta分析,有的软件是有统计包,例如Stata或R软件,有几十个包,大多数是用户编写的,可以处理绝大部分Meta分析的任务,甚至是复杂的Meta分析,例如网状Meta分析、GWAS和基因表达研究的Meta分析,详看:
https://cran.r-project.org/web/views/MetaAnalysis.html
https://www.stata.com/support/faqs/statistics/meta-analysis
还有一些软件专门用于Meta分析,例如OpenMetaAnalyst,NetworkAnalyst,JASP,MetaGenyo,EpiSheet (krothman.org/episheet.xls),GWAR,GWAMA,METAL, RevMan (https://community.cochrane.org/help/tools-and-software/revman-5)。
某些情况下,运行某些程序时会报错,可能因为这些程序依赖于其他程序包。
8. 记录和研究报告须完整且透明,
除了所使用的Meta分析策略的细节之外,检索、纳入标准、筛选出的摘要和纳入研究的数量等数据都很有用,对纳入研究进行的质量评估也很有用。
可以构建一个电子表格,记录筛选标准中的每个步骤,这将有助于构建流程图。描述不同步骤间进展的流程图非常有用,会提高Meta分析的质量。如果将来需要对该Meta分析进行更新,这些记录也大有用处。此外,说明Meta分析存在的局限性也很重要。
9. 投稿时提供足够的数据,
Meta分析的文章中,有一张关于原始研究完整信息的表格(如作者、年份、纳入人群、DOI、PMID等),非常有用,可以放在论文的正文中,也可以作为附录文件。应该指出所使用的Meta分析和生成关键图(例如森林图)的软件。应报告汇总的效应值,例如pooled odds ratios,包括置信区间。
在阳性结果的情况下,敏感性分析的图很有用。在更复杂的分析中,建议在附录文件中附上生成结果的脚本。
10. 针对你的发现建议未来研究方向,
讨论部分是Meta分析的重要组成部分,作者应该在目前已有文献和知识体系下对当前发现进行讨论。作者可以讨论Meta分析阳性或阴性结果的可能原因,基于现有的生物学或流行病学证据提供解释,并讨论个别研究的某些特征。
Meta分析通常综合了多个原始研究的证据,这些研究需要数年和大量资金,作者可以推荐未来进行原始研究的重要建议。