药物临床试验数据管理与统计分析计划指导原则
一、前言
药物临床试验过程中,制订规范的数据管理计划有助于获得真实、准确、完整和可靠的数据,严谨的统计分析计划有助于保证统计分析方法的合理性和结论的可靠性。因此,申办者有必要依照临床试验方案对数据管理工作和统计分析内容制定详细的计划。
随着近年来临床试验数据管理与统计分析技术与方法的不断发展,如电子源数据和电子数据采集系统的广泛应用,以及ICH E9(R1)《〈临床试验的统计学原则〉指导原则的增补:临床试验中的估计目标与敏感性分析》的出台和实施,对临床试验的设计、实施、数据收集和分析等方面的理念和实践都产生了影响。为了适应这些新的变化,现对2016年7月发布的《药物临床试验数据管理与统计分析的计划和报告指导原则》进行修订,更新数据管理计划与统计分析计划的技术要求,同时不再对数据管理报告和统计分析报告的撰写提出技术要求。对于上述资料的递交要求,建议申办者参考申报资料要求和ICH E3 等相关指导原则。
本指导原则主要适用于确证性临床试验,同时可供探索性临床试验参考使用。
二、数据管理计划
(一)一般考虑
数据管理计划由数据管理人员依据临床试验方案书写,详细、全面地规定并记录某一特定临床试验的数据管理任务,包括人员角色、工作内容、操作规范等。数据管理计划应在临床试验方案确定之后、第一例受试者筛选之前形成经申办者批准的版本且开始执行。在执行过程中,数据管理计划可能需要根据实际操作及时更新与修订。
数据管理工作需要多方参与,涉及临床研究机构和申办者指定的数据管理、统计、编程、监查、药物警戒等部门。各方职责在数据管理各步骤不尽相同,可分为负责、参与、审核、批准等,数据管理计划需明确参与各方及其人员的职责。同时,数据管理各步骤需建立并遵循相应的标准操作规程,数据管理计划应列出项目所遵循的标准操作规程清单。
(二)基本内容
数据管理计划应全面且详细地描述数据管理流程、数据采集与管理所使用的系统、数据管理各步骤及任务,以及数据管理的质量保障措施。
1. 试验概述
应简要描述临床试验方案中与数据管理相关的内容,一般包括研究目的和总体设计,如随机化方法及盲法(如有必要)、受试者数量、评估指标、试验的关键时间节点、重要的数据分析节点及对应的数据要求等。
2. 数据管理流程及数据流程
应描述数据管理的工作流程以及临床试验数据的流程,明确各环节的管理。如需要,可采用图示方式。
数据管理的工作流程应包含数据采集/管理系统建立(如病例报告表及数据库的设计)、数据接收与录入、数据核查与质疑、医学编码、外部数据管理、数据审核、数据库锁定、数据导出及传输、数据及数据管理文件的归档等过程。
数据流程应包含临床试验中所有类型和来源的数据(如病例报告表数据、中心实验室检测数据、药代动力学检测数据、患者报告结局数据、影像学数据等)的生成、采集、传输、导入、导出、存档位置、存储期限、负责单位/人等信息。应详细列出各种类型和来源的数据的流程,以便于对其进行数据管理。
3. 数据采集/管理系统
应列出采集临床试验数据的方法,如纸质或电子的病例报告表、采用的数据采集/管理系统的名称及版本。描述系统用户的权限控制计划,或者以附件形式提供相应信息,包含权限定义、分配、监控及防止未经授权操作的措施或方法、权限撤销等。
数据采集/管理系统应具备稽查轨迹、系统安全管理、权限控制及数据备份等功能,并通过完整的系统验证。电子数据采集/管理系统应同时具备除了上述功能之外的电子签名功能。
4. 数据管理步骤与任务
(1)病例报告表及数据库的设计
病例报告表的设计必须保证收集临床试验方案所规定的并满足统计分析需求的数据。无论病例报告表采用纸质版还是电子版,均需对其填写指南的撰写和管理有所阐述。
数据库的设计应与注释病例报告表和/或数据库设计说明保持一致,并依据数据核查计划建立逻辑核查,经用户接受测试合格后方可上线使用。应对此过程进行简要描述和说明。
(2)数据采集
应阐述数据采集的方式和过程,包括填写、接收和录入(或导入)等。
临床研究者或临床研究协调员应依照病例报告表填写指南,准确、及时、完整、规范地填写病例报告表。纸质病例报告表需定义已完成病例报告表的发送、转运、接收方式,如传真、邮寄、监查员收集等,同时定义收集频率及记录文件接收的格式等。纸质病例报告表通常采用双人独立录入后比对,以控制数据质量;在数据录入前需制定数据录入说明,确定数据录入的要求及方式。电子病例报告表由临床研究者或由其指定的临床研究协调员直接录入或由电子源数据直接导入。
(3)数据核查
在进行数据核查之前,应制定详细的数据核查计划,以明确数据核查内容、方式与核查要求。数据核查通常需要数据管理人员、监查员、医学人员及统计师等共同完成,因此应在数据核查计划中明确不同人员的职责分工。
(4)医学编码
医学编码是把从病例报告表上收集的不良事件、医学诊断、合并用药、既往用药、既往病史等的描述与标准字典中的术语进行匹配的过程。应制订医学编码计划,描述编码流程、编码方式、编码字典及版本,以及执行编码的相关标准文件。
(5)外部数据管理
外部数据是临床试验数据库的组成部分,包括但不限于实验室数据、随机化数据等。针对外部数据的管理,应制订其数据传输协议,描述数据类别、数据提供者、数据格式、传输方式、传输频率等协议内容,以及明确对外部数据进行质控的措施,如传输测试、一致性核查等。对于盲态的外部数据,如血液样品中的药物浓度或某些关键数据等,需描述此类数据的管理流程。
(6)电子源数据管理
目前,各研究中心数据的原始记录更多是以电子方式直接录入,例如电子健康记录、电子实验室报告、电子患者报告结局、数字化影像报告等。电子源数据有助于数据的及时、准确、完整采集,实现远程监查,实时数据审阅,避免某些不必要的数据重复录入,减少数据转录错误。如果电子源数据作为生成递交数据的直接来源,申办者应列出在临床试验中应用的与电子源数据相关的计算机化系统,数据安全防护措施、去隐私化措施及质控流程,系统访问权限控制,以及电子数据在软件和(或)硬件系统中的传输流程。电子源数据应满足可溯源性、易读性、同步性、原始性、准确性的质量要求及监管的文档保存要求,以便核查。
(7)数据审核与数据库锁定
为了保证数据质量,在临床试验过程中可以根据需要进行多次数据审核。一般地,数据审核应对数据质疑、脱落和方案偏离的病例、合并用药和不良事件的发生情况进行确认。应列出数据审核的要求,并描述数据审核操作的具体流程。临床试验若采用盲法设计,则数据审核也应在盲态下进行;若采用开放设计,则应对数据审核人员保持盲态。
数据审核是数据库锁定的前置条件。应说明数据库锁定的流程、实施部门及执行的标准操作规程文件。应尽量避免数据库锁定后的解锁和再锁定,同时应事先规定并说明其条件和流程。
(8)数据导出及传输
描述数据导出和传输的文件格式、导出内容(数据库、变量名及变量值编码)及传输介质,传输介质应符合国家法规和监管部门要求。
(9)数据及数据管理文件的归档要求
数据及录入/导入数据库的时间、录入者、数据稽查轨迹及数据管理文件都需要完整保存。数据通常包括但不限于:临床试验数据、外部数据、数据库元数据信息、实验室检测参考值范围、逻辑检验及衍生数据变更控制列表、数据质疑表和程序代码等。数据管理文件通常包括但不限于:数据管理计划、空白病例报告表、病例报告表填写指南、完成病例报告表的PDF 格式文件、注释病例报告表、数据库设计说明、数据库录入说明、数据核查计划、数据质控核查报告等。
应明确需要存档的临床试验数据、管理文件、介质、归档方式及时限。
5. 质量控制
需确定数据及数据管理操作过程的质控项目、质控方式(如质控频率、样本选取方式及样本量等)、质量要求及达标标准、对未达到预期质量标准的补救措施等。
三、统计分析计划
(一)一般考虑
相对于临床试验方案中对统计分析的阐述,统计分析计划是具有更多技术性和实际操作细节的一份独立文件,包括针对估计目标及其他数据进行统计分析的详细内容。统计分析计划应当由统计学专业人员起草,要求全面陈述临床试验数据的分析方法和呈现方式,以及预设的统计推断标准。统计分析计划应在临床试验方案第一版定稿之后形成。如需要,可以在临床试验过程中进行修改、补充和完善。不同时点的统计分析计划建议标注版本及日期,其终稿应在数据揭盲之前完成。在临床试验过程中,如果临床试验方案有修订,则统计分析计划也可根据需要作相应的调整。
确证性证据必须是在统计分析计划中事先规定的统计分析内容,其他的分析内容只能是支持性或探索性的。如果涉及期中分析,则相应的统计分析计划应最迟在每次期中分析前确定。
(二)基本内容
统计分析计划的基本内容涵盖但不限于研究目的、设计类型、比较类型、随机化与盲法、估计目标的定义、假设检验、样本量、分析集的定义、有效性及安全性评价的详细计划。
1. 试验概述
试验概述是对临床试验方案的简要描述,一般包括以下主要内容:
(1)研究目的:临床试验的主要目的和次要目的。
(2)设计类型:如平行设计、交叉设计、析因设计、单臂设计等。
(3)对照类型:如安慰剂对照、阳性对照、剂量组对照、目标值对照等。
(4)比较类型:明确临床试验的比较类型,如优效性检验、非劣效性/等效性检验及其界值等。
(5)随机化方法及其实施:明确随机化方法,如区组随机、分层随机及其分层因素等。
(6)盲法及设盲措施:说明是单盲、双盲,设盲措施是双盲单模拟、双盲双模拟,以及在盲态下执行统计分析的措施等。若采用开放设计,需说明是否采取了某种程度的设盲措施。
2. 估计目标
应依照临床试验方案描述估计目标的定义,每个估计目标应包括治疗(处理)、人群、变量(终点)、伴发事件及其处理策略、群体层面汇总等属性。
(1)主要估计目标
治疗(处理):相关的治疗条件,以及适用时进行比较的其他治疗条件。这些可能是单独的干预措施,也可能是同时进行的干预措施的组合(如加载治疗),或者是一个复杂干预序列组成的整体方案。
人群:临床问题所针对的目标人群。可以是整个临床试验人群,也可以是按某种基线特征定义的亚组,或由特定伴发事件定义的主层。
变量(终点):为解决临床问题从每个受试者获得的变量(或终点)。
伴发事件及其处理策略:针对伴发事件的临床相关问题,通常采用疗法策略、假想策略、复合变量策略、在治策略或主层策略来反映。一些伴发事件的处理策略可以通过治疗(处理)、人群和变量(终点)的精确说明来体现。无论采用何种策略,申办者均应提供充分的临床依据。
群体层面汇总:应规定变量的群体层面的汇总统计量,为不同治疗之间的比较提供基础,例如均数、中位生存时间、应答率等。
(2)次要估计目标
应参考前文的主要估计目标的描述。如果设有关键次要估计目标,则可与其他次要估计目标分开描述并置于这些次要估计目标之前。
(3)探索性估计目标
如果有探索性估计目标,可参考前文的主要估计目标的描述。如果无探索性估计目标,则无需描述。
3. 样本量
应阐述样本量的确定依据,包括样本量估计方法(包括所涉及的参数及其依据)、样本量估计所使用的软件模块等,以及样本量调整计划(如有)。确定的样本量应确保对主要估计目标的评价具有足够的检验效能。
4. 分析集
应根据不同研究目的描述分析集的定义。临床试验的分析集一般包括基于随机分组的分析集和安全性分析集。基于随机分组的分析集一般适用于人口学资料和基线特征的分析以及不同估计目标的评价;如果用于评价估计目标的人群不是该分析集的全部人群,则应在分析集中对这部分人群进行标记,并在本章节中描述标记的条件。安全性分析集一般适用于安全性分析。对于非随机化的临床试验可根据入组人群定义分析集。
5. 统计分析方法
统计分析应建立在真实、准确、完整和可靠的临床试验数据基础上,应根据研究目的、试验设计和估计目标等选择合理的统计分析方法。应给出不同类型资料的描述及统计推断方法,明确采用的单/双侧检验及其检验水准,并说明所采用的统计软件及版本号。针对统计分析涉及的衍生变量,应描述其衍生公式。通常以统计分析表或图的形式呈现统计分析结果,并以文字形式对其相关信息进行简要描述。
(1)受试者分布分析
对于受试者分布的分析,说明所采用的描述性统计分析方法和分析内容,如筛选、分配、终止治疗、终止研究等情况及其原因。
(2)人口学资料和基线特征分析
说明对于人口学等基线资料根据数据性质所采用的描述性统计分析方法。
(3)依从性和合并用药分析
对于依从性和合并用药的分析,说明所采用的描述性统计分析方法,并说明对依从性差、具有合并用药的受试者具体情况的描述方式。
(4)主要估计目标分析
应描述主要估计目标的主估计方法和敏感性估计方法。
①主估计方法
应阐明主要估计目标所涉及伴发事件的处理策略及相应的数据处理和分析方法,包括与伴发事件及其处理策略有关的缺失数据的处理。此处应避免与前面估计目标定义部分重复,应提供更多关于数据处理和分析方法的详细信息。
应定义主要估计目标统计检验的原假设、备择假设及其检验水准等。说明评价主要估计目标所采用的统计分析方法,相应的统计模型的选择要注意考虑变量(终点)的类型及其分布特征。治疗效应的估计应包括点估计和区间估计。
②敏感性分析方法
为了探索根据主估计方法得到的统计推断结果的稳健性,建议针对同一估计目标采用一种或多种形式的敏感性分析。
对于敏感性分析,同时变动主要分析的多个方面假设可能难以确定由哪些假设导致了目前所观测到的潜在差异。因此,应根据具体情况考虑是否需要进行同时变动多个假设的敏感性分析。阐明不同敏感性分析背后的假设变化,将有助于对敏感性分析结果做出更合理解释。敏感性分析方法同样需要事先说明。
(5)次要估计目标分析
应描述次要估计目标的估计方法,治疗效应的估计应给出点估计和区间估计。如果对次要估计目标设有假设检验,则应说明其原假设、备择假设以及检验水准等。如果设有关键次要估计目标,需参考前文的主要估计目标分析的描述,并将其置于其他次要估计目标的分析方法之前分别描述。
(6)探索性估计目标分析
如果有探索性估计目标,应描述其估计方法,治疗效应的估计应给出点估计和区间估计。如果无探索性估计目标,则无需描述。
(7)安全性分析
所有的安全性指标在分析中都需要高度重视,应特别关注严重不良事件以及与药物作用机理、代谢物和/或疾病领域相关的安全性事件。对不良事件及其严重程度的分级应采用统一的编码词典进行编码,并说明其名称和版本。
对于安全性数据的分析需说明所采用的统计分析方法。分析计划中需说明各种安全性数据的分类(如临床结局、实验室检查结果、生命体征等)及其汇总方法,如按照事件发生的频数、频次和发生率进行分析,必要时可进行组间比较。
对安全性数据的分析,必要时还可以结合适当的图形以显示某不良事件及其严重程度在各组间的分布,或不同时间段发生率和累计发生率的趋势。
(8)缺失数据处理
应预先说明缺失数据的处理方法及理由。应区分与伴发事件及其处理策略直接相关的缺失数据(如在疗法策略下,终止随机治疗后应收集但未被收集到的数据),以及与特定估计目标直接相关但与伴发事件及其处理策略不直接相关的缺失数据(如当直接退出研究未被预设为伴发事件时)。前者的处理方法应在估计目标的分析方法部分进行描述,后者的处理方法应在本章节进行描述。
(9)亚组分析
通常需要进行支持性亚组分析,主要目的是进一步探索试验药物在各个亚组中的疗效一致性。当涉及亚组分析时,需要对亚组给出明确的定义。
(10)补充分析
除以上的分析之外,还可以对估计目标进行补充分析,以提供对疗效更全面的了解。补充分析在解释临床试验结果方面的作用通常较小,因此需考虑补充分析的必要性和作用。
6. 多重性考虑
如果存在多重性检验问题,例如多个估计目标、多组间比较、多阶段整体决策、纵向数据的多个时间点分析、确证性亚组分析等,则应说明控制总I 类错误率的策略与方法。
7. 期中分析
如果事先制订了期中分析计划,则应阐述期中分析的时点(包括日历时点或信息时点)、决策策略和总I 类错误率控制方法等。如果成立了数据监查委员会,则应简要描述其任务。
参考文献
[1] 国家药品监督管理局. 化学药物临床试验报告的结构与内容技术指导原则. 2005
[2] 国家药品监督管理局. 药物临床试验的生物统计学指导原则. 2016
[3] 国家药品监督管理局. 临床试验数据管理工作技术指南. 2016
[4] 国家药品监督管理局. 药物临床试验的电子数据采集技术指导原则. 2016
[5] 国家药品监督管理局. 药物临床试验数据管理与统计分析的计划和报告指导原则. 2016
[6] 国家药品监督管理局. 药物临床试验质量管理规范. 2020
[7] 国家药品监督管理局. 药物临床试验多重性问题指导原则(试行). 2020
[8] 国家药品监督管理局. 药物临床试验亚组分析指导原则(试行). 2020
[9] 国家药品监督管理局. 药物临床试验数据监查委员会指导原则(试行). 2020
[10] 国家药品监督管理局. 药物临床试验适应性设计指导原则(试行). 2021
[11] 国家药品监督管理局. 用于产生真实世界证据的真实世界数据指导原则(试行). 2021
[12] FDA. Guideline for Industry on Electronic Source Data in Clinical Investigations. 2013
[13] FDA. Guideline for Industry on Use of Electronic Health Record Data in Clinical Investigation. 2018
[14] ICH. E3: Structure and Content of Clinical Study Reports. 1995
[15] ICH. E6: Guideline for Good Clinical Practice. 1996
[16] ICH. E9: Statistical Principles for Clinical Trials. 1998
[17] ICH. E9(R1): Addendum on Estimands and Sensitivity Analysis in Clinical Trials to the Guideline on Statistical Principles for Clinical Trials. 2019
附录:词汇表
| 词汇 | 解释 |
|---|---|
| 电子源数据(Electronic Source Data) | 是指以电子形式进行初始记录的数据,包括在临床研究开始之前或期间采集的可用于重现或评估该研究的原始记录及其核证副本中的信息。 |
| 电子数据采集(Electronic Data Capture,EDC) | 是一种基于计算机网络的用于临床试验数据采集的技术,通过软件、硬件、标准操作程序和人员配置的有机结合,以电子化的形式直接采集和传递临床数据。 |
| 权限控制(Access Control) | 是指按照临床试验电子系统的用户身份及其归属的某项定义组的身份来允许、限制或禁止其对系统的登录或使用,或对系统中某项信息资源项的访问、输入、修改、浏览能力的技术控制。 |
| 稽查轨迹(Audit Trail) | 是计算机系统(如数据管理系统)的基本功能。是指系统采用安全的和计算机产生的带有时间烙印的电子记录,以便能够独立追溯系统用户输入、修改或删除每一条电子记录的日期、时间,以及修改原因,以便日后数据的重现。任何记录的改变都不会使过去的记录被掩盖或消失。只要受试者的电子记录保存不变,这类稽查轨迹文档记录就应当始终保留,并可供监管视察或稽查员审阅和复制。 |
| 系统验证(System Validation) | 是指建立计算机化系统生命周期管理的文档化证据,以确保计算机化系统的开发、实施、操作以及维护等环节自始至终都能够高度满足其预设的各种系统技术标准、使用目的和质量属性,和处于监控的质量管理规程中,并能在其投入应用直至退役过程中都能高度再现和维护系统的标准和功能符合监管要求。 |
| 注释病例报告表(Annotated Case Report Form,aCRF) | 是对空白的病例报告表的标注,记录病例报告表各数据项的位置及其在相对应的数据库中的变量名和编码。 |
| 数据核查计划(Data Validation Plan,DVP) | 也称逻辑核查计划,是由数据管理员为检查数据的逻辑性,依据临床试验方案以及系统功能而撰写的系统设置文件。 |
| 逻辑核查(Edit Check) | 是指临床试验数据输入计算机系统后对数据有效性的检查。这种核查可以通过系统的程序逻辑,子程序和数学方程式等方法实现,主要评价输入的数据域与其预期的数值逻辑、数值范围或数值属性等方面是否存在错误。 |
| 用户接受测试(User Acceptance Testing,UAT) | 用户接受测试是由临床数据管理系统的用户进行的一种检测方式,检测记录可用以证明所设计系统经过了相关的验证过程。用户应全面检测所有正确和错误数据组合,记录检测结果。全面的检测文档应包括验证方案、测试细则记录、测试总结报告和验证总结报告等。 |
| 方案偏离(Protocol Deviation) | 是指任何有意或无意偏离和不遵循临床试验方案规定的治疗、检查或数据收集规程的且未经伦理委员会批准的行为。一般来说,这种偏离只是逻辑性地或管理性地偏离临床试验方案,不会对受试者的安全和获益产生实质性的作用,也不会影响所收集数据的价值。 |
| 估计目标(Estimand) | 对治疗效应的精确描述,反映了针对临床试验目的提出的临床问题。它在群体水平上汇总比较相同患者在不同治疗条件下的结局。 |
| 估计方法(Estimator) | 采用临床试验数据计算估计目标的估计值的分析方法。 |
| 伴发事件(Intercurrent Event) | 治疗开始后发生的事件,可影响与临床问题相关的观测结果的解释或存在。在描述相关临床问题时,需解决伴发事件,以便准确定义需要估计的治疗效应。 |
| 期中分析(Interim Analysis) | 是指在临床试验期间使用试验累积数据进行的分析,如评价有效性的分析,评价安全性的分析,以及样本量的重新估计等。 |
| 安全性分析集(Safety Set,SS) | 安全性与耐受性评价时,用于汇总的受试者集称为安全性分析集。安全性分析集应考虑包括所有至少接受一次治疗的且有安全性评价的受试者。 |
| 缺失数据(Missing Data) | 是指对于既定估计目标的分析有意义、但未收集到的数据。它应该与不存在的数据,或由于伴发事件而被认为没有意义的数据区分开来。 |
| 敏感性分析(Sensitivity Analysis) | 是指针对模型假设的偏离和数据局限,探索主估计方法统计推断的稳健性的一系列分析。 |
| 亚组分析(Subgroup Analysis) | 通常是指将受试者根据其特征变量值分成不同的亚组,并估计各亚组的疗效和/或安全性的分析策略。 |
| 补充分析(Supplementary Analysis) | 是指对于主要分析和敏感性分析之外的分析的一般描述,目的是更多地了解治疗效应。 |
附录:中英文对照表
| 中文 | 英文 |
|---|---|
| 安全性分析集 | Safety Set, SS |
| 伴发事件 | Intercurrent Event |
| 标准操作规程 | Standard Operation Procedure, SOP |
| 病例报告表 | Case Report Form, CRF |
| 补充分析 | Supplementary Analysis |
| 电子患者报告结局 | Electronic Patient Reported Outcome, ePRO |
| 电子数据采集 | Electronic Data Capture, EDC |
| 电子源数据 | Electronic Source Data |
| 多重性 | Multiplicity |
| 方案偏离 | Protocol Deviation |
| 估计方法 | Estimator |
| 估计目标 | Estimand |
| 患者报告结局 | Patient Reported Outcome, PRO |
| 稽查轨迹 | Audit Trail |
| 临床研究协调员 | Clinical Research Coordinator, CRC |
| 逻辑核查 | Edit Check |
| 敏感性分析 | Sensitivity Analysis |
| 期中分析 | Interim Analysis |
| 权限控制 | Access Control |
| 缺失数据 | Missing Data |
| 数据管理计划 | Data Management Plan, DMP |
| 数据核查计划 | Data Validation Plan, DVP |
| 数据监查委员会 | Data Monitoring Committee, DMC |
| 统计分析计划 | Statistical Analysis Plan, SAP |
| 系统验证 | System Validation |
| 亚组分析 | Subgroup Analysis |
| 用户接受测试 | User Acceptance Testing, UAT |
| 注释病例报告表 | Annotated Case Report Form, aCRF |
| 总I 类错误率 | Familywise Error Rate, FWER |