药物真实世界研究设计与方案框架指导原则(试行)
一、概述
已发布的《真实世界证据支持药物研发与审评的指导原则(试行)》和《用于产生真实世界证据的真实世界数据指导原则(试行)》为真实世界证据支持药物研发与审评奠定了基础。采用真实世界研究支持儿科药物、罕见疾病药物等监管决策的指导原则也相继发布。
为了指导申办者科学合理的设计真实世界研究,明确真实世界研究方案撰写的技术要求,本指导原则将重点阐述药物研发及评价中真实世界研究设计以及研究方案制订的基本考虑,为药物研发中开展真实世界研究提供指导意见。
本指导原则适用于通过真实世界研究获得药物评价的临床证据。真实世界证据支持药物研发和监管决策的适用情形参见《真实世界证据支持药物研发与审评的指导原则(试行)》。本指导原则也可供以非注册研究为目的的真实世界研究参考。
二、真实世界研究设计的主要类型
真实世界研究设计包括观察性(或非干预性)研究设计和干预性研究设计(如实用型临床试验)。单臂研究设计是一种特殊的设计形式,其研究组可以是干预性的,也可以是观察性的,其外部对照通常基于真实世界数据而设定。
(一)观察性研究设计
观察性研究可分为队列研究、病例对照研究和横断面研究等。以因果推断为目的的观察性研究通常采用队列研究设计。本指导原则后文若无特别说明,所述观察性研究均是指队列研究。
根据研究方案中定义的真实世界研究起始时间和结局发生的时间,队列研究可分为回顾性、前瞻性和回顾前瞻性队列研究。回顾性队列研究收集的是历史数据,即研究开始前生成的数据;前瞻性队列研究收集的是研究开始后的数据;回顾前瞻性队列研究既收集已有的历史数据,也收集研究开始后的数据。
队列研究设计主要考虑目标人群队列、因果推断和质量控制三个方面。其它方面的考虑在下文的研究方案部分有具体阐述。
1. 目标人群队列
目标人群队列根据临床所关心的问题而定,具体以数据体现,即目标人群从研究的治疗开始到观察期结束所形成的纵向观测数据。目标人群队列的具体定义应基于研究目的、入排标准 (包括本研究用治疗的初治者(本指导原则在实操上定义为:纳入研究队列之前在充分的洗脱期内未使用研究用治疗的病例)或非初治者) 、数据来源和数据治理 /管理计划综合考虑。 鉴于数据来源的多样性,需充分评估研究人群的代表性及研究结论的外推性。 目标人群所收集的重要变量包括治疗( 含 研究队列和对照队列)、基线、协变量 (如基 线协变量、时依变量) 和结局变量等。观察性研究的样本量 应在充分考虑混杂因素、缺失数据等因素的基础上 满足统计 假设的要求 ,通常不设上限,特别是回顾性研究。队列起始时间、观察期 /随访期的长短和观测时间点 /访视点的确定应符合所研究疾病的特征 、临床实践 和临床评价要求。
2. 因果推断
观察性研究由于变量间因果关系的不确定性和复杂性使得因果推断具有挑战。不同分析模型的选择往往会导致分析结果不同,因此,为了避免结果驱动的偏倚,需要在设计阶段明确主分析将要采用的分析数据集、分析模型及其相对应的统计假设。为使研究结果更为准确和稳健,应考虑混杂偏倚、选择偏倚、信息偏倚等重要偏倚识别及控制方法,以及缺失数据的处理策略及其基于的假设;还应针对可能影响研究结果的各种因素,如模型假设背离或各类潜在偏倚来源,充分考虑敏感性分析及定量偏倚分析计划和策略。
3. 质量控制
质量控制的主要目的是保证获得高质量的分析数据。一方面,需要事先制定数据治理计划(针对 历史 数据)或数据管理计划(针对前瞻 性 收集数据),保证所产生的数据能够满足适用性要求(参见《用于产生真实世界证据的真实世界数据指导原则(试行)》);另一方面,应制定具体措施保障观测变量值的准确性,例如在保障测量工具、度量单位和评价方法的一致性方面的具体措施。
(二)实用临床试验设计
实用临床试验(pragmatic clinical trial,PCT)又称实操临床试验或实效临床试验,是指尽可能接近真实世界临床实践的临床试验,是介于传统的随机对照试验(randomized controlled trail,RCT)和观察性研究之间的一种研究类型,属于干预性研究。与RCT不同的是:PCT的干预既可以是标准的,也可以是非标准的;既可以采用随机分组方式,也可以自然选择入组;受试病例的入选标准可以相对较宽泛;对干预结局的评价不局限于临床有效性和安全性;PCT更多地使用临床终点,而很少使用传统RCT中可能使用的替代终点;可以同时考虑多个治疗组,以反映临床实践中不同的标准治疗,或设置多个剂量组达到剂量探索目的;一般不设安慰剂对照;如果因难以实施而不采用盲法,应考虑如何估计和控制由此产生的偏倚;数据的收集通常依赖于患者日常诊疗记录,但也可以设置固定的随访时间点,其时间窗通常较RCT更宽。与观察性研究不同的是,PCT是干预性研究,尽管其干预的设计具有相当的灵活性。
PCT设计应重点考虑以下因素:①收集到的数据是否适用于支持产生真实世界证据;②治疗领域和干预措施等是否符合各种形式的常规临床实践;③是否具有足够的可以用于评价的病例数(特别是临床结局罕见的情况);④参与PCT的各试验中心甚至不同的数据库之间对终点的评价和报告方法是否一致;⑤是否采用随机化方法控制偏倚;⑥当盲法不可行时,应考虑非盲对结局变量,特别是患者报告的结局,可能产生的影响,可使用不受治疗分组影响的客观终点(如中风、死亡等),以减少非盲可能带来的偏倚;⑦分析方法的考虑可参照观察性研究的分析方法。
对于实用随机临床试验,还需要特别阐明治疗策略的选择(如单次治疗策略或持续治疗策略)和有效性的主分析所基于的数据集。由于P-RCT在随机化之后出现的治疗策略更改、剂量改变、停药、转组、数据缺失等情况较RCT更为普遍,因此,相较于RCT通常基于ITT/mITT(调整ITT)进行主分析,P-RCT则需要考虑基于符合方案数据集是否更为合理的问题,或者考虑更加合适的数据集定义,并在样本量计算时予以充分考虑。
(三)单臂研究设计
采用单臂研究首先要考虑的问题是其前提条件是否充分,例如,采用RCT难以实施或具有重大伦理风险,属于危及生命、复发难治、无药可治或甚为罕见的疾病。单臂研究组如果是干预性的,为单臂试验;如果是非干预性的,为单臂观察性研究。无论是干预或非干预的,单臂研究设计通常应设置外部对照,外部对照采用的形式有基于疾病自然史队列数据或其他外部数据的历史对照或平行对照,或者目标值对照。为了减少偏倚,采用外部对照需考虑其目标人群特征(人口学、基线水平和临床特征等)、诊断和治疗标准、伴随治疗、结局的测量和评价标准等对结局(预后)有潜在影响的各种因素与研究组是否足够相似,以保证与研究组有较好的可比性。此外,单臂研究设计至少还应考虑以下内容。
1. 研究组设置
研究组的设置主要分干预性和非干预性,前者更为常用。对于干预性设计,研究组需要定义标准干预,且在研究实施过程中严格执行所规定的干预措施;对于非干预性设计,研究的治疗通常没有统一标准,且在治疗过程中患者可能会同时接受其它治疗,使得治疗模式较为复杂多样,对此可通过设置合理的入选和排除标准来定义较明确的目标治疗。
2. 对照设置
(1) 历史对照
以既往获得的疾病自然史队列或其它外部真实世界数据作为对照,应考虑人群异质性及不同历史时期对疾病的定义、诊断、分类、自然史和可用的治疗手段等对疗效可比性和一致性的影响。
(2) 平行外部对照
收集与研究组同期的疾病自然史队列或其它外部真实世界数据作为对照。
(3) 目标值对照
目标值的确定应有充分依据,优先依次考虑国家标准、行业标准和专家共识,否则,需要根据已有的相关信息,包括但不限于公开发表的文献、研究报告、相关研究的原始数据等,通过综合分析确定目标值。
(4) 混合对照
将既往及研究同期获得的外部数据混合在一起形成对照臂。这些外部数据可以是日常的病例记录,也可以是过去开展不同的临床研究(观察性或干预性的)所获得的数据。研究开始前需评估外部数据的适用性、代表性和预先设定不同部分数据合成时的权重系数, 建议预先设置敏感性分析评估混杂因素、不同权重系数等对研究结论的影响。
3. 其它考虑
采用外部对照的单臂研究由于混杂因素、人群异质性和各种可能偏倚的影响,因果推断结论具有较大的不确定性。为克服或减少这些局限,除上述考虑外,还应注意:①主要终点采用客观指标,如肿瘤临床研究的客观缓解;②明确并严格把握入组人群的入排标准及筛选过程;③要确保所采集的数据符合真实世界数据的适用性要求;④较之于历史对照,更鼓励采用平行外部对照;⑤事先恰当地定义主分析的统计分析方法,如合理利用多因素模型、倾向评分方法,虚拟对照方法、工具变量方法等;⑥若对照组选择或主分析模型采用基于匹配的方法,应在方案中事先明确匹配标准;⑦要充分使用敏感性分析和偏倚的定量分析来考察未知或未测量的混杂因素、效应异质性、模型假设不成立以及其它各种可能偏倚对分析结果的影响。
三、真实世界研究方案的主体框架
不同设计类型的真实世界研究方案的主体框架基本相同,个别不同之处将在 主体框架下相应内容中分别阐述。以下是真实世界研究方案的建议框架,但并不排除个别研究项目的某些特殊考虑。
(一)方案摘要
以表格形式摘录研究方案的主要内容,突出重点,力求简洁。主要内容包括:标题、 研究背景、 研究目的、研究假设、整体设计、研究人群(含诊断标准、入选标准、排除标准、剔除标准等)、治疗 或干预 (定义研究组和对照组)、研究终点、基线变量与重要协变量、安全性指标、观察期与观测时间点、数据来源、数据治理或数据管理、样本量及其确定依据、统计分析、偏倚控制等。
(二)研究背景
简要介绍研究背景,包括国内外研究的现状和意义,本研究的前期基础等。应充分论述选择真实世界研究路径的主要依据(如其它研究类型的不可行性和伦理风险等),以及本研究的定位,例如用于注册的关键支持证据、辅助支持证据、或基于探索目的的研究等。
(三)研究目的
根据目标人群、治疗(含对照)和结局,简要阐述研究目的,即本研究计划回答的临床科学问题,明确主要目的和次要目的(如果有),也可包括探索性目的。
(四)研究假设
根据研究目的提出研究假设。
(五)整体设计
简述研究的整体设计,包括多中心或单中心、观察性或干预性、单臂或双臂 /多臂等要素。若是观察性研究,应说明是回顾性的还是前瞻性的 ,或回顾前瞻性的 。
干预性研究应说明是否采用随机化分配,如果采用,应详细说明具体的随机化分配方法及实施过程;是否采用盲法,如果采用盲法(单盲或双盲),应说明具体实施办法;如果采用开放设计,需说明终点事件是否采用盲评, 若采用盲评 如何实施。
单臂研究应说明研究组是干预性还是观察性的,以及采用何种形式的外部对照。
(六)研究人群
1. 诊断标准
如果所研究的疾病有不同诊断标准,应该说明本研究所采 用的诊断标准及其出处,并给出所采用诊断标准的具体内容,若内容较多可以在附件中呈现。还应标明疾病代码(如ICD9/ICD10等)。
2. 入选/排除标准
入排标准的制定应能代表研究的目标人群。一般而言,观察性研究的入排标准较干预性研究宽松。应注意 入排标准可能导致的恒定时间偏倚或选择偏倚,必要时对重要的入排 标准做出解释,并评估其对分析结果的影响。
(七)治疗或干预
本指导原则中,关于采用研究药物或治疗策略的人群队列,对于观察性研究,称之为“治疗组”或“治疗队列”;对于干预性研究(如PCT),称之为“试验组”。关于采用非研究药物或治疗策略的人群队列,称之为“对照组”或“对照队列”。
1. 治疗组/试验组
对于治疗组的定义,应阐明具体治疗方法,如药物治疗的剂量、频次、给药途径、疗程等,以及药物的商品名和生产厂家;如果是物理治疗(如放疗或激光治疗),应给出具体的治疗参数。观察性研究中治疗策略和治疗模式由临床实践所决定,因此具有多样性,在数据收集、因果推断和结果解释时应予以考虑。
对于试验组的定义,与观察性研究不同的是,治疗方法通常应固定下来,形成相对标准的治疗策略。
2. 对照组
真实世界研究通常选择阳性对照或标准治疗对照,阳性对照 应是目前或 数据采集的起止期 (如回顾性研究)临床实践中公认的疗效明确的治疗方法或治疗策略。对照组应像治疗组或试验组一样描述具体的治疗方法或策略。
除单臂研究的历史对照外,观察性研究对照的选择应与治疗组同时期。对于回顾性研究,为了避免病例选择偏倚,原则上应选择研究所定义的数据采集的起止期内 所有的治疗组和对照组的病例,或者采用严格的随机抽样方法选择病例(例如因为已有数据量太大而无法承受治理和分析全部数据的情况)。对于前瞻性研究,对照组的选择标准,特别是与治疗组的 匹配方法,应明确定义。
干预性研究对照组的选择与RCT类似。
单臂研究对照的选择见上述第三章的“(三)单臂研究设计 ”中的 “对照设置 ”一节。
3. 伴随治疗
真实世界研究中,伴随治疗的情况较为常见,应在方案中尽可能地阐述清楚可能出现的伴随治疗,对于未能预见的伴随治疗,也需要在分析过程中予以充分考虑。
(八)研究终点
1. 有效性终点
应定义主要终点和次要终点,如必要还需定义关键次要终点。有效性终点应完整定义,包括终点的名称、观测的时间点或时间段、测量方法与工具、计算方法、评价方法等。必要时,可设置独立第三方终点事件判定委员会,并描述实施办法,例如所执行的标准操作程序( SOP)。应注意,真实世界研究的主要终点通常不采用替代终点,如采用需充分说明理由。
2. 安全性终点
根据研究目的,安全性终点 可以是主要终点、(关键)次要终点、或者探索性终点。除了明确定义终点事件外,还应考虑对终点事件的编码(如用 MedDRA编码)、分级(如用 CTCAE对安全性事件的严重程度分级)、发生时间、发生频率(如反复多次发生,如何计算发生率)等加以说明。需要指出的是,与有效性终点不同,安全性终点在大多数情况下无法预先确定具体终点事件及其发生的时间和严重程度, 因此其不确定性给统计分析和结果的解释带来挑战, 具体考虑可参照相关临床试验指南 。
3. 探索性终点(如果有)
研究如有需要,也可以设置某个/些探索性终点, 例如药物经济学终点等。
(九)基线变量及重要协变量
研究方案中应明确基线变量和重要的协变量,以及它们的度量单位和观测时间。这些变量的确定依据主要来自对目标研究人群现有的研究成果,例如指南、专家共识、公开发表的文献、会议报告等提及的影响疗效 的变量 /因素,也有来自项目组专家的认识。重要协变量的确定应具备合理性,可结合各因素间的因果路径图确定,并综合考虑前期数据评估结果。在已确定的重要协变量中,建议在方案中明确协变量的属性,如效应修正因素、危险因素、混杂因素(包括时依混杂因素)、中间变量、碰撞变量、工具变量等。