CK:目前高通量的测序技术让以前复杂昂贵高高在上的基因检测终于滑落人间,虽然极大推动了临床诊治的进展,但也不可避免带来新的问题。比如,每个个体外显子组测序常可鉴定数万个变体,而基因组测序鉴定中变体达数百万个,而临床大夫看到的最终报告是经过多重筛选后剩余的可能与疾病相关的突变;而当报告给出的答案并非医生和患者的预期时,一种焦虑会开始。而更重要的问题是如何合理的应用测序方法和解释遗传信息,这也是临床医生欠缺的地方,如果没有遗传学专家的帮助,往往不能深入回答。
人类基因组测序已进入基因组医学时代。人类蛋白质编码基因的目录基本上是完整的,基因和特定疾病之间的联系数量正在迅速增加。此外,由于测序技术的革命性进步,现在可以鉴定个体蛋白质编码基因(全外显子组测序[whole-exomesequencing,WES])或其整个基因组(全基因组测序)中的几乎每一个遗传变异体,统称为“下一代测序(nextgenerationSequencing,NGS)”。当前解释这种变异的能力较低,但正在提高,因为变异及其临床相关性的数据库在大小和准确性方面都有所增加。国家生物技术信息中心的基因库(NCBIGenBank)成立于年,现在包含2亿多个序列,包括来自日本DNA数据库(DNADataBankofJapan)和欧洲核苷酸档案库(EuropeanNucleotideArchive.)等的全球贡献数据。正在进行的项目包括基因组聚合数据库、Exome聚合联合会(ExAC)、英国,基因组项目和NCBI的单核苷酸多态性数据库(NationalCenterforBiotechnologyInformationsSingleNucleotidePolymorphismDatabase.)。可用的测序数据呈指数级增长,信息量增加了对区分病理变异和良性变异的方法的需求。另外,也真诚的希望国内也有越来越多类似的参考数据库,期待那些动辄数千万的科研经费能搭建出自己的医学科研的基础设施或高速公路。
随着精准医学(precisionmedicine,遗传学指导下的个体化诊断和治疗)覆盖范围的扩大,预计越来越多的患者将具有外显子组或基因组测序的临床适应症,而目前很多患者的基因组在进行解释时,可以利用前人遇到或已验证的数据来协助诊断。而临床医生将越来越多地被要求解释这些遗传数据,以阐明个体发生疾病的风险、患者的诊断和预后、对家庭成员影响以及治疗个体化调整。因此,临床医生能够在DNA序列变异与人类(疾病或非疾病)特征和疾病之间建立有效且临床上有价值的联系至关重要。或许更重要的是如前所述,临床医生能够更好的理解此类信息的局限性是至关重要的。
另外,本文中,多数突变被称为“变体”,这二者并未对等,变体范围更大,意会就行......CKsEndocrineNotes
WE14-03(3)
内分泌学中遗传信息和测序
临床应用思考
编译:陈康
内分泌学中遗传信息和测序临床应用的思考
一般而言,医学应用的实验室检测需要三个组成部分。
首先,必须以足够的准确度和精密度建立经过验证的检测,以实现跨检测中心和随时间的一致测量(临床级检测)。
第二,必须对足够大小的代表性对照人群进行检测,以建立正常的临床参考范围。
第三,必须使用稳健的临床研究建立试验值和表型结果之间的映射。
理想情况下,这些研究采用前瞻性随机对照试验的形式。考虑到早期测序技术,这些研究本身就很昂贵,令人望而却步。NGS(下一代测序)提供了第一项要求,即以越来越合理的成本提供高通量、高保真测序。第二项要求目前正在实施中。基因组数据库在全球范围内不断增长,为健康个体的常见基因序列提供“参考范围”。
如前所述,遗传信息的临床应用包括诊断、预后、风险预测和个性化治疗(例如药物遗传学)。随着成本和可行性的障碍逐年降低,相信遗传信息的使用将在临床实践中会变得司空见惯。为了使患者受益最大化,同时将假阳性和假阴性结果的负担降至最低,临床医生必须选择合适的患者,部署适当的基因检测技术,并正确解读结果。特定的临床流程应个体化针对各种内分泌疾病(例如身材矮小)(JClinEndocrinolMetab.;99(9):–.),但它们需要时间来验证。有鉴于此,需要提出一系列广泛的患者情境,从无临床明显疾病的患者到有临床可识别遗传综合征的受影响个体,总结每种情景下遗传检测的益处和注意事项,这也是下文要回答的内容。另外,回顾与靶向和全基因组检测相关的问题,并为患者和检测选择提供了一些指导。最后,下文还提供遗传发现的疾病相关分类概述,检查临床实验室报告中对遗传信息的解释,并为临床决策提出了建议(图3)。
图3在疑似携带单基因/孟德尔(遗传)疾病的个体中
显示使用靶向和全基因组遗传检测的建议
VUS,不确定意义的变体(见正文)。普通人群的基因组筛选
基于人群筛选已知会导致疾病的孟德尔突变似乎是基因组测序的一个有价值应用。如前所述,RET基因的某些突变易导致侵袭性MTC,其外显率如此之高,以至于美国甲状腺协会建议对1岁以下的该突变婴儿进行预防性甲状腺切除术(Thyroid.;19(6):–.)。随着基因组测序变得司空见惯,似乎可以合理地筛查普通人群(例如作为新生儿筛查的一部分)是否有这种罕见但导致潜在致命疾病的RET突变。癌症病例可能得到预防,生命可能得到挽救。但是,必须考虑到有关RET基因突变的临床数据是从受MENA/B和家族性MTC影响的家系中获得的。RET突变与MTC之间,或其他基因突变与其他疾病风险之间的基因型-表型相关性是否适用于无家族病史的普通人群?
在普通人群中确定的孟德尔糖尿病突变研究表明,在孟德尔(遗传)疾病家族中确定的基因型-表型相关性一般可能不适用于普通人群。作为一个恰当的例子,对一个以人群为基础的纵向糖尿病表型美国队列的基因组测序确定了25名先前已知会导致常染色体显性糖尿病(MODY)的突变个体。尽管携带疾病基因精选目录(人类基因突变数据库专业版,HumanGeneMutationDatabaseProfessional,GenomeMed.;1(1):13)中的突变,但只有一名个体符合MODY的临床标准,总体而言,这组MODY突变携带者罹患糖尿病的比率与普通人群并无不同。随着基于群体的测序变得普遍,将变得有必要在不同遗传背景的背景下重新检查外显率和基因型-表型相关性的估计(例如祖先)和环境。目前证据和知识水平不支持将基因组测序用于基于人群的筛查。
个体患者的遗传信息和测序
无症状个体
没有明显症状的个体可能被转诊至内分泌医生,在这些个体中,疾病风险可能增加:(1)具有已知遗传疾病家族史但尚未检测的个体,(2)没有家族史但经检测发现具有明显致病突变(即一种“遗传意外瘤”)。目前,该家族史可作为遗传倾向或风险的替代物,用于计算筛选的检测前概率(pretestprobability)。与任何医学检验一样,遗传检验在个体中发生疾病可能性方面的含义取决于固有检验特征(通过敏感性/特异性量化)和疾病预检测可能性的组合。对于有遗传性疾病家族史的个体,高外显率常染色体显性遗传疾病的预检测患病概率可高达1/2,隐性遗传疾病个体的同胞中可高达1/4。因此,对于有孟德尔内分泌疾病家族史的患者,通常需要进行基因检测(取决于患者个体的风险和益处,包括心理社会因素);这很好地符合来自具有孟德尔(遗传)病的家族的无症状个体的当前临床实践。
然而,对于无家族史、表现为孟德尔式“遗传偶发瘤”的个体,疾病的检测前可能性为人群(1:10,至1:,)。即使一个突变赋予50倍的风险增加,个人仍然更有可能为无疾病。那么,对于携带孟德尔突变的这类个体,可以提供什么样的保证或建议呢?基于群体的测序调查揭示,平均而言,表面上健康的个体的基因组包含大约个孟德尔式的破坏性突变(即移码内含子和SNPs导致过早终止密码子),其中多达20个被纯合灭活(Science.;():–)。因此,甚至人类基因组的蛋白质编码部分(仅占总基因组的1-2%)也含有意外的冗余,可预防疾病。根据临床结局的严重程度和普通人群的外显率估计,密切等待可能是一个谨慎的行动方案。
有症状的个体
有症状疾病的个体可能表现出临床定义的或未知的综合征。在这两种情况下,基因诊断都有利于心理健康,为计划生育提供信息,有时还可以指导治疗性筛查/干预。NGS有可能提高这些有症状个体的诊断效率。GWASs和WES等技术将诊断工作流程从顺序搜索候选基因转变为平行测序panel。通过同时检测一系列靶基因,NGS避免冗长的排除诊断过程。此外,可以设计NGSPanels,以同时确定经典序列分析遗漏的二阶疾病(second-orderdisease)修饰突变。
内分泌肿瘤综合征的基因型-表型相关性(MEN1,MEN2;参见前面的讨论)是遗传诊断对于在受影响的个体和近亲中进行定向筛选和预防性干预的益处的典型例子。例如,RET癌基因突变的基因型-表型相关性决定了儿童预防性甲状腺切除术(范围从1岁到5岁)的紧迫性(Thyroid.;19(6):–)。因此,即使有临床诊断,基因检测也有很大的预后价值。另一个例子是由CUL7基因突变(及其他)引起的3-M综合征(临床定义为身材矮小、面部畸形和骨骼异常)。患有该综合征的男性性腺功能减退的风险较高,因此应根据基因诊断结果更加谨慎地进行筛查,以便为未来的不孕不育做好准备。有时,基因诊断可以使患者避免终身治疗和检测。GCK突变(MODY2)糖尿病个体表现出高血糖,但仍能调节其血糖水平,从而既不需要降糖治疗,也不会增加糖尿病继发性并发症的风险。更一般地说,特别是对于糖尿病等异质性内分泌疾病,遗传分类有可能指导药物治疗。在HNF1A突变引起的糖尿病个体中,可以找到一个现有的遗传指导药物治疗的例子。在临床试验中,这些HNF1A突变携带者对磺脲类药物比非携带者敏感得多,并且在不使用额外药物的情况下维持了更持久的血糖控制。
如前面所述的病例,当鉴定出高外显率遗传变异体时(即对于罕见的孟德尔型疾病),基因检测可能提供有价值信息。可参考以下提供的标准和简写(SSSS),这些标准和简写应引起对孟德尔(遗传)疾病的临床怀疑:
(1)严重(severe)--比通常的疾病更严重;(2)隔离(segregating)--多名受影响的家庭成员或有血缘关系的家族史;(3)综合征(syndromic)--畸形、发育异常和不寻常的生化表型等特征;(4)太快(toosoon)--发病年龄过早。由于技术原因和潜在的遗传(位点)异质性,遗传检测的诊断产出差异很大。即使对于描述良好的孟德尔综合征,如MEN1,30%的家系没有通过EN1基因测序鉴定可识别突变。对于未知综合征的受影响个体,或靶向测序未能做出诊断的受影响个体,将需要使用NGS方法进行系统的基因测序,且诊断产出通常较低。美国国立卫生研究院对罕见疾病进行的外显子组测序研究发现,20%的病例有诊断结果(GenetMed.;14(1):51–59)。避免侵入性诊断
随着超声、CT和MRI的不断改善,偶然内分泌发现的数量也在增加。NGS提供了一种工具来评估这些发现,而不用诉诸于侵入性切除。甲状腺结节是内分泌医生的典型诊断难题。虽然大多数结节为良性,但细针穿刺在美国每年可识别,个细胞学不确定的结节(Surgery.;(6):–.discussion–)。一些内分泌学会建议对不确定的病例采用叶切除或甲状腺全切术进行手术诊断,但这些结节中只有5%-30%被证明为恶性(hyroid.;24(5):–)。在这些病例中,基因诊断可有助于减少手术和终身甲状腺替代的需要。最近的一项研究对例细胞学不确定的甲状腺活检进行了基因检测。对于这些结节,典型的检查包括叶切除术、甲状腺全切除术或密切观察。可以替代的方式是,使用NGS分析细针穿刺活检,以检查是否存在与甲状腺恶性肿瘤相关的突变。结果分析显示特异性为91%,并阻止49例患者的诊断性甲状腺次全切除术。在46例接受后续超声随访的患者中,45例有大小保持稳定的结节,重复活检时异常为良性。因此,基因筛查工具成功应用于临床,可使患者免去侵入性外科诊断的发病率和费用(JClinEndocrinolMetab.;(6):–)。
NGS还可以帮助区分甲状腺乳头状癌(PTC)和良性腺瘤样结节。通过分析同时患有良性结节和PTC的患者,叶蕾(瑞金)等能够鉴定出仅在PTC中发现BRAF体细胞突变(22/32),而SPOP突变(4/38)、ZNF突变(6/38)和EZH1突变(3/38)富集于腺瘤样结节(NatCommun.;8:)。所发现的几个腺瘤样标记物相互排斥,系统发育树分析表明PTCs是独立发生的,而不是从腺瘤样结节逐渐发展而来。该模型揭示了侵袭性甲状腺肿瘤的独特遗传起源,其不同于如结肠等组织中明显的进行性发育不良。数据表明,甲状腺测序研究可能排除腺瘤结节中的恶性潜能,并减少进一步监测需求。将来,特定的遗传特征可增加穿刺活检的特异性,降低甲状腺切除术相关的费用、诊治负担和终生发病率(NatCommun.;8:)。
基因检测的选择:靶向还是全基因组方法
如果成本不是问题,人们可以考虑采用全基因组测序来最大限度地提高灵敏度,并在每种情况下发现“smokinggun(决定性证据)”突变。以这种方式使用基因组测序相当于同时执行数千项基因检测,在临床上类似于为每个内分泌患者确定每种可能的激素水平。直觉上,这种方法没有被采用,因为每一个检测都有假阳性结果的可能。一个人检测越多,就越有可能至少有一个结果是错误的。同样逻辑也适用于基因检测和基因组测序。即使以%的分析灵敏度和特异性鉴定遗传变异体,由于外显率不完全、表达率可变以及对基因型-表型相关性了解不完整,其对疾病风险的临床灵敏度和特异性也要低得多。
基因组检测的局限性
遗传变异的分子类型(单碱基变化或更复杂的变异,例如插入/缺失/重复)强烈影响分析的灵敏度和特异性。最常用的基因panel和全基因组检测依赖于NGS技术,该技术目前非常适合于检测单碱基或多碱基变异,但在检测结构变异(染色体重排)、大的indel(插入缺失)、三联体重复扩增、polyT和A序列、新断点和拷贝数变异方面优化较差(MolGenetMetab.;(2-3):61–71)。例如,在临床级基因组测序试点研究中鉴定的所有假阳性遗传变异都是indel或接近重复DNA片段(BMCMedGenet.;15:)。随着NGS技术和基因组重建算法的改进,准确检测这些更复杂遗传变异的能力也将提高,从而减少假阴性和假阳性结果。目前,使用染色体微阵列(阵列CGH)等替代检测模式来鉴定大(50kb)结构变异和CNVs(GenetMed.;13(7):–.)。
即使技术解决了测序局限性,基因变体正确分类也限制了测序在临床实践中的应用。来自ExAC数据库的最新数据集中于分析38个内分泌疾病基因中的罕见种系编码区、非同步单核苷酸变异体(SNVs)。该研究结论是,目前的变异预测工具存在确定偏差,并且依赖于计算机致病性预测。确定偏倚来自于对在疾病队列中发现罕见SNVs的研究的依赖性。随着遗传筛查扩大到普通人群,必须在大量健康对照人群中验证“致病性”SNVs的基线患病率。同样,真正致病的变异体应在受影响个体中富集,而在对照中不存在。在此阶段,使用疾病队列将太多变体称为致病性,但由于它们存在于健康对照中而未被适当排除。同时,对于错义突变,对突变功能效应的电子预测远不如更具戏剧性的移码和无义突变稳健。这两个因素的结果是,遗传预测模型经常将良性变异体误分类为致病性的,并且所识别的致病性基因变异体的数量远远超过所报告的疾病患病率。ExAC研究中出现了几个不包括孟德尔(遗传)病患者的此类例子。对于MEN1,1:2测序个体中出现明显的“致病性”错义突变,而疾病患病率为1:30,(JEndocrSoc.;1(12):–)。最终,健康个体携带大量错误分类的“致病性等位基因”,而这些在最初患病个体中鉴定为罕见变体。随着基因检测变得越来越广泛,对致病变异和临床上可操作的突变定义将要求越来越严格(JEndocrSoc.;1(12):–)。
靶向检测(要么检测所请求的一组基因中变异,要么屏蔽/仅报告所请求的一组基因中的变异)是减少假阳性结果的一种解决方案。此外,专注于检测特定基因组的临床实验室可能特别精通这些基因变异的解释,从而潜在地提高敏感性和特异性。当然,当靶向检测结果为阴性时,可能需要进行更全面的检测来做出诊断。然而,即使超出了假阳性结果的问题,靶向检测也可能提供更好的分析性能。在当前版本的全基因组测序中,变体的检测可能具有可变性,其中数百万个遗传变体被同时识别(GenetMed.;15(9):–.)。在鉴定的变异体数量与检测和调用任何个体变异体的敏感性/特异性之间通常存在权衡。这种分析灵敏度/特异性与覆盖率有关,覆盖率是指进行测序的深度,或在单次检测中对特定核苷酸进行测序的独立次数。在整个基因组中,深度可能会有很大的不同。例如,一项全基因组测序临床试验报告了临床级基因组测序,“平均覆盖率为30X,95%以上的碱基覆盖率至少为8X”(BMCMedGenet.;15:)。这意味着在人类基因组的30亿个碱基中,每个碱基平均独立测序30次,95%以上的碱基至少被观察8次。然而,仍有5%的人类基因组观察不到或缺失。因此,如果临床怀疑激发对某些基因或基因组区域的检查,那么靶向方法很可能具有更高的分析灵敏度和特异性。前面描述的临床级基因组足以以种系杂合性发现的频率检测变体(平均50%测序的分子含有变体碱基),但对于需要检测种系杂合性下的疾病,如肿瘤中的体细胞突变检测,则需要更高的覆盖率。
已识别遗传变异体的解释
一旦识别出遗传变异体(通过测序或其他方式),就必须解释其对健康和疾病的影响。这种解释需要整合人群数据(以了解是否观察到变异体高于致病变异体预期频率)、计算预测、实验证据和家族比较。正在建立精心规划的数据库,以开始准确地对这些信息进行编目并帮助解释。ClinVar档案集中有关基因组变异及其与人类健康关系的信息(
转载请注明:http://www.galanzweibolu.com/rhzlxjb/7034.html