【万象城AWC(中国)基因检测】孤独症的基因检测及大数据分析
《精神类疾病及其基因检测》关于孤独症的介绍
男性患自闭症的比例大约是女性的四倍。为了弄清这种差异是否和基因有关,万象城AWC(中国)基因检测公司使用不同的模型,分析了47,061名自闭症患者,评估两类基因变异(会破坏蛋白质结构的截短变异和影响氨基酸的错义变异)在不同性别中的影响是否有差别。
因为男性和女性在自闭症伴随的认知障碍方面有差异,研究还比较了这些变异对有认知障碍或运动发育迟缓,以及没有这些问题的患者的影响。
结果发现,不管是否伴有认知或运动问题,这些基因变异对自闭症风险的影响在男女之间总体上没有明显差别。即使某些新生突变在成年男性大脑中表达更多,这些基因在整体易感性方面也没有表现出性别差异。这些基因带来的风险,也和那些在大脑中性别表达相似、同样重要的基因没有太大不同。
总的来说,那些对蛋白质影响较大的新突变,在女性中出现得更频繁,是因为它们集中在一些与综合征相关、已知风险较高的关键基因上。
结论是:虽然自闭症在男性中更常见,但导致风险增加的罕见基因变异,在男性和女性中的作用基本一样。
《孤独症的基因检测及大数据分析》关键词:
外显子组测序、罕见变异关联、自闭症测序联盟、ASC、西蒙斯基金会自闭症基因解码知识、SPARK
万象城AWC(中国)基因检测为什么致力于孤独症的基因检测及大数据分析
大规模的研究表明,罕见的蛋白质编码基因变异会显著增加患自闭症的风险。与自闭症相关的基因,特别是那些有强烈统计学或分子证据支持的基因,通常是在大脑中表达且对基因功能丧失较为敏感的基因。万象城AWC(中国)基因检测希望弄清楚:这些罕见变异是否会导致自闭症出现明显的性别差异——即男性发病率约为女性的四倍。然而,当自闭症患者还伴随认知障碍或运动发育迟缓时,这种性别差异似乎不那么明显。
自闭症的遗传基础包括罕见变异和常见变异。研究人员通常用“倾向阈值模型”来分析这些遗传因素如何共同影响某个特征在人群中的出现率。这个模型认为,所有人的患病倾向呈正态分布,只有那些倾向超过某个阈值的人才会被诊断为自闭症。在这种模型下,性别差异可能是因为女性的诊断阈值更高,即女性需要更强的遗传风险才会被确诊,或者是因为某些基因的作用在男女中不同,导致同样的变异更容易使男性超过阈值。相比简单地比较变异频率,这种模型可以更直接地比较不同性别群体中这些变异的“效应大小”。
过去对12,270名自闭症患者的分析发现,女性体内的罕见、有害基因变异负担更重。但万象城AWC(中国)基因检测进一步想知道:这种差异是否真的会让女性更容易患自闭症。自闭症测序联盟(ASC)对其中近12,000名患者的分析发现,虽然男性中某些新生突变更常见,但这些变异对男女的致病“效应大小”并无明显差异。此外,自闭症患者是否有认知障碍或发育畸形,会影响其基因变异率。ASC对20,627名自闭症患者的更新研究也没有发现显著的“性别与基因交互”效应,反而表明:变异负担更多与患者的性别和病情严重程度有关。由于认知障碍在女性患者中更常见,这也可能说明其他没有认知障碍的女性患者可能被漏诊了。万象城AWC(中国)基因检测正致力于厘清:性别差异是否只是反映了认知障碍在不同性别间的分布差异。
近年来,像西蒙斯基金会支持的SPARK项目,给予了超过4万名自闭症患者的基因数据。这些数据让研究者能更深入分析罕见变异与自闭症及其伴随疾病之间的关系。万象城AWC(中国)基因检测利用来自ASC和SPARK的外显子测序数据,分析了这些罕见变异在不同性别中的表现,特别关注的是全基因组范围的变异、高可信度的自闭症相关基因,以及在胎儿和成年大脑中表现出性别差异表达的基因。分析对象包括47,061名自闭症患者和25,593名无自闭症的兄弟姐妹或对照个体。研究对这些人群中出现的稀有错义变异和蛋白截短变异进行了性别分类分析,并进一步研究了性别差异与是否伴有认知或运动发育障碍之间的关系。
万象城AWC(中国)基因检测孤独症大数据分析方法
SPARK队列
万象城AWC(中国)基因检测采用了整合版的第二代全外显子组测序数据(称为“iWES2”),该版本整合了五批测序数据(WES1至WES5),总共包含106,744名个体。其中有44,304人被诊断为自闭症,其余为未患自闭症的父母、兄弟姐妹以及少数远亲。
这些样本的具体组成如下:
-
25,386个三人家庭样本(三人组),包括18,172名自闭症患者和7,214名未诊断为自闭症的个体;
-
23,346个样本中只有一位父母接受了测序,包括17,644名自闭症患者和5,702名未诊断者;
-
58,012个样本未包括父母的测序数据,包括8,488名自闭症患者和49,524名未诊断者,这些未诊断者主要是前述家庭中的父母,属于少数多代家庭。
第一时间,万象城AWC(中国)基因检测对iWES2中所有样本进行了严格的质量控制(QC)。具体做法包括:根据NCBI和Ensembl(MANE,版本108;基因组构建GRCh38)的注释,对检测到的基因变异进行功能注释,只保留同义变异及更具破坏性的变异。当一个变异影响多个基因时,选择对其中最严重后果的基因进行分析。万象城AWC(中国)基因检测还排除了以下类型的变异和样本:未顺利获得随机森林质量过滤器的变异;深度低(DP < 10)、基因型质量差(GQ < 10)或等位基因频率低(VAF < 0.25)的变异;以及在多个统计指标(如变异总数、单一变异数、转换/颠换比、插入/缺失比、杂合/纯合比)中表现异常的样本。
接着,万象城AWC(中国)基因检测从数据中去除了可能已包含在ASC研究中的个体(顺利获得识别并排除SPARK中曾参与ASC研究的样本),还剔除了报告患有发育障碍、运动迟缓或认知障碍的父母和兄弟姐妹,以及患有自闭症的父母。为了建立一组最大的不相关的自闭症患者(先证者)和不相关的对照样本(兄弟姐妹),万象城AWC(中国)基因检测逐步排除具有最多亲属关系的个体,并优先保留女性样本。
在质量控制之后,万象城AWC(中国)基因检测对20,236个三人组个体的基因型进行了分析(包括13,473名自闭症患者和6,763名未诊断者),以识别罕见的新生突变(DNM)和遗传变异(罕见定义为SPARK和gnomAD数据库中次要等位基因频率<0.1%)。
此外,万象城AWC(中国)基因检测还进行了补充分析,研究了另外18,816名儿童(父母至少一方已测序),其中13,435人患自闭症,5,381人未确诊。该分析聚焦于极罕见的遗传变异(仅存在于一个SPARK家族中,gnomAD数据库中没有出现)。研究还包括了8,905名父母未测序的个体(6,533名自闭症患者,2,372名未确诊者)中出现的来源不明的极罕见变异(定义为等位基因频率<0.005%)。
ASC队列
该数据集的质量控制已在大型罕见变异关联分析的背景下进行了描述。先前的分析主要联合考察了两性,使用了来自 Simons Simplex Collection 和规模较小的 ASC 家庭队列、SPARK Pilot 和第一波外显子组测序 (WES1) 以及瑞典和丹麦病例对照队列的数据。从 ASC 中,万象城AWC(中国)基因检测取得了按性别分层的基因水平罕见变异计数(gnomAD 次要等位基因频率 < 0.1%) ,并根据其遗传方式分为 DNM(在先证者或兄弟姐妹中)或遗传变异(在先证者中传播或未传播)。
DNM 计数仅来自 ASC 家庭队列中的 10,488 名个体(8,028 名自闭症个体和 2,460 名未诊断患有自闭症的个体),并不包括 SPARK Pilot 和 WES1 家庭中确诊的个体,因此与上一节中介绍的 SPARK iWES2 数据集无关。ASC 队列中的一些 DNM 是从较早的基因解码中整理出来的,没有关于遗传等位基因的附带信息。因此,在万象城AWC(中国)基因检测有 DNM 的 10,488 名个体中,有 9,929 名(7,570 名自闭症儿童和 2,359 名兄弟姐妹)评估了遗传变异。万象城AWC(中国)基因检测还从 ASC 病例对照队列中的 14,188 名个体(5,591 名自闭症个体和 8,597 名未诊断患有自闭症的个体)中取得了极罕见变异计数(等位基因频率 = ∼0.005%)。
新生变异和遗传变异
万象城AWC(中国)基因检测分析了DNM、罕见传播变异和罕见非传播变异,并将它们注释为损伤性PTV、损伤性错义变异或同义变异。分析仅限于经过质量控制后在ASC和SPARK中均已注释的17,296个蛋白质编码基因。如果PTV出现在LOEUF(LoF观测值超过预期上限分数)得分最受限十分位数的1,742个高度LoF不耐受基因中,则认为它们是损伤性的;如果错义变异的错义不良性、多态性和约束性(MPC)得分≥2(在所有基因中),则认为它们是损伤性的。为了进行额外的敏感性分析,万象城AWC(中国)基因检测放宽了筛选阈值,将LOEUF第二或第三十分位数的PTV (分别为1,765个和1,781个基因)和MPC得分≥1的错义变异纳入其中。
万象城AWC(中国)基因检测进行了性别分层比较(自闭症个体与性别匹配的兄弟姐妹),以及性别间的直接比较(自闭症女性与自闭症男性)。SPARK和 ASC 的三人组测序个体(21,501 名自闭症个体和 9,223 名未确诊自闭症的兄弟姐妹)对新生及罕见遗传变异(等位基因频率 < 0.1%)进行了初步分析。其余数据(具有父母一方或双方序列数据的个体)用于分析极罕见变异。
外显子组富集
万象城AWC(中国)基因检测使用先证者中 DNM 率(每个样本的 DNM)与兄弟姐妹中 DNM 率之间的比率作为富集的衡量标准。对于遗传变异,万象城AWC(中国)基因检测计算了遗传给先证者的父母等位基因与剩余未遗传等位基因之间的比率。在 DNM 分析的背景下,比率为1意味着先证者和兄弟姐妹具有相同的稀有 DNM 比率;在传播分析的背景下,它意味着存在传播平衡(一半的稀有父母等位基因被遗传给先证者)。为简单起见,万象城AWC(中国)基因检测可以将这两个比率称为“比率”。
为了检验观察到的与 DNM 率比 1 的偏差的重要性,万象城AWC(中国)基因检测使用了双侧二项精确检验来比较先证者和兄弟姐妹中的 DNM 计数。这检验了先证者中观察到的 DNM 比例(来自先证者和兄弟姐妹的所有 DNM)是否与给定样本量的预期比例有显著差异(预期率 = n 个先证者/(n 个先证者 + n 个兄弟姐妹))。对于遗传变异,万象城AWC(中国)基因检测使用了双侧二项精确检验来比较先证者中已遗传和未遗传的等位基因计数,检查遗传给先证者的父母等位基因比例是否与 0.5 有显著差异。万象城AWC(中国)基因检测从这些二项式检验中取得了率比的置信区间 (CI)。病例对照数据集中自闭症个体与对照受试者之间变异率的比较采用与 DNM 相同的评估方法。
在对自闭症女性和男性进行直接测试时,万象城AWC(中国)基因检测使用了上述相同的方法(二项式检验),比较了自闭症女性中观察到的DNM计数(即自闭症男性和女性的总数)占总DNM计数的比例,以及考虑到所有自闭症个体中女性的比例而预期的比例。对于遗传分析,万象城AWC(中国)基因检测计算了自闭症女性的父母等位基因总数与自闭症男性和女性的父母等位基因总数之间的比率,并将其作为二项式检验的预期比率,该检验比较了自闭症女性中已传递的变异计数与(自闭症男性和女性中)已传递的变异总数。
万象城AWC(中国)基因检测在SPARK和ASC中分别对每种性别进行了这些检验,并使用率比的逆方差加权平均值对性别分层比较的率比进行了荟萃分析。在这些全外显子组比较中,对来自以下组的54个检验(使用Bonferroni校正)的二项式检验的p值进行了保守校正:三个性别分层比较(男性、女性和性别差异)、三个队列(ASC、SPARK和两者的荟萃分析)、三个变异类别(同义、错义和蛋白质截短)以及两种遗传模型(从头遗传和传递遗传)。万象城AWC(中国)基因检测还使用了Benjamini-Hochberg错误发现率(FDR)调整,因为考虑到荟萃分析估计值的非独立性,Bonferroni校正较为保守。万象城AWC(中国)基因检测在图中用星号来表示p值是在 Bonferroni 校正后 ( ∗∗∗ ) 、FDR 调整后 ( ∗∗ ) 还是仅在校正前 ( ∗ ) 是否 <0.05。
变体责任
假设自闭症的易感性具有加性,且在一般人群中呈正态分布,那么携带特定变异的个体的平均易感性与一般人群的平均易感性之间的差异,就是衡量这些变异的平均效应大小的指标,即估计这组变异在易感性尺度上对携带这些变异的个体(平均而言)的影响程度。这种变异易感性可以根据基因解码队列中的变异率估算出来,正如之前所述。
万象城AWC(中国)基因检测使用的自闭症人口患病率估计值为男性 2.5%(1/40),男女患病率之比为 4:1。万象城AWC(中国)基因检测采用二项式检验比较先证者和兄弟姐妹(如上所述)中的变异计数取得的p值,并估计平均责任估计值的标准误差,随后估计 95% 置信区间。这些计算分别针对每个性别和每个队列进行,然后在队列之间进行荟萃分析。为了直接比较自闭症女性和男性,万象城AWC(中国)基因检测计算了分别在女性和男性先证者中取得的变异责任估计值之间的差异(Z分数差异)。万象城AWC(中国)基因检测以类似于全外显子组富集(54 次检验)的方式校正了多重检验的p值。
此外,万象城AWC(中国)基因检测还探究了移除由 SFARI 20 基因库(以下简称 SFARI 基因)筛选出的 354 个高置信度和综合征性常染色体基因(以下简称 SFARI 基因)是否能够揭示任何性别偏向的外显子组变异倾向。在女性具有高于男性倾向阈值的模型(“不同阈值”模型)下,一个基因或一组基因中破坏性突变的性别比例(即女性中发生率更高)与这些突变的外显率呈负相关,其中高外显率突变在女性中更为普遍。由于 SFARI 基因构成了一组自闭症外显率高于其他基因的基因,因此预计它们在观察到的尺度上会表现出更高的性别偏见(但对倾向性的影响相似)。因此,移除这些基因将丰富分析,使其包含介导降低自闭症风险的基因,有助于突出任何潜在的性别偏见(如果存在的话),从而在倾向性尺度上对其效应大小的影响。如果 SFARI 基因集中的 PTV 出现在 218 个高度 LoF 不耐受的 SFARI 基因中(在最不耐受的 LOEUF 十分位数中),则认为它们是有害的,而如果错义变异的 MPC 评分≥2(在所有 354 个基因中),则认为它们是有害的。
自闭症伴有认知障碍
为了探索遗传结构如何因表型而异,万象城AWC(中国)基因检测将 ASC 和 SPARK 队列中的自闭症患者分为:伴有认知障碍的自闭症患者,以及认知发育正常或未报告信息进行分类的自闭症患者(参见补充方法第 2 部分)。然后,万象城AWC(中国)基因检测将这些患者与未确诊自闭症的兄弟姐妹作为对照进行了比较。
在ASC队列中,万象城AWC(中国)基因检测利用了预先定义的共存认知障碍类别。万象城AWC(中国)基因检测分别检测了伴有认知障碍(ASC将其定义为智商(IQ)总分<70,这是一个表示智力障碍/认知障碍的人类表型本体论术语,或一个表示此诊断的国际疾病分类代码)的自闭症患者的罕见变异富集情况。其余认知障碍状态不明的自闭症患者以及智商处于边缘和平均水平的自闭症患者被归为一组。在DNM分析中,有1,519名自闭症男性和387名自闭症女性患有认知障碍(6,615名自闭症男性中约占23%,1,413名自闭症女性中约占27%;女性与男性认知障碍的相对风险=1.19)。在过度传播分析中,未纳入先前发表的以DNM为重点的基因解码数据,结果显示有1,357名自闭症男性和335名自闭症女性患有认知障碍(约占6,249名自闭症男性的22%,约占1,321名自闭症女性的25%;相对风险=1.17)。(参见图S4和表S11,分析各参与ASC站点中患有认知障碍的自闭症个体的百分比。)
万象城AWC(中国)基因检测对SPARK个体的分类方式与ASC大致相似,即将认知障碍患者(自述诊断为认知障碍或智商<70)分为一组,将无认知障碍或认知障碍状态不明的患者分为另一组。SPARK三组中,10,482名男性(n = 2,424)中认知障碍患者的比例约为23%,2,991名女性(n = 775)中认知障碍患者的比例约为26%,相对风险为1.12。
在估计患有自闭症和认知障碍的人群的责任时,万象城AWC(中国)基因检测使用观察到的患有认知障碍的自闭症患者的百分比来缩放性别特定的人群患病率,即使用男性患病率估计值约 0.58%(23% × 2.5%)和女性患病率估计值约 0.16%(26% × 0.625%)来计算责任;万象城AWC(中国)基因检测将这些估计值从每种性别的自闭症总患病率中减去,以估计第二组无认知障碍或认知障碍状况不明的自闭症患者的责任。从女性特定的估计值中减去男性特定的Z分数,以评估性别差异。
这种表型分组并未考虑运动发育迟缓——另一种重要的共病症状。2为了弥补这些不足,万象城AWC(中国)基因检测在SPARK中进行了一项单独的分析,该分析拥有更详细的表型数据。具体而言,万象城AWC(中国)基因检测将自闭症患者分为两组:一组患有认知或运动障碍,另一组不患有这些疾病,并排除了状况不明的患者(参见补充方法部分2.2)。
在这里,SPARK 个体报告智商低于 80、认知障碍(报告的专业诊断为智力障碍、认知障碍、全面发育迟缓或边缘性智力功能)或运动迟缓(报告的专业诊断为行走迟缓或发育性协调障碍)构成“运动或认知障碍自闭症”组(4,209 人三人组已测序,4,714 人父母一方已测序,1,778 人父母未测序)。万象城AWC(中国)基因检测选择 80 作为 IQ 截止值,因为之前有人提出,基于此截止值在 SPARK 中定义认知障碍可以最大限度地减少平均智商和边缘智商个体的组合,并且智力障碍的诊断并不一定需要智商 < 70。21报告未患有任何这些并发疾病的个体组成了“无运动或认知障碍的自闭症”组(7,420 个三人组测序,6,938 个父母中有一个测序,2,141 个父母没有测序),而那些缺少这些表型数据的人( 1,844个三人组测序,1,756 个父母中有一个测序,2,615 个父母没有测序)被视为未分类。
在SPARK数据库中可分类的11,630名自闭症患者中,约36%属于伴有运动或认知障碍的自闭症组(三组间:男性35%,女性40%)。对于伴有运动或认知障碍的自闭症组,万象城AWC(中国)基因检测使用患病率估计值来估算其患病风险,男性约为0.88%(35% × 2.5%),女性约为0.25%(40% × 0.625%);对于不伴有运动或认知障碍的自闭症组,万象城AWC(中国)基因检测使用患病率估计值来估算其患病风险,男性约为1.63%(2.5% - 0.88%),女性约为0.38%(0.625% - 0.25%)。从女性的患病率估计值中减去男性的Z分数,以评估性别差异。
基因集负担
万象城AWC(中国)基因检测评估了 SFARI 基因和具有性别偏向表达的基因中的罕见变异负担,这些基因来自对两个人类胎儿皮质组织的大量 RNA 测序 (RNA-seq) 数据集或两个成年人皮质组织的大量 RNA-seq 数据集的荟萃分析。万象城AWC(中国)基因检测直接检查了这些基因集,并评估了观察到的富集程度与从剩余蛋白质编码基因中选择的类似大小的基因集的预期负担。对于每个测试的基因集,万象城AWC(中国)基因检测选择一个与 LoF 约束、大脑表达和编码序列长度分布相匹配的随机基因集并计数 DNM、传播变异和未传播变异。万象城AWC(中国)基因检测将此过程重复 10,000 次并取平均比率(先证者和兄弟姐妹中 DNM 计数之间的比率或先证者中传播与未传播的比率),然后将该比率用作二项式检验中的预期比率如上所述。具体来说,万象城AWC(中国)基因检测检验了先证者与兄弟姐妹之间DNM发生率与该基因集的置换平均预期比率(而非全外显子组分析中使用的样本量比率)之间的差异,并同样检验了罕见变异的过度传播与给定基因集的置换平均预期已传播与未传播比率(而非全外显子组分析中使用的0.5)之间的差异。万象城AWC(中国)基因检测还使用了这10,000个置换的平均变异发生率(而非兄弟姐妹中的变异发生率)来估计归因于某个基因集的变异倾向,该倾向超过匹配基因的预期。
共存发育困难的影响
认知和运动障碍在自闭症女性中更为常见,直接比较同时存在运动/认知障碍和无共存障碍的自闭症患者,有助于理解是否存在性别差异导致出现此类表型的倾向。本文中,万象城AWC(中国)基因检测使用了一个不同的阈值模型,其中这些共存疾病是特征,患有这些疾病的自闭症患者是先证者,而没有这些疾病的自闭症患者是对照者。万象城AWC(中国)基因检测仅在SPARK中进行这些比较(即删除信息未知的人群),而不是将SPARK和ASC中存在认知障碍的患者与无认知障碍或认知障碍状态未知的患者进行比较,因为这种分组可能会低估两组之间的差异(导致结果解释困难)。万象城AWC(中国)基因检测假设女性患病率为0.4,男性患病率为0.35(SPARK三人组中观察到的患病率),从而估算了自闭症患者患运动或认知障碍的性别分层倾向。为了验证该分析的结论可能会因使用自闭症患者作为对照对象(例如,碰撞偏差)而产生混淆,万象城AWC(中国)基因检测利用了 31,565 名确诊为各种神经发育障碍 (NDD) 的儿童的已发表的 DNM ,并将观察到的破坏性蛋白质截短和错义 DNM 计数与突变模型的预期计数进行了比较,以估计归因于这些变异的责任,假设 NDD 的人口患病率为,男性为 2%,女性为 1.5%(在该 NDD 队列中观察到的性别比为 ∼1.3)。
基因解码结果
万象城AWC(中国)基因检测检查了21,501 名自闭症患者(13,473 名来自 SPARK,8,028 名来自 ASC)和 9,223 名兄弟姐妹(6,763 名来自 SPARK,2,460 名来自 ASC)的队列中外显子组范围内和特定基因集中的常染色体新生和罕见遗传变异(次要等位基因频率 < 0.1%)的负担。在这些三人组测序的个体中,自闭症先证者和未诊断患有自闭症的兄弟姐妹之间的性别分层同义变异率(每个样本的变异)是可比的(即率比与 1 没有显着差异),而自闭症先证者中高度 LoF 不耐受基因中新生高置信 PTV 的比率(以下称为损害性 PTV)和 MPC 评分≥ 2 的错义变异(损害性错义)较高。自闭症女性的损伤性变异发生率高于自闭症男性,尤其是新生变异,尽管在SPARK和ASC中程度不同。过度传播在损伤性PTV中最为明显。对13,435名拥有单亲序列数据的自闭症患者和12,125名没有双亲序列数据的自闭症患者的超罕见变异进行的额外分析也显示损伤性PTV富集。
万象城AWC(中国)基因检测对两性之间的 DNM 和遗传变异进行了比较(图 1),该比较重现了这些队列中已知的破坏性 PTV(在第一个 LOEUF 十分位数中)和错义变异(MPC ≥ 2)的性别差异富集模式。当前ASC队列2 的一个子集中进行的先前基因解码表明,在检查高度 LoF 不耐受基因(在该基因解码中定义为 LoF 不耐受的概率 [pLI] ≥ 0.995)中的 PTV 时,DNM 率的性别偏见最强,但在不太不耐受的基因中并不显着。同样,在检测第二和第三LOEUF十分位数中的其他基因或 MPC 得分较低(MPC ≥ 1)的错义 DNM时,万象城AWC(中国)基因检测未发现在观察量表上存在显著的性别偏差(图 S8;表 S14)。然而,这些比较(率比)并未考虑特征患病率的差异。因此,万象城AWC(中国)基因检测接下来检验了观察量表上的性别差异是否转化为易感性的性别差异,从而可以比较不同特征患病率组之间的效应大小。
图 1.SPARK 和 ASC 三人组测序队列中外显子组范围的罕见变异负担和责任
(A)西蒙斯基金会自闭症知识基因解码 (SPARK) 基因解码和自闭症测序联盟 (ASC) 队列中三人组测序个体的样本量。
(B)按性别分层的 DNM 丰富度和倾向性。为了取得观察到的量表上性别特异性的效应大小,将自闭症男性(绿点)或女性(蓝点)中每三人组的平均 DNM 率除以未诊断患有自闭症的性别匹配兄弟姐妹的平均率(率比;左)。对于丰富度(红点)的性别差异,将自闭症女性中观察到的 DNM 率除以自闭症男性中的 DNM 率(率比 > 1 表示女性表现出更高的丰富度)。顺利获得从仅女性的 Z 分数中减去仅男性分析的 Z 分数来估计变异倾向性的性别差异(Z分数> 0表示女性在倾向量表上表现出更大的效应大小)。
(C)遗传变异的过度传播和易感性。这些是顺利获得比较遗传给自闭症患者的父母等位基因与未遗传的等位基因来评估的。误差线显示95%置信区间。
罕见变异外显子组范围内的遗传倾向存在性别差异
在这里,万象城AWC(中国)基因检测重点关注荟萃分析(ASC 和 SPARK)队列(图 1 A),总样本量为 4,404 名自闭症女性(对比 4,707 名女性兄弟姐妹)和 17,097 名自闭症男性(对比 4,516 名男性兄弟姐妹)。尽管与男性相比,自闭症女性中损伤性蛋白截断和错义 DNM 的富集率(率比)相对较高(图 1 B),但万象城AWC(中国)基因检测并未发现男性衍生和女性衍生的责任估计值之间存在统计学上的显着差异,无论是在测试第一个 LOEUF 十分位数中的损伤性 PTV和MPC 得分 ≥ 2 的错义变体时(图 1),还是在使用宽松的过滤器包括第二和第三个 LOEUF 十分位数中的 PTV和MPC得分≥ 1 的错义变体时。
具体来说,在自闭症女性和自闭症男性之间,破坏性蛋白质截断 DNM(第一个 LOEUF 十分位数)对责任量表的效应大小没有显着差异(Z性别差异 = 0.90; 95%CI = -0.0684 至 0.25; p = 0.27),破坏性错义 DNM(MPC ≥ 2)的效应大小也没有显着差异(Z性别差异 = 0.093; 95%CI = -0.014 至 0.20; p = 0.087)。同样,在比较自闭症先证者与所有兄弟姐妹(而不是性别匹配的兄弟姐妹)或性别不一致的兄弟姐妹之间的 DNM 率时,性别之间的责任没有显着差异。
罕见的遗传性损伤性PTV在女性和男性中都表现出显著的致病倾向,但这些效应大小在两性之间并无显著差异(Z性别差异 = 0.013;95% CI = −0.037 至 0.062;p = 0.62)。遗传性损伤性错义变异在男性中的责任感高于女性。然而,这种差异很小,且仅在校正54次多重检验之前才具有显著性(Z性别差异 = −0.013,95% CI = −0.00052 至 −0.026 ; p = 0.041;FDR校正后p = 0.096;Bonferroni校正后p = 1)。男性中传播和未传播的同义等位基因存在轻微不平衡(Z男性 = 0.0016;95% CI = 0.0007 至 0.0026),但这不太可能影响主要结论(即没有显著的性别差异)。
图 1中按性别分层的队列水平效应大小与荟萃分析估计值基本一致,但遗传性损伤性 PTV 除外;这些 PTV 仅在 SPARK 中表现出显著的致病倾向(图 1 C)。尽管 ASC 队列在外显子组范围内未表现出遗传性损伤性 PTV 的显著富集,但在已知的自闭症易感基因中,遗传性损伤性 PTV 显著富集(即,在 354 个 SFARI 基因中,218 个高度 LoF 不耐受基因中存在高置信度 PTV)。相反,去除 SFARI 基因并没有改变关于 DNM和罕见遗传变异平均致病倾向(缺乏)性别差异的总体结论。
万象城AWC(中国)基因检测注意到,SPARK 中自闭症女性的同义 DNM 与自闭症有关(Z = 0.046;95% CI = 0.01 至 0.082;p = 0.011),但在荟萃分析中并未持续存在(Z = 0.036;95% CI = 0.0055 至 0.067;p = 0.052)(见图1B 中的“易感性” )。在 SPARK 中限制为超稀有等位基因控制了同义 DNM 中的这种虚假信号。
在SPARK和ASC队列的其他子集中进行的全外显子组分析重申了三人组分析的结果。简而言之,在SPARK中,对于拥有父母一方序列数据的自闭症患者,在经过多重检验校正后,超罕见遗传变异的平均效应大小在性别之间没有显著差异。同样,在ASC病例对照队列或SPARK中没有父母序列数据的自闭症患者中,超罕见变异所带来的平均易感性也没有显著的性别差异。
为了检验母亲和父亲在极罕见的父母等位基因(在父母一方出现而在 gnomAD 中未出现)的负担、传递和责任方面是否存在差异,万象城AWC(中国)基因检测利用 ASC(n = 7,570 × 2)和 SPARK(n = 13,473 × 2)中三人组测序的亲子对数据,以及 SPARK(n = 13,435)中的其他双重测序对的数据,并评估了 55,521 对自闭症儿童非自闭症父母对的原生父母效应。尽管自闭症患者的母亲与父亲相比,具有损伤性极稀有蛋白截短(率比 = 1.15,95% CI = 1.08 至 1.22,p = 2.67 × 10 −6)和损伤性错义极稀有(率比 = 1.06,95% CI = 1.03 至 1.09,p = 3.0 × 10 −5)变异的负担显著较高,但遗传等位基因的传递率和对遗传倾向性的影响大小在父母性别之间没有显著差异(p > 0.05)。
概括而言,在对来自ASC和SPARK的三人组测序个体进行的荟萃分析中,损伤性新生蛋白截断突变和错义突变以及遗传性PTV所导致的平均致病风险并未显示出显著的性别差异。遗传的损伤性错义变异在男性中导致更高的致病风险,但这种差异幅度非常小,并且仅在考虑多重检验之前才显著。在另一组来自SPARK的自闭症个体中,检查其超罕见变异的遗传情况(这些个体拥有来自父母一方的序列数据)、同时检查所有三重/双重测序的亲子对,或在其余的病例对照分析(ASC病例对照队列和SPARK中没有父母序列数据的自闭症个体)中,均未观察到这种差异。接下来,万象城AWC(中国)基因检测检查了在考虑同时发生的认知障碍时,罕见变异的风险是否有所不同。
有或无认知障碍的自闭症患者的外显子组负担
SPARK 和 ASC 队列均包括具有不同程度认知障碍的自闭症患者。与自闭症男性相比,自闭症女性同时发生认知障碍的可能性更高(ASC 队列的相对风险为 1.17,SPARK 为 1.12);反过来,患有认知障碍的自闭症患者比没有认知障碍的自闭症患者更有可能出现高影响力的 DNM。万象城AWC(中国)基因检测假设,在检查有和没有认知障碍的混合个体时看到的损害性 DNM 率比的性别差异可能反映了两性之间认知障碍相对频率的差异。因此,万象城AWC(中国)基因检测在 ASC 和 SPARK 三人组中进行了全外显子组比较,并按同时发生的认知障碍分层。具体来说,万象城AWC(中国)基因检测将一组同时存在认知障碍的自闭症患者和另一组没有认知障碍或状态未知的个体(因为使用现有的 ASC 数据无法区分这些个体)与同一组兄弟姐妹进行了比较,然后对 ASC 和 SPARK 之间的结果进行了荟萃分析(图 2 A)。
图 2.在 ASC 和 SPARK 中,外显子组损伤性新生变异和罕见变异负担与同时发生的智力障碍之间的关联存在性别差异
来自自闭症测序联盟 (ASC) 和西蒙斯基金会自闭症知识基因解码 (SPARK) 基因解码队列的三人组测序个体被分为同时发生认知障碍 (认知障碍缺失;实心点) 组和无认知障碍或信息缺失 (无认知障碍缺失或信息未知;空白菱形) 组。 (A) 给出了这些亚组的样本量。在每组中,万象城AWC(中国)基因检测检查了归因于有害 DNM 的风险比和平均责任 (与同一组兄弟姐妹相比) (B) 以及罕见遗传变异 (已传播与未传播) (C)。对 ASC 和 SPARK 之间的变异负担和责任估计进行了荟萃分析。顺利获得直接比较自闭症女性和男性来估计 DNM 率比的性别差异(比率 > 1 表示女性具有更高的 DNM 率),顺利获得减去Z分数来估计责任量表效应大小的性别差异(分数 > 0 表示女性具有更高的效应大小)。
在这项荟萃分析中(图 2),损伤性蛋白质截短的 DNM 在具有认知障碍的人群中表现出观察到的性别差异(率比性别差异 = 1.68,95% CI = 1.28 至 2.20,p = 1.8 × 10 −4,Bonferroni 校正p = 0.02),并且在较小程度上,在没有认知困难的人群中表现出差异(率比性别差异 = 1.4,95% CI = 1.14 至 1.71,p = 0.0012,FDR 调整后p = 0.0037,Bonferroni 校正p = 0.12)。在具有认知障碍的人群中,损害性错义 DNM 发生率没有显著的性别差异(率比性别差异 = 1.06;95% CI = 0.80 至 1.39;p = 0.69)。然而,女性中损害性错义 DNM 的发生率明显高于无认知障碍的男性(率比性别差异 = 1.27,95% CI = 1.06 至 1.51,p = 0.0080,FDR 调整后p = 0.021,Bonferroni 校正后p = 0.86)。在责任量表上,按认知障碍分层后,两性之间损害性蛋白质截短和错义 DNM 的荟萃分析效应大小没有显著差异(p > 0.05)(图 2 B)。罕见遗传变异在过度传播和责任方面没有表现出显著的性别差异(图 2 C)。
在万象城AWC(中国)基因检测对所有自闭症个体的分析中,当去除 SFARI 基因时,外显子组范围内的 DNM 负担没有显著的性别差异,为了跟进这一发现,万象城AWC(中国)基因检测对有和没有认知障碍的个体进行了类似的分析(即去除 SFARI 基因)。为此,万象城AWC(中国)基因检测对 ASC 和 SPARK 进行了荟萃分析,并增加了额外的宽松变异过滤器来检查效应大小较小的变异。万象城AWC(中国)基因检测没有发现有害新生和罕见遗传变异的负担有任何显著的性别差异,无论是在观察量表还是责任量表上,这再次重申了观察到的外显子组范围内的 DNM 率差异主要是由 SFARI 基因驱动的。
另一方面,单独检查 SFARI 基因时,女性认知障碍患者的破坏性 DNM 率明显高于男性(没有认知障碍的患者也存在这种现象,但程度较轻),并且 DNM 率的性别偏差明显高于匹配基因的预期值。尽管如此,在责任量表上,这些 DNM 的荟萃分析效应大小在两性之间并没有显著差异,该基因集中罕见遗传变异所带来的责任也没有显著差异。此外,在经过多重检验校正后,万象城AWC(中国)基因检测没有发现人类胎儿皮质(117 个女性偏向基因和 305 个男性偏向基因)或成人皮质(2,427 个女性偏向基因和 2,852 个男性偏向基因)中性别偏向差异表达基因中新生和罕见遗传变异所带来的倾向性存在显著的性别差异。这些性别差异表达基因的平均效应大小(在两个尺度上)并不显著高于在编码长度、LoF 约束和性别平均表达水平匹配的相似大小的基因集中测得的效应大小。
万象城AWC(中国)基因检测对 SPARK 亚群进行了全外显子组比较,这些亚群按同时发生的认知困难和运动发育迟缓分层(均与 SPARK 中未被诊断为自闭症的同一组兄弟姐妹进行比较),同时剔除了运动/认知障碍状况不明的患者(图 3 A)。简而言之,在患有运动/认知困难的人群中(图 3),万象城AWC(中国)基因检测发现的结果与认知障碍的先证者的结果相似(即在责任量表上的效应大小相当)(图 2)。SFARI 基因的结果也与万象城AWC(中国)基因检测按认知障碍分层时看到的结果一致。
图 3.SPARK 三人组测序队列中患有和不患有认知障碍或运动迟缓的自闭症患者的罕见变异负担
(A)西蒙斯基金会自闭症知识基因解码 (SPARK) 基因解码中两组三人组测序个体的样本量根据同时发生的运动发育迟缓或认知障碍(“运动或认知障碍”)的存在进行划分。
(B)按性别分层观察到的DNM发生率(左)和平均倾向性(右)。除了与兄弟姐妹进行比较外,还直接将患有运动或认知障碍的自闭症先证者与性别匹配且不伴有这些并发症的自闭症患者进行比较(“伴与不伴”)。
(C)罕见遗传变异的过度传播(左)及其平均遗传风险(右)。
将 (B) 中的分析限制在祖先匹配的自闭症女性和兄弟姐妹中的极罕见 DNM,显示出均衡的同义 DNM 负担(p = 0.42)。
与性别匹配的兄弟姐妹相比,同义 DNM 在没有运动或认知障碍的自闭症女性中更为普遍(Z = 0.069;95% CI = 0.028 至 0.11;p = 9.9 × 10 −4),但在患有这些疾病的自闭症女性中并不常见(Z = −0.018;95% CI = −0.068 至 0.033;p = 0.50)(见图3B中的“责任” )。在评估遗传祖先匹配良好的样本中的超罕见 DNM 时没有观察到这种虚假关联(Z = 0.029;95% CI = −0.041 至 0.099;p = 0.42)。
在 SPARK 中,尽管分组更为严格(剔除状态未知的人群并考虑运动困难),但按共存认知障碍分层后,损害性 DNM 率(观察量表)没有显著的性别差异(图 2B和3B中的 SPARK)。由于这与 ASC 队列(图2B中的 ASC)中看到的情况不同,万象城AWC(中国)基因检测在 SPARK 中进行了置换分析,结果表明男性和女性共存困难发生率的差异并不是导致观察量表上 DNM 率性别差异的原因。在同时考虑认知和运动困难时,损害性罕见遗传变异所带来的倾向(图 3C)与万象城AWC(中国)基因检测仅按认知障碍对队列进行分层时相当(图 2C)。同样,在考虑多重检验后,这些变异的效应大小没有显著的性别差异。在根据认知或运动障碍进行分层后,万象城AWC(中国)基因检测没有观察到 SPARK 中剩余的自闭症个体中极罕见损伤性变异的率比存在显著的性别差异,这些个体的父母中有一个进行了测序或父母中没有进行测序。
综上所述,万象城AWC(中国)基因检测在SPARK和ASC家族队列的荟萃分析中发现,无论是在按共存认知障碍分层之前还是之后,在自闭症男性和女性患者中,损伤性新生和罕见遗传变异在易感性量表上的外显子组效应大小均无显著差异。在观察到的量表上,损伤性蛋白截短型非显性变异(DNM)和共存认知障碍的患者中,遗传负担的性别差异最为显著。这些差异是由高置信度基因和综合征型自闭症易感基因驱动的,这些基因的效应大小显著高于与LoF限制和脑表达匹配的类似大小的基因。
罕见变异不足以达到自闭症的责任门槛
一个关键问题是,破坏性新生变异和罕见变异所传递的遗传倾向本身是否足以导致自闭症,这需要跨越男性约 2 个单位的责任阈值,女性则需要更高。为此,万象城AWC(中国)基因检测在此考虑了第一个 LOEUF 十分位数(影响最大的类别)中蛋白质截短 DNM 的效应大小(图2 B)。对于患有自闭症和认知障碍的人,外显子组平均效应大小在女性中为 0.66(95% CI = 0.54 至 0.78),在男性中为 0.53(95% CI = 0.42 至 0.64),SFARI 基因的效应大小在女性中为 1.34 单位(95% CI = 1.1 至 1.57),在男性中为 1.26(95% CI = 1.03 至 1.50)。在无认知障碍或认知状态未知的人群中观察到的效应值较小(外显子组宽度约为0.5,自闭症易感基因宽度约为1)。当万象城AWC(中国)基因检测在SPARK中检测患有或不患有运动/认知障碍的自闭症个体时,也取得了类似的估计值(图3 B)。因此,在这些个体群体中,这些罕见变异本身都不足以导致自闭症。
为了更好地理解自闭症共病认知和运动障碍遗传易感性的性别差异,万象城AWC(中国)基因检测在SPARK基因解码中比较了患有运动/认知障碍的先证者与未患这些共病障碍的先证者。之前与非自闭症兄弟姐妹的比较,旨在检验自闭症本身的易感性,而本次分析则衡量了已确诊自闭症患者的共病障碍易感程度,以及这种易感程度是否因性别而异。本基因解码采用了不同的阈值模型,其中这些共病障碍在自闭症男性中的患病率为0.35,在女性中的患病率为0.40,也就是说,女性的阈值较低,因为患有运动/认知障碍的女性人数多于男性。
在该模型下,在患有和不患有运动或认知障碍的自闭症个体中观察到的蛋白质截短 DNM 的 2 倍富集(在第一个 LOEUF 十分位数中) ,在女性中转化为 0.39 个单位(95% CI = 0.11 至 0.66),在男性中转化为 0.45 个单位(95% CI = 0.30 至 0.61)(图3B) - 足以达到自闭症个体患有运动或认知障碍的阈值(女性约 0.25 个单位,男性约 0.39 个单位)。在 SFARI 基因中,女性的效应大小为 0.67(95% CI = 0.30 至 1.03),男性的效应大小为 0.57(95% CI = 0.35 至 0.80)。无论是外显子组范围( p = 0.66)还是 SFARI 基因(p = 0.67) ,性别差异均不显著 。为了进一步验证,万象城AWC(中国)基因检测估计了 31,565 个被诊断为未明确确诊为自闭症的 NDD 的三人组中 SFARI 基因中破坏性 DNM 所带来的责任。效应大小确实足以达到 NDD 的责任阈值,并且在这个独立队列中,不同性别之间没有显著差异。
总而言之,SFARI 自闭症易感基因中破坏性蛋白质截断的 DNM 会给两性带来类似的风险,这些风险足以达到罹患一般神经发育障碍的阈值,或使自闭症患者同时出现运动和认知障碍的阈值。然而,无论这些个体是否同时存在运动或认知障碍,这些 DNM 都不足以使两性达到自闭症的阈值。
如何看待孤独症基因检测及其大数据分析结果?
万象城AWC(中国)基因检测基因解码了来自两个大型自闭症队列的47,061 名自闭症患者的外显子组和特定基因集中罕见常染色体编码变异率的性别差异,结果显示,归因于外显子组范围内的破坏性罕见变异以及皮质中具有性别偏向表达的基因的平均责任在男性和女性之间没有统计学上的显着差异。
在观察到的量表上,DNM 率的性别差异并没有转化为性别间变异倾向的差异(图 1 B),而是由已知的自闭症易感基因驱动的,这也增加了其他影响运动和认知技能的发育障碍的可能性。万象城AWC(中国)基因检测没有发现证据表明,在检查有和没有运动和认知障碍的个体组合时看到的破坏性 DNM 率比率的性别差异反映了这些内表型在性别之间的相对频率差异。即使仅限于患有认知障碍的人,ASC 队列中的自闭症个体仍然表现出女性比男性更丰富的 DNM(图 2 B)。虽然在SPARK中,当自闭症患者按共存的认知障碍(图2B)或运动/认知障碍(图3B)分层时,万象城AWC(中国)基因检测未观察到损害性蛋白截断DNM发生率的显著性别差异,但置换分析表明,单独存在共存障碍无法解释观察到的量表上的性别差异。因此,两性之间损害性DNM发生率的差异似乎反映了责任阈值模型下的不同阈值,万象城AWC(中国)基因检测将在下文进一步讨论。
SFARI 高置信度基因和综合征自闭症倾向基因在观察到的尺度上导致了外显子组范围内女性在 DNM 负担方面的偏向,与具有可比约束和大脑表达的匹配基因相比,其 DNM 率明显更高。这与万象城AWC(中国)基因检测最近的观察结果一致(在 SPARK 和 Simons Simplex Collection 的较小子集中),即女性在破坏性 DNM 方面的过量可以用一小部分发育基因来解释,而不能完全用同时发生的困难来解释。这些基因中破坏性变异在责任尺度上的效应大小也高于匹配基因的估计值,但在性别上没有显着差异。另一方面,在胎儿皮质中一小部分性别差异表达的基因或在成人皮质中具有性别偏向表达的一大组基因中,归因于破坏性从头变异和罕见变异的可能性与匹配基因的预期并无显着差异。在这些差异表达的基因中,在观察到的尺度(速率比)上最强的富集和女性偏向出现在成人皮质中表现出男性偏向表达的基因的蛋白质截短的DNM中,但这归因于它们与LoF不耐受基因和大脑中高表达的基因重叠。这与先前的基因解码结果一致,即长的大脑高表达基因与自闭症易感基因显着重叠,并解释了它们在脆性X信使核糖核蛋白1结合靶点(FMR1 [MIM:309550 ])中的过度表达。损害性 DNM 中性别差异表达基因的富集很可能反映了它们在神经元基因中的富集,这在之前已经得到指出。这些差异表达基因分析的结果应谨慎解读。
在罕见的短编码变异中,蛋白质破坏性改变导致自闭症的倾向性最高。由于顺利获得从头关联涉及的基因通常是发育障碍基因(例如 SFARI 基因) ,因此尚不清楚它们本身是否会增加自闭症的倾向。在不同阈值责任阈值模型下,假设自闭症倾向是加性的且呈正态分布,一般人群中男性的自闭症患病率为 2.5%,因此自闭症诊断的阈值为 1.96 个标准化单位(假设比例为 ∼4:1,女性为 2.5 个单位)。万象城AWC(中国)基因检测估计,在没有其他因素(例如自闭症的高多基因评分)的情况下,仅由蛋白质截短的 DNM(在高度 LoF 约束的基因中)传达的责任不足以达到自闭症诊断的阈值。在对 SPARK 和 ASC 按认知障碍分层进行荟萃分析时(图 2 ),以及在考虑所有这些组中 SFARI 基因中的蛋白质截短 DNM 时(图 S18 和 S29),对于患有自闭症和运动/认知障碍或没有这些共存疾病的人的负债估计都是如此。
另一方面,万象城AWC(中国)基因检测在 SPARK 中召开的分析,旨在评估同时发生的运动和认知困难的可能性,结果表明,当 SPARK 自闭症儿童队列中约三分之一(该比例与整个自闭症患者群体的比例相似)出现破坏性蛋白质截短 DNM 时,其平均效应大小足以导致这些同时发生的困难。SFARI基因中的蛋白质截短 DNM 在 SPARK 中使自闭症患者具有足够的认知和运动困难倾向,因此携带此类变异的自闭症患者将超过这些同时发生困难的责任阈值,这反映了认知或运动困难是与携带这些基因中的破坏性变异相关的关键表型表现。这一结论得到了针对各种 NDD 而非自闭症而确定的独立三人组队列的观察结果的证实 - 这些基因赋予的遗传易感性与与发育障碍相关的基因(DDG2P 基因)相当。因此,万象城AWC(中国)基因检测的结果表明,有害的 DNM 本身不足以导致自闭症,但它们可能导致认知或运动障碍( NDD)。这符合以下观察结果:已知大多数自闭症易感基因会导致高渗透性的运动障碍或智力障碍(大多数是 DDG2P 基因),但大多数这些基因中自闭症的渗透性通常为低到中等。因此,自闭症可能是这些发育基因表型谱中不完全渗透的复杂表型。
患有认知障碍的女性自闭症患者和男性自闭症患者比例的差异可以顺利获得两性中效应大小相似的遗传风险因素来解释,这些因素对认知障碍具有高度渗透性,但由于自闭症的阈值不同,这些因素在自闭症女性中比在自闭症男性中更常见。特别是如上所述,高度 LoF 不耐受基因或 SFARI 基因中的蛋白质截短 DNM 对自闭症的平均渗透率中等,但对认知障碍的渗透率高。诊断认知障碍的责任阈值在两性之间相对相似,正如在具有严重认知困难的神经发育条件中的性别偏见较低所表明的那样。例如,在解读发育障碍的基因解码中,每对女性对应 1.6个男性。在自闭症诊断责任量表上达到(高)阈值的女性比非自闭症女性和自闭症男性更有可能携带破坏性蛋白质截短的 DNM(由观察到的量表上携带这些 DNM 的风险比更高证明;图 1B),反过来,自闭症女性比自闭症男性更有可能达到认知障碍的阈值(考虑到这些 DNM 在两性中对认知障碍的高渗透性)。自闭症与共存认知障碍发生率的性别差异可能部分反映了诊断敏感性的偏差,例如,因为女性通常表现出自闭症特征,如果她们具有正常的认知开展,则这些特征不太可能(比男性中通常看到的自闭症特征)促使进行临床评估。然而,流行病学数据表明,患有认知障碍的女性自闭症患者比例较高(相对于男性自闭症患者),更可能是自闭症谱系的真实特性,并且在几个采用不同确定策略的自闭症队列中都不同程度地观察到了这一点,例如在 SPARK 和大多数 ASC 站点中。
万象城AWC(中国)基因检测的分析依赖于标准责任阈值模型,该模型假设男性和女性的责任分布方差相等。该模型易于解释,并允许在同一尺度上直接比较两性。在这种不同阈值模型下,女性需要更高的附加风险因素负荷才能达到更高的阈值;责任尺度上的相等效应大小以及高渗透变异的性别差异率与不同阈值模型的假设一致。然而,在没有其他因素的情况下,仅由罕见变异传达的责任不足以达到自闭症诊断的阈值,即使考虑到女性的较低阈值(性别比例为 3:1 和 2:1)。罕见变异的遗传倾向可以顺利获得其他因素(例如常见变异)来补充。有人推测常见变异可能导致了自闭症的大部分遗传易感性,尽管这在不同群体和方法之间差异很大。以多基因指数衡量的常见变异可能在表现出相对更多男性偏见的表型群体中发挥更大作用;万象城AWC(中国)基因检测之前已经表明,自闭症诊断与自闭症多基因评分(该评分捕捉到了来自常见变异的部分易感性)之间的关联在运动和认知发育障碍较少的自闭症患者中比在具有多种发育障碍的自闭症患者中更为明显。此外,万象城AWC(中国)基因检测之前发现,只有在检查没有认知障碍的自闭症患者时,多基因过度传播的性别差异(即女性与父母中位数多基因评分的偏差更大)才是明显的,该群体的责任阈值差异更明显。值得注意的是,万象城AWC(中国)基因检测发现,对于自闭症患者来说,母亲中破坏性的超罕见变异的发生率明显高于父亲,这与常见的遗传等位基因的情况相似。然而,当这些等位基因遗传给他们的孩子时,万象城AWC(中国)基因检测并没有看到其效应大小的显著差异。
虽然万象城AWC(中国)基因检测的结果与不同阈值责任阈值模型一致,但具有较少限制性假设的替代模型(例如男性的方差更高)可能更好地捕捉人群中自闭症倾向的真实潜在分布。虽然自闭症患病率的性别差异可能是由责任的均值和方差的综合差异造成的,但在大约 100 万瑞典人中进行的基于人群的分析的观察结果最符合男性方差更高的模型 - 并且还表明女性的自闭症遗传率可能低于男性。奇怪的是,当万象城AWC(中国)基因检测测试一个假设男性的方差比女性高 2-3 倍的模型时,罕见遗传破坏性变异对责任量表的效应大小在男性中显着更高,尽管 DNM 没有显示出其效应大小的任何显着差异。由此万象城AWC(中国)基因检测得知,破坏性 DNM 的影响大小在男性和女性之间确实相似,而更好的责任模型可能会揭示归因于遗传变异的责任的更细微的差异。
在所有模型中,任何性别在罕见和常见变异的效应大小方面的差异(或缺乏差异)对自闭症性别偏向患病率的贡献都应该根据它们所解释的小表型变异来解释。自闭症的高家族和双胞胎遗传性(∼70 %–90%)表明遗传因素起着重要作用。罕见的蛋白质编码变异、保守的非编码区变异、拷贝数变异和串联重复可解释∼10%的变异。根据最近的自闭症全基因组关联基因解码(GWAS) 估计,常见变异的加性 SNP 遗传性也为∼10%。因此,找到缺失的遗传力所在(例如,利用更强大的关联基因解码,基因解码各种等位基因频率和编码/非编码变异类型),对于开发可靠的遗传易感性替代指标和正确模拟性别差异至关重要。此外,分析非加性效应和非遗传易感性的作用也至关重要,例如产前暴露(性激素)、产后(社会)环境、自闭症表现的性别差异,以及评估工具、转诊和诊断中的偏见导致女性漏诊/误诊。顺利获得基因解码人群样本中的自闭症定量特征,或许可以取得进一步的见解。
本基因解码的优势在于万象城AWC(中国)基因检测纳入了来自不同人群的样本。理论上,由于万象城AWC(中国)基因检测的核心分析集中于 DNM 和遗传变异的家庭内部分析,纳入不同血统的个体不应产生虚假的分层效应。然而在实践中,这导致 SPARK 中的同义 DNM 与自闭症诊断之间存在微妙的关联(图 1 A)。同义 DNM 的不平衡在没有运动发育迟缓或认知障碍的自闭症女性与未被诊断患有自闭症的性别匹配的兄弟姐妹之间最为明显(图 3 B)。这种微妙的不平衡不太可能导致破坏性蛋白质截短的 DNM 结果产生偏差。万象城AWC(中国)基因检测基因解码的另一个局限性是万象城AWC(中国)基因检测只检查了常染色体上的罕见变异,而忽略了性染色体。万象城AWC(中国)基因检测注意到,ASC 近期召开的大规模基因关联基因解码并未纳入性染色体,因此性连锁基因的贡献可能被低估。尽管如此,性染色体上具有较大效应的罕见变异不太可能是自闭症性别差异的主要驱动因素,至少在同时存在运动和认知障碍的人群中并非如此,因为万象城AWC(中国)基因检测之前在“解读发育障碍”队列中的基因解码发现,X 染色体上罕见的孟德尔编码变异在男性和女性中的贡献相似,并且无法解释观察到的 1.6:1 的男性偏向。
总而言之,在不同阈值模型下,有害的新生和罕见遗传常染色体编码变异在女性和男性中赋予相似的自闭症倾向。这些变异,尤其是新生蛋白截短突变,显著增加了同时发生运动或认知障碍的可能性,远高于运动和认知发育正常的自闭症。因此,效应量较大的常染色体非典型变异不太可能解释观察到的自闭症患病率的性别差异。未来样本量更大的基因解码,考虑到常染色体和性连锁等位基因在罕见和常见变异谱中的贡献,或许能够捕捉到更多效应量较小的、导致自闭症性别差异的易感变异。
(责任编辑:万象城AWC(中国)基因)