引言
DNA甲基化是表观遗传调控的核心机制之一。在哺乳动物中,5-甲基胞嘧啶(5mC)主要发生在CpG二核苷酸上,它通过改变染色质结构、影响转录因子结合等方式,在不改变DNA序列的情况下调控基因表达。
这篇综述(Smith等,2024,Nature Reviews Genetics)系统性地总结了DNA甲基化在哺乳动物整个生命周期中的动态变化、调控机制,以及在衰老和疾病中的作用。过去十年,这个领域从发现和基因组表征阶段,进入了更深层次的功能理解阶段——我们开始认识到这个古老的修饰如何被整合到强大的表观遗传密码中。
一、体细胞DNA甲基化景观
哺乳动物生命周期中的大多数细胞类型都保持着一致的双峰甲基化模式(bimodal methylation pattern),这主要由序列背景决定。我们将这种状态称为体细胞景观(somatic landscape),因为它在胚胎着床时出现,并代表了下游所有细胞和组织类型的共同特征。
1. CpG岛与甲基化状态
-
CpG岛(CGI):
- 定义:GC含量>50%,Obs/Exp CpG比>0.6,长度>200bp
- 约占基因组的1-2%
- 约50%的CGI与转录起始位点重叠,另外25%位于编码序列或基因体内
- 正常状态:未甲基化
-
甲基化分布:
- 基因组大部分区域(重复序列、基因间区):高度甲基化
- CpG岛启动子:未甲基化(除非发生沉默)
- 基因体(gene body):中等程度甲基化
2. 高度甲基化结构域(HMDs)与部分甲基化结构域(PMDs)
哺乳动物基因组是异质性的,存在密集的转录基因区域、相对孤立的发育基因,以及广阔的基因贫乏、富含重复元件的"沙漠"。
-
高度甲基化结构域(HMDs):
- 特征:早期复制、高基因密度、低核纤层关联、高GC含量
- 机制:活跃转录区域招募从头甲基转移酶
-
部分甲基化结构域(PMDs):
- 特征:晚期复制、高核纤层关联、低基因密度、低GC含量
- 大小:0.1-12 Mb
- 覆盖范围:约占哺乳动物基因组的50%
- 重叠区域:LOCKs(大的染色质K9修饰)、LADs(核纤层关联结构域)、B compartments
- 机制:复制偶联的甲基化消耗
重要发现:PMDs在许多成年组织中都存在,在长期体外培养或某些癌症中甲基化水平会变得非常低。但人胚胎干细胞(ESCs)可以无限传代且快速分裂,却不表现出同样的增殖依赖性甲基化丢失——这表明表观基因组保真度本身是可以被调控的。
3. 管家基因与发育基因启动子
管家基因的CGI启动子通常持续未甲基化,因为:
- CXXC结构域蛋白结合并保护未甲基化的CG-rich DNA
- H3K4甲基化拮抗DNMT3活性
- R-loop(新生RNA与基因组DNA形成)进一步破坏DNMT相关复合物
发育基因启动子则位于更大的GC-rich和CGI-rich区域,称为DNA甲基化谷(DMVs)或峡谷(canyons):
- 大小:5-50 kb
- 状态:在天然组织和细胞类型中大部分保持无甲基化
- 调控:由Polycomb repressive complex 2(PRC2)沉积的高水平H3K27me3作为兼性异染色质被抑制
- 特征:同时具有H3K27me3(抑制)和启动子H3K4me3(激活),即所谓的二价结构域(bivalent domains)
- 功能:使祖细胞能够激活或失活相关的分化程序
DMV的保护机制:
- TET酶(TET1/2/3)与PRC1和PRC2共定位
- TETs将5mC氧化为5hmC、5fC、5caC
- QSER1等互作伙伴通过CXXC结构域将TETs靶向DMVs
- KDM2B(H3K36特异性组蛋白去甲基化酶)也参与保护
疾病中的DMV异常:
- DNMT3A的功能获得性突变导致Tatton-Brown-Rahman综合征(过度生长)或Heyn-Sproul-Jackson综合征(侏儒症)
- PWWP结构域突变导致DMV边界模糊,异常甲基化向内部扩散
- TET三敲除的人ESCs会表现出DMV甲基化增加
4. 活跃的增强子元件
在体细胞中,DNA甲基化的变化通常反映了转录因子与CpG贫乏的远端增强子的活跃结合。这些区域:
- 平衡到中等水平的甲基化
- 表现出低水平的、TET依赖性的5hmC富集
- 指示DNMT介导和TET介导的周转的实质性程度
例子:
- 在小鼠造血谱系中条件性敲除TET2会导致远端增强子的DNA甲基化向更高水平的5mC倾斜,并支持急性髓性白血病(AML)样表型
- 先驱因子结合后的擦除可能依赖于复制偶联的稀释,而不是催化去除修饰碱基
二、DNMT活性与招募的调控
DNMT家族在维持(DNMT1)和从头(DNMT3家族)甲基化活性之间的分工在20世纪90年代首次被描述。
1. 与组蛋白密码的互作
除了发育背景外,成年细胞中主要的从头甲基转移酶是DNMT3A1;相比之下,DNMT3B主要转换为催化失活形式DNMT3B3。
关键结构域:
- ADD结构域(Atrx-Dnmt3a-Dnmt3l):
- 作为变构抑制剂
- 当酶与H3K4甲基化的核小体复合时,阻断从头甲基转移酶活性
- 当核小体未修饰时,支持与相邻核小体的对接
- PWWP结构域:
- 作为表观遗传阅读器,将DNMT3酶招募到H3K36甲基化的染色质
- H3K36me3由SETD2沉积,通常与转录延伸相关
- DNMT3A和DNMT3B对H3K36me2与H3K36me3有细微不同的亲和力
新发现:
- H3K36me2-DNMT3A轴:支持基因间甲基化,主要依赖于H3K36甲基转移酶NSD1
- DNMT3A1的N端内在无序结构域(IDR):与PRC1沉积的H2AK119泛素化互作,作为不同表观遗传调控因子之间的额外交叉对话层
2. 成熟神经元中DNMT3A活性的增加
出生后大脑发育期间,基因间DNA的DNMT3A甲基化特别显著——有丝分裂后神经元中的非CpG二核苷酸甲基化水平持续上升。
非CpG甲基化的特征:
- 在成熟卵母细胞和ESCs中也会增加
- 在出生后"关键期"(神经可塑性增强、驯化和成熟)显著上升
- 在H3K36me区域积累,包括基因体和基因间区域
- 单个被甲基化的非CpG胞嘧啶在细胞群体中是变化的(“盐和胡椒"模式)
与Rett综合征的关系:
- MeCP2(MBD包含蛋白)整合这种增加的非CpG甲基化
- MeCP2与NCOR1/2去乙酰化酶复合物连接
- Rett综合征的出生后进展与非CpG甲基化的上升浪潮相吻合
- MeCP2对CpG背景外的5mC序列具有扩展的亲和力
3. 逆转录转座子控制策略
在哺乳动物中,DNA甲基化长期以来与寄生基因组元件的控制相关,主要是长散在核元件(LINEs)和包含长末端重复(LTR)的内源性逆转录病毒(ERVs)。
KRAB锌指蛋白
- 基于序列的逆转录转座子抑制主要通过KRAB-ZFPs进行
- KRAB结构域招募关键整合蛋白TRIM28(KAP1)和H3K9甲基转移酶SETDB1
- 触发异染色质形成
- 其他因子:DAXX(组蛋白伴侣,沉积H3.3)、NuRD复合物(核小体重塑和去乙酰化)、DNMT3s
- DNA甲基化似乎是主要的基于序列的抑制因子的下游,作为以H3K9me3为中心的扩展组蛋白密码的一部分
RNA-based沉默
- 通过RNA传感运作,特别是通过进化上古老的生殖系抑制机制产生不同类别的piwi-interacting RNAs(piRNAs)
- Miwi2/Piwil4结合新生的逆转录转座子转录本,并直接招募与非催化辅因子DNMT3L复合的从头DNMTs
- 这发生在胎儿发育晚期的全局基因组重新甲基化期间
- Miwi2或其他互作伙伴(如Spocd1、Tex15)的突变会阻止LINE1和一些ERV调控序列的从头甲基化
DNMT3C的发现:
- 在鼠科啮齿动物中发现
- 最初被注释为截断的串联重复Dnmt3b假基因
- 保留了DNMT3B的N端ADD结构域,但缺乏PWWP结构域
- 在胎儿晚期和出生后早期发育期间表现出雄性生殖系特异性表达
- 突变动物表型模拟Miwi2和Dnmt3l破坏的许多方面
DNMT1的从头功能
- 在小鼠中发现DNMT1在选择性逆转录转座子(特别是ERV-K的Intracisternal A-type Particles,IAPs)的从头甲基化中的非经典作用
- 涉及表观遗传抑制和维持的多个核心成分,包括KRAB-ZFP途径和UHRF1的成分
人类沉默枢纽(HUSH)复合物
- 识别和沉默异位转基因以及小鼠和人类细胞系中的选择性逆转录转座子
- 识别延伸的无内含子初级转录本(逆转录整合的通用标志)
- 招募H3K9甲基转移酶
4. 着丝粒和 pericentromeric 染色质
定义哺乳动物着丝粒的染色体区域包含广泛、高度重复且快速进化的阵列,共同跨越 megabases,并表现出自己独特的表观遗传抑制因子配置。
ICF综合征:
- 常染色体隐性免疫缺陷、着丝粒区域不稳定和面部异常综合征
- 特异性影响DNMT3B的突变
- 也发现影响pericentromeric异染色质相关的其他调控因子的突变
DNMT3B的作用:
- 转基因小鼠系统、人ESCs和ICF患者组织的DNA甲基化谱分析证实了DNMT3B在维持pericentromeric区域高DNA甲基化水平中的显著和特异性作用
- 生化研究鉴定了DNMT3B与关键着丝粒蛋白的许多特异性互作
- DNMT3B3虽然无催化活性,但可能仍然需要与催化性DNMT3A异构体复合并招募它们,以在整个生命周期中维持这些关键基因组元件的动态抑制
三、发育动态
一旦建立,体细胞DNA甲基化景观就非常稳定,并代表了大多数发育的总体基因组框架。相比之下,早期胚胎和生殖系中的DNA甲基化景观经历了实质性的全基因组重编程。
1. 生殖系和早期胚胎景观
哺乳动物生殖系在原条后部与将形成羊膜的细胞一起被诱导。生殖系特化后不久,开始了表观基因组重塑的主要浪潮,包括DNA甲基化的全局去除。
哺乳动物生殖系中的DNA去甲基化
- 小鼠中:网络主要围绕共享的多能性和生殖系蛋白PRDM14,它直接抑制Dnmt3b和Uhrf1的表达
- 哺乳动物特异性生殖系因子DPPA3(STELLA):破坏甲基化维持,部分通过结合并抑制UHRF1
- 去甲基化机制:
- 虽然在此期间观察到TET介导的羟甲基化增加,但大多数DNA甲基化丢失似乎通过基于增殖的稀释发生
- PGC染色质从全局DNA甲基化状态转换为PRC2介导的H3K27甲基化状态
- TET酶的作用:
- 虽然TET酶对于全局DNA去甲基化不是必需的,但它们对于重置选择性印记控制区域和生殖系特异性基因启动子是必需的
- Dnmt1的条件性缺失导致减数分裂程序的虚假和过早激活,以及其他组成型抑制的逆转录转座子家族的激活
性别特异性生殖细胞甲基化
- 雄性生殖细胞:
- 经历实质性的有丝分裂扩增,在减数分裂前创建自我更新的干细胞群体
- 在子宫内的生殖细胞祖细胞中经历接近完全的DNA重新甲基化到体细胞样水平
- piRNA途径提供专门帮助以确保成功抑制逆转录转座子家族
- 雌性生殖细胞:
- 作为胎儿分化的一部分经历减数分裂的初始阶段,在减数分裂I前期停滞
- 保持大部分未甲基化,直到在生殖生命周期中被单独触发生长并成熟为受精能力的、中期II停滞的卵
配子特异性DNA重新甲基化
- 两种配子都利用相同的基本机制:主要是DNMT3L支持的DNMT3A甲基化
- 精子特异性模式:额外依赖于NSD1沉积的H3K36me2
- 成熟卵母细胞:
- 不获得体细胞景观,而是建立混合模式
- 高度转录的区域是高甲基化的并积累非CpG甲基化——这两个特征推测由SETD2介导的H3K36甲基化驱动
- 相比之下,比较低甲基化的基因间染色质的megabase长的track携带实质性的H3K4甲基化
- 数百个含CGI的启动子也发生高甲基化,创建了一组新的印记样特征,传递到合子但在着床前发育期间大部分丢失
受精时父本基因组重编程
- 受精后父本基因组的快速、全局去甲基化激发了数十年的研究
- 总体机制似乎反映了遗传模式的被动消耗,加上目标化的TET介导的氧化浪潮
- 父本基因组被系统地剥离鱼精蛋白,并在DNA复制前配备含H3.3的核小体
- DPPA3的作用:促进复制偶联的去甲基化,部分通过结合并废除UHRF1基于染色质的DNMT1招募
- 存在于H3K9甲基化状态的母本基因组区域保持高DNA甲基化水平,而重新染色质化的父本基因组变得优先富集由PRC1和PRC2沉积的替代组蛋白修饰
2. 体细胞景观的建立
亲本来源特异性的DNA甲基化不对称在最初几个卵裂分裂中持续存在,之后甲基化水平在全基因组继续下降,直到在囊胚阶段胚胎的内细胞团(ICM)和滋养外胚层中达到最低值。
着床时的全局基因组重新甲基化
- 着床代表了第一个主要的发育时间点,此时细胞变得依赖全局高甲基化以维持长期活力
- 胚胎基因组重新甲基化主要由催化活性的DNMT3B异构体驱动
- Dnmt3b突变小鼠胚胎对着床后甲基化组的影响比Dnmt3a敲除更显著
- 甲基化景观的转变与Polycomb组抑制因子的占据和功能的主要转换同时发生——它们在着床前似乎更广泛富集,但与基因组重新甲基化平行地被限制在DMVs
- DNA甲基化也在同一窗口延伸到雌性失活X染色体上基因的含CGI启动子
支持原肠胚形成时的快速分化
- 原肠胚形成胚胎的DNA甲基化谱分析表明,即使开始分化,水平仍继续上升
- 使用单细胞技术在这种转变期间表征DNMT3和TET酶的作用,证明了对谱系特化的多样影响
- DNMT3B在ncPRC1.6(非经典PRC1复合物)下游的配子特异性基因的最终沉默中具有独特作用——失败会导致胚胎停滞
3. 全局中等的胚外景观
除了ICM,着床前胚胎形成滋养外胚层和原始内胚层谱系,将成熟为胎盘和卵黄囊。
胚外景观的特征:
- 在基因组重新甲基化之前分化这些谱系似乎允许了发育独特的景观,其特征是维持全局中等的DNA甲基化水平
- 包括DMVs的从头甲基化和数百个在多谱系承诺中具有核心功能的基因的嵌入CGI启动子——实际上是除了在这些谱系中表达的之外的全套PRC2调控的二价基因
- 还鉴定了额外的非经典母本印记区域,最初通过H3K27me3传递,但在胎盘内获得亲本特异性DNA甲基化模式
- DNMT3B似乎是涉及的核心从头甲基转移酶,CGI甲基化似乎作为PRC2和PRC1的主要沉默的下游
胚外干细胞中的发现:
- 这些谱系中固有的中等DNA甲基化水平也表明与胚胎谱系相比,个体CpGs的从头活性和持续周转增加
- 在自我更新的滋养层干细胞中验证了这一点,由DNMT3B指导的高甲基化和PRC2指导的低甲基化状态之间的持续、全局冲突驱动
- 胚外谱系也保持许多显著的配子相关基因和逆转录转座子家族(如IAPs)的较高表达水平——这些在胚胎的其余部分被特异性和最终地沉默
四、替代的非生理景观
据我们所知,只有少数替代的DNA甲基化景观偏离了上述体细胞原则,其中大多数尽管独特背景却似乎共享关键特征。具体来说,在衰老、衰老和癌症期间,DNA甲基化在CGIs处获得并在全局丢失。
1. 衰老与老化
衰老是在长期增殖或暴露于各种压力源后在哺乳动物细胞中触发的,广泛特征在于细胞形态改变和增殖停滞。
衰老的分子特征:
- 与端粒缩短相关
- 导致核重组,包括染色质的广泛改变、衰老相关异染色质灶(SAHF)的出现和DNA甲基化变化
- 当前见解表明全局丢失和DNA甲基化向CpG-rich DMVs和/或CGIs的有限侵蚀——尽管似乎比在人类肿瘤中观察到的程度要小
- 更系统地比较衰老和诱导的癌细胞转化也突出了目标的关键差异以及在这些区域内发生的表观基因组改变的程度
老化细胞的特征:
- 类似地积累DNA损伤、端粒损耗、核组织改变和/或表观遗传错误,以响应一系列氧化、炎症或代谢压力
- 许多这些错误被发现与有丝分裂分裂跟踪,导致所谓的"老化时钟”,以合理的精度预测生物体的实际年龄
- 这种现象在哺乳动物中根据它们独特的寿命高度保守
- 还鉴定了额外的CpGs,它们更多地跟踪健康状态、压力暴露或其他诱导的核变化,而不是实际时间
表观遗传复兴:
- 各种基于DNA甲基化的时钟随后被用于测量所谓的"表观遗传复兴"的影响,这结合了诱导多能性领域的观察结果
- 具体而言,多能性相关转录因子的瞬时、间歇性或长期诱导据报道触发自然或实验损伤组织的分子,在某些情况下可能是功能复兴,包括老化相关CpGs的相应变化
未解决的问题:
- 将这些特征的性质及其在"复兴"动物中的消耗与特定分子机制联系起来仍然是一个主要挑战
- 表观遗传老化特征可以通过计算含有甲基化CpGs的测序DNA分子的分数来精确测量——这些分数通常在几十年内仅变化单个百分点或更少,并且可以反映记忆淋巴细胞的年龄相关富集
- 表观遗传老化特征是否因此代表调控中的微妙群体范围变化或单个细胞的聚焦低频转化才刚刚开始被研究
- 此外,老化相关的DNA甲基化动态可能与经典的衰老方面(如DNA损伤或端粒损耗)的因果关系不如与全局特性(如细胞代谢)的改变相关
2. 肿瘤生物学
人类癌症中DNA甲基化改变的初步见解在40多年前被报道,此后已被详细验证和完善。
癌症甲基化景观的通用特征:
- 大多数肿瘤共享显著的表观遗传相似性,似乎反映了泛癌特征——跨越大多数肿瘤类型和突变谱
- 包括在CGIs和/或DMVs上的DNA甲基化获得,以及在其他地方的DNA甲基化丢失,主要在PMDs上
- “受保护"和"易感"CGIs的表观遗传特征通常与组成型管家基因的启动子与具有细胞类型特异性或发育功能的启动子的状态相关
肿瘤类型特异性模式:
- 个体肿瘤和肿瘤类型在发育基因启动子内"易感CGIs"的高甲基化——这些在健康细胞中未被主动转录,但在其他方面富集H3K27me3
- 这些原则最终导致显著的肿瘤类型和亚型特异性甲基化模式,很大程度上由原始组织中未表达的、PRC抑制的基因的调控状态解释
关键肿瘤特异性突变特征:
- DNMT3A:在骨髓增生异常综合征患者中高频率突变,在克隆性造血中也体细胞突变
- SETD2:在晚期、高度侵袭性临床阶段的透明细胞和乳头状肾细胞癌中发生从头CGI甲基化
- IDH1/2:在胶质母细胞瘤(GBMs)和髓性白血病中频繁携带功能获得性突变——产生2-羟基戊二酸(强效肿瘤代谢物),竞争性抑制TETs和许多组蛋白赖氨酸去甲基酶的α-酮戊二酸依赖性去甲基化
- H3K27M:在儿科高级别胶质瘤(HGGs)的亚类中复发,似乎改变PRC2占据
肿瘤中无序的甲基化模式:
- 使用诸如Shannon熵之类的高级指标评估每分子甲基化模式彼此相似的程度——这些分析强烈表明肿瘤中的大多数细胞维持局部无序的甲基化模式,不符合任何明确的表观遗传传播模式
- 慢性淋巴细胞白血病患者疾病进展的纵向分析发现,这些中等模式在几十年内可以高度稳定,并通过侵袭性治疗瓶颈和亚克隆适应持续存在
- 结直肠肿瘤的单细胞谱分析发现,即使从不同位置或从多个个体转移取样,大多数患者肿瘤细胞共享相似的结构域水平甲基化谱
五、治疗和诊断意义
由于其悠久的历史,DNA甲基化是早期治疗靶点,特别是在5-氮胞苷(5-aza)作为全局去甲基化剂的偶然发现之后。
1. 表观遗传治疗
- 2004年,美国食品药品监督管理局(FDA)批准Vidaza(阿扎胞苷)用于低剂量治疗骨髓增生异常综合征患者,这是AML的前兆
- 还开发了几种额外的抑制剂来规避与这些核苷类似物的作用机制相关的许多歧义——它们不可逆地将催化参与的DNMTs捕获到DNA,也可以被大量掺入RNA
当前挑战:
- 癌症甲基化组目前不是常见的治疗靶点,部分原因是其在肿瘤发生中的因果作用尚未完全确立
- 虽然它们的靶向重新激活可能具有治疗作用,但基因组调控的多层性质并不保证这种方法的功效
- DNMT抑制的小鼠和人细胞的评估显示长ERV启动的转录本的大量激活,其形成强效的双链RNA底物,触发先天免疫检查点并使基于癌细胞系的异种移植模型对治疗清除敏感
2. 诊断应用
- DNA甲基化用于癌症检测已有数十年历史,但利用从凋亡和/或垂死肿瘤细胞释放到血流中的无细胞DNA的新测序液体活检已经更新了对癌症特异性甲基化作为常规筛查的非侵入性、潜在泛癌生物标志物的兴趣
- DNA甲基化分析特别有前景,因为它直接从测序分子测量,使得即使在无细胞DNA中以非常低的频率存在时也能够检测不同的表观多态性,以及针对不断增长的参考人类细胞图谱的异质特征的解卷积
- 将这些分析方法与实时单分子测序相结合的额外努力指出了这种修饰在一系列治疗和诊断挑战中成为临床肿瘤学常规特征的新机会,包括患者活检的实时诊断
六、总结与展望
过去几十年,我们在DNA甲基化的理解上取得了巨大进步:
已知的:
- DNA甲基化在整个哺乳动物生命周期中(发育、生活史、众多疾病)的基因组分布
- 这种修饰的动态和分子协调的研究突出了经典异染色质相关修饰与通常与局部基因控制相关的修饰之间令人惊讶的相互作用——包括早期胚胎发生和生殖系中从PRC2基到DNA甲基化基调控的主要转变
- 亚硫酸氢盐测序的分子敏感性证明了这些相同的表观基因组区域作为组织老化和肿瘤发生的一部分分解的显著趋势
- DNMTs如何跨基因组区域相互作用——从逆转录转座子控制和着丝粒调控到发育基因启动子的架构——的广泛研究突出了许多不同调控因子之间的实质性交叉对话,并大大扩展了我们对它们的效用和作用的理解
未知的:
- 改变的DNA甲基化模式如何与组蛋白密码的其他方面相互作用,或连接到细胞生理学的更广泛变化,如代谢、免疫敏感性或对环境线索的响应性
- 这些景观对细胞身份有什么贡献
- 什么触发了肿瘤发生时间线中的这些表观遗传转换,或者这些模式是否反而反映了体细胞原则的更被动分解
未来方向:
- 改进的测序技术、生物样本的持续收集和新实验工具的创新将继续为哺乳动物基因组在其所有形式中的调控增加更大的深度和洞察力
- 单细胞、单分子水平的甲基化组动态研究
- 更高分辨率的甲基化编辑工具(如dCas9-DNMT/TET)
- 基于甲基化的精准医学(早期检测、治疗反应预测)
- 开发更具特异性、更安全的表观遗传药物,减少脱靶效应
参考:Smith, Z. D., Hetzel, S., & Meissner, A. (2024). DNA methylation in mammalian development and disease. Nature Reviews Genetics, 25, 755–772.