引言

RNA不只是DNA和蛋白质之间的“信使”——它能折叠成复杂的功能结构。从tRNA、核糖体RNA到核糖开关,我们早已知道RNA结构的重要性,但直到高通量测序技术的出现,我们才真正意识到:RNA结构无处不在,存在于每一种生物的每一条RNA上

这篇综述(Cao等,2024,Nature Reviews Molecular Cell Biology)系统性地总结了过去十年RNA结构研究的技术进展、RNA结构在基因调控中的作用,以及如何靶向RNA结构进行药物设计。


一、研究RNA结构的技术进展

1. 传统方法的局限

早期研究RNA结构主要依赖生物物理技术:

  • X射线晶体学:分辨率高,但需要结晶,适合短RNA
  • NMR:可溶液中研究,但分子量受限
  • 冷冻电镜(cryo-EM):近年来突破很大,但仍有挑战

生化方法包括:

  • 核酸酶酶切:RNase T1/S1(单链)、RNase V1(双链)
  • 化学修饰:DMS(修饰A/C)、SHAPE(修饰2’-OH)

但这些方法通常只能研究单个RNA,且电泳检测耗时耗力,不适合全转录组规模。

2. 高通量测序时代

2010年以来,高通量测序彻底改变了这个领域:

化学探针法(Chemical Probing)

  • 原理:化学修饰后,逆转录酶会在修饰位点停滞或引入突变,通过测序定位
  • 常用试剂
    • DMS:体内外都可用,修饰A/C
    • SHAPE(NAI、2A3):修饰所有4种碱基的柔性2’-OH
  • 检测方式
    • RT-stall:逆转录停滞,测截断位点
    • MaP(Mutational Profiling):突变谱,更准确

邻近连接法(Proximity Ligation)

  • 原理:交联后将相互作用的RNA片段连接在一起,测序鉴定
  • 方法
    • PARIS、SPLASH、LIGR-seq、COMRADES:基于补骨脂素交联,捕获直接碱基配对
    • CLASH、hiCLIP、CRIC-seq、RIC-seq:基于蛋白-RNA交联,捕获蛋白介导的相互作用
  • 优势:能鉴定长程的分子内或分子间相互作用

新技术方向

  • 单细胞、单分子:smStructure-seq、Nano-DMS-MaP
  • 纳米孔直接测序:避免逆转录偏差
  • AI辅助:结合深度学习预测结构

3. 计算工具

  • 结构预测:RNAfold、CONTRAfold、EternaFold
  • 数据处理:从测序reads推断化学 reactivity
  • 构象解析:RING-MaP、DREEM、DANCE-MaP、DRACO(从混合群体中解构不同构象)
  • AI方法:SPOT-RNA、MXfold2、Ufold、DRfold、trRosettaRNA、ARES

二、RNA结构在基因调控中的作用

1. 转录调控

  • 原核生物
    • 核糖开关(Riboswitch):感受代谢物,通过结构变化控制转录终止
    • 转录暂停为核糖开关折叠提供时间窗口
  • 真核生物
    • 转录速度影响共转录折叠:慢Pol II导致更紧凑的结构,影响剪接和编辑
    • lncRNA结构:7SK的构象转换控制P-TEFb活性;COOLAIR结构响应温度调控FLC(开花)

2. RNA剪接

  • 局部结构:5’剪接位点前两个核苷酸保持未配对对识别很重要
  • 长程配对
    • 果蝇Dscam基因通过竞争性RNA配对实现互斥剪接
    • 哺乳动物中RBFOX蛋白通过远端RNA配对调控剪接
    • 反向剪接产生circRNA也依赖Alu重复序列配对

3. 翻译调控

  • 5’ UTR结构
    • 热力学稳定结构阻碍扫描
    • RNA温度计:高温熔解,暴露RBS(如李斯特菌毒力基因)
    • 铁响应元件(IRE):结合铁调节蛋白
    • uORF附近的发夹动态调控起始密码子选择
  • G-四链体(rG4)
    • 5’ UTR的rG4抑制翻译,需要解旋酶(如DHX36)
    • 植物中JUL蛋白结合rG4调控韧皮部发育
  • IRES:病毒和部分细胞mRNA的帽非依赖翻译
  • CDS结构:起始密码子下游约70nt的高度折叠结构需要解旋酶(Dhh1/DDX6)
  • 3’ UTR结构:rG4也能抑制翻译;RBP结合促进5’-3’通讯

4. RNA降解

  • 3’ UTR整体结构化:通常与稳定性正相关
  • 结构动态:斑马鱼母源-合子转换(MZT)期间,3’ UTR结构重塑,控制Elavl1a结合,决定mRNA命运
  • 蛋白识别:AUF1、HuR识别单链ARE;STAU1、regnase 1、roquin识别双链或茎环

5. RNA定位

  • RNA zipcode:定义结构被RBP识别,沿细胞骨架运输
    • 酵母ASH1:茎环结构决定子细胞定位
    • 果蝇bicoid、oskar等:母体mRNA的不对称定位
    • 哺乳动物ACTB:3’ UTR zipcode决定成纤维细胞前缘定位
  • 植物长距离运输:tRNA样结构促进mRNA通过韧皮部 systemic movement
  • 病毒RNA:HIV RRE、逆转录病毒CTE介导核输出

6. RNA结构依赖的凝聚体

  • RNA-RNA相互作用
    • 酵母应激颗粒富含反义RNA-mRNA配对
    • 环-环碱基配对驱动RNA多聚化
    • GGGGCC重复(ALS/FTD)形成分子间rG4诱导凝聚
    • 植物SHR mRNA的rG4触发内皮层细胞凝聚
  • RNA-蛋白相分离
    • 单链RNA促进polyQ蛋白Whi3凝聚
    • SARS-CoV-2基因组双链RNA促进N蛋白凝聚
    • NEAT1作为架构形成paraspeckles
    • rG4和i-motif与组蛋白H1形成液滴

三、靶向RNA结构的药物开发

曾几何时,RNA被认为是“不可成药”的——缺乏特异性的“药袋”。但现在情况变了。

1. 靶点选择

理想靶点:复杂、稳定、功能性、特异性。

  • 病原体RNA
    • HIV TAR、RRE:抑制病毒复制
    • 细菌FMN核糖开关:5FDQD选择性抑制艰难梭菌,不影响肠道菌群
  • 人类RNA
    • NRAS 5’ UTR G-四链体:抑制癌基因翻译
    • Xist lncRNA RepA元件:Xist靶向

2. 成功案例:Risdiplam

  • 适应症:脊髓性肌萎缩症(SMA)
  • 靶点:SMN2前mRNA-蛋白复合物
  • 机制:稳定弱剪接位点处的剪接机器,增加功能性SMN2异构体
  • 优势:高选择性,脱靶剪接效应少

3. 其他策略

  • 靶向pre-miRNA:结合Dicer加工位点附近的二级结构,抑制成熟
  • 模块化组装:两个小分子连接,提高相邻结构的结合特异性
  • RNA降解剂:结合模块+RNA切割模块(博来霉素)或招募内源性RNase(如RNase L)

四、总结与展望

过去十年,我们在RNA结构鉴定上取得了巨大进步,但仍有很多未知:

  • 单细胞、单分子水平的结构动态
  • 细胞内RNA三级结构如何折叠执行功能
  • 如何更精准地设计小分子靶向RNA结构

随着技术和算法的发展,未来十年有望:

  1. 获得更多单分子和单细胞的结构动态数据
  2. 深入理解RNA三级结构在细胞内的折叠和功能
  3. 更好地设计高特异性、高亲和力的小分子靶向RNA结构
  4. 结合AI,破译结构-功能的规则,用于RNA工程(疫苗、药物)

参考:Cao, X., Zhang, Y., Ding, Y., & Wan, Y. (2024). Identification of RNA structures and their roles in RNA functions. Nature Reviews Molecular Cell Biology, 25, 784–801.