引言
RNA不只是DNA和蛋白质之间的“信使”——它能折叠成复杂的功能结构。从tRNA、核糖体RNA到核糖开关,我们早已知道RNA结构的重要性,但直到高通量测序技术的出现,我们才真正意识到:RNA结构无处不在,存在于每一种生物的每一条RNA上。
这篇综述(Cao等,2024,Nature Reviews Molecular Cell Biology)系统性地总结了过去十年RNA结构研究的技术进展、RNA结构在基因调控中的作用,以及如何靶向RNA结构进行药物设计。
一、研究RNA结构的技术进展
1. 传统方法的局限
早期研究RNA结构主要依赖生物物理技术:
- X射线晶体学:分辨率高,但需要结晶,适合短RNA
- NMR:可溶液中研究,但分子量受限
- 冷冻电镜(cryo-EM):近年来突破很大,但仍有挑战
生化方法包括:
- 核酸酶酶切:RNase T1/S1(单链)、RNase V1(双链)
- 化学修饰:DMS(修饰A/C)、SHAPE(修饰2’-OH)
但这些方法通常只能研究单个RNA,且电泳检测耗时耗力,不适合全转录组规模。
2. 高通量测序时代
2010年以来,高通量测序彻底改变了这个领域:
化学探针法(Chemical Probing)
- 原理:化学修饰后,逆转录酶会在修饰位点停滞或引入突变,通过测序定位
- 常用试剂:
- DMS:体内外都可用,修饰A/C
- SHAPE(NAI、2A3):修饰所有4种碱基的柔性2’-OH
- 检测方式:
- RT-stall:逆转录停滞,测截断位点
- MaP(Mutational Profiling):突变谱,更准确
邻近连接法(Proximity Ligation)
- 原理:交联后将相互作用的RNA片段连接在一起,测序鉴定
- 方法:
- PARIS、SPLASH、LIGR-seq、COMRADES:基于补骨脂素交联,捕获直接碱基配对
- CLASH、hiCLIP、CRIC-seq、RIC-seq:基于蛋白-RNA交联,捕获蛋白介导的相互作用
- 优势:能鉴定长程的分子内或分子间相互作用
新技术方向
- 单细胞、单分子:smStructure-seq、Nano-DMS-MaP
- 纳米孔直接测序:避免逆转录偏差
- AI辅助:结合深度学习预测结构
3. 计算工具
- 结构预测:RNAfold、CONTRAfold、EternaFold
- 数据处理:从测序reads推断化学 reactivity
- 构象解析:RING-MaP、DREEM、DANCE-MaP、DRACO(从混合群体中解构不同构象)
- AI方法:SPOT-RNA、MXfold2、Ufold、DRfold、trRosettaRNA、ARES
二、RNA结构在基因调控中的作用
1. 转录调控
- 原核生物:
- 核糖开关(Riboswitch):感受代谢物,通过结构变化控制转录终止
- 转录暂停为核糖开关折叠提供时间窗口
- 真核生物:
- 转录速度影响共转录折叠:慢Pol II导致更紧凑的结构,影响剪接和编辑
- lncRNA结构:7SK的构象转换控制P-TEFb活性;COOLAIR结构响应温度调控FLC(开花)
2. RNA剪接
- 局部结构:5’剪接位点前两个核苷酸保持未配对对识别很重要
- 长程配对:
- 果蝇Dscam基因通过竞争性RNA配对实现互斥剪接
- 哺乳动物中RBFOX蛋白通过远端RNA配对调控剪接
- 反向剪接产生circRNA也依赖Alu重复序列配对
3. 翻译调控
- 5’ UTR结构:
- 热力学稳定结构阻碍扫描
- RNA温度计:高温熔解,暴露RBS(如李斯特菌毒力基因)
- 铁响应元件(IRE):结合铁调节蛋白
- uORF附近的发夹动态调控起始密码子选择
- G-四链体(rG4):
- 5’ UTR的rG4抑制翻译,需要解旋酶(如DHX36)
- 植物中JUL蛋白结合rG4调控韧皮部发育
- IRES:病毒和部分细胞mRNA的帽非依赖翻译
- CDS结构:起始密码子下游约70nt的高度折叠结构需要解旋酶(Dhh1/DDX6)
- 3’ UTR结构:rG4也能抑制翻译;RBP结合促进5’-3’通讯
4. RNA降解
- 3’ UTR整体结构化:通常与稳定性正相关
- 结构动态:斑马鱼母源-合子转换(MZT)期间,3’ UTR结构重塑,控制Elavl1a结合,决定mRNA命运
- 蛋白识别:AUF1、HuR识别单链ARE;STAU1、regnase 1、roquin识别双链或茎环
5. RNA定位
- RNA zipcode:定义结构被RBP识别,沿细胞骨架运输
- 酵母ASH1:茎环结构决定子细胞定位
- 果蝇bicoid、oskar等:母体mRNA的不对称定位
- 哺乳动物ACTB:3’ UTR zipcode决定成纤维细胞前缘定位
- 植物长距离运输:tRNA样结构促进mRNA通过韧皮部 systemic movement
- 病毒RNA:HIV RRE、逆转录病毒CTE介导核输出
6. RNA结构依赖的凝聚体
- RNA-RNA相互作用:
- 酵母应激颗粒富含反义RNA-mRNA配对
- 环-环碱基配对驱动RNA多聚化
- GGGGCC重复(ALS/FTD)形成分子间rG4诱导凝聚
- 植物SHR mRNA的rG4触发内皮层细胞凝聚
- RNA-蛋白相分离:
- 单链RNA促进polyQ蛋白Whi3凝聚
- SARS-CoV-2基因组双链RNA促进N蛋白凝聚
- NEAT1作为架构形成paraspeckles
- rG4和i-motif与组蛋白H1形成液滴
三、靶向RNA结构的药物开发
曾几何时,RNA被认为是“不可成药”的——缺乏特异性的“药袋”。但现在情况变了。
1. 靶点选择
理想靶点:复杂、稳定、功能性、特异性。
- 病原体RNA:
- HIV TAR、RRE:抑制病毒复制
- 细菌FMN核糖开关:5FDQD选择性抑制艰难梭菌,不影响肠道菌群
- 人类RNA:
- NRAS 5’ UTR G-四链体:抑制癌基因翻译
- Xist lncRNA RepA元件:Xist靶向
2. 成功案例:Risdiplam
- 适应症:脊髓性肌萎缩症(SMA)
- 靶点:SMN2前mRNA-蛋白复合物
- 机制:稳定弱剪接位点处的剪接机器,增加功能性SMN2异构体
- 优势:高选择性,脱靶剪接效应少
3. 其他策略
- 靶向pre-miRNA:结合Dicer加工位点附近的二级结构,抑制成熟
- 模块化组装:两个小分子连接,提高相邻结构的结合特异性
- RNA降解剂:结合模块+RNA切割模块(博来霉素)或招募内源性RNase(如RNase L)
四、总结与展望
过去十年,我们在RNA结构鉴定上取得了巨大进步,但仍有很多未知:
- 单细胞、单分子水平的结构动态
- 细胞内RNA三级结构如何折叠执行功能
- 如何更精准地设计小分子靶向RNA结构
随着技术和算法的发展,未来十年有望:
- 获得更多单分子和单细胞的结构动态数据
- 深入理解RNA三级结构在细胞内的折叠和功能
- 更好地设计高特异性、高亲和力的小分子靶向RNA结构
- 结合AI,破译结构-功能的规则,用于RNA工程(疫苗、药物)
参考:Cao, X., Zhang, Y., Ding, Y., & Wan, Y. (2024). Identification of RNA structures and their roles in RNA functions. Nature Reviews Molecular Cell Biology, 25, 784–801.