在本期节目中,由我为大家介绍DNA甲基化与机器学习在遗传病诊断中的应用。
从基础的表观遗传调控讲起,到机器学习如何帮助分析数百万个CpG位点,我们会一起了解人工智能如何改变临床诊断的精准度与速度。本期节目还特别介绍了 EpiSign平台——一种利用甲基化“表观指纹”辅助罕见病诊断的创新技术。它通过机器学习算法分析血液DNA甲基化模式,已能检测两百余种先天性神经发育障碍,显著提高了诊断率。我们也将讨论它的工作机制、临床成效、局限性,以及未来在表观遗传病、癌症早筛中的潜力。
参考文献
EpiSign网站:https://epigen.ccm.sickkids.ca/
和嘉琦师兄合作的 cfDNA 甲基化 paper:10.1186/s12943-021-01330-w
三代测序甲基化分析:10.1038/s41576-025-00822-5
术语列表
表观遗传学
Epigenetics
研究在不改变DNA序列的情况下,基因如何被开启或关闭的学科。就像同一本说明书,不同人有不同的“阅读方式”。
DNA甲基化
DNA Methylation
在DNA的胞嘧啶(C)上加上甲基(–CH₃),形成“开关”,决定基因是否被表达。是最经典的表观遗传修饰之一。
CpG位点
CpG Site
DNA中一个C和一个G相邻的位置,是甲基化最常发生的区域。可理解为基因调控的“关键节点”。
表观签名 / 表观指纹
Episignature
一种疾病特有的甲基化模式,像“指纹”一样可用于识别特定病症。EpiSign平台正是基于这种特征。
神经发育障碍
Neurodevelopmental Disorder (NDD)
一类影响脑部发育的疾病,如智力障碍、自闭症、发育迟缓等。部分由基因或表观遗传异常引起。
意义不明变异
Variant of Uncertain Significance (VUS)
在基因测序中发现的变异,尚不清楚是否与疾病有关。EpiSign通过甲基化特征帮助重新评估这些变异。
支持向量机
Support Vector Machine (SVM)
一种常用的机器学习算法,用于分类任务。EpiSign使用SVM模型区分不同疾病的甲基化模式。
DNA甲基化芯片
DNA Methylation Microarray
一种检测几十万到上百万个CpG位点的实验工具,如Illumina EPIC芯片,用于EpiSign的数据收集。
批次效应
Batch Effect
不同实验批次或检测平台间产生的系统性误差,会干扰机器学习模型的准确性。
Agentic AI / 智能代理
Agentic AI
一种能自动执行分析、解释和报告生成的AI系统,未来或可自动完成整个甲基化诊断流程。
MethylGPT / 甲基化大模型
MethylGPT
类似ChatGPT的基础模型,但专门训练于甲基化数据上,可用于泛化预测或新疾病发现。
cfDNA / 循环游离DNA
Cell-free DNA
存在于血液中的游离DNA片段,可反映体内细胞状况,常用于癌症早筛和非侵入性产检。
EPIC芯片
Illumina Infinium EPIC Array
当前主流的DNA甲基化检测芯片,覆盖约85万个位点,EpiSign和EPICUP等检测均基于它。
亚硫酸氢盐处理
Bisulfite Conversion
实验步骤:将未甲基化的C转为U(最终为T),以便区分甲基化与未甲基化位点。
若对播客有任何问题或者投稿,或需要获得文字版音频总结,请联系我 zhaosen830@gmail.com,小红书/微博:@撸森森
同时也可以添加微信zhaosen830进入听友交流群,谢谢Thanks♪(・ω・)ノ
Информация
- Подкаст
- ЧастотаКаждые две недели
- Опубликовано12 ноября 2025 г. в 05:17 UTC
- Длительность24 мин.
- ОграниченияБез ненормативной лексики
