新聞中心
NEWS
技術革新帶來的顛覆性潛力
第三代測序(Third-Generation Sequencing, TGS)以超長讀長(1 kb – 2 Mb)徹底重塑了基因組學研究的多個核心環節:
??跨越重復區域:解析端粒、著絲粒、大型結構變異等以往難以解析的復雜區域;
??全長轉錄本測定:直接獲得完整的mRNA isoform結構,跳過拼接假設;
??實時病原檢測:Oxford Nanopore可實現現場測序,廣泛應用于疫情響應與臨床快速診斷。
平臺差異與錯誤機制
盡管TGS具備革命性的結構解析能力,但原始測序錯誤率遠高于二代技術,糾錯成為流程中不可或缺的一環。
??Nanopore最新R10.4芯片 + Kit12試劑可將Indel錯誤率降低近40%(Nature, 2022);
??HiFi數據通常不需要傳統糾錯流程,可直接用于組裝與變異檢測,但仍可通過工具如DeepConsensus進一步提升質量。
糾錯方法大致可分為以下三類,每類針對不同的數據特征與分析目標。
自我糾錯(Self-correction)
原理:利用長讀段之間的冗余重疊區域,通過構建overlap consensus實現錯誤校正,適用于高深度測序場景(>30×)且無短讀支持的項目。
混合糾錯(Hybrid correction)
原理:借助Illumina短讀段的高準確度,從兩個方向修正長讀錯誤。
??k-mer圖法(如LoRDEC):構建短讀的de Bruijn圖,對長讀進行路徑校正;
??比對共識法(如Proovread):直接將短讀比對至長讀并提取高置信區段。
深度學習糾錯(Deep learning-based)
原理:基于深度神經網絡模型直接學習堿基誤差特征,實現端到端的誤差校正或堿基識別優化,已成為Nanopore和PacBio官方支持方向。
注意:Medaka不直接讀取fast5原始信號。原始信號模型建議使用Bonito或Dorado。
讀段級糾錯(Read-Level)
目標:提升原始讀段質量
Nanopore標準流程:
組裝后拋光(Assembly Polishing)
目標:修正系統性錯誤
Nanopore 流程:
PacBio HiFi 流程:
??算法融合:圖神經網絡(如2023年MetaFlye引入的模型)有望整合比對、圖構建與深度學習;
??原始信號級糾錯:直接對原始電流/脈沖信號建模,而非僅比對堿基;
??平臺無關化:設計適配不同平臺(PacBio HiFi vs ONT Q20+)的通用糾錯模型。
掃描二維碼關注我們
數字PCR平臺|多重細胞因子檢測平臺|納米孔測序平臺