人類生殖細(xì)胞突變背后的生物學(xué)機(jī)制很大程度上并不清楚,近幾十年的實(shí)驗(yàn)研究揭示出了各種各樣DNA復(fù)制和修復(fù)的可能錯(cuò)誤模式,但是還沒有哪種機(jī)制被闡明可能是人類生殖細(xì)胞突變的主要原因。為了對(duì)人類生殖細(xì)胞系中的突變進(jìn)行全面分類和理解,美國(guó)哈佛醫(yī)學(xué)院Shamil Sunyaev研究組在Science發(fā)文題為Population sequencing data reveal a compendium of mutational processes in the human germ line,通過使用體積正則化非負(fù)矩陣分解(Volume-regularized nonnegative matrix factorization)的方法,給出了群體測(cè)序數(shù)據(jù)統(tǒng)計(jì)分解沿基因組突變率和圖譜的變異過程,揭示出人類生殖細(xì)胞突變過程的概要。
在該工作中,作者們所采用的思路是利用基因組的突變率變化來模擬生殖細(xì)胞系的突變。作者們通過對(duì)基因組中192個(gè)三核苷酸突變類型和不同強(qiáng)度的譜圖來對(duì)生殖細(xì)胞系中的突變機(jī)制進(jìn)行描述。從基因組位點(diǎn)突變圖譜的變異性推斷突變過程其實(shí)是一個(gè)經(jīng)典的非負(fù)矩陣因子分解(Nonnegative matrix factorization,NMF)的問題。NMF將一組非負(fù)信號(hào)也就是突變過程從觀察到的突變頻率中分離出來。然而,NMF可以有許多具有相同近似性質(zhì)的解,所以在該問題單純的NMF并不能對(duì)生殖細(xì)胞系中的突變機(jī)制進(jìn)行解釋。
所以作者們對(duì)NMF的方法進(jìn)行了優(yōu)化,構(gòu)建了體積正則化非負(fù)矩陣分解的方法對(duì)生殖細(xì)胞系中的突變與突變頻率之間的機(jī)制進(jìn)行分類和揭示。反向平行DNA鏈之間的對(duì)稱性為評(píng)估和推斷生物學(xué)過程相關(guān)性提供了一種有力的方法。轉(zhuǎn)錄和復(fù)制等過程會(huì)打破這種對(duì)稱性,而這些機(jī)制與突變機(jī)制是相互依賴的。對(duì)于一個(gè)DNA鏈依賴的突變機(jī)制,統(tǒng)計(jì)程度相同,舉例來說A>G與T>C的突變頻率是相同的,但是對(duì)于DNA鏈非依賴的突變機(jī)制這兩種突變的頻率則并不相同。作者們將該體積正則化非負(fù)矩陣分解的方法應(yīng)用到TOPMed 數(shù)據(jù)庫(kù)中2.92億非常罕見的單核苷酸變異的分析之中。對(duì)該數(shù)據(jù)庫(kù)應(yīng)用體積正則化非負(fù)矩陣分解后作者們共識(shí)別出14種突變以及突變頻率分類(圖1),并且通過對(duì)gnomAD數(shù)據(jù)庫(kù)的重采樣分析發(fā)現(xiàn)具有同樣穩(wěn)健性和準(zhǔn)確性的組成分類。
圖1 體積正則化非負(fù)矩陣分解TOPMed數(shù)據(jù)庫(kù)的14個(gè)組分分類以及相應(yīng)突變率
14個(gè)組分分別對(duì)應(yīng)9個(gè)突變過程,其中五個(gè)DNA鏈依賴的由兩種組成分類表示以及4個(gè)DNA鏈獨(dú)立的突變過程。這些過程只與一個(gè)或兩個(gè)基因組特征相關(guān),包括基因體、復(fù)制時(shí)間、復(fù)制方向和染色質(zhì)可及性。舉例來說,過程1/2是DNA鏈依賴的,是大體積DNA損傷不對(duì)稱分辨的足跡,在發(fā)育早期的強(qiáng)度較低,嵌合A>G/T>C突變轉(zhuǎn)錄對(duì)稱的方向相反。DNA鏈依賴過程3/4捕獲的是不對(duì)稱復(fù)制錯(cuò)誤,其不對(duì)稱性與復(fù)制的方向有關(guān),由大量的DNA損傷組成的。過程5/6在L1PA LINE重復(fù)序列的非轉(zhuǎn)錄鏈上強(qiáng)度升高。再比如,過程10是以CpG轉(zhuǎn)變?yōu)樘卣?,主要由甲基胞嘧啶脫氨或甲基胞嘧啶的錯(cuò)誤復(fù)制所介導(dǎo)的。
總的來說,作者們的工作通過體積正則化非負(fù)矩陣分解的方法揭示出了TOPMed數(shù)據(jù)庫(kù)中突變特性差異的發(fā)生過程,并且作者們?yōu)槠渲械亩鄠€(gè)過程提供了可能的生物學(xué)機(jī)制解釋,為理解人類生殖細(xì)胞系中突變的發(fā)生過程給出了新的分析方法和思考方式。
原文鏈接:
http://doi.org/10.1126/science.aba7408
來源: “BioArt” 如有侵權(quán)請(qǐng)聯(lián)系刪除 !