現在生態演化學的大家越來越多使用基因體階級的資料類型了,也越來越多人用這些大量的資料來研究族群分化及物種分化層級的問題。這些都是非常棒的事及發展方向!
族群基因體學研究有一個非常常被使用的軟體Structure(或是ADMIXTURE),它可以根據你輸入的遺傳資料幫你計算出最可能能夠解釋你收集到的資料中的遺傳變異需要有幾個不同遺傳來源的族群(k)。然後再幫你計算每一個你輸入的個體(individual)的遺傳資料有多少百分比是來自各個不一樣的遺傳來源。
這是一個很方便很好用的軟體,它的結果圖像化(visualization)也非常直觀一目瞭然:比如說下面這一個圖很明顯的說明你輸入的遺傳資料最合適的解釋目前觀察到的遺傳變異的遺傳群(Wright-Fisher population; k)是2: 紅色及藍色。蠻多個體(individual)的遺傳組成可以純粹由其中一個遺傳群解釋(要不是藍色就是紅色),但是中間有一些個體的遺傳組成同時包含來自兩個遺傳群的來源。
像上圖這樣的結果,有時候會讓人想到中間黃框框內的個體是不是藍色及紅色兩個族群的雜交後代呢?這樣的推論當然是可能的,而且也是非常發生的推論,各大研討會及期刊發表上面都可以看得到。但是我這裡想說的是雜交並不是唯一一個可以解釋目前看到上圖這樣的結果(pattern)的假說,有些特定的族群分化歷史也可以導致一樣的Structure分析結果。
在Lawson 2018年寫的文章介紹如何看待STRUCTURE分析結果的文章,其Fig. 2就有對這種結果不要太“過多解釋(overinterpret)”的介紹。
如上圖所示,b panel 的三個STRUCTURE結果是極度相似的,看到這樣的STRUCTURE很容易讓研究人員就會做a panel最左邊的歷史推論(recent admixture:P2族群是雜交後代),近年來也很多研究會討論panel a中間那個歷史模型(過去的遺傳交流,只是其中一個種源滅絕了:Ghost admixture:P2族群是雜交後代)出現的可能性。以上這兩個解釋或多或少都有用歷史上的遺傳交流(或雜交)來解釋目前觀察到的遺傳多樣性。
然而,同樣用電腦模擬,如果中間這一個P2族群在很近代有一小群人出走建立了遺傳多樣性很小的P1族群,那STRUCTURE分析一樣會算出一樣的結果!雖然Recent Bottleneck這一個歷史模型完全沒有加入任何遺傳交流的歷史參數(parameter),STRUCTURE因為估出來最佳的k依然是3,而因為P1是近代出現遺傳多樣性很小的族群(佔了一個k),唯一的解方就是把P2當成是有很多遺傳來源的族群!
要如何分辨你的資料到底是哪一種歷史造成的結果當然還是有很多辦法可以解決,如果有興趣可以好好的看看Lawson 2018這一篇文章(雖然已經有很多citations,但我還是覺得它得到的關注不夠多)。這裡主要想分享的就是大家data量越來越大,分析也可以做很多,看到patterns後會有很多很可能有趣大家也都這樣推測的歷史原因(都很好),但是不要忘了其他也可能的alternative hypotheses!
Lawson 2018 的文章連結:
https://www.nature.com/articles/s41467-018-05257-7