首頁 > 技巧
點擊下載文章原文
海洋占地球體積的71%,擁有豐富的生物資源。 海洋生物多糖和蛋白質含量較高,部分海洋生物容易死亡和腐敗,導致DNA降解,提供高純度和完整的基因組DNA。 收購帶來很大困難。 海洋生物通常比陸地動植物更復雜,并且更難以組裝和拼接。 本研究利用測序技術突破了這些瓶頸,完成了超高質量的海洋魚類基因組組裝!
研究中利用104X測序數據進行基因組組裝,并通過Canu、WTDBG等多種軟件分別進行組裝。 選擇最優的組裝結果(主要從基因組大小、N50、組裝完整性、組裝準確性等方面進行評估)用于后續研究。 優化。 研究人員最終利用WTDBG軟件組的基因組版本結合Hi-C技術的進一步優化,組裝出474.31 Mb的基因組,并將該基因組的99.44%安裝在20條染色體上,增加到22.46 Mb,最長的達到了32.32 MB!
圖1 基因組組裝流程
眾所周知,N50是衡量基因組組裝質量的重要指標。 在一定程度上,價值越高,裝配的質量就越好。 與現有的河豚基因組相比,綠鰭河豚的基因組組裝超過同樣采用三代測序組裝的黃鰭河豚的5倍,是翻車魚(Mola mola)的1000倍!
表1 瞳孔目基因組比較
與近年來的一些魚類基因組相比,綠鰭河豚基因組組裝的連續性也很突出。 從表2中不難發現,近年來魚類基因組水平基本徘徊在Kb和Mb之間,但此次組裝的綠鰭河豚直接提升了一個數量級,完成了高質量的基因組具有很強的連續性。
表2 近年發表的魚類基因組
優秀的基因組不能僅僅建立在連續性的基礎上,完整性也同樣重要。 研究人員利用Racon和Pilon分別對WTDBG組裝好的基因組進行了兩輪和三輪糾錯,從多個方面評估了糾錯前后基因組的完整性。
01.二代reads對比分析
使用bwa軟件將二代數據與參考基因組進行比較。 結果顯示,第二代reads的雙端比對效率為97.41%,表明第三代組裝的基因組完整性較好。
02. 核心基因完整性評估
CEGMA v2.5數據庫包含458個真核生物保守核心基因。 CEGMA v2.5 用于評估最終基因組組裝的完整性。 在最終版本的基因組中,通過序列相似性(>70%)比對,總共找到了458個核心基因中的442個(96.51%)。 CEGMA v2.5包含的248個更保守的序列中,91.13%可以在組裝的基因組中找到。
03. BUSCO評價
BUSCO v2 中的數據庫包含 4584 個真核生物保守的核心基因。 我們使用 BUSCO v2.0 軟件來評估基因組組裝的完整性。 在我們組裝的基因中海洋魚類,總共找到了4,324個完整的BUSCO基因,其中單拷貝4,213個,多拷貝111個; 62個不完整的BUSCO基因; 198 未找到。 BUSCO評估基因組完整度為94.33%(/Total)。
評估結果均顯示完整性在94%以上,表明基因組整體組裝質量非常優異,這將極其有利于后續下游分析,具有無限的發展潛力。
總結
本案海洋經濟魚類綠鰭河豚通過平臺進行超長讀長基因組測序,使得海洋生物組裝指數(N50)超過22 Mb! 成為迄今為止我們所知的海洋魚類N50最高的基因組! 同時,評估結果也表明,裝配的精度和完整性也非常高。
ONT平臺超連續基因組研究演示(部分)
結合前幾期展示的組裝數據和上表,不難看出,在一定的組裝深度下,技術可以帶來高水平的基因組甚至新的驚喜! 無論是動物、植物還是微生物,無論是基因組、轉錄組還是元基因,無論是更新舊數據還是破譯困難物種,它都能表現出色~
截至目前,平臺已完成近400個物種的DNA文庫構建和測序工作,擁有豐富的項目經驗! 無論是技術還是項目經驗,我們都很強! 期待越來越多可喜的成果交到老師們的手中~
官方認證
本文來自《百麥克生物》,原文鏈接:
- 上一篇: 海洋探秘帶你一起探索藍色之旅
- 下一篇: 宿州論壇 關于埇橋區主城區分類實施社區防控的通告(第34號)
猜你喜歡
- 2024-02-17 世界海洋魚類種類最豐富的國家之一營養豐富嗎
- 2024-01-15 海魚的種類圖片,請問下哪里有關于海洋魚類色彩的資料
- 2024-01-12 海洋魚類 營口大白鯨世界海岸城封頂明年底具備運營條件
- 2024-01-11 海洋魚類大全圖冊,海洋當中又好多種魚類
- 2024-01-10 海魚的品種大全及名字,海洋魚類名稱?
- 2024-01-06 世界上最大的海洋魚類,你吃過幾種?
- 2024-01-05 鯖魚是什么魚?海洋魚類是怎么吃的?!
- 2023-12-23 氣候變化導致全球海洋魚類種群的生產力同步趨勢變得越來越顯著