臻和(北京)科技有限公司正在構建從基因測序數據生產,到樣本數據挖掘分析,再到備份保存和群體復查的信息流全生命周期管理,浪潮天梭TS10000高性能集群解決方案采用了TStor3000并行存儲系統(tǒng),有力支撐了腫瘤個體化精準診療和伴隨診斷的科學研究與商業(yè)運營,實現了對存儲資源的最大化利用,幫助臻和科技提升生產效率,個體基因測序數據運行時間縮短了50%。
美國癌癥學會官方期刊發(fā)表的《2018年全球癌癥統(tǒng)計數據》報告顯示,中國已成為癌癥發(fā)病率、死亡率最高的國家,全球每新增100個癌癥患者中就有21個中國人。在中國,平均每分鐘有7個人確診癌癥,每分鐘有將近5人死于癌癥,腫瘤精準診療已成為迫切而必要的趨勢。
作為改善腫瘤患者生命質量的引領者,臻和(北京)科技有限公司(以下簡稱臻和科技)借助浪潮TStor3000并行存儲系統(tǒng),得以高效的開展針對主要癌癥的基因病理特征、個體化精準診療和伴隨診斷等醫(yī)學研究與醫(yī)療服務。浪潮TStor3000是基于目前歐洲非常流行的BeeGFS商業(yè)版并行文件系統(tǒng)開發(fā)和優(yōu)化版本,專門針對高性能用戶需求設計的并行存儲系統(tǒng)。
基因研究的“小”困擾
臻和科技創(chuàng)立于2014年,以二代測序技術和生物信息學為核心,從事無創(chuàng)為主的腫瘤個體化精準診療和伴隨診斷。目前,臻和科技已建立優(yōu)化的游離DNA提取及定量檢測技術平臺,具備國內首創(chuàng)的基于游離DNA檢測的多個實體腫瘤的伴隨診斷、預后評估、用藥指導的技術平臺。
信息流的全生命周期管理是臻和科技研發(fā)、生產與醫(yī)學檢測等各項業(yè)務的基礎所在,它涵蓋了大量測序數據的產生、挖掘分析、備份保存以及群體復查等環(huán)節(jié)。在信息流的全生命周期管理過程,臻和科技面臨的一大挑戰(zhàn)在于小文件的并行處理與高擴展性的分布式存儲,HPC系統(tǒng)在這方面的性能表現,將直接影響到科研進度與相應醫(yī)療服務的開展。
臻和科技早期癌癥診斷類的基因序列數據通常由千萬到億萬條的基因片段組成,需要通過大量的比對和糾錯才能拼接成完整的基因序列,隨后再經過大量病例樣本數據的對比,找到誘發(fā)腫瘤病變的基因變異特征。在這一過程中,拼接結果的準確程度、拼接的速度都與HPC提供的計算力息息相關。當數據從高速的計算設備中被完整記錄和備份,進入歸檔程序后,還需要進入群體數據的回顧挖掘,積累出中國人群特有的癌癥基因數據庫,對存儲的高擴展性有著較高要求。
周期縮短50%,浪潮基于BeeGFS的并行存儲系統(tǒng)來幫忙
此前,用于生命科學領域的HPC平臺多采用基于Lusture文件系統(tǒng),但在實際使用中效果并不理想。針對于此,浪潮為臻和科技設計了基于BeeGFS并行集群文件系統(tǒng)的高性能集群解決方案,率先實現了BeeGFS在國內生命科學領域的部署。
浪潮天梭TS10000高性能計算集群系統(tǒng)能夠提供超過500個計算核心,計算峰值速度達到50TFlops/s(萬億次),可在4小時內完成一個人的全基因序列拼接、比對;存儲方面,TStor3000內置的BeeGFS并行文件系統(tǒng)可提供極高的IO性能,充分發(fā)揮每塊硬盤的讀寫速度,滿足二代基因測序大文件帶寬需求,在處理三代基因測序場景下小文件并發(fā)的時候,BeeGFS也能發(fā)揮不錯的效果。帶寬可以達到寫7GB/s讀5GB/s。
BeeGFS具備高性能、高可靠性、存取讀取方便等特點,可以大大滿足用戶對數據安全可靠性、存取和維護的需求。其可為元數據和對象數據提供鏡像功能,使系統(tǒng)在半數服務器失效的情況下,業(yè)務不中斷,數據不丟失。BeeGFS還有一項非常有代表性的功能——BeeOND,用以滿足高性能用戶計算過程數據的讀寫需求,輕松達到高帶寬高IOPS的效果,并且可以通過作業(yè)調度系統(tǒng)快速地啟動和關閉文件系統(tǒng),并將其中的重要數據快速地可以轉移到后端存儲中,既保證計算,又不影響數據存放。
在部署了浪潮天梭TS10000高性能集群系統(tǒng)后,臻和科技在系統(tǒng)易用性、生產效率提升、存儲成本降低上均獲得顯著改進。臻和科技相關負責人表示:“通過BeeGFS的分布式存儲功能,我們實現了對存儲資源的最大化利用,有效降低了存儲開銷,并且滿足了對存儲安全性及數據全生命周期追溯的需求。同時,系統(tǒng)易用性的提升極大的降低了使用門檻,從而提升了生產效率,個體基因測序時間縮短了50%。”
作為中國最早涉足生命科學領域的HPC解決方案提供商,浪潮對基因研究的應用特點擁有深厚積累和深刻洞察,始終致力于以先進計算技術及解決方案,推動精準醫(yī)療的發(fā)展。目前,浪潮高性能計算系統(tǒng)已經在中科院北京基因組所、蘇州大學醫(yī)學部、上海兒童醫(yī)院等眾多醫(yī)學研究與醫(yī)療服務機構部署,為解決人類面臨的重要醫(yī)學問題提供領先的計算力支撐。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。