【米源服務(wù)】生信分析加速計(jì)算(含極速變異檢測(cè))

全基因組重測(cè)序技術(shù)憑借覆蓋全面、檢測(cè)精準(zhǔn)的特點(diǎn),已成為挖掘功能位點(diǎn)、解析性狀遺傳基礎(chǔ)的重要工具。隨著研究群體規(guī)模的持續(xù)擴(kuò)大,面對(duì)畜禽、水產(chǎn)以及水稻、小麥、玉米、大豆等作物的大樣本量數(shù)據(jù),常規(guī)計(jì)算平臺(tái)常面臨資源緊張、分析周期長(zhǎng)等問(wèn)題,影響項(xiàng)目整體進(jìn)度。

米源生物基于企業(yè)級(jí)高性能計(jì)算集群與優(yōu)化并行策略,面向科研與育種單位提供重測(cè)序群體變異檢測(cè)及多組學(xué)高算力分析服務(wù)??蛻魞H需提供標(biāo)準(zhǔn)fastq格式下機(jī)數(shù)據(jù)及參考基因組,即可獲得高質(zhì)量的變異位點(diǎn)文件及完整分析報(bào)告。

變異檢測(cè)流程。

服務(wù)內(nèi)容

群體重測(cè)序變異檢測(cè)

  • 支持二倍體及多倍體作物,適配主流參考基因組版本

  • 精準(zhǔn)識(shí)別全基因組范圍SNP與InDel位點(diǎn)

  • 采用高度優(yōu)化的Joint Calling計(jì)算方案,在降低內(nèi)存開銷的同時(shí)將計(jì)算效率提升數(shù)十倍甚至上百倍

  • 流程涵蓋數(shù)據(jù)質(zhì)控、序列比對(duì)、重復(fù)標(biāo)記、變異檢測(cè)、聯(lián)合基因分型及嚴(yán)格過(guò)濾

  • 交付標(biāo)準(zhǔn)VCF文件,兼容下游GWAS、GS、群體進(jìn)化等分析需求

高計(jì)算資源需求分析服務(wù)

除變異檢測(cè)外,米源生物同步提供以下方向的加速分析支持:

  • 大隊(duì)列轉(zhuǎn)錄組測(cè)序分析

  • 宏基因組物種組成與功能注釋分析

  • (泛)基因組組裝與注釋

  • 全基因組甲基化檢測(cè)與差異甲基化區(qū)域識(shí)別

  • 全基因組/轉(zhuǎn)錄組關(guān)聯(lián)分析(GWAS/TWAS/eQTL)與基因組選擇(GS)建模

  • 其他需大規(guī)模并行計(jì)算或存儲(chǔ)資源的組學(xué)分析任務(wù)(可定制化)

[圖片上傳失敗...(image-c0278c-1778494278143)]

服務(wù)優(yōu)勢(shì)

極低的價(jià)格優(yōu)勢(shì)

米源生物通過(guò)資源優(yōu)化和流程改進(jìn),將重測(cè)序分析成本控制在極限范圍內(nèi),比常規(guī)GATK流程的計(jì)算花銷降低一半以下,在保證分析質(zhì)量的同時(shí)大幅降低研究成本。

極短的交付周期

米源生物已完成數(shù)萬(wàn)份樣本的群體變異檢測(cè)分析,形成標(biāo)準(zhǔn)化作業(yè)流程與質(zhì)量評(píng)估體系。對(duì)于100TB以內(nèi)的原始數(shù)據(jù),可在7個(gè)工作日內(nèi)完成計(jì)算任務(wù),具體周期根據(jù)數(shù)據(jù)量、物種復(fù)雜度及分析內(nèi)容協(xié)商確定。

圖片

技術(shù)支撐

百萬(wàn)核級(jí)計(jì)算資源

米源生物部署百萬(wàn)核級(jí)別的高性能計(jì)算集群,支持分布式并行計(jì)算,分析通量可達(dá)5000例/天,能夠穩(wěn)定承載數(shù)千至數(shù)萬(wàn)樣本的超大規(guī)模群體分析需求。

智能資源監(jiān)控與保障

平臺(tái)具備全生命周期資源監(jiān)控能力,實(shí)時(shí)監(jiān)測(cè)CPU負(fù)荷、內(nèi)存使用及磁盤狀態(tài),支持自動(dòng)擴(kuò)容和任務(wù)失敗重試機(jī)制。針對(duì)高內(nèi)存消耗任務(wù)提供預(yù)警,確保計(jì)算任務(wù)穩(wěn)定完成。任務(wù)提交后2分鐘內(nèi)即可啟動(dòng)計(jì)算資源。

流程優(yōu)化與質(zhì)控

分析流程基于行業(yè)通用開源軟件構(gòu)建,支持客戶指定軟件及版本。針對(duì)群體基因組分析進(jìn)行深度優(yōu)化,兼容參考基因組contig十萬(wàn)級(jí)規(guī)模,顯著降低內(nèi)存消耗。流程經(jīng)數(shù)萬(wàn)樣本實(shí)戰(zhàn)驗(yàn)證,各環(huán)節(jié)設(shè)置質(zhì)控節(jié)點(diǎn),確保結(jié)果可重復(fù)、可追溯。

靈活的計(jì)算模式

支持單任務(wù)和批量并行任務(wù)兩種模式,用戶可根據(jù)項(xiàng)目需求靈活選擇。平臺(tái)已對(duì)數(shù)百個(gè)常用生物信息軟件進(jìn)行容器化封裝,便于直接調(diào)用,同時(shí)支持其他軟件的容器化部署。

數(shù)據(jù)獲取支持

配備5Gbps國(guó)際下載帶寬,單日可下載20TB境外公共數(shù)據(jù),有效解決科研數(shù)據(jù)獲取難題。

定制化流水線服務(wù)

針對(duì)高頻重復(fù)的分析需求,提供計(jì)算流水線定制服務(wù)。用戶完成數(shù)據(jù)和參數(shù)配置后即可啟動(dòng)任務(wù),無(wú)需關(guān)注計(jì)算過(guò)程,結(jié)果通過(guò)郵件通知,適合中小型測(cè)序公司和大型課題組使用。

合作咨詢

為提高評(píng)估效率,聯(lián)系時(shí)請(qǐng)?zhí)峁┮韵滦畔ⅲ?/p>

  1. 物種名稱及倍性

  2. 參考基因組版本及來(lái)源

  3. 樣本數(shù)量與平均測(cè)序深度

  4. 測(cè)序下機(jī)原始數(shù)據(jù)(fq.gz)大小

  5. 預(yù)期分析內(nèi)容與交付形式


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容