這是唐海寶老師GitHub上的JCVI工具的非官方說明書。
該工具集的功能非常多,但是教程資料目前看起來并不多,因此為了能讓更多人用上那么好用的工具,我就一邊探索,一邊寫教程
fetch模塊里封裝了好幾個數(shù)據(jù)庫的下載方式
- bisect: 搜索給定accession的版本,(目前沒想到怎么用)
- ensembl: 從ENSEMBL上下載基因組和注釋
- entrez: 從ENTREZ里獲取記錄
- phytozome: 從phytozome的FTP里下載基因組和注釋
- pytozome10: 基于Globus的API從phytozome里下載基因組和注釋, 需要額外配置
- sra: 調(diào)用wget從SRA的FTP里下載數(shù)據(jù)(感覺不如直接調(diào)用prefetch)
其中ensembl和phytozome是我比較喜歡的工具,因為它可以讓我輕松地去下載一些注釋得比較好的基因組。而且用法也很簡單,直接輸入python -m jcvi.apps.fetch ensembl或python -m jcvi.apps.fetch phytozome就會告訴你你可以下載哪些基因組,

基因組列表