GSP_多倍體物種引物設(shè)計

??GSP??

A tool for Genome Specific Primers design in polyploid species

簡介:
在多倍體 物種中,同源基因組的基因表現(xiàn)出非常高的序列相似性,尤其是在編碼區(qū)。這使得在多倍體基因組背景下設(shè)計基因組特異性引物來擴增單個基因組的特異序列變得困難。為多倍體物種中的重要基因開發(fā)基因組特異性引物,不僅對于研究自然群體中基因的序列多樣性和關(guān)聯(lián)圖譜,而且對于開發(fā)基于基因的功能標(biāo)記進行標(biāo)記輔助育種都是非常有用和關(guān)鍵的。GSP是設(shè)計基因組特異性引物的有力工具,可以區(qū)分多倍體物種不同基因組的序列。此外,GSP還允許用戶在多序列比對中設(shè)計特定的優(yōu)先級。

目前該網(wǎng)站在線版似乎在維護中,無法使用!

QSP所需依賴包,bedtools、Muscle、Primer3 作者已經(jīng)準(zhǔn)備好了。

    1. bedtools: a powerful toolset for genome arithmetic
    1. Muscle: Multiple sequence alignment program
    1. Primer3: program for designing PCR primers

1. 安裝依賴包

  1. cmake
wget  https://github.com/Kitware/CMake/releases/download/v3.21.0/cmake-3.21.0.tar.gz
tar  zxvf  cmake-3.21.0.tar.gz
cd   /home/manager/biosoft/cmake-3.21.0  (你的軟件安裝路徑)
./bootstrap && make && sudo make install

如果在編譯時提示參考: Could NOT find OpenSSL 的解決方法
報錯提示如下

Could NOT find OpenSSL, try to set the path to OpenSSL root folder in the system variable OPENSSL_ROOT_DIR (missing: OPENSSL_LIBRARIES OPENSSL_INCLUDE_DIR) 

解決方案:安裝OpenSSL 的依賴即可。

sudo apt-get install libssl-dev
  1. Boost
apt-get update                     # 更新
apt upgrade                        # 更新
apt-get install libboost-all-dev   # 安裝依賴項

cd /usr/local/src                  # cd 到安裝目錄
wget  https://boostorg.jfrog.io/artifactory/main/release/1.76.0/source/boost_1_76_0.tar.gz     # 下載源碼            
tar  zxvf    boost_1_76_0.tar.gz                # 解壓文件
cd  boost_1_76_0                                # 進入目錄
./bootstrap.sh –prefix=/usr/local/boost         # 參數(shù)設(shè)置
./b2 -j8                                        # 編譯時間較慢
./b2 install                                    # 安裝

打開配置文件,
vim /etc/profile  

在/etc/profile 文件末尾添加如下內(nèi)容
export CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/boost/include
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/boost/lib        

source  etc/profile

打開配置文件/etc/ld.so.conf,末尾添加/usr/local/boost/lib
vim /etc/ld.so.conf
/usr/local/boost/lib     # 要添加的內(nèi)容
 
sudo ldconfig               # 執(zhí)行配置                

2. 安裝GSP

下載安裝
解壓
cd  /home/manager/biosoft/GSP
cmake ./src
make

3. 查看GSP 依賴的可執(zhí)行文件 (bin文件夾下)

cd  /home/manager/biosoft/QSP/bin
ls
=============================================================
-rwxrwxrwx 1 root root 1355512 Jul 20 22:20 bedtools*
-rwxrwxrwx 1 root root 1058280 Jul 20 22:20 muscle*
-rwxrwxrwx 1 root root  985836 Jul 20 22:20 primer3_core*
=============================================================

4. QSP 實戰(zhàn)

?案例1 (Example 1):

根據(jù)比對結(jié)果,在多倍體中設(shè)計特異引物。
Design specific primers in polyploid based on blast result.

./GSP -r ./example/example1/blast.tab
-d  ./example/example1/sequences.fas \
-b  ./bin/bedtools \
-m  ./bin/muscle \
-p  ./bin/primer3_core \
-o  ./example1_result.csv \
-q  3  

?案例2 (Example 2):

多條序列設(shè)計引物,這個比較適合小麥、棉花等同源基因的引物設(shè)計。
Design specific primers of multiple sequences.

 ./GSP -a ./example/example2/sequences.fas \
-b  ./bin/bedtools \
-m  ./bin/muscle  \
-p  ./bin/primer3_core  \
-o  ./example2_result.csv  

?案例3 (Example 3):

根據(jù)blast結(jié)果和引物參數(shù)設(shè)置設(shè)計多倍體中的特異引物。
Design specific primers in polyploid based on blast result with primer parameters setting.

./GSP -r ./example/example3/blast.tab \
-d ./example/example3/sequences.fas \
-b  ./bin/bedtools \
-m  ./bin/muscle \
-p  ./bin/primer3_core \
-o  ./example3_result.csv \
-q  3 \
-t  ./example/example3/parameter_for_primer  

GSP 參數(shù):

  • -r: 比對的結(jié)果的路徑。blast table result path
  • -d: 序列的路徑。sequence database path (blast database path)
  • -a: fasta 文件路徑,該參數(shù)僅適用于設(shè)計多個序列的特異引物。fasta file path (for design + specefic priemrs in multiple sequences only)
  • -b: bedtools的安裝路徑。bedtools path (default: bedtools)
  • -m: muscle的安裝路徑。muscle path (default: muscle)
  • -p: primer3的安裝路徑。primer3 path (default: primer3_core)
  • -t: primer3參數(shù)的路徑。primer3 parameters file path
  • -o: 輸出結(jié)果路徑。output path.
  • -q: 每個序列的設(shè)計的引物數(shù),默認(rèn)3。number of hit sequences for perimer design of each query (default: 3)
  • -f: hit sequence flanking length (default: 200)
  • -s: 擴增產(chǎn)物最少__bp,默認(rèn)200。product min size (default: 200)
  • -l: 擴增產(chǎn)物最多__bp,默1000。product max size (default: 1000)
  • -c: 引物中差異位點數(shù),默認(rèn)2。different site in primer (default: 2)
  • -e: 引物3'端差異位點數(shù),默認(rèn)無。different site in 3 end of primer (default: No)

注意:

    1. 確保所有依賴都在環(huán)境變量中,不然需要指定路徑。
      Make sure that the dependencies (bedtools, muscle, primer3_core) are in the $PATH. If not, they must be specified (-b, -m, -p).
    1. 路徑必須是絕對路徑。Please use absolute path.

5. GSP實戰(zhàn)

將小麥同源基因的序列存為sequences.fas,文件放在example2/下。
由于是設(shè)計qpcr引物,所以,擴增產(chǎn)物最短-s設(shè)為150,最長-l設(shè)為300。

# 進入目錄
cd  /home/manager/biosoft/QSP  

# 運行
./GSP  -a  ./example/example2/sequences.fas  \
-b   ./bin/bedtools \ 
-m   ./bin/muscle  \
-p   ./bin/primer3_core  \ 
-o   ./MyWRKY1.tab  \
-s   150 \
-l   300 

結(jié)果如下所示:

qpcr引物對.jpg

注意:LEFT_PRIMER和RIGHT_PRIMER 引物方向均為5' -> 3'。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容