??GSP??
A tool for Genome Specific Primers design in polyploid species
簡介:
在多倍體 物種中,同源基因組的基因表現(xiàn)出非常高的序列相似性,尤其是在編碼區(qū)。這使得在多倍體基因組背景下設(shè)計基因組特異性引物來擴增單個基因組的特異序列變得困難。為多倍體物種中的重要基因開發(fā)基因組特異性引物,不僅對于研究自然群體中基因的序列多樣性和關(guān)聯(lián)圖譜,而且對于開發(fā)基于基因的功能標(biāo)記進行標(biāo)記輔助育種都是非常有用和關(guān)鍵的。GSP是設(shè)計基因組特異性引物的有力工具,可以區(qū)分多倍體物種不同基因組的序列。此外,GSP還允許用戶在多序列比對中設(shè)計特定的優(yōu)先級。
目前該網(wǎng)站在線版似乎在維護中,無法使用!
QSP所需依賴包,bedtools、Muscle、Primer3 作者已經(jīng)準(zhǔn)備好了。
-
bedtools: a powerful toolset for genome arithmetic
-
-
Muscle: Multiple sequence alignment program
-
-
Primer3: program for designing PCR primers
-
1. 安裝依賴包
- cmake
wget https://github.com/Kitware/CMake/releases/download/v3.21.0/cmake-3.21.0.tar.gz
tar zxvf cmake-3.21.0.tar.gz
cd /home/manager/biosoft/cmake-3.21.0 (你的軟件安裝路徑)
./bootstrap && make && sudo make install
如果在編譯時提示參考: Could NOT find OpenSSL 的解決方法
報錯提示如下
Could NOT find OpenSSL, try to set the path to OpenSSL root folder in the system variable OPENSSL_ROOT_DIR (missing: OPENSSL_LIBRARIES OPENSSL_INCLUDE_DIR)
解決方案:安裝OpenSSL 的依賴即可。
sudo apt-get install libssl-dev
- Boost
apt-get update # 更新
apt upgrade # 更新
apt-get install libboost-all-dev # 安裝依賴項
cd /usr/local/src # cd 到安裝目錄
wget https://boostorg.jfrog.io/artifactory/main/release/1.76.0/source/boost_1_76_0.tar.gz # 下載源碼
tar zxvf boost_1_76_0.tar.gz # 解壓文件
cd boost_1_76_0 # 進入目錄
./bootstrap.sh –prefix=/usr/local/boost # 參數(shù)設(shè)置
./b2 -j8 # 編譯時間較慢
./b2 install # 安裝
打開配置文件,
vim /etc/profile
在/etc/profile 文件末尾添加如下內(nèi)容
export CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/boost/include
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/boost/lib
source etc/profile
打開配置文件/etc/ld.so.conf,末尾添加/usr/local/boost/lib
vim /etc/ld.so.conf
/usr/local/boost/lib # 要添加的內(nèi)容
sudo ldconfig # 執(zhí)行配置
2. 安裝GSP
下載安裝
解壓
cd /home/manager/biosoft/GSP
cmake ./src
make
3. 查看GSP 依賴的可執(zhí)行文件 (bin文件夾下)
cd /home/manager/biosoft/QSP/bin
ls
=============================================================
-rwxrwxrwx 1 root root 1355512 Jul 20 22:20 bedtools*
-rwxrwxrwx 1 root root 1058280 Jul 20 22:20 muscle*
-rwxrwxrwx 1 root root 985836 Jul 20 22:20 primer3_core*
=============================================================
4. QSP 實戰(zhàn)
?案例1 (Example 1):
根據(jù)比對結(jié)果,在多倍體中設(shè)計特異引物。
Design specific primers in polyploid based on blast result.
./GSP -r ./example/example1/blast.tab
-d ./example/example1/sequences.fas \
-b ./bin/bedtools \
-m ./bin/muscle \
-p ./bin/primer3_core \
-o ./example1_result.csv \
-q 3
?案例2 (Example 2):
多條序列設(shè)計引物,這個比較適合小麥、棉花等同源基因的引物設(shè)計。
Design specific primers of multiple sequences.
./GSP -a ./example/example2/sequences.fas \
-b ./bin/bedtools \
-m ./bin/muscle \
-p ./bin/primer3_core \
-o ./example2_result.csv
?案例3 (Example 3):
根據(jù)blast結(jié)果和引物參數(shù)設(shè)置設(shè)計多倍體中的特異引物。
Design specific primers in polyploid based on blast result with primer parameters setting.
./GSP -r ./example/example3/blast.tab \
-d ./example/example3/sequences.fas \
-b ./bin/bedtools \
-m ./bin/muscle \
-p ./bin/primer3_core \
-o ./example3_result.csv \
-q 3 \
-t ./example/example3/parameter_for_primer
GSP 參數(shù):
-
-r: 比對的結(jié)果的路徑。blast table result path -
-d: 序列的路徑。sequence database path (blast database path) -
-a: fasta 文件路徑,該參數(shù)僅適用于設(shè)計多個序列的特異引物。fasta file path (for design + specefic priemrs in multiple sequences only) -
-b: bedtools的安裝路徑。bedtools path (default: bedtools) -
-m: muscle的安裝路徑。muscle path (default: muscle) -
-p: primer3的安裝路徑。primer3 path (default: primer3_core) -
-t: primer3參數(shù)的路徑。primer3 parameters file path -
-o: 輸出結(jié)果路徑。output path. -
-q: 每個序列的設(shè)計的引物數(shù),默認(rèn)3。number of hit sequences for perimer design of each query (default: 3) -
-f: hit sequence flanking length (default: 200) -
-s: 擴增產(chǎn)物最少__bp,默認(rèn)200。product min size (default: 200) -
-l: 擴增產(chǎn)物最多__bp,默1000。product max size (default: 1000) -
-c: 引物中差異位點數(shù),默認(rèn)2。different site in primer (default: 2) -
-e: 引物3'端差異位點數(shù),默認(rèn)無。different site in 3 end of primer (default: No)
注意:
- 確保所有依賴都在環(huán)境變量中,不然需要指定路徑。
Make sure that the dependencies (bedtools, muscle, primer3_core) are in the $PATH. If not, they must be specified (-b, -m, -p).
- 確保所有依賴都在環(huán)境變量中,不然需要指定路徑。
- 路徑必須是絕對路徑。Please use absolute path.
5. GSP實戰(zhàn)
將小麥同源基因的序列存為sequences.fas,文件放在example2/下。
由于是設(shè)計qpcr引物,所以,擴增產(chǎn)物最短-s設(shè)為150,最長-l設(shè)為300。
# 進入目錄
cd /home/manager/biosoft/QSP
# 運行
./GSP -a ./example/example2/sequences.fas \
-b ./bin/bedtools \
-m ./bin/muscle \
-p ./bin/primer3_core \
-o ./MyWRKY1.tab \
-s 150 \
-l 300
結(jié)果如下所示:

注意:LEFT_PRIMER和RIGHT_PRIMER 引物方向均為5' -> 3'。