導(dǎo)語
寶子們!做中藥活性成分研究的我,最近剛踩完 “成分篩選” 的坑 —— 中藥里的成分多到像開盲盒,有效成分混在一堆非有效成分里,光靠文獻(xiàn)瞎找根本效率太低!后來才發(fā)現(xiàn),選對數(shù)據(jù)庫比啥都重要,就像給實驗裝了 “導(dǎo)航”,直接精準(zhǔn)定位有用信息~
之前跟大家提過不少中藥化學(xué)成分?jǐn)?shù)據(jù)庫,這次我結(jié)合自己的使用頻率和功能實用性,從里面挑出了5個 “核心選手”。今天先帶大家把這些 “數(shù)據(jù)彈藥庫” 摸清底,知道每個庫擅長啥、能給咱們提供啥;明天再手把手教你們怎么用 —— 從搜草藥到導(dǎo)數(shù)據(jù),避坑指南都備好,作為你的科研搭子,必須互相帶飛!

數(shù)據(jù)庫“看家本領(lǐng)”大點兵
近年來,國內(nèi)外研究者開發(fā)了多個涵蓋草藥、方劑、成分、靶點和疾病信息的數(shù)據(jù)庫,為網(wǎng)絡(luò)藥理學(xué)和虛擬篩選提供了數(shù)據(jù)支持,但不同的數(shù)據(jù)庫在草藥、成分、靶點和疾病數(shù)量上各有側(cè)重:

那下面就跟丸子一起看看這些數(shù)據(jù)庫都有哪些“看家本領(lǐng)”吧~
TCMSP(中藥系統(tǒng)藥理學(xué)數(shù)據(jù)庫與分析平臺)
TCMSP是一個獨特的中草藥系統(tǒng)藥理學(xué)平臺,收錄了《中國藥典》中的499味常用草藥,包含約29,384種化學(xué)成分、3,311個靶點和837種相關(guān)疾病信息。
它就是個“成分篩選小管家”:給你提供 OB(口服生物利用度)、DL(類藥性)這些關(guān)鍵藥動學(xué)參數(shù),不用自己查文獻(xiàn)算閾值 ,搭建成分-靶點和靶點-疾病關(guān)聯(lián)網(wǎng)絡(luò)可以靠他起步。
TCMID 2.0(中藥綜合數(shù)據(jù)庫)
TCMID旨在整合多源數(shù)據(jù)以促進(jìn)中藥現(xiàn)代化研究。最新版TCMID 2.0(2018年發(fā)布)收錄了46,929首方劑、8,159味草藥、43,413種成分、4,633種疾病、8,182種藥物和17,603個靶點。
實實在在的“數(shù)據(jù)整合王者”:不僅把 TCM Database@Taiwan、HIT 這些庫的數(shù)據(jù)揉到一起,還加了方劑煎煮成分、質(zhì)譜數(shù)據(jù)這些 “獨家料”。想研究經(jīng)典方劑(比如四物湯、六味地黃丸)的寶子,用它能查方劑里每味藥的成分,還能做成分 - 靶點 - 疾病關(guān)聯(lián)、PPI(蛋白質(zhì)相互作用)網(wǎng)絡(luò),從傳統(tǒng)方劑挖到現(xiàn)代機(jī)制超方便。
TCM Database@Taiwan(臺灣中藥數(shù)據(jù)庫)
TCM Database@Taiwan是全球最大的非商業(yè)中藥數(shù)據(jù)庫之一,由臺灣團(tuán)隊開發(fā)。它包含453味中藥的61,000余種化合物。
它是“分子結(jié)構(gòu)寶庫”:提供化合物的二維和三維結(jié)構(gòu)供下載,還能用于虛擬篩選和分子動力學(xué)模擬等計算輔助藥物設(shè)計。主要側(cè)重于提供大量天然產(chǎn)物分子結(jié)構(gòu),支持研究者進(jìn)行基于結(jié)構(gòu)的藥物篩選。
SymMap(癥狀映射數(shù)據(jù)庫)
SymMap通過整合中醫(yī)癥狀與現(xiàn)代疾病、基因靶點,將中藥與現(xiàn)代醫(yī)學(xué)聯(lián)系起來。SymMap v2收錄了2,518種中醫(yī)癥狀/證候、698味草藥、25,975種成分、14,086種現(xiàn)代疾病和20,965個靶點。
它是“中西醫(yī)翻譯官”:建立了“癥狀-成分-靶點-疾病”關(guān)聯(lián)網(wǎng)絡(luò),用戶可查詢某中藥或成分對應(yīng)的中醫(yī)癥狀和現(xiàn)代疾病,有助于從整體上把握中藥的作用特點。

HERB 2.0(高通量實驗與參考數(shù)據(jù)庫)
HERB數(shù)據(jù)庫由北京中醫(yī)藥大學(xué)等構(gòu)建,整合了高通量實驗數(shù)據(jù)和文獻(xiàn)信息。HERB 2.0版(2020年)通過人工整理文獻(xiàn),收錄了7,263味草藥、28,212種成分、12,933個靶點和49,258種疾病,并提供這些實體之間的網(wǎng)絡(luò)關(guān)系。
它是“實驗證據(jù)大佬”:不僅有文獻(xiàn)挖的數(shù)據(jù),還整合了高通量實驗結(jié)果(比如細(xì)胞實驗)、臨床試驗、薈萃分析 —— 你查一個成分,能看到它在實驗室里有沒有效、臨床用著咋樣。更絕的是能關(guān)聯(lián) CMap 基因表達(dá)譜,想做藥物重定位(比如找中藥成分治其他病的可能),用它準(zhǔn)沒錯。
其他相關(guān)數(shù)據(jù)庫
?TCMD(中藥化學(xué)數(shù)據(jù)庫):2001年發(fā)布的早期數(shù)據(jù)庫,收錄3,922種藥用植物和9,127種化合物,記錄了草藥的傳統(tǒng)功效、化學(xué)成分和現(xiàn)代藥理信息。它實現(xiàn)了中藥傳統(tǒng)信息與化學(xué)成分的初步整合,但功能較為基礎(chǔ)。
?HIT(草藥信息數(shù)據(jù)庫):由香港浸會大學(xué)開發(fā),側(cè)重中藥活性成分與靶點的關(guān)聯(lián),曾為TCMID等提供數(shù)據(jù)支持。HIT收錄了大量草藥成分及其實驗證實的靶點,是早期中藥靶點數(shù)據(jù)庫的代表。
?TCMGeneDIT:一個整合中藥-基因-疾病關(guān)聯(lián)的數(shù)據(jù)庫,通過文獻(xiàn)挖掘建立了中藥、化學(xué)成分、基因、疾病之間的關(guān)聯(lián)網(wǎng)絡(luò)。它有助于從基因和疾病角度理解中藥的作用機(jī)制,可用于預(yù)測中藥可能影響的基因通路。
?CHCD(中草藥化學(xué)成分?jǐn)?shù)據(jù)庫)、BPCD(中藥方劑數(shù)據(jù)庫)等:這些數(shù)據(jù)庫分別側(cè)重于單味草藥化學(xué)成分和經(jīng)典方劑信息。例如CHCD收錄了數(shù)千種草藥的化學(xué)成分及理化性質(zhì),BPCD則匯集了古方和現(xiàn)代方劑的組成與功效。這些數(shù)據(jù)庫為特定研究需求提供了補(bǔ)充數(shù)據(jù)。
丸子幫你做筆記
從 TCMSP 的藥動學(xué)參數(shù)篩選、TCMID 2.0 的方劑數(shù)據(jù)整合,到 SymMap 的中西醫(yī)癥狀關(guān)聯(lián)、HERB 2.0 的實驗證據(jù)支撐,每款數(shù)據(jù)庫的特色功能和適用場景小譜在前面都帶大家都掰扯得明明白白。但是光靠文字記細(xì)節(jié)容易亂,專門把關(guān)鍵內(nèi)容整理成了表格,讓大家在后續(xù)應(yīng)用中能夠輕松匹配自己的研究需求,趕緊收藏起來吧~

結(jié)語
寶子們!今天這波數(shù)據(jù)庫大盤點是不是超干貨?從發(fā)展歷程圖能看清各庫的迭代脈絡(luò),數(shù)據(jù)規(guī)模對比圖也直觀告訴你不同庫的 “家底厚度”—— 不管你是想快速篩活性成分、挖方劑機(jī)制,還是拿分子結(jié)構(gòu)、連中西醫(yī)癥狀,這5個核心庫都能精準(zhǔn)匹配需求:篩成分找 TCMSP,析方劑用 TCMID 2.0,要 3D 結(jié)構(gòu)沖臺灣庫,搭癥狀 - 疾病關(guān)聯(lián)鎖 SymMap,查實驗證據(jù)選 HERB 2.0,入門打基礎(chǔ)靠 TCMD~
明天咱們直接落地實操!每個庫的操作步驟都會結(jié)合圖表邏輯拆解開,從官網(wǎng)入口到數(shù)據(jù)導(dǎo)出,關(guān)鍵按鈕、篩選閾值、避坑點全標(biāo)紅,就算是剛接觸的寶子也能跟著走通~ 記得定好鬧鐘蹲更新,科研效率提升就差這步啦!
參考資料
[1] Wang Y, Liu M, Jafari M, Tang J. A critical assessment of Traditional Chinese Medicine databases as a source for drug discovery. Front Pharmacol. 2024;15:1303693. Published 2024 Apr 26. doi:10.3389/fphar.2024.1303693
[2] Huang L, Xie D, Yu Y, et al. TCMID 2.0: a comprehensive resource for TCM. Nucleic Acids Res. 2018;46(D1):D1117-D1120. doi:10.1093/nar/gkx1028
[3] Lv Q, Chen G, He H, et al. TCMBank-the largest TCM database provides deep learning-based Chinese-Western medicine exclusion prediction. Signal Transduct Target Ther. 2023;8(1):127. Published 2023 Mar 31. doi:10.1038/s41392-023-01339-1
[4] TCMSP 數(shù)據(jù)庫官網(wǎng) [EB/OL].?Traditional Chinese Medicine Systems Pharmacology Database and Analysis Platform
[5] TCMID 官網(wǎng) [EB/OL].?http://www.tcmid.cn
[6] SymMap 官網(wǎng) [EB/OL].?http://www.symmap.org/.
[7] HERB 數(shù)據(jù)庫官網(wǎng) [EB/OL].?http://herb.ac.cn/.
[8] TCM Database@Taiwan [EB/OL].?TCM - Database Commons
拓展
寶子們可能會問,靠數(shù)據(jù)庫篩選出的“成分 - 靶點”關(guān)聯(lián),怎么進(jìn)一步確認(rèn)這些靶點在實際生物樣本中真的起作用呢?
小譜推薦蛋白質(zhì)組學(xué):數(shù)據(jù)庫更多是基于文獻(xiàn)或預(yù)測模型提供靶點線索,而蛋白質(zhì)組學(xué)能從中藥處理后的細(xì)胞、動物組織甚至臨床樣本中,直接檢測差異表達(dá)的蛋白質(zhì) —— 比如用質(zhì)譜技術(shù),找出中藥活性成分作用后表達(dá)量顯著變化的蛋白;再通過蛋白質(zhì)相互作用網(wǎng)絡(luò)分析,定位這些差異蛋白中的核心靶點,最后和數(shù)據(jù)庫預(yù)測的靶點做交叉驗證,就能篩選出 “預(yù)測可靠、實驗可證” 的關(guān)鍵靶點,讓咱們的中藥活性成分研究從 “虛擬預(yù)測” 落地到 “實體驗證”,結(jié)論更扎實~