PDBx/mmCIF 文件格式(三)

PDB-101: Learn: Guide to Understanding PDB Data: Missing Coordinates and Biological Assemblies (rcsb.org)

Missing Coordinates and Biological Assemblies

由于結(jié)構(gòu)確定方法的特點(diǎn),大多數(shù)條目不包括已識(shí)別分子中每個(gè)原子的坐標(biāo)。在某些情況下,實(shí)驗(yàn)方法可能無(wú)法觀察到某些原子。例如,在 X 射線晶體學(xué)實(shí)驗(yàn)中沒有觀察到柔性區(qū)域和氫原子,因此不包含在 PDB 坐標(biāo)文件中。在其他情況下,只有一部分分子可能包含在 PDB 條目中。例如,在對(duì)稱分子的 X 射線晶體結(jié)構(gòu)中,PDB 條目通常僅包含復(fù)合物的一個(gè)亞基,并且需要根據(jù)亞基坐標(biāo)計(jì)算完整生物組裝的坐標(biāo)。搜索 PDB 檔案時(shí),重要的是要考慮結(jié)構(gòu)的哪些部分包含在每個(gè)特定條目中。
下面描述了您可能遇到的一些常見情況。

Asymmetric and Biological Assemblies

在用于 X 射線晶體學(xué)的晶體中,蛋白質(zhì)和/或核酸的多個(gè)拷貝對(duì)稱地堆疊在一個(gè)陣列中。通常,該數(shù)組的最小唯一部分的結(jié)構(gòu)(稱為非對(duì)稱單元,asymmetric unit)存放在 PDB 檔案中。根據(jù)晶體中的對(duì)稱性,不對(duì)稱單元可以具有一個(gè)或多個(gè)拷貝的蛋白質(zhì)和/或核酸。
分子的生物學(xué)相關(guān)組裝可能與 PDB 條目中包含的不對(duì)稱單元結(jié)構(gòu)完全不同。對(duì)于充當(dāng)四聚體的血紅蛋白,不對(duì)稱單元在一些 PDB 條目中僅包括 2 條鏈(功能性四聚體的一半),在其他條目中包括 8 條或更多鏈(代表幾個(gè)功能性四聚體)。二十面體病毒是另一個(gè)常見的例子:通常只存放一條鏈,因此需要生成衣殼中所有 60 條鏈的坐標(biāo)。如果您想自己進(jìn)行計(jì)算,條目文件中提供了生成或選擇生物組裝鏈所需的對(duì)稱操作,或者您可以從檔案中下載生物組裝的坐標(biāo)。
For a detailed tutorial on biological assemblies, click here.

Alpha-Carbon Coordinate Files

在某些情況下,實(shí)驗(yàn)只產(chǎn)生蛋白質(zhì)的低分辨率圖像,例如來(lái)自電子顯微鏡或 X 射線晶體學(xué)的結(jié)構(gòu),其晶體排列不整齊。在這些情況下,實(shí)驗(yàn)數(shù)據(jù)不足以解析每個(gè)原子,研究人員可能會(huì)選擇僅包含蛋白質(zhì)中每個(gè)氨基酸的單個(gè)坐標(biāo)。大多數(shù)情況下,包括α-碳位置的位置。這些結(jié)構(gòu)顯示了蛋白質(zhì)鏈的折疊。

提示:如果您嘗試顯示 PDB 條目的線框圖并得到一個(gè)空白屏幕或只是一堆小點(diǎn),您可能正在查看一個(gè)只有 α-碳的結(jié)構(gòu)。線框圖通常會(huì)在這些文件中出現(xiàn)空白,因?yàn)?α-碳位置相距太遠(yuǎn)而無(wú)法顯示鍵。相反,嘗試使用帶狀圖或粗骨架管來(lái)顯示分子。如果您的分子圖形程序允許使用那么大的球體,則具有人工大球體(半徑 5 埃)的空間填充圖也可以很好地工作。

Missing Loops and Tails

由于 X 射線晶體學(xué)依賴于獲得具有許多完全相同位置的蛋白質(zhì)的晶體,因此柔性蛋白質(zhì)會(huì)引起問(wèn)題。在 X 射線結(jié)構(gòu)中通常不會(huì)觀察到蛋白質(zhì)中移動(dòng)的區(qū)域,因此這些區(qū)域的坐標(biāo)不包含在 PDB 條目中。您會(huì)將這些視為鏈中的斷點(diǎn),并且通常是鏈開頭和結(jié)尾處的缺失部分。源自 NMR 的結(jié)構(gòu)通常不存在此問(wèn)題。 NMR 結(jié)構(gòu)的集合通常包括幾種非常不同的柔性區(qū)域構(gòu)象,因此您可以選擇一種或全部使用它們。
不幸的是,除了為缺失部分建模坐標(biāo)外,沒有簡(jiǎn)單的解決方案來(lái)解決這個(gè)問(wèn)題 (see the list of links for molecular modeling programs)。 這個(gè)問(wèn)題可能很重要,因?yàn)槿嵝原h(huán)通常涉及蛋白質(zhì)的活性位點(diǎn)或結(jié)合位點(diǎn)。

提示:搜索包括配體或結(jié)合配偶體的其他結(jié)構(gòu)通常很有用。在這些情況下,環(huán)可能以穩(wěn)定的構(gòu)象圍繞配體閉合,因此將在晶體學(xué)實(shí)驗(yàn)中看到。

Fragments and Domains

許多大型蛋白質(zhì),尤其是具有幾個(gè)可移動(dòng)部分的蛋白質(zhì),已被證明不可能作為一個(gè)整體結(jié)晶。在這些情況下,研究人員采取了分段方法。他們將蛋白質(zhì)切成易于處理的小塊,然后解析出每一塊的結(jié)構(gòu)。為了獲得整個(gè)蛋白質(zhì)的圖片,必須以正確的方向重新組裝這些片段。
不幸的是,在這些情況下,沒有綜合資源可以幫助您拼湊功能分子。您將需要查看序列數(shù)據(jù)以及分子生物學(xué)報(bào)告來(lái)整理整體形式。
提示:在搜索 PDB 條目時(shí),請(qǐng)務(wù)必注意每個(gè)坐標(biāo)文件中實(shí)際包含的內(nèi)容。注意 PDB 標(biāo)題中的“配體結(jié)合域”和“片段”等詞,它提示您正在查看功能分子的一部分。

Where are the Hydrogen Atoms?

大多數(shù)晶體學(xué)實(shí)驗(yàn)不解析氫原子,因此 PDB 檔案中的大多數(shù)晶體坐標(biāo)文件僅包含非氫原子的位置。在某些情況下,在結(jié)構(gòu)細(xì)化過(guò)程中使用極性氫原子(極性氫原子是那些與氮、氧和硫相連的原子,它們可以參與氫鍵)。另一方面,NMR 確定的結(jié)構(gòu)通常包括結(jié)構(gòu)中的所有氫原子,因?yàn)樵谶@些實(shí)驗(yàn)中獲得的大部分實(shí)驗(yàn)信息包括這些氫原子之間的距離。
由于晶體學(xué)實(shí)驗(yàn)通??床坏綒湓?,并且由于氧原子和氮原子具有相似數(shù)量的電子,因此在晶體學(xué)電子密度圖中看起來(lái)相似,因此通常難以確定側(cè)鏈中原子的確切身份,例如天冬酰胺和谷氨酰胺。在某些情況下,如果您仔細(xì)觀察與相鄰氨基酸的氫鍵模式,您可能會(huì)通過(guò)轉(zhuǎn)換酰胺側(cè)鏈中的氮和氧來(lái)找到更好的匹配。
提示:Reduce 程序可用于添加蛋白質(zhì)和核酸中缺失的氫原子,以及確定蛋白質(zhì)中的最佳氫鍵模式。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容