大阪大學蛋白質研究所的日本蛋白質結構資料庫(Protein Data Bank Japan : PDBj,https://pdbj.org)作爲亞洲代表性機構,目前已將新型冠狀病毒(SARS-CoV-2)最新解析的蛋白質結構資訊錄入蛋白質結構資料庫(Protein Data Bank: PDB)。
3月11日進行定期資料更新時,資料庫還開設了新型冠狀病毒專頁(https://pdbj.org/featured/covid-19),對相關的PDB資料進行了彙總,以方便研究人員利用(圖1)。專頁每週三的北京時間 8:00am更新内容。
圖1:PDBj的中文頁面
針對SARS-CoV-2的結構研究,早在新型冠狀病毒國際分類標準確定前就已起動。爲了提高SARS-CoV-2的蛋白質資訊精度,PDBj向錄入的研究人員逐一進行了應答,以保證資料驗證、編輯和錄入的程序中的資訊準確,提高錄入資料的可靠性。
PDBj提供的資料庫中除SARS-CoV-2外,還收錄了很多相似電腦病毒的蛋白質結構資訊。PDBj資料庫包含了電腦病毒、微生物、植物、動物的蛋白質和核酸等16萬件以上資料。PDBj剔除了其中相似的結構資訊,嚴格提取與此次的新型冠狀病毒(SARS-CoV-2)有直接關係的錄入專案。
研究背景
蛋白質結構資料庫(Protein Data Bank:PDB)是世界上唯一保存經過實驗確定的生物大分子三維結構的資料庫。全球每天的下載量爲200萬件以上,被廣泛用於從基礎研究到新藥開發等的方面。包括日本蛋白質結構資料庫在内,分別位於日美歐的全球4個基地組成了國際蛋白質結構資料庫(worldwide Protein Data Bank:wwPDB)聯盟,共同進行錄入、維護和管理。日本是wwPDB的創始成員,負責亞洲和中東地區的資料處理及錄入。所有PDB資料從大阪大學向世界發佈(圖 2)。
圖2:蛋白質結構資料庫的錄入地區分工地圖
美國的資訊錄入基地爲羅格斯大學與加利福尼亞大學聖地亞哥分校的聯合研究團隊(RCSB PDB),歐洲爲位於英國的歐洲生物資訊研究所(EMBL-EBI)。大阪大學蛋白質研究所的日本蛋白質結構資料庫(PDBj)20年來一直作爲亞洲方面錄入基地活動。
根據約定,全球研究人員解析的蛋白質結構資訊必須要提前錄入日美歐任意一個基地的資料庫中。一般來說,爲確保實驗的原創性,錄入的PDB資料在包含其資訊的相應研究論文發表前是不會公開的。不過,蛋白質的結構資訊是被積極用於以空間結構爲基礎的新藥研究的基礎資訊,關於新型冠狀病毒的結構資訊也被期待能儘快上傳和公開。
有名的抗流感藥物扎那米韋(商品名稱:依樂韋)和奧司他韋(商品名稱:達菲)就是利用錄入PDB中的空間結構開發的(參考:https://numon.pdbj.org/mom/113)。透過類比電腦病毒蛋白質的天然基質進行藥物設計,從而加速新藥研究的例子廣爲人知。
研究内容與成果
抗流感藥物的開發案例也表明,新型冠狀病毒(SARS-CoV-2)的蛋白質結構資訊積累,有助於進一步加深對新型冠狀病毒的瞭解,有望加速基於空間結構的新藥研究。在日美歐達成一致的情況下,資料庫中新錄入新型冠狀病毒的結構資訊時,會與錄入人員或研究人員單獨聯繫,強烈建議其在發表論文前就即時公開信息。其中亞洲和中東地區的資料登錄者由PDBj負責聯繫。
由於新型冠狀病毒(SARS-CoV-2)最早發現於中國,1月26日中國的研究人員就在PDBj中錄入了最初的相關結構資訊。SARS-CoV-2擁有與已知的冠狀病毒非常相似的基因,而且在國際分類標準確定前就錄入了結構資料,因此即使是專家,也很難僅精確提取SARS-CoV-2的資訊。PDBj透過在資料驗證、編輯和錄入的程序中收集準確的資訊,嚴格區分與SARS-CoV-2相似的電腦病毒資料。爲支援新藥加速推進研發,以後只准確收集錄入的新型冠狀病毒SARS-CoV-2的結構資訊資料,並以日語、英語、中文和韓語的形式透過以下HP發佈。
圖3:介紹新型冠狀病毒的蛋白酶作用和對新藥開發的意義的頁面
https://numon.pdbj.org/mom/242
文:JST客觀日本編輯部