客觀日本

日本理研查清癌症全基因體的微衛星不穩定性

2020年04月06日 生物醫藥

日本理化學研究所(簡稱「理研」)生命醫科學研究中心癌症基因體研究小組的藤本明洋副組長和中川英刀組長等組成的聯合研究團隊,從2,700多例癌症全基因體序列資料中,鑑定出名爲「微衛星(MS)」的基因體重複序列突變,並明確了其特徵。該研究作爲國際合作開展的全基因體泛癌分析專案(PCAWG)的一環,是迄今爲止關於癌症全基因體「微衛星不穩定性(MSI)」最全面的研究和診斷。

該研究成果可用於癌症免疫療法的適應力診斷和遺傳性腫瘤診斷,並有望推動新一代癌症基因體醫療研究的隊形變換。

使用高突變率MS標誌物的MSI檢測目前應用於遺傳性腫瘤診斷和癌症免疫療法的適應力診斷。不過,重複序列分析非常難做,所以此前一直不清楚全基因體發生了什麼樣的MS突變。

此次,聯合研究團隊開發了確定全基因體的MS突變的高精度分析法「MIMcall」,對PCAWG分析的21種癌症的2,717例全基因體序列資料,實施了每例平均約765萬處、合計約200億處的MS突變分析。發現雖然大多數MS中未發現突變,但大約20萬處MS中有多個癌症基因體發生突變(約佔分析的所有MS的2.6%)。其中31例癌症(大腸癌、子宮內膜癌、胃癌等)發現的MS突變數量極多,判斷爲MSI。另外,新確定了20個高頻率突變的MS標誌物,並發現突變頻率與現有MS標誌物相當,MSI檢測精度也基本相同。

相關研究成果預定發佈在科學期刊《Genome Research》上,已於3月25日在網路版公開。

背景

癌症是隨着基因體不斷髮生突變而發病和惡化的「基因體疾病」,所以說,癌症的本質在於「基因體的不穩定性」。目前,全球正積極開展全面的癌症全基因體序列分析,並根據獲得的癌症基因體突變資料開發新藥及實施精準醫療(癌症基因體醫療)。理研團隊2014~2019年透過癌症基因體領域的國際聯合專案「全基因體泛癌分析(PCAWG)」,對癌症實施了大規模的全基因體序列分析,由此發佈了最全面最詳細的癌症基因體目錄。

在人類基因體的30億個鹼基序列中,重複序列約佔一半。其中,1~6個鹼基重複數十次的序列被稱爲「微衛星」,人類基因體被認爲擁有1000萬個以上的MS。MS的突變率較高,而且個體間的重複長度具有豐富的遺傳多態型,因此可作爲遺傳標誌物用於群體遺傳學和譜系分析等研究。

癌症診療透過檢查幾種MS標誌物是否存在突變(重複長度變化)來判斷「微衛星不穩定性(MSI)」,用於診斷DNA開墾機制缺損的遺傳性腫瘤(林奇症候群)。另外,近年來發現,MSI陽性癌症對使用免疫檢查點抑制劑的冶癒反應良好,因此,MSI檢測還被作爲免疫檢查點抑制劑的適應標準,受到了廣泛關注。不過,此前MSI檢測雖然使用了幾種具有高突變率的MS標誌物,但一直不清楚整個基因體發生了什麼樣的MS突變。此外,關於MS的高突變率機制也有很多不明之處。

近年來,隨着新一代測序儀(NGS)技術的快速隊形變換以及資訊分析技術和IT硬體技術的革新,約由30億個鹼基資訊構成的人類全基因體序列分析可以低成本輕鬆實施。今後,不僅是研究,預計全基因體序列分析在癌症基因體醫療等診斷和精準醫療方面也將成爲重要的分析方法。不過,利用現在的NGS分析技術,極難對MS和重複序列位點進行分析,目前還沒有利用NGS對全基因體實施大規模的MS分析。

研究方法與成果

重複序列MS在聚合酶鏈式反應(PCR)及NGS的序列分析階段容易出現錯誤。爲明確此測量中的錯誤頻率和模式,聯合研究團隊着眼於男性正常DNA全基因體序列資料中X染色體上的MS。因爲男性的X染色體只有一條,無需像位於其他染色體上的MS那樣評估兩個等位基因。因此,聯合研究團隊根據男性X染色體的資料推算了MS在全基因體序列中的人爲突變比例,然後利用該資訊,開發了確定癌症中的MS突變的分析法「MIMcall」,並應答該方法具有很高的精度。

接下來,聯合研究團隊利用MIMcall,針對PCAWG分析的21種2,717例癌症全基因體序列資料(癌症和正常),以每例平均約765萬處、合計約爲200億處的MS爲物件實施了突變分析。由此發現,雖然大多數MS中未發現突變,但大約20萬處MS中有多個癌症基因體發生突變,而且這些突變MS大多位於未編碼蛋白質的基因體區域。

另外發現,突變MS的個數與全基因體中的SNV(單鹼基更換)突變數量沒有關係,但與indel(短插入、缺失)突變數量密切相關。MS突變與indel突變的發生機制相同。此外,詳細分析突變MS的特徵發現,腺嘌呤 A和胸腺嘧啶T的重複會導致突變率升高(圖1上)、MS突變與DNA的克隆時間和DNA結構有關等。

在整個基因體分析的約765萬處MS中,將有3%以上的MS發生突變的腫瘤定爲MSI陽性,由此在整個基因體確定了31例MSI陽性癌症。其中,大腸癌(59例中有7例)、胃癌(78例中有6例)和子宮內膜癌(50例中有11例)較多。此外肝癌、胰腺癌、卵巢癌、腎癌和惡性黑色素瘤各佔1~2例(圖1下)。

title

圖1:21種癌症的全基因體微衛星(MS)突變率
上:針對A(腺嘌呤)重複26次的MS(黑色),顯示了插入突變(藍色)和缺失突變(紅色)。
下:3%以上的MS發生突變的癌症判定爲微衛星不穩定性(MSI:Microsatellite Instable,紅點)。大腸癌、子宮內膜癌和胃癌檢測出多個MSI陽性的樣本。MS突變低於3%的癌症不屬於微衛星不穩定性(MSS:Microsatellite Stable,黑點)。

在這31例MSI陽性癌症中,2例DNA開墾基因的生殖細胞突變,相當於林奇症候群;還發現了很多DNA開墾基因的體細胞突變。另外,MSI陽性癌症會隨着突變表達很多新抗原,誘導抗原產生等的免疫原性被認爲比較高。本研究推測,MSI陽性癌症的新抗原比MSI陰性癌症多,很多MSI陽性癌症是因爲編碼蛋白質的基因内的MS或者重複序列發生突變形成的。

研究團隊還新確定了20個高頻率突變的MS標誌物,並利用埼玉縣立癌症中心的大腸癌和子宮內膜癌DNA庫,驗證了MSI的診斷精度。由此應答新MS標誌物的突變頻率與現有MS標誌物相當,MSI檢測精度也基本相同(圖2)。

title

圖2:透過新MS標誌物判斷大腸癌和子宮內膜癌的MSI
用橙色標記了現有MSI診斷標誌物(8個)、此次新確定的具有高突變率的MS標誌物(20個)及蛋白質編碼區(11個)的MS標誌物的突變。可以看出MSI陽性大腸癌(24例)和子宮內膜癌(12例)具有相同程度的突變頻率。MSI陰性大腸癌(22例)的突變頻度也爲同等水平,表明MSI檢測精度也基本相同。

未來展望

隨着DNA序列分析技術的創新帶來成本降低,今後不僅是研究領域,預計全基因體序列分析在癌症診斷和精準醫療領域也將成爲標準的基因體分析方法。

MSI是與癌症的本質「基因體不穩定」直接相關的現象,透過此次的大規模全基因體序列數據分析獲得的關於MSI的知識,有助於查清癌症的真面目,預計今後會開發以該現象爲靶標的冶癒方法。

另外,此次開發的基於全基因體序列資料的MS突變分析法(MIMcall)和MSI檢測法,還有望用於全基因體時代的癌症免疫療法的適應力診斷及遺傳性腫瘤診斷。

論文資訊
題目:Comprehensive Analysis of Indels in Whole-genome Microsatellite Regions and Microsatellite Instability across 21 Cancer Types
期刊:《Genome Research》
DOI:10.1101/gr.255206.119


日語發表原文

中文:JST客觀日本編輯部