2020年1月4日 星期六

DIABIMMUNE Microbiome Project 資料簡介

DIABIMMUNE Microbiome Project,  https://pubs.broadinstitute.org/diabimmune
儘管許多研究探討腸道微生物群落的建立過程,但這些研究的資料未必開放使用。為了研究飲食與腸道微生物發育的關係,我在 NCBI SRA database 還有 EMBL-EBI MGnify 以嬰兒(infant)、腸道 (gut)、微生物 (microbiome) 等關鍵字搜尋適合的數據。雖然 DIABIMMUNE Microbiome Project 提供的資料在數據類型、樣本規模和飲食記錄等條件上非最佳選擇,但它卻開放使用。本文簡介此計畫的研究目的還有資料特性,供往後欲使用此數據的研究者參考。

1. DIABIMMUNE Microbiome Project 的目的


衛生假說 (hygiene hypothesis) 是指幼兒因衛生條件改善而減少病原暴露,以致於免疫系統發育異常,增加罹患自體免疫疾病的風險。DIABIMMUNE Project 的目的是檢驗衛生假說 (hygiene hypothesis) ,並探討腸道菌群發育與一型糖尿病等自體免疫疾病的關聯。此計畫的執行期間為 2008 年 9 月到 2011 年 11 月,下轄 Three country cohort (Karelia cohort)、Antibiotics cohort (Abx cohort) 以及 Type-one-diabetes cohort (T1D cohort) 等針對不同子題的研究定群,總計 293 名嬰兒參與。

這些嬰兒分屬芬蘭、愛沙尼亞及俄國籍,且皆經人體白血球抗原測試 (human leukocyte antigen haplotypes) 診斷出有較高的機率罹患自體免疫疾病。由於芬蘭與卡累利阿 (Russia Karelia) 的經濟條件差異還有愛沙尼亞今昔的工業化發展,這三個國家的國民可作為測試假說的自然實驗對象。

Vatanen et al., 2015

為了研究腸道微生物的功能及組成變化,研究人員逐月採集了產後兩個月至三歲前的排遺樣本,再以16S rRNA 基因擴增定序或 Metagenomic shotgun sequencing 定序。在臨床資訊方面,飲食、用藥和免疫疾病病史等資訊由監護人記錄,並在定期的研究訪視中回收問卷(month 3, 6, 12, 18, 24, 36)。而用於測定自體免疫抗體的血清樣本則在出生時(臍帶血)以及產後 3、6、12、18、24 及 36 月的定期回診時採集。


The DIABIMMUNE Project website, https://diabimmune-17.ltdk.helsinki.fi/
除了個別研究定群,DIABIMMUNE Microbiome Project 網站也提供了整合性的 Combined cohort,統合了所有研究定群的定序和臨床資料。

Vatanen et al., 2019

2. DIABIMMUNE Microbiome Project 的臨床資料


從 DIABIMMUNE 計畫的官方網站或是相關發表皆可下載各研究定群的臨床資料。因為 Combined cohort 的臨床資料已經校正了其他定群內不一致的紀錄,所以 Dr. Vatanen 建議我們優先使用之。

Combined cohort 的臨床資料涵蓋了嬰兒的分娩方式、早期飲食型態、糖尿病檢驗結果與體格成長狀況等資訊。這些資訊又分為兩類,maternal age at delivery, gestational diabetes, gestational age in days, mode of delivery, gender, country of birth, cohort and HLA risk class 是所有研究對象皆具的臨床變數,其餘臨床變數則有數量不一的缺失值。


adapted from the supplementary information provided by Vatanen et al., 2019

3. DIABIMMUNE Microbiome Project 的定序資料


此研究使用 Caporaso et al 設計的 515F/806R primers (2012),並採單步驟 PCR 法建立 16S rRNA 基因 V4 區域的定序文庫(擴增片段為 253 bp),接著混合不同樣本在 Illumina Miseq 平台,以讀長 175 bp 從文庫的兩端定序,計有 97 bp 長的重疊區域可供雙端序列合併。混樣定序的結果隨後以 ea-utils 拆分,順向和逆向各得 3989 個以樣本辨識碼命名的 fastq 檔案。由於部分樣本的定序品質不符標準,所以論文只提供其中 3204 個樣本的臨床資訊。

根據 Dr. Vatanen 所述,16S 定序資料是從定序公司得來的原始數據,而 metagenomic shotgun sequencing 資料則已用 Kneed 過濾潛在的宿主基因汙染。

可是我檢查後卻發現, 有些 16S V4 序列的讀長僅有 100 bp,而且含有論文沒提及的 Nextera transposase sequence,所以我懷疑這些資料可能被 Illumina Hiseq libraries 汙染。詢問 Dr. Vatanen 後,他也認為可能是樣本製備過程中發生的交叉汙染。因此使用 16S 資料前可能要排除這些樣本,或是依照長度和 Nextera sequences 清單過濾這些序列。

4. DIABIMMUNE Microbiome Project 相關發表




T. Vatanen, A. Kostic, E. d’Hennezel, et al. (2015) Variation in microbiome LPS immunogenicity contributes to autoimmunity in humans. Cell.


沒有留言:

張貼留言