學位論文來不及印的應對策略

有些學校要求繳交精裝版碩士論文,但精裝版往往要三天以上的製作工時,若不及準備好所有文件該怎麼應付?

狀況一:來不及印精裝本,但已經準備好內文和應附文件

先印平裝本,再申請抽換論文,將平裝本換成精裝本

狀況二:仍有時間印精裝本,但應附文件尚未備齊

先印精裝本,再將應附文件膠封到精裝本內

狀況三:仍有時間印精裝本,但未改完內文

先印平裝稿,再申請抽換論文,同時更動電子和紙本論文

狀況四:仍有時間印精裝本,但內文沒改完,應附文件也還沒備齊

應該只能申請保留成績並延期離校了

Gastroenterology: 嬰兒排遺微生物相之發展及其與分娩方式、飲食及過敏疾病的關聯

Galazzo et al. (2020) Development of the Microbiota and Associations With Birth Mode, Diet, and Atopic Disorders in a Longitudinal Analysis of Stool Samples, Collected From Infancy Through Early Childhood. Gastroenterology.

1. 緒論


(1) 出生後的腸道微生物拓殖攸關免疫系統發育與成熟,許多流行病學研究指出,嬰兒腸道微生物與哮喘及過敏性疾病息息相關。(2) 儘管與過敏或哮喘相關的微生物已被辨識,但何者對疾病有正面影響,又何者有負面影響仍不明確。

(3) 這種現象可能是方法學差異、樣本數不足或沒有控制好混淆因素所致。(4) 此外,雖然橫斷研究設計普遍用於探討微生物相與疾病的關係,但難以排除反向因果關係;而縱向研究設計雖然能克服反向因果的問題,但有限的縱向研究欠缺足夠的追蹤時間,所以仍難以了解腸道微生物相的變化與病程的關係。

(5) 因此,Galazzo et al. 追蹤 440 名嬰兒周歲前的排遺樣本微生物變化 (n = 1453),藉由提升樣本數來排除臨床上的混淆因子,以研究腸道高度複雜且動態的微生物生態系。

【解析】句子 (1) 說明主題和研究重要性,句子 (2) 提出研究問題,句子 (3) 、(4) 解釋研究難題:「橫斷研究難以釐清因果,而縱向研究的樣本數又不夠」,句子 (5) 解釋研究策略(增加樣本數)和研究目的。

2. 結果


(1) 產後 13 、21、31 周,哺乳解釋了最多的腸道微生物組成變異(以 EnvFit 建模,用 r^2 度量解釋率)

(2) 產後 13 、21、31 周,腸道微生物組成因哺乳與否而異 (Permutational multivariate analysis of variance based on unweighted UniFrac)

(3) 相較於哺乳,添加副食僅在產後 31 周與腸道微生物組成相關,而且關聯性也較哺乳低。

(4) Bifidobacteria、staphylococci、streptococci 的相對數量在停止餵食母乳後顯著下降,而 Lachnospiraceae 的細菌之相對數量則上升 (Multivariate Analysis by Linear Models)

(5) 哺乳的時間長短與微生物相年齡負相關 (Multivariate Analysis by Linear Models)

【討論】依據結果 (1)、(2)、(3),Galazzo et al. 推論唯有在離乳後,隨著母乳寡糖及其降解物質減少,才會加速腸道微生物相成熟的進程(即能代謝複雜碳水化合物的菌屬成為腸道的優勢菌屬)。

原則上,哺乳佔嬰兒飲食的比例會隨年齡增長而下降,相對地,攝取副食品的比例會逐漸上升。我最初以為微生物相的變化可能會反映飲食型態的轉變模式。然而此文及其引用的文獻卻指出,添加副食只有在離乳後才會對腸道微生物相有影響。

這個現象意味著,與哺乳相關的微生物特徵和母乳攝取量無關,亦或是離乳對腸道微生物的影響遠大於母乳攝取量的影響。(不過也可能是推論的基礎有誤,或許這些嬰兒的飲食變化是劇烈而非漸進的)

3. 句型


We first examined the compositional changes in the microbiota during infancy and compared this to the school age microbiota composition.

To identify covariates associated with the microbiota dynamics during infancy, we continued our analyses focusing on the infant samples. 

To further investigate whether differences in microbiota development precede the onset of atopic disease, we applied several longitudinal analyses while controlling for potential confounding factors by adjusting for other covariates. 


Microbiology: 人類嬰兒排遺樣本內的腸道微生相在首次引入副食後的決定因素

Fallani et al. (2011) Determinants of the human infant intestinal microbiota after the introduction of first complementary foods in infant samples from five European centres. Microbiology.

1. 緒論


(1) 早期發生在嬰兒腸道微生物的事件可能對慢性疾病的發展有長遠影響。(2) Fallani et al. 先前曾指出腸道微生物初期的拓殖深受嬰兒飲食行為、分娩方式、國籍和抗生素施用影響。(3) 在此研究中,Fallani et al. 則要檢視腸道微生物在離乳期間的變化。

(4) 離乳期間,嬰兒的腸道出現新的不可消化碳水化合物,消化系統和免疫系統也逐漸成熟。這些環境條件的變化可能影響微生物的組成。(5) 然而,目前針對嬰兒腸道微生物在離乳期間之變化的研究有限,而探討離乳前的飲食和各項臨床因素在引入副食後對腸道微生物之影響的研究也闕如。

(6) 因此,Fallani et al. 分析了來自五個歐洲國家的嬰兒在離乳前後採集的排遺樣本內的微生物,探討嬰兒腸道微生物在離乳期間的變化,並評估影響此過程的其它臨床因素。

2. 解析


句子 (1) 說明主題和重要性,句子 (2) 作為鋪陳,以說明研究目的(句子 (3))。句子 (4) 預測「離乳 → 腸道環境變化 → 微生物組成改變」。句子 (5) 說明研究利基,句子 (6) 具體說明研究目的和內容。

3. 句型


Early events in the bacterial colonization of the human gut may have long-term consequences for the development of chronic diseases, including allergies.


Anaerobe: 利用 FISH 描繪餵食配方奶和母乳的嬰兒之排遺樣本微生物相

Bezirtzoglou, Tsiotsias, and Welling (2011) Microbiota profile in feces of breast- and formula-fed newborns by using fluorescence in situ hybridization (FISH). Anaerobe.

1. 緒論


(1) 由於微生物涉及宿主的營養代謝、免疫運作與致病機制,正常的微生物相攸關宿主的健康。(2) 為了瞭解微生物與宿主生理及健康的關聯,精確測量微生物的組成相當重要。(3) 既有研究受限於培養方法,僅能探討可培養的菌群,而這些菌群也可能受培養環境的選擇性影響(特異性太差或靈敏度太低)。(4) 這兩項因素導致基於培養方法的研究無法充分比較人體共棲菌群的差異。

(5) 若能更細緻地紀錄排遺樣本的微生物相,將有助於我們了解腸道疾病的病理機致,也能提升治療手段的效率和特異性。(6) 此外,增進腸道微生物變化的知識有助於我們了解健康人與患者的腸道微生物生態。(7) 然而培養方法難以反映腸道微生物在處於不同狀態的宿主的變化。

(8) 近年來,分子技術逐漸用於微生物生態學研究,這些技術使排遺微生物的研究能克服培養方法的限制。(9) Fluorescence in situ hybridization (FISH) 是其中最直接,且能辨識複雜生態系統中單一細胞的技術。(10) 因此 Bezirtzoglou, Tsiotsias, and Welling 使用 FISH 來比較餵食配方奶和母乳的嬰兒之排遺樣本微生物相,以取得培養學方法無法獲得的資訊。

2. 解析


句子 (1) 說明重要性,句子 (2) 提出研究問題。句子 (3)、(4) 說明研究難題和既有研究的限制,句子 (5)、(6)、(7) 解釋若不解決這些難題會有什麼後果。句子 (8) 呈現克服難題的轉機,句子 (9) 說明克服難題的策略,句子 (10) 表明研究目的。

簡而言之,此文的核心概念是:「測量微生物的方法很重要,過去的方法不好,所以我採用新方法來研究微生物。」不過雖然說明了重要性和必要性,但沒有解釋為什麼 FISH 比其他技術好。不過這也許是當代的常識,所以才沒有特別提點。

3. 句型


Previous work in intestinal ecology has been greatly hampered by the inaccuracy and limitations of culture methods.

Moreover, if we can gain a better understanding of the colonization pattern and its developmental changes, then we will have a better foundation for understanding infant gastrointestinal ecology in health and disease. 

FEMS Microbiol. Ecol.: 利用即時 PCR 和北方墨點法定量嬰兒排遺內的腸道細菌

Hopkins et al. (2005) Characterisation of intestinal bacteria in infant stools using real-time PCR and northern hybridisation analyses. FEMS Microbiology Ecology.

1. 緒論


(1) 腸道細菌的拓殖受飲食、環境、抗生素施用及年齡影響。(2) 由於哺乳及益生菌在預防腸道疾病的功效,許多研究探討了哺乳與腸道微生物的關聯。(3) 即時 PCR 可以克服難養菌的限制,也能研究北方墨點法無法偵測到的少量細菌。(4) 因此 Hopkins et al. 分別使用即時 PCR 和北方墨點法,定量常見的腸道微生物並了解其與飲食型態的關聯,聚焦的菌群如下:

  • Bacteroides and bifidobacteria 在碳水化合物的代謝中扮演重要角色,其中常用作益生菌的 bifidobacteria 是嬰兒腸道的優勢菌群。
  • Enterococcus faecalis (一類兼性厭氧菌)是許多感染性腸炎的病原,且被認為與逐漸盛行的抗藥性有關。
  • Dissimilatory sulfate-reducing bacteria 可能與發炎性腸道疾病有關。

2. 解析


句子 (1) 說明研究主題,接著利用句子 (2) 的推理點出研究問題:「腸道微生物與哺乳行為的關聯是什麼?」(推理方式:哺乳與預防疾病有關 → 益生菌與預防疾病有關 → 哺乳可能透過改變腸道微生物達到預防疾病的效果 → 研究哺乳與微生物的關聯)。

Hopkins et al. 沒有明確指出研究難題(或研究立基)是什麼,但從句子 (3) 看來,應該是想表達即時 PCR 和北方墨點法可以相輔相成,克服培養學的部分限制。最後句子 (4) 解釋了選擇的研究目標和理由。

由於腸道菌與飲食的關聯是一個很大的題目,所以論文標題有「使用某某技術」的字眼限制研究範圍。不過即使如此,問題還是沒有很明確,這可能是因為早期的腸道微生物研究仍在探索階段的關係。

3. 句型


The composition of the microbiota in babies has been the subject of a number of investigations, aimed at identifying how breast-feeding confers protection against intestinal diseases.

Pediatrics: 影響嬰兒早期腸道微生物組成的因素

Penders et al. (2006) Factors influencing the composition of the intestinal microbiota in early infancy. Pediatrics.

1. 簡介


由於腸道微生物攸關人體健康,了解腸道微生物的組成與建立相當重要。雖然已有文獻報導分娩方式、飲食和環境等因素與腸道微生物的關聯,但這些研究多半僅聚焦特定因素,且涵蓋的樣本數有限,以至於難以符合隨機分派的研究標準。

因此,Penders et al. 在荷蘭施行了一項前瞻性研究,分析千餘名足月嬰兒的排遺樣本,以透過大規模的調查,來評估影響嬰兒早期腸道微生物組成的多種因素。

2. 解析


可能因為這是項探索性研究,所以論文中沒有把問題描述得很清楚。

  • 主題:影響嬰兒腸道微生物相的因素
  • 疑難:樣本數不足以符合隨機分派的標準,以至於無法排除干擾因素的影響
  • 策略:使用更多的樣本

3. 句型


Because the gut microbiota is involved in many aspects of human health, it is important to understand how the composition of this microbial ecology is established. 

The aim of this study was to examine the influence of a broad range of potential determinants of gut microbiotic composition in a prospective cohort study in the Netherlands.

Although determinants of gut microbiotic composition were investigated previously in several studies, those studies focused on only 1 or a few determinants at a time and generally involved a limited number of infants.

FEMS: 離乳期間嬰兒排遺微生物相的縱向研究

Magne et al. (2006) A longitudinal study of infant faecal microbiota during weaning. Federation of European Microbiological Societies.

1. 簡介


嬰兒腸道微生物相受多種環境因素影響,其中以飲食型態最為重要。相較於餵食配方乳,餵食母乳可能助長嬰兒腸道中的 bifidobacteria 並抑制 Bacteroides、Clostridium 和 Enterobacteria 等厭氧菌的增殖。

由於腸道微生物可作為防範病原的屏障,哺乳可能保護嬰兒免於特定疾病。以痢疾和呼吸道疾病為例,相較於提早餵食副食品的嬰兒,在發展中國家中這兩項疾病在哺乳的嬰兒之盛行率較低。

儘管添加副食可能影響嬰兒排遺樣本的微生物相組成,相關的研究仍然有限。雖然曾有研究以培養方法發現 Enterococci 和 Bacteroides  的數量在已添加副食品的嬰兒(六個月大)中較高,但此研究並沒有控制各嬰兒的飲食型態,因此難以評估飲食對腸道微生物的影響。此外,由於飲食型態的轉變是漸進過程,所以也增添評估副食影響的難度。

鑒於這些困難, Magne et al. 統一研究對象的飲食內容(餵食相同的配方乳),並將嬰兒的飲食階段分為哺乳期、哺乳配合配方乳、僅餵食配方乳三個階段,使用 PCR-temporal temperature gradient gel electrophoresis 評估排遺樣本內的微生物在離乳期間的變化,以了解飲食轉變對於腸道微生物的衝擊。

2. 解析


  • 主題:嬰兒腸道微生物相與飲食行為轉變的關係
  • 觀察:在開發中國家裏,哺乳嬰兒的痢疾與呼吸道疾病盛行率低於提早添加副食者
  • (假說:飲食影響腸道微生物組成、部分微生物能防範病原入侵、哺乳能助長益菌發展)
  • (預測:添加副食對嬰兒腸道微生物相可能有別於哺乳的影響)
  • 缺口:既有研究沒有控制飲食型態、飲食轉變是漸進過程
  • 解方:控制飲食內容、分期觀察
  • 目的:透過前述解方研究腸道微生物相在飲食轉換期間的變化

3. 句型


The difficulty in understanding the effects of supplementation lies partly in the fact that, in human infants, supplementary foods are usually added gradually, and the total daily intake of breast milk declines progressively until weaning is completed.

J. Pediatr. Gastroenterol. Nutr.: 健康且哺乳嬰兒的腸道微生物與免疫標記物在副食哺餵期間之轉變

Amarri et al. (2006) Changes of Gut Microbiota and Immune Markers During the Complementary Feeding Period in Healthy Breast-fed Infants. Journal of Pediatric Gastroenterology and Nutrition.


1. 簡介


嬰兒無菌的腸道在出生後逐漸被細菌拓殖。雖然各研究的結果有些差異,但親餵與瓶餵的嬰兒之腸道微生物發育模式不同,哺乳嬰兒的腸道往往有較多的 bifidobacteria 和較少的 Enterobacteriaceae。在副食添加期間,哺乳的嬰兒腸道中的 enterobacteria 和 enterococci 數量漸增,隨後 Bacteroides、clostridia 和厭氧性 streptococci 也逐漸拓殖。

在離乳之後,親餵與瓶餵的嬰兒腸道的厭氧微生物逐漸演變為似於成年人腸道菌群的組成,同時兼性厭氧菌的數量也逐漸下降。目前,探討嬰兒腸道微生物演替在添加副食品和離乳期間的研究有限,少數以此為題的研究之定群規模和追蹤時數也不足。

鑒於嬰兒腸道微生物對幼兒往後健康狀況的重要性,此研究的目的是探討數種腸道微生物,以及免疫標記和腸漏指標物在嬰兒添加副食期間的轉變。

2. 解析


此文的寫法是依序解釋嬰兒腸道微生物的演替、哺乳相關的微生物相差異、腸道微生物與免疫的關聯等主題的研究成果,然後說明相關主題沒人做,所以自己跳下來做。我覺得這種寫法比較不有趣,因為沒有講解為什麼別人不做,也沒有講解解決問題的推理過程,讓人感覺問題之所以被解決,是增加資源而不是有什麼新的觀點。

3. 句型


At present, the knowledge concerning changes of the predominant gut microbiota during the period of complementary feeding (introduction of food and drink other than breast milk) is limited to a few reports with a restricted number of children, different intervals of breast-feeding and relatively short follow-up periods.

In view of the importance of gaining more knowledge in this area, the primary objective of this descriptive study was to investigate changes of selected gut microbiota in exclusively breast-fed infants during the complementary feeding period (from ages 4 to 9 months) and to evaluate changes of markers of immune function and gut permeability (secondary objectives) during this important period of life.

J. Microbiol. Methods: 結合主成分分析與 16S rRNA 基因定序的 T-RFLP:比較不同年齡之嬰兒排遺微生物相的有效策略

Wang et al. (2004) T-RFLP combined with principal component analysis and 16S rRNA gene sequencing: an effective strategy for comparison of fecal microbiota in infants of different ages. Journal of Microbiological Methods.

1. 簡介


人體的腸道微生物可能參與宿主的營養代謝、病源入侵和免疫反應的過程,進而影響宿主的健康狀況。研究健康嬰兒腸道菌群的結構與動態或能幫助我們了解過敏性疾病的成因,奠立相關疾病之預防醫學的基礎。

目前嬰兒腸道微生物的生態學知識多得自於基於培養學的研究。然而,培養技術受限於難養菌的存在及定量菌群規模的困難。雖然可透過擴增和複製 16S rDNA 來補足培養學的限制,但這類技術勞力費時,不易應用於大規模樣本的對照研究。

Terminal restriction fragment length polymorphism (T-RFLP) 是環境微生物生態學常用的技術,雖然其具有高效和便捷等優點,但分析 T-RFLP 得出的大量數據相當困難。為克服詮釋數據的困難,Wang et al. 引進主成分分析來探索,腸道正處發育階段的嬰兒之排遺微生物群變化。

2. 解析


此文的主題、背景、問題、既有研究、難點和解決方案都交代了:以腸道微生物與疾病的關聯起頭,強調研究嬰兒腸道微生物發育的重要性。接著指出培養技術和其他替代方案之缺陷,最後提出結合 T-RFLP 和主成分分析或能克服難養菌與解釋數據的困境。

3. 句型


Current knowledge of gut microbial ecology and diversity in infants is largely based on the use of traditional culture techniques.

It is clear that culture techniques have handicaps since certain bacteria are uncultivable and most media used for quantification of bacterial groups are nonspecific (Tannock, 1999).

For comparing infant fecal microbiota over time, more rapid and convenient methods are needed. One of these methods is terminal restriction fragment length polymorphism (T-RFLP) analysis. 

However, interpreting large sets of data generated by T-RFLP analysis is difficult, and a statistical evaluation is needed. 

Microb Ecol Health Dis.: 以 16S rDNA 序列差異評估哺乳與餵配方奶之嬰兒的雙歧桿菌及乳桿菌多樣性區別

Satokari et al. (2002) Diversity of Bifidobacterium and Lactobacillus spp. in Breast-Fed and Formula-Fed Infants as Assessed by 16S rDNA Sequence Differences. Microbial Ecology in Health and Disease.

1. 簡介


人體腸道微生物的拓殖使於出生後與生母及環境的接觸,隨後歷經數階段的演替逐漸形成複雜而穩定的成人微生物相。分娩方式、用藥、飲食等因素皆與腸道微生物的拓殖與演替有關。

早期的培養學研究發現,相較於餵食配方奶的嬰兒,BiŽdobacteria 是採樣自哺乳嬰兒的排遺樣本中的優勢微生物群。然而,相異研究的結果往往彼此衝突,因此與哺乳相關的微生物相差異仍無共識。 

Fluorescent in situ hybridisation、dot blot hybridisation, and 和其他以 PCR 為基礎的分子技術能更精確地辨識微生物組成差異。因此 Satokari et al. 使用 PCR 及 temperature or denaturing gradient gel electrophoresis 等技術研究腸道微生物的 16S rDNA ,比較哺乳和餵配方奶的嬰兒在離乳前後,BifidobacteriumLactobacillus 等與哺乳相關的菌群組成差異。

2. 解析


Satokari et al. 試圖以基於 16S rDNA 的分子技術研究嬰兒腸道微生物,解釋以培養為基礎的研究得出的衝突結果。只是作者沒有在導言中說清楚為什麼採用其他技術就能克服不同研究的矛盾,也沒有講解為什麼目前沒有相似研究的原因。畢竟各研究結果有異的原因可能是因為研究族群、材料、方法的差異,我覺得如果作者能解釋採用新技術優於統合分析等方法的理由,那這篇論文的問題脈絡便更清楚了。

3. 句型


Conficting results have also been obtained regarding other groups of bacteria such as Bacteroides, clostridia, enterococci, lactobacilli and enterobacteria in breast-fed and formula-fed infants.


AEM: 以分子技術監測人類新生兒的細菌群集演替

Favier et al. (2002) Molecular Monitoring of Succession of Bacterial Communities in Human Neonates. Applied and Environmental Microbiology

(期刊文獻的 Introduction 結構分析)

1. 簡介


嬰兒無菌的腸道在出生後逐漸被細菌拓殖,了解腸道微生物及影響其拓殖的因素可能提供調控微生物的機會。腸道微生物的組成深受飲食影響。當今對於嬰兒腸道微生物相的理解幾乎全數得自於基於培養方法的研究,然而腸道微生物多由難以培養的厭氧菌組成,費時的厭氧培養也限制了研究的規模。

近期,基於 16S rRNA 等分子的微生物學技術逐漸用於研究複雜的微生物生態學,但是僅有少量的研究採分子技術研究嬰兒腸道微生物。例如  Fluorescent in situ hybridization (FISH) 即用於定量分析源於不同飲食型態的嬰兒腸道微生物樣本,然而這類技術的研究範圍受限於引子的種類。

PCR 及 denaturing gradient gel electrophoresis (DGGE) 更常用於微生物生態學研究。PCR 和 DGGE 配合定序技術能夠有效地鑑識分類群,而相關技術也已被用於研究與早產兒之壞死性腸炎有關的細菌。因此,Favier et al. 使用 PCR-DGGE 探討兩名嬰兒的排遺樣本,以了解腸道細菌群集在產後十個月內的演替。

2. 解析


此研究探討與嬰兒飲食相關的腸道微生物相差異,但標題與文中強調的是以分子技術研究相似主題的開創性。因此,Favier et al. 首先提出困境:腸道微生物研究受限於可培養的細菌種類。

這問題顯然不是 Favier et al. 發現的,但為什麼前人沒辦法解決,此研究卻能夠克服克服?為了解釋這點,Favier et al. 提到了分子技術的發展使難養菌的研究便得可行,再比較不同分子技術的優劣,以支持研究的合理性。

3. 句型


So far, only a limited number of infant microbiota studies have been performed with molecular techniques.

In the present study, we investigated the feasibility of using PCR-DGGE to monitor rapid changes in the populations in the intestinal tracts of babies.

OoL Santa Fe: 生命的特例與通性 (2)

我們所知的生命形式有許多共同特徵,例如遵循分子生物學中心法則、以 DNA 為遺傳系統、使用特定手性的醣類和蛋白質等。然而既存生物的共同性源於最後普適共祖 (Last Universal Common Ancestor, LUCA) 的祖徵,探討哪些祖徵為歷史因素的偶然,哪些祖徵為形成生命的必然,是了解既存生命這項特例以及生命自身原理需解決的問題。

歸納既存生命的共同性,可得出生長、繁殖、遺傳、代謝、隔離、感應、適應等抽象特徵。由於生長和繁衍解釋了細胞成長與分裂等基本行為,演化與適應解釋了生命脫離穩定態而展現的複雜性和多樣性。在 NASA 的生命定義中格外強調生長繁殖與演化適應的重要性 :生命是能自我增殖並遵循適應性演化的化學系統。

然而,目前我們沒有在任何地外天體發現生命,而且地球生命也都有相同來源,暗示了生命形成有嚴格的條件,既存生命可能已是生命的典型形式。然而,鑑於生命最遲在地球形成後十億年內形成,米勒與尤里的經典實驗也展示了構建生命的原料能在數周內生成,意味著生命可能在環境適當的情況下迅速萌生。

假使後者符合實際情形,為什麼至今仍沒有發現源於它處的生命形式?其中一種假說是,成形的生命會阻礙往後生命的形成,以至於其中一種生命形式佔據了我們所知生命的多數。為了檢驗這項假說,除了探討生命形成的機制與模式以外,亦有研究員積極在地球尋找可能的替代生命形式(alternative types of life, alt-life) 或是在歐羅巴或泰坦等天體尋找潛在的地外生命跡象。任何新發現都能拓展對生命的認識,幫助我們釐清生命的特例與通性。

David Baum, Section 1.2 Life. Origin of life. Complexity Explorer | Santa Fe Institute

數據科學在精準醫學上的應用(楊永正老師)

除了這次的演講,我也曾在不同的課堂聽楊老師講資料科學在精準醫學的應用,因此本文正好可作為兩年來的學習小結。

利用模擬 PCR 評估 16S rRNA 基因特定變異區的長度分布

我在「怎麼處理 16S rRNA 標的基因分析中長度不一的序列?」提到可以利用模擬 PCR 來評估16S rRNA 基因特定變異區的長度分布。本文示範如何使用 SILVA 資料庫的 TestPrime 模擬 PCR 擴增 16S rRNA 基因,還有如何將 V4 區域用 Usearch 擷取出來以便統計長度分布。

怎麼處理 16S rRNA 標的基因分析中長度不一的序列?

在標識基因分析中,會以引子 (primer) 鎖定目標基因兩端的保守區,以截獲其中可提供分類資訊的變異區。例如由 Caporaso et al (2012) 設計,常用於研究人體腸道微生物的 515F/806R 引子,便能擴增 16S rRNA 的 V4 變異區,獲得長度約為 253 bp 的序列(順向擴增起點座標 - 逆向擴增起點座標 +1 - 順向引子長度 - 逆向引子長度 (806 - 515 + 1 - 19 -20 = 253 bp) )。

僅憑印象判斷,可能會以為16S rRNA V4 區域兩端的保守區間距變化不大,所以引子擴增出的序列應具有相似長度,但實際上並非如此。下圖為 DIABIMMUNE 計畫,嬰兒腸道微生物 16S rRNA V4 區域的擴增結果。雖然多數的序列集中在 253 bp,但周圍仍有長度從 37 bp 到 258 bp 的序列。

這張圖中呈現的資料已經事先經過許多處理,所以不是原始資料的長度分布。但我想以此圖說明,即使是從保守區擴增出來的片段,也不會只有一種長度。

這些長度不一的序列可能是具有生物含義的正確序列,也可能是定序和建庫過程中產生的偽序列,亦或是資料處理時引進的誤差。由於長度不一有許多成因,所以資料處理的方式也因成因而異。

此外,不同的標的基因分析流程對於序列有不同的要求,所以處理這些序列的方式也因研究議題和採用的工具而異。例如,使用 Deblur(將序列降噪為 ASVs 的工具)和 UPARSE(將序列聚類為 OTUs 的工具)等要求輸入序列長度一致的演算法時,便得在資料前處理階段統一裁切樣本中的序列;但使用 DADA2(另一種將序列降噪為 ASVs 的工具)則可省略此步。

然而,無論採取何種方法,由於多數序列的長度集中在特定範圍,序列長度在 16S rRNA 分析中可以作為判斷序列可信度的依據,透過移除極端長度者能排除偽序列或汙染序列的影響。


行天宮獎學金線上面試心得

由於疫情的關係,今年改用 Cisco Webex Meetings 視訊面試。線上面試的內容其實跟現場面試類似,只不過面試者得自己安排場地,排除可能出現的技術障礙。(這次申請我採取了新的策略,但結果還沒出來,所以本文先著重在線上面試時遭遇的問題和從中學到的教訓。)

為什麼 Illumina 平台的定序品質在序列前端和末端較差?

下圖是 Miseq 平台的定序品質報告結果,本文簡介為什麼品質平均分數呈現中間高且兩端低的分布模式。

各鹼基的平均品質分數在最初月十五個鹼基長處驟升,之後隨長度遞減


行天宮獎學金面試猜題

大學的寫作課老師曾提醒我們,不要把考試和學習混為一談。學習時碰上問題要追根究柢,但考試時面對問題不要鑽牛角尖。考場上決勝負的關鍵不是思維能力,而是辨識題型、回憶題庫、組織答覆的反應力。這項能力仰賴平時積累,只有在赴考前磨練過各種題目,才有機會在考場上當機立斷。

這份清單整理了他人分享的求職、獎學金和升學面試題目,還有我想質問自己的問題。我想,除了準備面試,這些問題也能讓我好好思考自己究竟離目標有多遠。

以梯度圖實踐三項連續變數的資料視覺化

本文簡介怎麼用 ggplot2 套件以下圖的方式表示三項連續變數關係。

Jiao 利用這三張圖展示了林木周圍不同深度和半徑的土壤微生物多樣性變化。左:細菌,中:古菌,右:真菌。Jiao et al. (2017). Soil microbiomes with distinct assemblies through vertical soil profiles drive the cycling of multiple nutrients in reforested ecosystems. Microbiome.

Single nucleotide polymorphism (SNPs)

Single nucleotide polymorphism (SNP) 是族群中,DNA上某個位置核甘酸的多樣性。以古典遺傳學的概念解釋的話,SNPs 就相當於 locus 落在單一核甘酸上,且只有 ATCG 四種表現型的等位基因。 (A site in the genome where individual members of a species differ in a single base pair)

點突變和SNP的差異


點突變(point mutaion)導致族群基因歧異,經演化篩選後仍保留至今就成了 SNPs。所以點突變是分子生物概念,SNPs 則是族群遺傳學概念:點突變是偶發現象,SNPs 則是穩定的現象。若點突變的結果沒有在族群中擴散以致滅絕,那麼此變異僅是偶發現象,不足稱為SNPs。應用時多半採取該突變於族群中的比率區分 SNPs 和點突變。

SNPs 的特性

  • DNA序列差異(長序列差異、短序列差異、單核甘酸差異)中最普遍者。
  • 世代間變異率低,相對穩定
  • 表現型簡單,利於篩選分類

Haplotype


染色體上能穩定不變並代代遺傳的一批 SNPs。其應用價值在於,如果能界定出基因上 haplotype 的區段,研究者就不須檢驗所有 SNPs,只要檢驗當中代表性的 tag SNPs 即可得知其餘在同一 haplotype 的 SNPs,能降低研究成本。 (Haplotypes are combinations of gene variants, or SNPs, that are likely to be inherited together within the same chromosomal region.)

HapMap (國際人類基因體型圖譜)


Hapmap 是在五個國家的國際合作下,進行染色體的單體型圖譜製作計畫,計畫於 2002 年 10 月於美國華盛頓舉行討論會,決定由各國共同分擔,其中有日、美、英、加、中五國,計有十一個研究中心參與計畫。
  • 選取的歐洲白人、日本人與漢族之間的等位基因有相當的差異,但日本人與漢族相當相似。
  • 因 DNA 修復、複製……等的演化讓基因高度保守,種族之間有很少的差異。但如人體免疫系統基因……等,及受環境因素、感染症等密切影響的基因多型性,在種族之間有較大的差異。
  • 在人類基因體裡發生的同源染色體重組,並不是均勻分布的,我們明確的知道,有易發生重組的熱點 (hot spot) 存在,90% 全基因體中僅發生重組的約 25%。
  • 如果要分析整個基因體,全基因體(約 95%)的覆蓋所需要的 SNPs 數量:亞洲、西方人約 25 萬個,非洲人約 50 萬個
  • 單體型 (haplotype block) 的大小,亞洲人平均約 13kb,西方人約 16kb,非洲人約 7kb
  • 發現了許多超過200萬鹼基對的大型單體型的存在,這些是以多數個存在。
  • 種族之間有許多頻率顯著不同的 SNPs。其中之一是決定耳垢類型的基因。這是由於存在於特定基因區域裡的選擇壓力。
  • 更廣泛地確認出缺失、重複等的結構多型性。
  • 存在基因的區域與不存在基因的區域相比,存在基因的區域重組率較低。

全基因體關聯分析簡介(Genome-wide association studies)

全基因體關聯分析 (Genome-wide association studies, GWAS) 是透過比較性狀組和控制組的基因差異來揭示性狀與基因的關係。具體的方式是從遍布基因體的分子標記(例如:SNPs、RFLPs、STR)中篩選出與疾病高度相關者,基於其與致病基因的連鎖不平衡,獲得可能涵蓋致病基因的基因片段供後續分析。

Nat Rev Microbiol.:生態學理論在微生物生態學扮演的角色



微生物生態學需要用理論統整新科技產生的海量資訊,建立取代經驗(empiricism and intuition)的預測模型,以發揮其應用價值。

科技進步是雙面刃,雖然 16s rRNA 擴增定序、全基因體分析、全轉錄體分析等高通量手法能補足以培養為基礎的方法之不足,然而得出的大量數據有時反而迷惑了研究者。因此作者認為目前阻礙微生物生態學進步的關鍵不在於科技瓶頸,而是缺乏理論框架解讀資料。

作者說明借鑑既有的動植物生態學理論是最佳且可行的方式,一方面可以用以統整資料,另一方面也能在微生物界檢驗既有理論,甚至能從快速生長、大生物量、無性繁殖的獨特群集屬性中發展出新的理論。建立理論後,決策者就能減少依賴應用範圍侷限的經驗和直覺,可以利用理論預測現象並提出解決辦法。

此文一方面論證應用既有生態理論的必要,另一方面也指出可能的研究方向和困難。可以用於答辯「為何要應用生態理論」或是思考研究題目。文中所提的可應用生態學理論的研究方向可分為三種:
  • 群集生態學:群集組成內容、群集多樣性與環境、能量、時間的關聯
  • 行為生態學:物種生殖策略、競爭策略
  • 時間關聯:活動力變化、空間分布
美中不足是沒有提到生態交互作用網路,需要其他文獻補充。


Curr Opin Biotechnol.:整合微型化全細胞活菌感測器於可實際運用的自動化裝置

雖然是針對偵測環境汙染的生物感測器,但實際上是在說明任何生物感測器都該注意的地方。


全細胞生物感測器(biosensor)是以微生物偵測分子,轉換為電子元件可接收的訊號後,再由電子元件分析以及統整供使用者查閱的裝置。在環境污染的情境下有兩種發展方向,首先是定期定點蒐集並分析樣本,因為採用更龐大複雜的器械,所以可以取得較精準的資料。然而因為取樣分析的手續較繁複,因此不易得到即時的資訊。另一方面,可以壓縮分析的時間和範圍,濃縮生物感測器的體積到容許裝載在可攜式平台,即時監測周遭環境。作者回顧可攜式平台的現況、發展與限制。

生物感測器的先天性限制是對於各類目標分子的偵測專一性不一,有些反應迴路僅能監測特定種類分子而非特定分子,所以偵測結果要和已知結果校正;而且生物感測器必須解決背景雜訊問題,這些問題都要在不影響感測器應用範圍的條件下解決(例如最好不要增加體積或是操作手續)。

要解決訊號的問題又有兩種策略,第一種是增加訊號強度,第二種是降低背景值。增加訊號強度可以藉由調整反應類型或是增加反應時間辦到,然而如果增加反應時間就會降低生物感測器的即時監測能力。其中一項解決辦法就是改變生物反應類型,目前生物感測器多半採取基因迴路控制來反應外界變化,然而這需要等候基因作用,於是研究者提出了替代方案,以偵測化學反應取代偵測基因表現,例如偵測細胞運動、細胞內胞器位置差異、離子濃度等方式。

降低背景值可以安裝校正參照組解決,不過這也會增加體積,或是可以發展連續測試以解決此問題。


分析到最後還是不能只靠 QIIME2

目前, QIIME2 和 mothur 等終端工具能支持16S rRNA 基因分析的許多步驟,例如原始序列處理和多樣性分析;而 MicrobiomeAnalyst 和 MG-RAST 等線上分析平台甚至不需要程式功底,只要依照指示輸入資料,便能產出附帶統計檢定的美化圖表。

我剛開始學微生物分析的時候認為,解決研究問題比排除技術障礙重要,與其陷入程式與演算法的泥沼,不如先用套裝軟體得到初步結果,等到有新想法時再用其他語言實踐。然而在嘗試各種套裝軟體之後發現,分析到最後還是得靠 R 或 Python 等語言才能滿足多變的分析需求。

以 QIIME2 為例,它的特性是整合了標的基因分析的資料前處理步驟,並納入多樣的分析模組供使用者挑選。這些功能對採取標準作業流程的定序公司,或是能產出數據的實驗團隊應該足夠,但不適合基於公開資料庫的純生物資訊研究,原因如下:
  1. 由於 QIIME2 提供的多樣性分析、排序分析和差異豐度分析是總基因體學分析的基本要素(參考:一文讀懂宏基因組分析套路),所以公開數據的提供者通常已在自己的文章中紀錄這些分析的結果。是以,只用 QIIME2 提供的功能可能沒辦法從公開數據中找到足供發表的新發現。
  1. 為了實踐分析模組化和研究重複性,QIIME2 犧牲了操作的彈性,例如把所有分析檔案封裝在特有的「.qza/.qzv」檔,也限制了輸出入的文件格式。然而在探索階段,常要測試不同分組與特定生態指標的關係,但 QIIME2 沒有資料清理的套件,所以每次分析都要重複「修改實驗設計表、修改指令、執行 QIIME2 套件、輸出視覺化檔案、上傳 QIIME2 VIEW 察看結果」等繁瑣的步驟。即使用腳本整合各個環節,分析過程中產出的大量檔案也很讓人頭痛。
  1. 此外,QIIME2 可用的圖表有限而且無法修改美學映射和視覺屬性,所以即使內建圖表很精緻,還是得在 R 或 Python 尋找替代方案。
綜上所述,我認為這類套裝軟體適合處理標準化的分析流程 ,但不適合探索式資料分析。換句話說,如果覺得跑一遍分析就足以取得可供發表的結果,那便適合使用套裝軟體。反之,如果得多方嘗試各種分析手段才有機會找到有價值的資訊,那麼使用套裝軟體不僅費時費工,還可能沒有斬獲。

國內研究生可申請的非清寒獎學金(109 年)

可撥啊,都碩二下了才在找獎學金,還發現一堆之前沒注意到的,都不知道自己錯失多少機會,我真是可撥仔喔。

Error in alpha(pseq, index = "all") : unused argument (index = "all")

使用 microbiome 套件(R 語言)分析微生物相的 α 多樣性時,要先以 alpha 指令計算多樣性指標。然而,如果使用舊版套件會跳出以下錯誤,此時只要安裝新版即可解決問題。
Error in richness(x, detection = 0, index = "observed") : unused argument (index = "observed")
而我碰到的狀況則是,昨天可以執行這指令,但今天卻不能執行。仔細檢查後發現,我在昨天跟今天分別用了不同的環境

我的 conda 裡有 R 和 Qiime 2 (內建 R)專用的環境,平常我都是用 R studio server,從桌機連線到伺服器使用 R。昨天我是在 R 環境內連線,今天則不小心在 Qiime 2 環境連線。兩邊安裝的套件種類不同,我在 Qiime2 環境內安裝的 microbiome 套件仍屬舊版,所以沒辦法順利執行。

雖然我嘗試安裝新版,但不知道為什麼安裝不成,最後是連線回 R 環境才解決這項錯誤。

總而言之,我以後得好好釐清在 conda 環境安裝 R 套件的細節以及 R studio server 的連線觀念,避免這次莫名其妙出現問題,又莫名其妙迴避問題的狀況。(可以參考這篇:在伺服器上跑R 的上手須知


bad interpreter: No such file or directory

在 Linux 執行 Perl、R 或 Python 腳本時,有幾種情況可能會跳出 "bad interpreter: No such file or directory"。

1. 打錯字


檢查 #!/usr/bin/env 有沒有拼對,如果拼錯的話也會報錯。

2. 路徑不對


即「執行Python "/bin/usr/python: bad interpreter: No such file or directory" 錯誤」中提到的問題:當腳本開頭寫成 #!/usr/bin/python 時,如果沒有主動連結到安裝的 python 版本,有可能找不到。改寫成 #!/usr/bin/env python,就會自動尋找 python 的路徑了。

3. 腳本的編碼格式不相容


Windows 記事本的格式和 Linux 的腳本不同,所以會因為隱藏的字元而無法判讀,解決方法可參考「sh腳本異常:/bin/sh^M:bad interpreter: No such file or directory」,在 vi 或 vim 編輯器下,以 :set fileformat=unix 修改腳本編碼。

DADA2 execution halted (Error in table: attempt to make a table with >= 2^31 elements)

本文純粹是技術問題。我之前以 Qiime2 外掛的 DADA2 處理已切除轉接子的 16S rRNA 基因序列 (V4 region) 時,因為以下錯誤而中斷了執行四天的程式。
Plugin error from dada2: An error was encountered while running DADA2 in R (return code 1), please inspect stdout and stderr to learn more.

MiTalk 2020 工作坊的交流機會

這次的工作坊有好幾個交流的機會,像是邀請演講(發問)、海報(私下討論)、主題討論(討論)。如同主辦人楊姍樺老師所述,參加研討會或工作坊的目的是結善緣。

即使是學有所成的教授們也會利用這些機會和其他老師互通有無,所以學生更應該克服自己害羞的個性,盡可能參與每個討論環節,逐漸習慣科學交流的生態。

讀後感|少棒的基礎 — 高掛球鞋之後

相較於影片,要以圖文解釋複雜動作有許多限制,所以此書的重點不在於老生常談的技術內容,而是引進刻意練習的帶隊觀念。

《尋找外星人》與天文生物學的科普地圖

李冰,《尋找外星人》
此書的內容中規中矩,例如德雷克公式(估計地外智慧生命數量的算式)各項次的含意,SETI(搜索地外智慧生命)和METI(發信給地外智慧生命)的目標和成效等搜索地外生命的熱門議題都點到了。

PatientsLikeMe:透過數據挖掘達到醫病互利的案例


PatientsLikeMe 是結合病友互動,醫病交流的商業網站。(此文為「轉譯醫學資訊」的課後作業,助教要求我們在瀏覽  PatientsLikeMe 的網站後,交一份心得給他。)

可能反映與嬰兒飲食相關的腸道菌相演替機制的現象

人體腸道菌群建立攸關個體健康,為理解與菌群相關的致病機制並精進目前的干預治療手段,腸道微生物學應逐步從關聯分析邁向機制研究。

過往累積的數據已辨識出許多影響菌相的外在因素,為了發掘導致現象的機制,本文試圖以生態理論和調控原理連結觀察與機制,探討可能反映飲食作用機制或菌群演替原則的現象與問題,期望可以指引出往後研究的方向。

(此文是「生物調控原理」課程的報告。這門課以系統論與建模思維,重新介紹遺傳學、生物化學、細胞生物學課程中講授的觀念。我嘗試用課堂上學到的方式,思考微生物學的研究。那時候趕著交報告,沒有很完整發展想法,也沒辦法用資料實證。現在看來除了點子天真了,可行性也受限於總基因體定序資料的精密度。儘管如此,我相信老師的建議是對的:「有想法就寫出來跟大家分享,即使只幫到一個人、只幫到自己也好。」)

預期錯誤率與序列品質篩選 (Read quality filtering)

Robert Edgar 是 UPARSE 和 UNOISE 等演算法的發明人,也是 Usearch 軟體的開發者,他的網站介紹了標識基因分析的重要概念。本文統整 Edgar 討論序列品質篩選的文章,介紹品質篩選方法和原則。

讀後感|因果經濟學

這本書似乎是科普版的計量經濟學,為瞭解因果推論的細節,我也翻了 Mostly Harmless Econometrics 。儘管看不懂,我還是挺喜歡的。人類明明那麼複雜,這些學者居然還能巧妙地利用自然實驗和工具變數等方式,間接推論關注對象間的因果關係。

想要解決科學問題不能局限於領域內的知識,凡是有機會的方法都該試試。既然微生物分析的設計碰到狀況,那麼便觀摩一下社會科學家怎麼從紊亂的世界中找到規律,看看能不能激發新想法。(但是我也得記住,科普書只是入門而已,不能期待從中得到複雜問題的解答。)


DIABIMMUNE Microbiome Project 資料簡介

DIABIMMUNE Microbiome Project,  https://pubs.broadinstitute.org/diabimmune
儘管許多研究探討腸道微生物群落的建立過程,但這些研究的資料未必開放使用。為了研究飲食與腸道微生物發育的關係,我在 NCBI SRA database 還有 EMBL-EBI MGnify 以嬰兒(infant)、腸道 (gut)、微生物 (microbiome) 等關鍵字搜尋適合的數據。雖然 DIABIMMUNE Microbiome Project 提供的資料在數據類型、樣本規模和飲食記錄等條件上非最佳選擇,但它卻開放使用。本文簡介此計畫的研究目的還有資料特性,供往後欲使用此數據的研究者參考。

Back to top