部落格將搬家到 5uperb0y.com

大家好,我是超級boy,由於網站維護和文章管理的方便性,我決定改用 hexo + git page 來發布部落格,新部落格的網址為 5uperb0y.com,終於有了自己專屬的ID了。

本站將不再更新與維護,舊文章也會逐漸搬到新網站,順便更新內容。

感謝大家對盛夏不等式的支持😌


題外話:網域年費和水煎包價目表的陳列邏輯出奇地相似(水煎包價目表截自viviyu.com)


Trimmomatic 裁切功能簡介以及比對方式的疑問

裁切序列是 NGS 品質控管重要的一環,諸如建庫時添加的人工序列和序列末端品質低落的片段等都是要移除的目標。Trimmomatic 是專門用於 Illumina 定序資料的品管軟體,它可以發揮以下功能:

  • 從 3' 端切除建庫時添加的人工序列

  • 依照四種不同的模式裁切品質不佳的序列

  • 依照平均定序品質分數篩選序列


本文著重 Trimmomatic 裁切功能的簡介與疑問。

讀後感|大數據

 巨量資料所指的,是資料量一定要達到相當規模才能做的事(例如得到新觀點、創造新價值),沒有一定規模就無法實現,而且這些事將會改變現有市場、組織、市民與政府間的關係。

巨量資料的核心重點在於「預測」。……能有大量資料作為預測的基礎,此外,這些系統也必須能夠隨著時間自動改進,從新增的資料中,判斷出最佳的信號和模式。

利用模擬 PCR 評估 16S rRNA 基因特定變異區的長度分布

我在「怎麼處理 16S rRNA 標的基因分析中長度不一的序列?」提到可以利用模擬 PCR 來評估16S rRNA 基因特定變異區的長度分布。本文示範如何使用 SILVA 資料庫的 TestPrime 模擬 PCR 擴增 16S rRNA 基因,還有如何將 V4 區域用 Usearch 擷取出來以便統計長度分布。

DIABIMMUNE Microbiome Project 資料簡介

DIABIMMUNE Microbiome Project,  https://pubs.broadinstitute.org/diabimmune
儘管許多研究探討腸道微生物群落的建立過程,但這些研究的資料未必開放使用。為了研究飲食與腸道微生物發育的關係,我在 NCBI SRA database 還有 EMBL-EBI MGnify 以嬰兒(infant)、腸道 (gut)、微生物 (microbiome) 等關鍵字搜尋適合的數據。雖然 DIABIMMUNE Microbiome Project 提供的資料在數據類型、樣本規模和飲食記錄等條件上非最佳選擇,但它卻開放使用。本文簡介此計畫的研究目的還有資料特性,供往後欲使用此數據的研究者參考。

Back to top