一般生物體中的的RNA中,rRNA占絕大多數,含量超過(guò)90%,而mRNA的含量在1-2%,左右,轉錄組測序文庫是以樣本的Total RNA為基礎,從中提取mRNA構建測序文庫,因此文庫構建包括mRNA富集和碎片化、mRNA反轉錄、接頭添加和PCR富集等過(guò)程。
mRNA富集
在生物的Total RNA中,mRNA所占比例很低,絕大部份時(shí)核糖體RNA (rRNA),因此如果直接使用Total RNA進(jìn)行測序,得到的結果必然是不準確的,因此需要先將Total RNA中的mRNA分類(lèi)純化出來(lái)。
轉錄組測序的文庫根據待測樣品的物種分為真核轉錄組和原核轉錄組。由于真核生物和原核生物mRNA結構不同,因此在mRNA富集時(shí)所采用的方法也并不相同。
真核生物mRNA中含有polyA尾結構,因此可以使用oligoT與其特異性的匹配,從而在Total RNA中特異性的富集mRNA。
然而,原核生物并不像真核生物mRNA具有polyA的結構,因此,無(wú)法直接利用oligoT將mRNA純化出來(lái),目前,提高原核生物中mRNA的量,最主要的方式是去除Total RNA中rRNA。
由于測序儀器不能直接對RNA測序,所以還要反轉錄成cDNA
鏈特異性文庫
由于轉錄組文庫構建過(guò)程中要將mRNA反轉錄為雙鏈的cDNA,因此,在測序時(shí),即會(huì )同時(shí)得到cDNA雙鏈的序列信息,這就消除了mRNA單鏈的特性,無(wú)法區分cDNA中的正義鏈和反義鏈。
因此提出了另一種文庫構建方式,鏈特異性文庫,其在文庫制備和測序中保留mRNA 的方向信息,使得有效數據增多,基因表達定量更準確;基因注釋更準確,新基因識別等分析更可靠;同該方法能夠鑒定與開(kāi)放閱讀框反義的ncRNA、發(fā)現反義轉錄本。
其建庫原理與普通轉錄組類(lèi)似,不同之處在于合成第二鏈cDNA時(shí),用dUTP代替dTTP,此時(shí)第二鏈cDNA上布滿(mǎn)了含dUTP的位點(diǎn)。
在接頭連接后用一種特定的酶,其可在尿嘧啶位置產(chǎn)生一個(gè)單核苷酸缺口,從而消化掉第二鏈cDNA,只保留第一鏈cDNA,隨后進(jìn)行PCR擴增純化,得到只含第一鏈cDNA信息的文庫。