1 根據已知序列克隆基因 對已知序列的基因克隆是基因克隆方法中zui為簡便的一種。獲取基因序列多從文獻中查取,即將別人報道的基因序列直接作為自己克隆的依據。現在上公開發行的雜志一般都不登載整個基因序列,而要求作者在投稿之前將文章中所涉及的基因序列在基因庫中注冊,擬發表的文章中僅提供該基因在基因庫中的注冊號(accession number),以便別人參考和查詢。目前,世界上主要的基因庫有:(1)EMBL,為設在歐洲分子生物學實驗室的基因庫,其網上地址為http://www.ebi.ac.uk/ebi-home.html;(2)Genbank,為設在美國國家衛生研究院(NIH)的基因庫,其網上地址為http://www.ncbi.nlm.nih.gov/web/search/index.html;(3)Swissport和TREMBL,Swissport是一蛋白質序列庫,其所含序列的準確度比較高,而TREMBL只含有從EMBL庫中翻譯過來的序列。目前,以Genbank的應用zui頻繁。這些基因庫是相互的,在Genbank注冊的基因序列,也可能在Swissport注冊。要克隆某個基因可首先通過Internet查詢一下該基因或相關基因是否已經在基因庫中注存。查詢所有基因文庫都是免費的,因而極易將所感興趣的基因從庫中拿出來,根據整個基因序列設計特異的引物,通過PCR從基因組中克隆該基因,也可以通過RT-PCR克隆cDNA。值得注意的是,由于物種和分離株之間的差異,為了保證PCR擴增的準確性,有必要采用兩步擴增法,即nested PCR。 根據蛋白質序列也可以將編碼該蛋白質的基因擴增出來。在基因文庫中注冊的蛋白質序列都可以找到相應的DNA或cDNA序列。如蛋白質序列是自己測定的,那么需要設計至少1對簡并引物(degenerated primer),從cDNA文庫中克隆該基因。以這種方法克隆的基因必須做序列測定才能鑒別所擴增產物的特異性。 另外,在基因克隆之后,如還要進一步做表達研究,所使用的PCR酶不用Taq DNA聚合酶,而采用其他有自我檢測(reading proof)功能的酶,如pfu。這樣可以避免由于擴增過程中出現的點突變或終止密碼子而導致整個研究結論的錯誤。 2 根據已知探針克隆基因 這也是基因克隆的一種較直接的方法。首先將探針作放射性或非放射性標記,再將其與用不同內切酶處理的基因組DNA雜交,zui后將所識別的片段從膠中切下來,克隆到特定的載體(質粒、噬菌體或病毒)中作序列測定或功能分析。這種方法不但可以將基因克隆出來,還能同時觀察該基因在基因組中的拷貝數。但在探針雜交后,要注意高強度(high stringent)漂洗,以避免干擾信號,即保證克隆的特異性,同時節省時間。 3 未知序列的基因打靶 根據已知序列進行基因克隆,多數是重復別人的工作,或者是在別人工作的基礎上繼續自己的工作,因而不存在新基因的克隆過程。對未知序列的基因克隆才是真正的創造性研究。 3.1 隨機引物法克隆未知序列基因 隨機引物PCR(arbitrarily primed PCR,AP-PCR)首先被用于基因組DNA或RNA的指紋圖譜(finger print)分析,后來也有人將這種方法用于克隆與表型相關的基因或mRNA。該方法的理論依據是:表型受基因支配,在一個生物體發生了表型變化后,其基因組DNA很可能發生變化或出現不同基因的激活或關閉等;另一方面,如在寄生蟲的發育過程中,不同發育階段的蟲體所表達的基因很可能不同,如將不同發育階段的蟲體mRNA提取出來,用單一引物(隨機引物,其長度不超過16 nt)對不同時期的蟲體mRNA進行擴增比較,即可找出導致表型變異的遺傳學依據。這種方法是一種比較PCR,它要求至少有2種來自不同表型但又很類似的基因組DNA或mRNA。AP-PCR擴增后的產物必須99%是一致的,只有個別特異的產物出現在特異的表型個體中。該方法對表型或種源關系相差甚遠的生物個體之間沒有比較意義(見圖1)。 圖1 應用AP-PCR法進行2種或多種表型特征類似的個體間指紋圖譜分析或表型相關基因克隆 箭頭所指擴增帶為特異于個體(Ⅱ)的擴增產物 AP-PCR的操作一般采用兩步法,即*個循環多以較低的退火溫度(annealing temperature)進行擴增,后20個循環則采用較高的退火溫度擴增。AP-PCR產物多較短,一般需高濃度的瓊脂糖凝膠檢測,也可用聚丙烯酰胺凝膠檢測。如擴增的模板為mRNA,通過比較擴增產物的強度,可以得知該基因在2種生物或同一生物不同發育階段的表達強度。另外,在AP-PCR檢測到與某一表型相關的基因或基因產物(mRNA)以后,下一步工作就是克隆出整個基因或mRNA。主要操作程序為:(1)AP-PCR產物的提取、克隆及序列測定。首先將AP-PCR檢測到的特定片段從凝膠中切下,提取DNA克隆到適宜的載體內(如TA載體),再測定其核苷酸組成。根據其核苷酸組成設計2個方向相反的引物(P-1,P-2,見圖2)。引物長度多在20 nt以上;退火溫度在60℃以上;(2)將基因組DNA做適當酶切,然后在其兩端連接上相同的接頭(見圖2,這種接頭可從生物制品公司購買)。根據接頭的序列擴增。
3.2 Differential display PCR(DD-PCR) DD-PCR是在AP-PCR基礎上發明的一種RT-PCR方法,主要用于2種或多種類似生物個體在基因表達上的差異分析。其基本原理是:所有真核生物的成熟mRNA都含有不同長度的poly+(A)尾部序列,根據poly+(A)內部的2個核苷酸排列的不同,可以將所有的mRNA分子分為12類(見圖3)。 圖3真核生物12種mRNA的序列特點 圖4DD-PCR示意圖 箭頭所示為特異擴增產物 根據這12種mRNA序列可合成12種相應的反轉錄引物,即M’N’TTTTTTTT……,用其分別進行反轉錄,即可將所有mRNA分類合成12種cDNA(于12個試管內),然后再用隨機引物,以這12種cDNA分別做模板進行PCR擴增(見圖1和圖4),那么與表型相關的mRNA就很容易被發現并克隆出來。但不論AP-PCR還是DD-PCR,都適用于2種種源近似生物或不同發育階段的同一個體之間的比較。因而,其PCR的模板必須是來自2個生物或同一生物的不同發育階段的mRNA。DD-PCR的優點是快速、方便,可以檢測表達量極低的mRNA,但其技術條件要求較高,所擴增的mRNA的質量不能有差異,即mRNA不應降解。目前這一方法已廣泛應用于生物表型相關基因的克隆及比較研究。 3.3 Representative difference analysis PCR (RDA-PCR) 這是一種差減雜交 (subtractive hybridizatio-n)與PCR相結合的技術,其整個操作程序*不同于AP-PCR和DD-PCR。前2種方法是將兩模板DNA或cDNA分別進行PCR擴增,zui后通過擴增產物的差異,分離和克隆特異擴增帶,其缺點是需要將特異擴增產物從膠中切下來,提取DNA,再擴增后才能克隆。RDA-PCR只擴增區別于某一表型的特異基因,因而更便于擴增產物的克隆與分析(見圖5)。 其基本原理是:用一個在種源上相近的基因組將靶基因組中所有共同的基因掩蓋起來,而只暴露出特異的基因,在整個反應中只有特異基因能被擴增。其操作程序為:(1)用同一限制性內切酶(一般用Bam HI,Bgl II或Hind III)同時處理靶基因組和掩蓋基因組DNA,其中掩蓋基因組DNA的量至少要2倍于靶基因組DNA的量;(2)在經酶切的靶基因組片段的兩端加上連接頭,其序列與酶切產生的粘性末端的序列相對應;(3)將2個基因組的DNA混合后,高溫變性,低溫退火。由于掩蓋基因組DNA的量遠大于靶基因組DNA量,那么與掩蓋基因組DNA相同的靶基因就會與掩蓋基因形成雜合體,而只有特異的靶基因才能重新組合,不會受掩蓋基因的影響;(4)用Taq DNA聚合酶將粘性末端補齊后,加入與連接子相對應的引物,經過30個左右的PCR擴增,就可以將靶基因組中與掩蓋基因不同的特異基因擴增出來。這種方法的起始操作程序較復雜,各反應步驟要求準確無誤,但其檢測的準確度較高。對于基因組內的點突變、重排、插入序列等變化均可檢測出來。 4 用特異抗體克隆基因 用抗體克隆基因的關鍵是抗體的特異性。一般以單克隆抗體zui為理想。獲取特異抗體的方法主要有:(1)制備識別功能抗原的單克隆抗體;(2)將SDS-PAGE分離的蛋白質特異帶切下免疫動物,其抗體只識別該特異蛋白質;(3)用Western-blot法將識別某一蛋白質帶的抗體從膜上洗脫下來。在獲取理想的抗體后,便可以用這些抗體篩選表達型基因組文庫或cDNA文庫,從文庫中將編碼某一特異蛋白質的基因克隆出來。 5 特異基因的功能克隆 它是借助于基因產物即基因所編碼的蛋白質的功能將該基因克隆出來的一種方法。基因的功能克隆主要有2種:一是phage display,另一是peptide display。后者的原理與前者基本相同。目前以phage display的應用,本文只對這一方法加以介紹。 任何一種病原體,包括細菌、病毒和寄生蟲,在其對宿主侵入或致病過程中,病原體本身的蛋白質成分(ligand)需要首先與宿主細胞上的受體(receptor)相互識別連接。如口蹄疫病毒需要借助于受體細胞上的Heparan sulfate受體,并與其相互作用后才能侵入細胞內;巴貝斯蟲裂殖子需借助于宿主的補體作為橋梁,才能與紅細胞結合并zui后侵入紅細胞內。對病原體與宿主受體相互作用成分的特性與功能分析,是制訂免疫預防措施及制備阻斷藥物的前提。phage display法是克隆病原體ligand的一種zui為理想的手段。 圖6 phage display克隆基因示意圖 Phage display的基本操作過程為:(1)提取某一病原體基因組DNA,用超聲波將DNA切割成500~1 500的片段;(2)將片段末端用T4DNA聚合酶處理后,與載體DNA(phagemid)連接形成噬菌體質粒。用這些質粒與輔助噬菌體(helper phage)同時轉染大腸桿菌。phagemid在大腸桿菌內包裝成噬菌體,大量繁殖,同時將插入的外源基因片段表達,表達產物主要集中在噬菌體顆粒的表面;(3)將特定的受體固定于載體上(多為ELISA板),方法同一般的ELISA包被。將噬菌體懸液作適當稀釋后,加入平板孔內,感作一段時間,用PBS等緩沖液漂洗。zui后,只有表達特異功能蛋白的噬菌體才能與包被在平板上的受體相互結合,那些表達非相關蛋白的噬菌體由于不能與受體連接而被洗脫;(4)用高強度NaCl液將結合在受體上的噬菌體分離下來,再感染大腸桿菌,便可將編碼特異功能蛋白質的基因克隆。 一個真核生物至少含有10萬個不同的基因,其中只有10%~15%的基因在不同的發育時期表達,且不同的基因表達的強度相差甚遠。在致病生物中,致病力強的生物,其致病因子(往往是1種或幾種功能蛋白或酶)的表達量往往多于致病力弱的生物。從基因組中將人們感興趣的基因或其轉錄產物擴增并克隆出來,是進一步對所編碼蛋白質作功能分析的關鍵。本文介紹的幾種基因克隆的方法是近幾年應用比較廣泛的方法。在具體實驗中選擇哪一種方法,還要根據研究者所要克隆的基因及其所在的基因組和對該基因的研究背景來決定。 |