文丨尋藥真理團
基因編輯技術可以對受影響家庭進行DNA測序以提供導致每種疾病突變的深度詳細信息,以及特定基因變化(基因型)與疾病嚴重程度之間的盤點相關性。隨后通過DNA序列的文帶改變和修正,破壞有毒或抑制性基因的讀懂功能或恢復必要基因的功能來提供遺傳治療。
目前的基因技術基因編輯技術有ZFNs(zinc-finger nucleases)技術、TALENs(transcription activator-like effector nucleases)技術、編輯CRISPR/Cas9技術和BE(base editing)及PE(prime editing)技術。深度
ZFNs、盤點TALENs和CRISPR/Cas9技術是文帶將DNA打斷后依賴非同源末端連接或同源定向重組修復的方式進行修復。
BE可以將某一特定位點的讀懂特定堿基對替換為另一指定堿基對。
PE可以通過細胞自我修復機制將一段單鏈DNA整合到基因組中,基因技術而原始序列會通過細胞的編輯修復機制去除掉。
圖1. 不同基因編輯技術的深度作用原理
目前的基因編輯技術通過體細胞修飾治療患者。這些治療旨在只影響接受治療的盤點個人而并不會影響其后代。而在胚胎發生期間或之后發生的文帶基因組變化可以在一些或所有的兒童細胞中發現,包括生殖系。與體細胞編輯不同,經過種系編輯的人類可以將這些編輯傳遞給后代,因此這種基因編輯技術因有污染人類基因庫的潛在風險而不被使用。
圖2. 生殖細胞編輯
01ZFNs技術
ZFNs(zinc-finger nucleases)由決定其特異性的鋅指蛋白結構域和切割 DNA 的 Fok I 核酸酶結構域共同組成,是一種人工核酸酶。
圖3. a為ZFNs與DNA互作用示意圖,b為三聯鋅指結構配對DNA示意圖
鋅指結構是鋅配位DNA結合結構域類轉錄因子的DNA結合域所使用的一種模體。在人類基因組中有700多種蛋白質中包含至少4000個這樣的結構域,占人類基因的2%左右。它們折疊形成ββα構象,這種結構不會直接與DNA結合,而是會穩定模體中的α螺旋,并讓α螺旋中暴露在外側的側鏈伸入DNA大溝中。
圖4. C2H2型鋅指pdb(其中紅球為鋅離子)
其中最常見的一種鋅指為C2H2型鋅指由兩個半胱氨酸和兩個組氨酸與中間的鋅離子配位以穩定整個結構。
圖5. 人轉錄因子sp1第二個鋅指的pdb結構圖,圖中間灰球為鋅離子
在結構被穩定后,鋅指通過其阿爾法螺旋的-1、3、6三個位點對DNA的堿基進行特異性識別。
圖6. 人轉錄因子sp1第三個鋅指的pdb結構圖
如上圖中所示,-1位的R和6位的R特異性識別G,3位的E特異性識別C。
Fok I 是Flavobacterium okeanokoites限制性修飾系統的一員,它識別一個dsDNA的非回文序列5'- GGATG-3'-5'-CATCC-3’。
完成識別后,它會切割GGATG下游9nt和CATCC下游13nt的位點形成一個粘性末端,這意味著它有兩個結構域-DNA識別結構域和核酸內切酶結構域。
圖7. Fok1蛋白的pdb圖
FOk1必須二聚才具有活性,該二聚體的形成需要鎂離子輔助。
圖8. Fok1蛋白二聚體示意圖,D1,D2,D3代表洋紅色、綠色、白色的3個結構域,藍色結構域為核酸內切結構域
首先,Fok I單體在其識別位點與DNA結合。在Mg2+的存在下,裂解域與識別域分離。第二個Fok I分子與另一個識別位點結合,通過其裂解域與第一個分子二聚,并在第一個位點催化裂解。裂解后,兩個Fok I分子從DNA中分離出來,或者它們仍然結合在一起,并通過與與其他位點結合的Fok I分子二聚來催化更多的裂解。
圖9. Fok1切割機理示意圖
1993年Chandrasegaran和金洋均等人將3個鋅指結構域與1個 Fok I 核酸酶的水解結構域進行連接,構建出了第一個鋅指蛋白核酸酶 。它通過鋅指結構域識別DNA序列并通過Fok1的二聚對DNA進行定點切割。
圖10. ZNFs與DNA特異性識別結構示意圖
02TALENs技術
TALENs(transcription activator-like effector nucleases)技術的核心是TALE蛋白。TALE蛋白最初是在黃單胞菌中發現的,黃單胞菌是辣椒和番茄細菌性葉斑點病的主要病原體。通過對黃單胞菌關鍵致病基因avrBs3進行插入突變和缺失分析確定了avrBs3活性必需的3.6-3.7kb區域,對該區域進行測序后發現了一段氨基酸編碼區(ORF1),該區域能夠編碼具有avrBs3活性的蛋白。在另一條鏈上鑒定出另一段相似的ORF區域,兩段區域的相同點是具有17個102bp的重復序列,而該區域編碼的蛋白就是TALE蛋白。如圖1所示,TALE蛋白的主要結構分為三個部分,包括:中心結構域的串聯重復序列(Repeat domain)、核定位信號和酸性轉錄激活結構域,其中中心結構域的串聯重復序列是TALENs技術特異性識別DNA序列的區域。
圖11. TALE蛋白結構示意圖。圖中紅色區域表示串聯重復序列,黃色區域表示核定位信號,綠色區域表示酸性轉錄激活結構域。圖中展示了串聯重復序列的第一個序列,其中12、13位氨基酸為可變氨基酸
串聯重復序列一般由34個氨基酸重復單元組成,具有高度的保守性。其中12、13位的氨基酸具有高度可變性,為可變氨基酸(RVD),RVD可以識別四種不同的堿基。每一個重復序列對應識別一個核苷酸,如圖2所示。C端的第一個重復序列只有前二十個氨基酸與其他重復單元相同,稱為半重復性。
圖12. TALE蛋白中重復序列識別DNA上對應堿基示意圖.第一行代表串聯重復序列中的各個序列,以可變氨基酸的縮寫表示;第二行代表每個序列對應的堿基
通過嘗試不同的RVD氨基酸組合,得到了以下的密碼表
圖13. TALE蛋白重復序列中RVDs與核苷酸對應的密碼表.圖中堿基字母的高低代表了該堿基與相應可變氨基酸序列配對的頻率大小,表中數字代表該該堿基與相應可變氨基酸序列配對的頻率
因為TALE具有特異性識別DNA序列的能力,類似于鋅指蛋白核酸酶(ZFNs)。因此將TALE蛋白中特異性識別區域與FokⅠ核酸酶偶聯即可構建新的DNA編輯工具,稱為TALENs。由于FokⅠ核酸酶需要二聚才能發揮作用,TALENs也需要成對作用以切斷目標DNA位點。同時TALENs技術也存在脫靶現象、費用昂貴且費時、可能會引起機體免疫反應等問題。
03堿基編輯技術
堿基編輯(BE)技術提供了不引入DNA雙鏈斷裂和外源工體DNA模板的條件下,就可以對單堿基進行轉換的可能性。2016年,David R. Liu團隊首先報道了胞嘧啶脫氨酶和nCas9組成的CBE系統,可以實現C-T或G-A的轉換。
2017年,David R. Liu 團隊又開發了由腺嘌呤脫氨酶和nCas9 組成的ABE系統,可以實現A-G或T-C的轉換。BE系統主要由dCas9、sgDNA和脫氨酶組成,dCas9是失活的Cas9酶,沒有催化活性,但是可以與目標DNA結合,使得sgDNA(single guide DNA)與目標序列的互補鏈結合,繼而DNA雙螺旋打開,此時脫氨酶將單個堿基進行轉變:對于CBE系統,胞嘧啶脫氨酶將胞嘧啶變為尿嘧啶;對于ABE系統,腺嘌呤脫氨酶將腺嘌呤變為與鳥嘌呤相似的I堿基,I堿基會與C堿基配對。經過堿基變化后,兩條DNA鏈堿基不配對,互補鏈經過DNA修復之后與新堿基配對,這樣就實現了單一堿基對的替換。
圖14. CBE技術
圖15. ABE技術
堿基編輯技術具有編輯效率高、編輯損傷少等特點,但是使用脫氨酶可能增加癌變的風險,而且可能出現的脫靶效應會嚴重影響編輯效率。
BE系統的脫靶現象,2019年,David R. Liu團隊報道了開發了全新的基因編輯技術PE(prime editor),不僅較好解決了脫靶的問題,而且可以實現全部12種可能的堿基轉化。2021年,高彩霞團隊與David R. Liu 團隊合作,成功建立并優化了適用于植物的PPE (plant prime editing) 編輯系統,實現了對植物基因組精準的堿基編輯。
PE是prime editing,簡單來說就是在BE技術的基礎上引入逆轉錄的方法,不僅可以實現單個堿基轉換,還可以實現堿基敲除、添加等多種操作。PE技術的原理是通過將Cas9 H840A切口酶和逆轉錄酶偶連在一起,接著在一種含有一段RNA的pegRNA(prime editing guide RNA)引導下,靶向結合并切開一條 DNA鏈,逆轉錄生成的單鏈DNA會在該切口處與原始序列展開競爭,由于DNA修復的酶一般從5端結合DNA鏈,所以原始的鏈傾向于被清除掉,希望加入的片段優先整合到原序列中,這樣可以實現堿基替換、增減,也可以實現DNA片段的增減。
PE技術還不成熟,其可靠性有待進一步研究,而且與堿基編輯技術相似,使用逆轉錄酶和脫氨酶仍然存在安全隱患。
圖16. PE技術
04CRISPR/Cas9技術
CRISPR/Cas9 系統主要由 Cas9 蛋白和單鏈向導 RNA (sgRNA) 所組成,其中 Cas9 蛋白起切割 DNA 雙鏈的作用, sgRNA起向導的作用,在sgRNA的向導下通過堿基互補配對原則,Cas9蛋白可對不同的靶部位進行切割,實現DNA的雙鏈斷裂。
圖17. CRISPR/Cas9技術的主要原理
CRISPR/Cas9技術主要過程是crRNA結合到Cas9,Cas9核酸酶的構象發生改變,產生一條能通道,讓DNA更容易結合。Cas9/crRNA復合體能夠識別PAM(5'-NGG)位點導致DNA解旋,使crRNA找到PAM位點相鄰的DNA互補鏈。當Cas9結合到PAM位點相鄰的,與crRNA互補的DNA序列上,REC葉內部的橋螺旋和靶DNA形成RNA-DNA 異源雙鏈結構。PAM位點的識別包括可使靶DNA雙鏈斷裂(DSB)的HNH和RuvC核斷裂的激活,導致DNA降解。如果crRNA與靶DNA不互補,Cas9將會釋放出來,尋找新的PAM位點。DNA中的線性靶基因組斷裂后可以通過非同源末端接合(NHEJ)或者同源介導的修復(HDR)來進行修復,而非同源末端接合(NHEJ)會引起插入或者刪除錯誤,從而達到定點敲除某種基因的目的。
在利用CRISPR/Cas9系統進行基因組編輯的過程中,tracrRNA和crRNA可以融合成為1條RNA(sgRNA)表達同樣可以起到靶向剪切的作用。因此現在我們用的CRISPR/Cas9工具只有Cas9核酸酶和sgRNA兩部分。應用此工具,我們可以非常方便快捷地進行任意基因的編輯改造,比如基因敲除、敲入、定點突變等等。
圖18. CRISPR/Cas9技術的基因插入應用
05CRISPR/Cas9技術的主要應用
1基因敲除(Knock-out)
在通常情況下,當細胞出現 DNA 雙鏈斷裂的情況時, 會采用高效的非同源末端鏈接 (Non-homologous end join?ing,NHEJ)對斷裂的DNA進行修復。但是,在修復過程中通常會發生堿基插入或缺失的錯配現象,造成移碼突變,使靶標基因失去功能。而CRISPR/Cas9系統可以利用Cas9蛋白對靶基因組進行剪切,形成DNA的雙鏈斷裂,進而實現基因敲除。
2基因敲入(Knock-in)
當DNA雙鏈斷裂后,如果有DNA修復模板進入到細胞中,基因組斷裂部分會依據修復模板進行同源重組修復 (HDR),從而實現基因敲入。修復模板由需要導入的目標基因和靶序列上下游的同源性序列(同源臂)組成,同源臂的長度和位置由編輯序列的大小決定。DNA 修復模板可以是線性/雙鏈脫氧核苷酸鏈,也可以是雙鏈DNA質粒。HDR修復模式在細胞中發生率較低,通常小于10%。
CRISPR/Cas9技術的優勢是應用范圍廣泛,基因編輯效率更高,操作簡便,費用低廉,局限在于同源重組效率低,PAM序列依賴性還有脫靶效應。
06基因編輯技術在基因治療中的應用
從 1996 年對ZFNs 第一次進行體外驗證到2012年CRISPR/Cas9 技術的出現和之后的蓬勃發展,基因編輯技術發展迅速,編輯效率和精確性不斷提高,應用領域也不斷拓寬。不僅可用于表達調控和基因功能的研究、細胞動物模型的構建、癌基因和藥物靶點的篩選,在基因治療中更是具有巨大的發展前景,為單基因遺傳病、癌癥等疾病提供了新的治療方法。
基因治療通過導入正?;蚧蛘呔庉嬓迯腿毕莼?,實現治療疾病的目的。目前,利用基因編輯技術在多種疾病,如單基因遺傳病、眼科疾病、艾滋病及腫瘤等的基因治療中得到了應用。
圖19. 基因編輯技術發展歷程
鐮狀細胞病(sickle cell disease, SCD)是由于β-珠蛋白基因的第7 個密碼子的單基因點突變造成的。Hoban 等利用ZFNs 特異性靶向于β-珠蛋白基因,并誘導CD34+造血干細胞和祖細胞中的DNA 被切割。當ZFNs 與整合酶缺陷型慢病毒載體或寡核苷酸供體一起傳送進細胞時,有效地實現了β-珠蛋白基因座的基因矯正。Hoban 的研究為鐮狀型細胞性貧血的基因治療提供了重要的方法路徑。
基因編輯技術不僅應用于遺傳性疾病的治療,在非遺傳性疾病中也有重大的突破。與年齡相關的黃斑衰退(age-related macular degeneration, AMD)是導致成人失明的主要原因,脈絡膜新血管形成(choroidal neovascularization, CNV)是其主要病理學特征,血管生成因子如VEGFA (vascular endothelial growth factor A, VEGFA)基因的高表達是造成病變的主要原因。Kim 等將預先設計好的Cas9 核糖核蛋白 (ribonucleoprotein, RNP)導入成年小鼠眼中,使視網膜色素上皮中VEGFA 基因失活;并且在AMD 的小鼠模型中發現cas9 RNPs 有效地減少了脈絡膜新血管生成的面積。該研究表明CRISPR/Cas9 技術有可能用于非遺傳性退行性眼部疾病的局部治療。
基因編輯技術在艾滋病、腫瘤治療等領域也取得了初步進展。第一次在人類中應用靶向核酸酶是利用ZFNs 技術編輯CCR5 基因抵抗HIV。研究者從HIV 病人中提取T細胞,用ZFNs 技術干擾T細胞中CCR5 基因,由于CCR5 基因是大部分HIV 菌株尤其是早期感染菌株的輔助受體,干擾CCR5 基因的表達可以抗HIV 感染,表明基因編輯技術可能成為艾滋病治療的新方向。
基因編輯應用于腫瘤治療,主要是與免疫治療相結合,尤其是與CAR (chimeric antigen receptor) T細胞,該方法在白血病、淋巴瘤和部分實體瘤中有巨大的發展前景。CARs 包括腫瘤細胞特異抗原的胞外單鏈可變片段和細胞內嵌合信號域,可以激活T 細胞和殺傷腫瘤細胞。Ren 等使用CRISPR/Cas9 系統同時破壞多個基因位點,產生的TCR (T cell receptor)和HLA-I (HLA class I)缺陷的CAR-T細胞可作為通用的CAR-T 細胞,用于免疫治療;除了產生通用的CAR-T 細胞,基因編輯技術也可通過敲除編碼T 細胞抑制受體或信號分子的基因如PD1(programmed cell death protein 1)和CTLA4 (cytotoxic T lymphocyte-associated protein 4),用于產生增強型CAR-T 細胞。
2016 年,四川大學華西醫院盧鈾團隊開展了CRISPR 基因編輯技術的臨床實驗,從轉移性非小細胞肺癌患者中分離出T 細胞,并使用CRISPR/Cas9 技術敲除細胞中的PD-1 基因,在體外擴增到一定量后再重新輸回患者體內,達到殺死腫瘤細胞的目的但是簡單的敲除T細胞的抑制因子是一把雙刃劍,真正投入臨床使用還需要進一步研究敲除這些抑制因子是否會引起細胞的不可控制的增殖或者產生嚴重的自身免疫。
由于BE技術是在不造成雙鏈DNA斷裂的情況下進行的精確堿基轉換,這對于基因治療而言無疑是一個非常有效的工具。β-地中海貧血是由于珠蛋白基因(hemoglobin-beta, HBB)突變所致,中國和東南亞地區的發病原因主要是HBB基因A到G的突變。2017年,中山大學黃軍就團隊利用單堿基編輯技術在不能發育成熟的人類三元核胚胎中對HBB的點突變進行編輯,即將堿基G改為A從而修正錯誤。該研究是第一個利用BE技術對遺傳疾病突變位點進行精準修復的研究,為治療新生兒β-型地中海貧血癥,甚至為其他遺傳性疾病的治療打開了新窗口。Chadwick團隊也通過BE技術實現PCSK9基因的敲除,從而降低血漿膽固醇的水平。
07結論及展望
基因編輯技術的快速發展極大地提高了我們對真核細胞基因組進行精準改變的能力??删庉嫷暮怂崦?,尤其是編輯效率更高、操作簡單、成本低的CRISPR/Cas 系統,徹底改變了我們對基因組功能的研究。單堿基編輯技術的出現和不斷改進,實現了單個堿基的精準轉換,降低了脫靶效率。
雖然目前基因編輯技術仍然面臨著脫靶效率和潛在的免疫反應等副作用的問題,相信在未來多學科的交叉融合和科學家的共同合作下,新一代基因編輯技術將更加簡便、高效、精確,目前存在的問題也會逐步得到解決。隨著人們對疾病新的有效靶點的研究突破,特別是對那些傳統療法難以治愈的疾病,可以通過糾正致病基因或引入有益突變來達到治愈疾病的目的?;蚓庉嫾夹g的臨床轉化和應用研究值得拭目以待,這將成為下一代轉化療法和治療范例的關鍵,也將促進個體化醫療的快速發展。
參考文獻:
邱志超, 李卓霏, 石宏. "基因編輯技術及其在疾病治療中的研究進展和應用前景." 昆明理工大學學報:自然科學版 46.5(2021):10.
Y. G., et al. "Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain.” Proceedings of the National Academy of Sciences of the United States of America (1996).
Doudna, J.A. The promise and challenge of therapeutic genome editing. Nature 578, 229–236 (2020).
Bitinaite et al. "FokI dimerization is required for DNA cleavage. " Proceedings of the National Academy of Sciences of the United States of America (1998).
來源:新浪醫藥。