科學也可以如此靠近

2017年諾貝爾化學獎揭曉: 冷凍電鏡技術獲獎


2017年10月04日00時 今日科學 博科園
博科園

北京時間10月4日17時45分許,瑞典皇家科學院在斯德哥爾摩宣布將2017年度諾貝爾化學獎授予瑞士洛桑大學的Jacques Dubochet、美國哥倫比亞大學的Joachim Frank 和英國劍橋大學的Richard Henderson,以表彰他們在「發展冷凍電子顯微鏡在生物大分子高分辨結構解析」方面的貢獻。

冷凍電鏡(Cryo-EM)領域在過去四十多年裡面的發展和逐漸成熟當然並不只包括Richard Henderson, Joachim Frank和Robert M.Glaeser三個小組的貢獻。近期在探測器和圖像處理方面更是取得了突破,使得解析度達到X射線晶體學的水平。

化學獎得主

Richard Henderson是蘇格蘭人,愛丁堡大學獲得物理學位後,於1969年在劍橋大學分子生物學實驗室獲得博士學位,在美國耶魯大學做過博士後研究之後,於1973年回到劍橋大學至今。

Joachim Frank原來是德國人,1970年在慕尼黑技術大學獲得博士學位之後,在美國遊學兩年多,然後在劍橋大學卡文迪許實驗室做研究助理,1975年任職於美國紐約州Albany的公共衛生實驗室(Wadsworth Center),2008年加入哥倫比亞大學生命科學系。

Robert M. Glaeser於1964年獲得UC Berkeley的生物物理學博士學位,並在牛津大學和芝加哥大學從事量子化學的博士後研究,之後回到UC Berkeley做教授和退休教授至今。

2007年12月的美國國家科學院院刊(PNAS)曾刊登過一篇Joachim Frank當年當選美國科學院院士之後的採訪介紹(Profile of Joechim Frank). 這篇介紹中講述了Frank的科學生涯和致力於低溫電鏡技術發展以及推動其在生命科學中應用的過程。

以上是關於今年化學諾獎信那麼關於冷凍電鏡單顆粒技術可看下文:《冷凍電鏡單顆粒技術的發展、現狀與未來》

1 引言

在低溫下使用透射電子顯微鏡觀察樣品的顯微技術,就叫做冷凍電子顯微鏡技術,簡稱冷凍電鏡(cryo-electron microscopy, cryo-EM)。冷凍電鏡是重要的結構生物學研究方法,它與另外兩種技術:X射線晶體學(X-ray crystallography)和核磁共振(nuclear magnetic

resonance,NMR)一起構成了高解析度結構生物學研究的基礎,在獲得生物大分子的結構並揭示其功能方面極為重要。

電子顯微三維重構技術起源於1968 年,D.J. De Rosier 和Aaron Klug 在Nature 上發表了一篇關於利用電子顯微鏡照片重構T4 噬菌體尾部三維結構的著名論文,提出並建立了電子顯微三維重構的一般概念和方法。Aaron Klug 本人也因為這個開創性的工作獲得了1982 年的諾貝爾化學獎。

為了降低高能電子對分子結構的損傷,Kenneth A. Taylor 和Robert M. Glaeser 於1974

年提出了冷凍電鏡技術,並且用於實驗研究。經過三十多年的發展,冷凍電鏡技術已經成為研究生物大分子結構與功能的強有力手段。冷凍電鏡本質上是電子散射機制,基本原理就是把樣品凍起來然後保持低溫放進顯微鏡裡面,利用相干的電子作為光源對分子樣品進行測量,透過樣品和附近的冰層,透鏡系統把散射信號轉換為放大的圖像在探測器上記錄下來,最後進行信號處理,得到樣品的三維結構。

在超低溫的條件下,電子帶來的輻射損傷被有效控制。即便如此,分子樣品所能承受的輻射劑量也是非常低的,導致信噪比非常低。另外,隨著觀測的進行,額外的電子會累積而造成分子的移動,導致獲得的圖像變得模糊。這就好比用一個簡單的傻瓜相機拍攝在雨中飛馳的子彈,得到的影像必然是模糊的並且充滿噪音。因此,冷凍電鏡的方法技術在很長時間內只能確定個頭比較大的樣品的結構,比如病毒顆粒的結構,而且通常解析度都不高。然而隨著工程技術和算法的不斷發展,能夠確定的解析度也越來越高(圖1(a)),2016

年發布的谷氨酸脫氫酶結構的解析度甚至已經達到了1.8 Å。與此同時,也有越來越多的通過冷凍電鏡技術得到的研究成果發表在高水平的期刊上(圖1(b)),冷凍電鏡正備受科學界的關注。

圖1 冷凍電鏡技術和單顆粒重構技術越來越備受關注(統計數據來源於EMDataBank )(a)不同年份中利用冷凍電鏡單顆粒重構技術能夠達到的最高解析度;(b)通過冷凍電鏡技術進行的研究成果在不同雜誌上發表的論文數

在最近幾年,冷凍電鏡技術有了革命性的進步,主要得益於三個方面的突破。首先是樣品製備,通過利用薄膜碳層甚至石墨烯可以用更薄的冰層包裹分子樣品來提高信噪比。第二個突破是電子的探測技術,也就是電子探測器的發明。在300 keV

電子的轟擊下,傳統的器件都會被高能量打壞,因此在電子探測器出現之前,冷凍電鏡中使用的CCD相機需要將電子打在探測器上變成光信號,再通過CCD 把光信號轉成電信號後得到圖像,「電光—光電」轉換的過程降低了信噪比。而現在電子探測器能夠直接探測電子數量,同時,互補型金屬氧化物半導體(CMOS)感光元件的應用使得探測器支持電影模式(movie

mode),可以在一秒鐘之內獲得幾十張投影圖片。通過後期對樣品進行漂移修正,再把這幾十張圖片疊加起來,從而大幅提高成像的信噪比。模糊的子彈一下子變得清晰,冷凍電鏡的解析度不斷上升。第三個突破是計算能力的提高和軟體算法的進步。冷凍電鏡的模型重構通常需要對幾萬甚至幾十萬張投影圖片進行分析、組裝和優化。這需要先進的計算資源配合有效的算法才能實現。基於貝葉斯理論的模型重構框架解決了這個問題,我們在下文中詳細介紹。綜上所述,冷凍電鏡技術不僅提高了空間解析度,而且可以應用於很多以前不能解決的生物大分子的結構研究。

具有里程碑意義的成果是,2013 年加州大學舊金山分校(UCSF) 程亦凡和David Julius 的研究組首次得到膜蛋白TRPV1 的3.4 Å 近原子級別高解析度三維結構,結果發表在Nature 上。我國在冷凍電鏡的應用領域也有很大突破,代表性工作包括清華大學的施一公研究組和劍橋大學MRC 實驗室Sjors H.W. Scheres

研究組合作在2015 年獲得的γ 分泌酶複合物結構( 圖2(c)), 以及2015 年清華大學高寧研究組和香港科技大學戴碧瓘研究組合作得到的3.8 Å 的真核生物MCM2-7 複合物結構;2015 年北京大學毛有東研究組、歐陽頎研究組與哈佛醫學院吳皓研究組合作得到炎症複合體的高解析度三維結構(圖2(a));2014 年中國科學院生物物理研究所朱平研究組和李國紅研究組合作得到的30 nm

染色質左手雙螺旋高級結構(圖2(b))以及2016 年中國科學院生物物理研究所柳振峰、李梅、章新政三個研究組合作得到3.2 Å 的捕光複合物II 型膜蛋白超級複合體結構。這些成果在結構生物領域得到巨大的反響,這也使得冷凍電鏡高解析度成像技術獲得空前的關注。

圖2 我國在冷凍電鏡領域中獲得高質量的研究成果(a)近原子解析度的炎症複合體結構(圖中NBD為核酸結合結構域,HD1 為螺旋結構域-1,WHD為翼螺旋結構域,HD2 為螺旋結構域-2,LRR為亮氨酸重複序列);(b)30 nm 染色質左手雙螺旋高級結構;(c)3.4 Å 的人源γ 分泌酶複合物結構(圖中NCT是一種I

型單次跨膜糖蛋白,APH-1 為前咽缺陷蛋白-1,PS1為早老素-1,PEN-2 為早老素增強子-2)

2 圖像處理技術

經過多年的發展,目前冷凍電鏡的數據處理部分主要包含了以下的流程(圖3):

(1) 襯度傳遞函數的修正(CTF correction)

(2) 樣品分子投影數據的篩選(particle selection)

(3) 二維投影數據的分類和降噪(2D analysis)

(4) 三維模型的重構和優化(3D reconstruction and refinement)

(5) 多重構象的結構分析(heterogeneity analysis)

(6) 對重建結構解析度的分析(structure resolution assessment)

(7) 結合生物化學原理和實驗數據對三維結構的解讀(model interpretation and validation)

圖3 冷凍電鏡數據分析處理流程

圖像處理軟體的發展對冷凍電鏡單顆粒重構技術極其重要,當前廣泛使用的電鏡分析軟體系統主要包括SPIDER,EMAN2, FREALIGN,SPARX,RELION等。對於剛剛接觸單顆粒重構技術的人來說,更偏好集成的軟體套裝來完成整個分析流程。我們在表1 中列出了大部分主流的綜合冷凍電鏡圖像處理軟體,以供參考。

表1 冷凍電鏡中流行的圖像處理軟體

2.1 襯度傳遞函數估計與修正

襯度傳遞函數(contrast transfer function,CTF)是在數學上描述通過透射電子顯微鏡得到樣品圖像上的像差變化。準確地判斷襯度傳遞函數對於確認顯微圖像的質量以及後續的三維結構重建極為重要。常用的估算襯度傳遞函數的參數軟體是CTFFIND4。確定了CTF

的參數以後,就可以對採集到的冷凍電鏡圖像進行修正。這個修正過程其實就是圖像處理中的圖像復原技術。

2.2 顆粒挑選

接下來需要從原始數據中篩選出顆粒投影,也被稱為「顆粒挑選」,顆粒挑選的好壞也將影響所有後續的分析和處理過程,是一個重要並且繁瑣的步驟。顆粒挑選方式可以分為手動挑選、半自動挑選和完全自動挑選這幾種。

在早期的分析中,對於結構的了解還非常少,優先考慮的都是人工挑選。但是自動的顆粒圖像獲取方法的出現使得在很短時間內可以收集數十萬張顆粒圖像,人工挑選大量的顆粒圖像不太現實,並且人工的挑選通常會過於集中於某一類顆粒圖像,導致遺漏和偏差。

半自動和全自動的方法主要有以下三類:

(1)通過例如降噪、反襯增強、邊緣算子等圖像形態學方法搜索區域,基於數字圖像處理學的原理,將顆粒圖像與背景分離開來。

(2)基於模板的方法,通過掃描數據圖像和已知的模板比較來挑選出潛在的顆粒圖像,模板的來源通常為手動選出的數據圖像中較為清晰的顆粒圖像,或者是已知結構的投影。

(3)結合無模板和有模板的方法,通過一些有監督的機器學習算法進行顆粒挑選。

隨著圖像識別領域中深度學習方法的流行,各類基於深度學習的顆粒識別框架也被引入到顆粒挑選的過程中。隨著深度學習方法的發展,相信如何把深度學習方法應用到單顆粒冷凍電鏡圖像分析領域的研究將會越來越多。

2.3 二維圖像分析——顆粒圖像的匹配與分類

二維顆粒圖像的分類是獲取三維結構過程的第一步。對二維圖像的分析包括兩部分:顆粒圖像的匹配和顆粒圖像的分類。

匹配的過程通常會對顆粒圖像應用一些變換操作,通過關聯函數去判斷不同顆粒圖像之間的相似程度。圖像匹配的算法主要分為兩種,即不依賴模型的方法和基於模型的方法,取決於是否存在利用樣本先驗信息得到的模板。

隨著圖像匹配的完成,顆粒圖像需要進行分類。主要利用多元統計分析和主成分分析方法等算法,其他流行的二維顆粒分類技術還有神經網絡分類,將圖像在二維空間自組織映射(self-organising mapping,SOM)再進行分類和排序。

二維圖像分析的目的是,首先通過圖像匹配消除旋轉和平移的誤差,利用類內緊緻、類間離散的原則進行圖像分類,最終可以對類內顆粒圖像進行平均,提高信噪比,從而實現對高解析度三維結構的構建。

2.4 模型重構和優化

模型三維重構的基礎是中心截面定理,重構過程中的關鍵問題是如何確定每個顆粒圖像的空間角(orientation determination)。大多數模型重構和優化算法都是基於投影匹配(projection

matching)的疊代方法。簡單說就是,先利用粗糙的三維結構模型,進行投影得到參考的圖像,和實驗顆粒圖像進行比對,根據結果來更新空間方位參數,繼而構造新的三維結構,對實驗圖像的空間方位修正,形成疊代的過程,直至收斂就獲得了最終的三維模型。

2.5 解析度的確定及二級結構的確定

在模型優化的過程中,通常有很多指標給出結構的解析度信息。目前一個較為廣泛使用的解析度信息參數是被稱為傅立葉殼層關聯函數(Fourier shell correlation,FSC)曲線,並通過在曲線上選取一個合適的閾值來判定解析度。

在模型優化中經常伴隨著過擬合的問題。過擬合的出現通常由於在優化過程時無法分辨「噪聲」與「信號」。為了避免過擬合對解析度的誤判,最近一種被稱為「黃金標準」(gold standard)的優化過程開始被廣泛使用。

根據不同的解析度,可以從結構中得到不同的信息量。按照解析度數值大致分為三個範圍:

(1)結構解析度大於10 Å 的生物大分子結構被視為低解析度的結構,在低解析度的結構範圍內只觀察得到一個大致的整體形狀,以及有可能分辨出主要成分的相互位置關係。

(2)一個中等解析度的生物大分子結構精度大約在4—10 Å之間,在這個解析度範圍內的生物大分子結構已經可以得到一些二級結構的信息和分辨出大部分組成結構的相對位置關係。分子結構之間如果存在構象變化也可以分辨出來。

(3)高精度甚至是近原子級別的分子結構解析度可以達到4 Å 以下。在高解析度的三維結構中,可以準確地看見如α肽鏈等的二級蛋白質結構以及部分單獨的殘基,多肽鏈的結構變得清晰起來。同時高解析度的分子結構可以描述精確的構象變化。

總之,FSC 曲線等標準提供的解析度是一個有指導意義的數字,不可作為絕對參考來評價所獲得的模型質量,需要批判地對待,尤其是要與生物分子系統的生物化學知識相結合。

2.6 三維結構的多構象性和動態分析

生物大分子通常具有內稟的柔性,所以生物分子的動態結構變化以及結構的不均一性一直是結構生物學的研究重點之一。在晶體狀態下,生物分子的結構變化被晶格約束,一般只提供一個靜態的結構和有限的動力學參數。冷凍電鏡相比晶體學方法的優勢在於可以捕捉生物分子在溶液中的形態,並記錄下不同構象下的投影。因此針對冷凍電鏡的數據可以進行多構象的重構,現有的一些算法是通過聚類分析、最大似然法分析等對多構象進行分析,得到的生物大分子結構形態和構象差異還需要結合分子功能來檢驗分子結構的合理性。

3 最新進展和突破

3.1 最大似然估計理論

近年來在單顆粒分析中取得重大突破的應當是最大似然估計(maximum likelihood)理論。最大似然估計的理論可以貫徹整個單顆粒技術圖像分析的過程,在圖像匹配,2D、3D分類 和模型優化上均可以應用,是一個強有力的理論工具。最大似然估計的算法已經在RELION、FREALIGN

等軟體中實現,方便普通用戶使用,這對於推動冷凍電鏡成像技術的應用有重大意義,近三四年來有許多突破性的近原子級別解析度的分子結構大多是由基於最大似然估計理論的分析軟體得到。

3.1.1 減少計算需求

最大似然估計算法的計算量很大,如何降低計算量是一個重要問題。過多的計算資源消耗曾經阻礙這個方法在冷凍電鏡單顆粒重構中的廣泛應用。在減少最大似然算法在冷凍電鏡應用中的計算需求方面,有兩個重要的貢獻是空間降維(domain reduction)算法和網格插值(grid interpolation)算法。

我們最近在研究一個新的方法來對旋轉參數進行分步處理,初步的結果顯示這種方法可以把計算複雜度降低一個維度,這個方法可很好地應用於高信噪比的數據處理,但對於低信噪比的數據分析還需要對該方法進行改進。

3.1.2 對最大似然方法的未來展望

在未來的研究中,關注點是減少計算的耗時和增加準確度。通用圖形處理器(GPU)的應用和CUDA 編程框架已經顯示出了在高性能計算領域的威力,研究表明GPU 技術可以顯著減少計算時間,而RELION 也將發布支持GPU 計算的2.0 版本。

在加快計算速度的同時,提高模型的重構的準確性則更為重要。如何提高顆粒圖像的準確性以及最大似然方法在這些方面的應用還有待深入探索。總而言之,最大似然方法獨特的、可擴展的統計理論框架可以適用在冷凍電鏡的各種問題上,如多構象、低噪聲、信息缺失中均有很好的應用。

3.2 流形嵌入方法(Manifold Embedding)

自然界的分子過程通常是連續的,比如三磷酸腺苷(ATP)合成酶等分子結構的狀態變化通常都是連續的。現有的方法只能得到有限的、若干個離散的構象變化,限制了我們對於分子結構的進一步觀察。而流形嵌入法則是通過將顆粒圖像映射到具有特定拓撲結構的參數空間(manifold

space),可以分辨出更為細緻的動力學變化,進而實現對生物分子連續的結構變化過程的研究。Ali Dashti 等人已經利用這種方法成功刻畫出核糖體的結構變化路徑。

3.3 揭開表面看實質

冷凍電鏡對更為複雜的結構並沒有很好的處理方式,在一些分子量比較大,包含多層的病毒結構研究中,一直沒有高解析度的三維模型,這也是由於病毒普遍具有對稱失配的特性,基因結構被殼體完全覆蓋,無法通過二維圖形處理的方式對內部結構直接進行重構。劉紅榮教授通過改進襯度分離方法展示出了解決該類問題的途徑,其發展的新方法已經成功應用在一個多面體衣殼NCPV的病毒顆粒(圖4)上,通過該重構方法,使得外部的衣殼結構(圖4(a))和內部的基因組結構(圖4(b))分離,成功得到包含在內部的dsRNA

近原子級高解析度結構和分布。

圖4 利用襯度分離方法得到對稱失配情形下的病毒顆粒結構(a)外部的衣殼結構;(b)內部的基因組結構

3.4 羅馬不是一天建成的(Building Protein in One Day)

最近的研究成果顯示,最大似然估計算法能夠更好更快地完成三維重構,多倫多大學的Marcus A. Brubaker

教授針對最大似然估計算法提出了優化,有效地縮短了三維重構所需的時間。對傳統疊代算法極度依賴於初始模型結構的缺點進行改進,同時通過採樣優化的方式降低了計算量,減少計算時間,據稱這些優化可以達到100000倍的加速,利用一台計算機工作站在一天內就能完成模型重構。

4 展望與總結

冷凍電子顯微鏡技術已經發展成為一個成熟的方法,應用於各種複雜的生物分子體系的高分辨結構研究。按照目前的發展勢頭,解決生物分子結構組(structural

proteome)的問題已經不是遙不可及的了。在解決單一靜態結構的基礎上,冷凍電鏡也展示了其研究多構象體系的潛力。下面對冷凍電鏡在結構生物學研究領域的應用做一些大膽的展望,希望能拋磚引玉。

4.1 解決膜蛋白的結構

由於膜蛋白是鑲嵌在磷脂分子構成的細胞膜內,目前在冷凍電鏡領域的樣品製備還沒有很好的處理方法,因此還很少見到對膜蛋白的結構解析。隨著技術的發展,新的試劑分子或者納米尺度的容器可以用來製備單一性很高的穩定的細胞膜以及鑲嵌在內的膜蛋白。這樣就可以利用冷凍電鏡的方法對膜蛋白進行結構研究。目前在納米盤(nanodiscs)的研究領域已經取得了一定的進展,對

冷凍電鏡解析高精度的膜蛋白結構,我們拭目以待。

4.2 細胞內分子結構測定:從溶液內(in vitro)到細胞內(in situ)

當前的高分辨分子結構基本都是在溶液中提純出來的分子樣品,也就是通常所說的in vitro 實驗。現在可以利用快速冷凍的方法把細胞固定,再用高能粒子槍對細胞進行高精度切片。在細胞的某些部位,常常有大量同類分子聚集,比如在內質網(endoplasmic

reticulum,ER)部分有很多核糖體,在細胞骨架上會有大量的肌動蛋白(actin)分子。對這些切片進行成像研究可以獲取這些分子在細胞環境的結構信息。

4.3 細胞結構和分子在細胞內的分布:從部分到整體

電鏡可以用來做斷層成像(cryogenic computed tomography,cryo-CT),應用於亞細胞層面的研究,比如細胞器的結構,蛋白質分子的分布,以及一些細胞骨架的構成。與超低溫樣品操作結合,cryo-CT

可以提供更高解析度的信息,銜接分子層面和細胞層面的知識,對於了解細胞功能至關重要。在電鏡成像研究領域,這將是一個有廣闊前景的課題。

4.4 多構象的識別和自由能景觀確定

人們開始不滿足於近原子級別解析度能夠提供的信息,想要進一步刻畫分子結構連續變化的狀態。得益於冷凍電鏡的成像特性,相對其他技術而言,冷凍電鏡技術在時間尺度的系綜上具有優勢。在冷凍電鏡下分子結構的動力學研究中,有兩個值得關注的趨勢,分別是能夠獲取分子結構「 慢」 反應過程(10—1000 ms)

時間分辨(time-resolved)的冷凍電鏡技術,以及能夠分析出連續構象變化的分類算法。獲取短期反應過程(10—1000

ms)分子結構的基礎是在準備樣本過程中分子反應的速度慢於冷凍樣本的時間,目前混合噴霧(mixing-spraying)等快速冷凍技術的實現使得一些較慢的反應過程可以看到動力學變化。而流形嵌入算法在分類過程中取得突破,在更好地利用冷凍電鏡觀察分子的平衡態結構動力學變化和展現自由能景觀上取得了令人鼓舞的成果。

4.5 從靜態結構到動態分子電影

生物分子在室溫下是活躍的,而且大多數的分子功能是通過結構的變化來實現的。基於X射線, 尤其是最近發展的X 射線自由電子雷射(XFEL)的結構生物學的研究重點之一便是實現時間分辨的結構生物學研究(time-resolved structure determination)。到目前為止,基於X

射線的研究取得了很大的進展,但主要還是局限在對晶體的衍射方面,比如對光合作用過程中水分子分解的研究和光敏黃蛋白的光吸收過程的研究。三維冷凍電鏡的單顆粒成像技術最有希望在單分子水平上實現對時間分辨的結構變化研究,同時,這對於樣品製備和實驗操作提出了非常高的要求。

5 結束語

冷凍電鏡的技術突破及其在生物分子結構領域的應用把我們對分子生物學的研究推進了一大步,開始探索未知的區域。立足於解決單一構象的基礎,對多構象以及動力學過程和熱力學的研究也需要展開,這需要對現有技術進行提升並與其他方法進行結合,計算建模和模擬的方法也需要緊密結合起來,實現對生物分子系統的集成研究。

參考信息:諾貝爾獎委員會官網,Pnas等

作者: 黃嵐青 劉海廣

來源:《物理》2017年第2期

綜合:博科園


延伸閱讀

小心,你的萌寵隨時準備吃了你

只知道很厲害?悟空號的大發現究竟是什麼?其實可能

貓和狗到底誰更聰明?最新研究給出答案

最詭異的自然現象:地震雲之謎

以人類現在科技水平,能否在毀滅恐龍的那場小行星撞


熱門內容

友善連結



APP