この項目では、タンパク質の二次構造について説明しています。核酸の二次構造については「核酸二次構造 」をご覧ください。
The image above contains clickable links PCNA を例に用いたタンパク質構造 の双方向図。 (PDB : 1AXC )
二次構造 (にじこうぞう、英 : Secondary structure )は、タンパク質 や核酸 といった生体高分子 の主鎖の部分的な立体構造のことである。本項ではタンパク質の二次構造を扱う。
タンパク質の二次構造 は、タンパク質の「局所区分」の3次元構造 である。最も一般的な2種類の二次構造要素はαヘリックス とβシート であるが、βターン やωループ も見られる。二次構造要素は通常、タンパク質が三次構造 へと折り畳まれる 前の中間状態として自発的に形成される。
二次構造はペプチド主鎖 中のアミド水素原子とカルボニル酸素原子との間の水素結合 のパターンによって形式的に定義される。二次構造は別法として、正しい水素結合を持っているかどうかにかかわらず、ラマチャンドラン・プロット の特定の領域における主鎖の二面角 の規則的なパターンに基づいて定義することもできる。
二次構造の概念は1952年にスタンフォード大学 のカイ・ウルリク・リンデルストロム=ラング によって初めて発表された[ 1] [ 2] 。核酸といったその他の生体高分子 も特徴的な二次構造 を有する。
種類
主要な3種類のタンパク質らせん構造[ 3]
幾何配置の特性
αヘリックス
310 ヘリックス
πヘリックス
回転毎の残基
3.6
3.0
4.4
残基毎の並進
1.5 Å (0.15 nm)
2.0 Å (0.20 nm)
1.1 Å (0.11 nm)
らせんの半径
2.3 Å (0.23 nm)
1.9 Å (0.19 nm)
2.8 Å (0.28 nm)
間隔幅
5.4 Å (0.54 nm)
6.0 Å (0.60 nm)
4.8 Å (0.48 nm)
最も一般的な二次構造はαヘリックス とβシート である。310 ヘリックス およびπヘリックス といったその他のらせんはエネルギー的に好ましい水素結合パターンを持つと計算されるが、ヘリックスの中心における不利な主鎖の詰め込みのためαヘリックスの末端を除いては天然のタンパク質ではめったに見られない。ポリプロリンヘリックス およびαシート といったその他の伸長構造は天然状態 のタンパク質では希であるが、タンパク質の折り畳み の重要な中間体としてしばしば仮定されている。締まったターン と緩く柔軟なループはより「常連」の二次構造要素を繋ぐ。ランダムコイル は真の二次構造ではないが、正規の二次構造の欠如を示すコンホメーションの一分類である。
アミノ酸 は様々な二次構造要素を構成する能力にそれぞれ違いがある。プロリン およびグリシン はαヘリックス主鎖の規則性を混乱させるため「ヘリックスブレイカー」と呼ばれることがある。しかしながら、どちらのアミノ酸も特有の立体配座能を有しており、ターン中でよく見られる。タンパク質中でらせん 配座を取りやすいアミノ酸には、メチオニン 、アラニン 、ロイシン 、グルタミン 、リシン がある(アミノ酸の1文字表記で "MALEK")。対照的に、大きな芳香族残基(トリプトファン 、チロシン 、フェニルアラニン )およびCβ -分岐アミノ酸(イソロイシン 、バリン 、スレオニン )はβ鎖 配座を取りやすい。しかしながら、これらの傾向は、配列のみから二次構造を予測する信頼性のある手法を確立できるほど強いわけではない。
低周波集団振動はタンパク質内の局部剛性に敏感であると考えられており、β構造はα構造あるいは不規則タンパク質よりも一般的に剛直であることが明らかにされている[ 4] [ 5] 。中性子散乱測定は~1 THzのスペクトル特性をβバレル タンパク質GFP の二次構造の集団運動を直接的に結び付けた[ 6] 。
二次構造中の水素結合パターンは大きくゆがんでおり、これが二次構造の自動的な決定を困難にしている。タンパク質二次構造を形式的に決定する手法はいくつか存在する(例: DSSP [ 7] 、DEFINE[ 8] 、STRIDE [ 9] 、ScrewFit[ 10] 、SST[ 11] [ 12] )。
DSSP分類
Non-redundant pdb_select dataset (March 2006) から得られた分布。二次構造はDSSPによって割り当てられた。8種類の配座状態は3つの状態へと縮小されている: H=HGI, E=EB, C=STC。
The Dictionary of Protein Secondary Structure(略称DSSP)は、一文字表記を使ってタンパク質二次構造を記述するために一般的に用いられている。二次構造は1951年(タンパク質構造が実験的に決定されるよりも前)にポーリングらによって提唱された水素結合パターンに基づいて割り当てられる。DSSPが定義する8種類の二次構造は以下の通りである。
G = 3-ターンヘリックス(310 ヘリックス )。最小長は3残基。
H = 4-ターンヘリックス(αヘリックス )。最小長は4残基。
I = 5-ターンヘリックス(πヘリックス )。最小長は5残基。
T = 水素結合したターン(3、4、5ターン)
E = 平行あるいは逆平行βシート 配座の伸長鎖。最小長は2残基。
B = 孤立したβブリッジ(単一ペアのβシート性水素結合形成)残基
S = ベンド(唯一、水素結合に基づかない割り当て)
C = コイル(上記のいずれにも該当しない残基)
「コイル」はしばしば ' '(空白)、C (coil)、または '–'(ダッシュ)と表記される。ヘリックス(G、H、I)およびシート配座は全て妥当な長さを持つことを必要とする。これは、タンパク質構造中の2つの隣接した残基同じ水素結合パターンを形成しなければならないことを意味する。ヘリックス性またはシート性水素結合パターンが短かすぎる場合は、それぞれTまたはBと指定される。その他にも二次構造のカテゴリーは存在するが(鋭いターン、ωループ 等)、めったに使われない。
二次構造は水素結合 によって定義されるため、水素結合の厳密な定義が決定的に重要な意味を持つ。二次構造に関する標準的な水素結合の定義はDSSPの定義であり、これは純粋に静電的なモデルである。DSSPはカルボニル炭素と酸素にそれぞれ±q 1 ≈ 0.42e の電荷を、アミド水素と窒素にそれぞれ±q 2 ≈ 0.20e の電荷を割り当てる。静電エネルギーは
E
=
q
1
q
2
(
1
r
O
N
+
1
r
C
H
−
1
r
O
H
−
1
r
C
N
)
⋅
332
kcal/mol
.
{\displaystyle E=q_{1}q_{2}\left({\frac {1}{r_{\mathrm {ON} }}}+{\frac {1}{r_{\mathrm {CH} }}}-{\frac {1}{r_{\mathrm {OH} }}}-{\frac {1}{r_{\mathrm {CN} }}}\right)\cdot 332{\text{ kcal/mol}}.}
である。
DSSPによれば、E が−0.5 kcal/mol (−2.1 kJ/mol) より小さい時かつその時に限り水素結合が存在する。DSSPの式は「物理的」水素結合エネルギーの比較的粗い近似であるものの、二次構造を定義する道具として一般的に受け入れられている。
実験的決定
生体高分子の大まかな二次構造含量(例えば、「このタンパク質は40%のαヘリックスと20%のβシートを含む」)は分光法 により推定することができる[ 13] 。タンパク質に対しては、遠紫外(170–250 nm)円偏光二色性スペクトル測定 が一般的な手法である。208および222 nmにおける目立った二重極小はαヘリックス構造を示すのに対して、204 nmまたは217 nmにおける単一極小はランダムコイルまたはβシート構造をそれぞれ反映している。水素結合によるアミド基の結合振動における違いを検出する手法である赤外分光法 も用いられるがあまり一般的ではない。二次構造含量はNMR スペクトルの化学シフト を使って正確に推定することができる[ 14] 。
予測
アミノ酸配列のみからタンパク質三次構造を予測することは非常に困難な問題であるが、より単純な二次構造の定義を用いることはより扱いやすい。
初期の二次構造予測の手法では3つの主要な状態、ヘリックス、シート、またはランダムコイルを予測することしかできなかった。これらの手法は個々のアミノ酸のヘリックスまたはシートを形成する傾向に基づいており、二次構造要素形成の自由エネルギーを推定するための規則を組み合わせられることもあった。このような手法が残基が3つの状態(ヘリックス/シート/コイル)のどれを取るかの予測精度は概して~60%であった。アミノ酸配列から二次構造を予測するために最初に広く用いられた手法はシュー–ファスマン法 (英語版 ) であった[ 15] [ 16] [ 17] 。
精度の著しい上昇(~80%近くまで)は多重配列アラインメント を利用することによって成された。進化 を通じてある位置(とその周辺、典型的には前後に~7残基)に存在するアミノ酸の完全な分布を知ることにより、その位置周辺の構造的傾向についてはるかに良い予想を立てることが可能になった[ 18] [ 19] 。
例えば、あるタンパク質がある位置にグリシン を持つとすると、それ自体はその位置にランダムコイルが存在することを示唆する。しかし、多重配列アラインメントにより、数十億年近くの進化を経ている相同タンパク質の95%においてヘリックスに多く含まれるアミノ酸がその位置(と近傍)に存在することを明らかにするかもしれない。さらに、その位置と近傍における平均疎水性 を調べることによって、同じアラインメントがαヘリックスと一致した残基の溶媒接触可能表面積 (英語版 ) のパターンをも示唆するかもしれない。これらの事実は元のタンパク質のグリシンがランダムコイルではなくαヘリックス構造に含まれることを示唆する。ニューラルネットワーク 、隠れマルコフモデル 、サポートベクターマシン を含む数種類の手法が、利用可能な全データを組み合わせ上記の3種の二次構造を予測するために用いられている。現代的な予測手法は、全ての位置における予測に対する信頼性スコアも提供する。
二次構造予測手法は継続的に基準に従って評価された(例: EVA (英語版 ) )。これらの試験に基づいた最も正確な手法は、PSIPRED (英語版 ) 、SAM[ 20] 、PORTER[ 21] 、PROF[ 22] 、SABLE[ 23] であった。改善のための根本的な領域はβ鎖の予測と考えられている。β鎖と確信を持って予測される残基についての精度は高いが、これらの手法は一部のβ鎖領域を見落としがちである(偽陰性)。PDB構造に対して二次構造クラス(ヘリックス/ストランド/コイル)を割り当てる標準手法(DSSPで割り当てられ、この二次構造に対する予測精度が評価される)の特異性のため、全体の予測精度には~90%の上限がありそうである[ 24] 。
最も単純なホモロジーモデリング (英語版 ) の場合を除いて、正確な二次構造予測は三次構造 の予測において鍵となる要素である。例えば、明確に予測された6つの二次構造要素のパターンβαββαβはフェレドキシン 折り畳み構造の特徴である[ 25] 。
応用
タンパク質および核酸二次構造のどちらも多重配列アラインメントに利用でき、単純な配列情報に加えて二次構造の情報を含めることでより正確にアラインすることできる。RNAでは、塩基対が配列よりもかなり高度に保存されているためあまり役に立たない。一次構造がアラインできないほどに異なるタンパク質間の関係が二次構造の比較によって見出されることがある[ 18] 。
天然タンパク質において、αヘリックスはβストランドよりも安定で、変異に対して頑強で、設計可能であることが示されてきたことから[ 26] 、全てがα-ヘリックスによって構成されている機能性タンパク質の設計はヘリックスとストランドの両方を持つタンパク質の設計よりも容易であると思われており、最近実験的に確かめられている[ 27] 。
ペプチド結合の構造
trans -ペプチド結合構造。長さの単位はÅ
cis -ペプチド結合構造。長さの単位はÅ
1930-40年代、ライナス・ポーリング とロバート・コリー はポリペプチド 鎖内においてアミノ酸 やペプチド結合 がどのような形状をしているのかを調べるためX線構造解析 を行い、右図のような平面構造を取っていることを突き止めた。ペプチドのC-N結合はCα -N結合より0.13 Å短く、C=O結合がアルデヒド やケトン のC=Oよりも0.02 Å短い事から次のように共鳴 していると考えられている。
ペプチド結合の共鳴エネルギー は平面のとき最大値(約85 kJ/mol)をとり、平面から90° ねじれると共鳴エネルギーはゼロとなることからも平面構造が非常に強いことが分かる。ペプチド結合は普通トランス型をとり、隣接するCα 同士は点対称の関係になる。シス型をとった場合、立体障害 のためトランス型より約8 kJ/molだけ不安定になる。しかし、プロリン の手前のペプチドでは少しだけ安定化する。このためプロリンの手前のペプチドの約10%はシス型をとっている。
ポリペプチド主鎖の二面角
ポリペプチド鎖は平面構造のペプチド結合が繋がっている。したがって、ポリペプチドの構造はそのペプチド結合面同士の二面角 (ねじれ角)で表すことができ、Cα -N結合角はφ、Cα -C結合角はψで、それぞれの角度はCα から見て時計回り に回ると値が大きくなると決めている。二面角とφ、そしてψは立体障害 のために様々な制約を受ける。
ラマチャンドランダイアグラム
核内増殖抗原 (PCNA) のラマチャンドランダイアグラム。縦軸はψ、横軸はφ。青領域はふつう許容される範囲、緑領域は限界範囲。このグラフからもφ、ψのとりうる範囲は全体の25%程度であることが分かる。
ラマチャンドランダイアグラム 、ラマチャンドランプロット 、またはラマチャンドランマップ とは、φ、ψ値、各原子間距離の計算によって立体的に許容されるペプチドの構造の範囲を図示したものである。
ラマチャンドランダイアグラムの示す構造可能範囲は各アミノ酸の側鎖の大きさによって変化する。例えばグリシン はCβ が無いため他のアミノ酸に比べて許容範囲はずっと広い。また、プロリン の側鎖は環状であるため許容範囲は極端に制限される(φ = −60°±25°)。
ヘリックス構造
ポリペプチド鎖の各Cα 炭素が同じようにねじれるとヘリックス(螺旋 )構造をとる。ヘリックス構造はφ、ψではなく、1回転あたりの残基数(n:右巻きは正、左巻きは負)、1回転で軸方向に進む距離(ピッチ、p)で表される。p=0のとき閉環となり、p=2のときは平面リボン構造をとる。
αヘリックス
αヘリックス
ポリペプチドのヘリックス構造の中で二面角と水素結合形成の双方を満足する構造はαヘリックス だけで、L -アミノ酸で作られるαヘリックスはφ=−57°、ψ=−47°、n=3.6、p=5.4 Åである。αヘリックスではすべてのN-H 基が4残基離れたアミノ酸のC=O 基へ水素結合をしている。このときのN…O間の距離は2.8 Åで、水素結合には適当であり、会合エネルギーも最大となる。右巻き構造では側鎖は外側を向いており主鎖にとっても相互にも障害にならない。しかし左巻き構造では側鎖が主鎖に近すぎるため作られることは少ない。
その他のヘリックス構造
2.27 リボン、310 ヘリックスのようなnm という表示のnはヘリックス1回転あたりのアミノ酸残基数、mは水素結合 で閉環した構造の水素 原子を含む構成原子数を表している。αヘリックスをこの表記で書くと3.613 ヘリックスとなる。
右巻き310 ヘリックスは、p=6.0 Åで、二面角はラマチャンドランダイアグラムでは禁制領域に入り、側鎖にも立体障害がある。このため、310 ヘリックスはあまり見られることはなく、普通はαヘリックスの終端に1回転だけできる。また、2.27 リボンは二面角が完全に禁制領域にあるためタンパク質中には存在しない。πヘリックス (4.416 ヘリックス)も二面角が禁制領域にあるため、ヘリックスの途中にたまに見られる程度である。
βシート構造
βシート は、φとψが同じ角度で繰り返し、水素結合が2本のポリペプチド鎖の間にある構造である。βシートには平行βシートと逆平行βシートがある。水素結合が適切にできるためには完全な平面構造(φ=180°=ψ)ではなく襞(プリーツ)状をとる。襞の周期は7.0Åである。
非繰り返し構造
球状のタンパク質においてヘリックスやシート構造は全体の半分ほどで、それ以外の部分はループ と呼ばれるひも状の状態をとる。球状タンパクでは二次構造の間にペプチド鎖が急にターンする場所があり、この部分はβターン (逆ターン)と呼ばれる。βターンにはI型とII型が存在し、両方ともアミノ酸4残基で構成されている。βターンは3残基離れたアミノ酸と水素結合して安定化するが、構造がずれて水素結合できないこともある。また、II型βターンでは2番目のアミノ酸残基の酸素原子が3番目のアミノ酸残基のCβ と衝突するため、ほとんどの3番目のアミノ酸はグリシン である。
脚注
^ Linderstrøm-Lang KU (1952). Lane Medical Lectures: Proteins and Enzymes . Stanford University Press. pp. 115. ASIN B0007J31SC
^ “Kaj Ulrik Linderstrøm-Lang (1896–1959)” . Protein Sci. 6 (5): 1092–100. (1997). doi :10.1002/pro.5560060516 . PMC 2143695 . PMID 9144781 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2143695/ . "He had already introduced the concepts of the primary, secondary, and tertiary structure of proteins in the third Lane Lecture (Linderstram-Lang, 1952)"
^ Steven Bottomley (2004年). “Interactive Protein Structure Tutorial ”. 2011年1月9日閲覧。
^ “Secondary structure and rigidity in model proteins”. Soft Matter 9 (40): 9548–56. (October 2013). doi :10.1039/C3SM50807B . PMID 26029761 .
^ “Rigidity, secondary structure, and the universality of the boson peak in proteins” . Biophysical Journal 106 (12): 2667–74. (June 2014). doi :10.1016/j.bpj.2014.05.009 . PMC 4070067 . PMID 24940784 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4070067/ .
^ “Coherent neutron scattering and collective dynamics in the protein, GFP” . Biophys. J. 105 (9): 2182–87. (2013). doi :10.1016/j.bpj.2013.09.029 . PMC 3824694 . PMID 24209864 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3824694/ .
^ “Dictionary of protein secondary structure: pattern recognition of hydrogen-bonded and geometrical features”. Biopolymers 22 (12): 2577–637. (Dec 1983). doi :10.1002/bip.360221211 . PMID 6667333 .
^ “Identification of structural motifs from protein coordinate data: secondary structure and first-level supersecondary structure”. Proteins 3 (2): 71–84. (1988). doi :10.1002/prot.340030202 . PMID 3399495 .
^ “Knowledge-based protein secondary structure assignment” . Proteins 23 (4): 566–79. (Dec 1995). doi :10.1002/prot.340230412 . PMID 8749853 . http://nook.cs.ucdavis.edu/~koehl/Classes/ECS289/reprints/Paper_Stride.pdf .
^ Calligari, Paolo A.; Kneller, Gerald R. (2012-12-01). “ScrewFit: combining localization and description of protein secondary structure” (英語). Acta Crystallographica Section D 68 (12): 1690–1693. doi :10.1107/s0907444912039029 . ISSN 0907-4449 . https://doi.org/10.1107/S0907444912039029 .
^ Arun Konagurthu. “SST: Protein Secondary structural assignment using Minimum Message Length inference ”. Laboratory of Computational Biology, Monash University. 2018年1月4日閲覧。
^ “Minimum message length inference of secondary structure from protein coordinate data” . Bioinformatics 28 (12): i97–i105. (Jun 2012). doi :10.1093/bioinformatics/bts223 . PMC 3371855 . PMID 22689785 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3371855/ .
^ “Spectroscopic methods for analysis of protein secondary structure”. Anal. Biochem. 277 (2): 167–76. (2000). doi :10.1006/abio.1999.4320 . PMID 10625503 .
^ “Rapid protein fold determination using unassigned NMR data” . Proc. Natl. Acad. Sci. U.S.A. 100 (26): 15404–09. (2003). doi :10.1073/pnas.2434121100 . PMC 307580 . PMID 14668443 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC307580/ .
^ “Prediction of protein conformation”. Biochemistry 13 (2): 222–45. (Jan 1974). doi :10.1021/bi00699a002 . PMID 4358940 .
^ “Empirical predictions of protein conformation”. Annu. Rev. Biochem. 47 : 251–76. (1978). doi :10.1146/annurev.bi.47.070178.001343 . PMID 354496 .
^ “Prediction of the secondary structure of proteins from their amino acid sequence”. Adv. Enzymol. Relat. Areas Mol. Biol. 47 : 45–148. (1978). doi :10.1002/9780470122921.ch2 . PMID 364941 .
^ a b “Integrating protein secondary structure prediction and multiple sequence alignment”. Current Protein & Peptide Science 5 (4): 249–66. (Aug 2004). doi :10.2174/1389203043379675 . PMID 15320732 .
^ “Protein secondary structure prediction”. Methods Mol. Biol. 609 : 327–48. (2010). doi :10.1007/978-1-60327-241-4_19 . PMID 20221928 .
^ “SAM-T08, HMM-based protein structure prediction” . Nucleic Acids Res. 37 (Web Server issue): W492–97. (2009). doi :10.1093/nar/gkp403 . PMC 2703928 . PMID 19483096 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2703928/ .
^ “Porter: a new, accurate server for protein secondary structure prediction”. Bioinformatics 21 (8): 1719–20. (2005). doi :10.1093/bioinformatics/bti203 . PMID 15585524 .
^ “PredictProtein—an open resource for online prediction of protein structural and functional features” . Nucleic Acids Res. 42 (Web Server issue): W337–43. (2014). doi :10.1093/nar/gku366 . PMC 4086098 . PMID 24799431 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4086098/ .
^ “Combining prediction of secondary structure and solvent accessibility in proteins”. Proteins 59 (3): 467–75. (2005). doi :10.1002/prot.20441 . PMID 15768403 .
^ “The effect of long-range interactions on the secondary structure formation of proteins” . Protein Science 14 (8): 1955–963. (Aug 2005). doi :10.1110/ps.051479505 . PMC 2279307 . PMID 15987894 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2279307/ .
^ “Structural classification of thioredoxin-like fold proteins” . Proteins 58 (2): 376–88. (2005). doi :10.1002/prot.20329 . PMID 15558583 . http://prodata.swmed.edu/Lab/Thiored_Proteins04.pdf . "Since the fold definition should include only the core secondary structural elements that are present in the majority of homologs, we define the thioredoxin-like fold as a two-layer / sandwich with the βαββαβ secondary-structure pattern."
^ “Alpha helices are more robust to mutations than beta strands”. PLoS Computational Biology 12 (12): 1–16. (2016). doi :10.1371/journal.pcbi.1005242 . PMID 27935949 .
^ “Global analysis of protein folding using massively parallel design, synthesis, and testing”. Science 357 (6347): 168–175. (2017). doi :10.1126/science.aan0693 . PMID 28706065 .
参考文献
『ヴォート生化学 第3版』 DONALDO VOET・JUDITH G.VOET 田宮信雄他訳 東京化学同人 2005.2.28
関連項目