タンパク質を構成するアミノ酸(タンパクしつをこうせいするアミノさん、英: Proteinogenic amino acid)は、タンパク質中に見られるα-アミノ酸であり、二級アミンであるプロリン(かつてはイミノ酸とも呼ばれた)を除き全て一級アミノ酸である。有機体はタンパク質を合成するために遺伝情報中にその細胞機構がコードされていることが必要である[1]。タンパク質を構成するアミノ酸は通常22種であるが、真核生物では21種しか見られない。22種のうち20種は直接コドンに暗号化されている。ヒトはその20種のうち、11種を他のアミノ酸または中間代謝物から合成することができる。それ以外の9種は食事によって摂取しなければならず、それらは必須アミノ酸と呼ばれている。必須アミノ酸はヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、トレオニン、トリプトファン、そしてバリンである。残りの2種はセレノシステインとピロリシンで、これらは特殊な合成機構でタンパク質に組み込まれる。
タンパク質を構成しないアミノ酸 (non-proteinogenic amino acid) は、タンパク質中に存在しないものか(カルニチン、GABA、L-ドーパなど)、直接合成されないものか(ヒドロキシプロリン、セレノメチオニンなど)のどちらかである。後者はしばしばタンパク質の翻訳後修飾で生じる。
数種のタンパク質を構成しないアミノ酸を有機体が組み込むよう進化しなかったのには明確な理由がある[2][3]。例えば、オルニチンとホモセリンはペプチド鎖に逆らって環化してしまい、タンパク質が寸断され半減期が比較的短くなる[4]。また、タンパク質が誤ったアミノ酸(例えばアルギニンの類似化合物であるカナバニン)を組み込んでしまうと毒となる[5]。
タンパク質を構成しないアミノ酸は、リボソームでの翻訳を経て合成されない非リボソームペプチドで見られる[6]。
構造
下に、真核生物の遺伝情報によってタンパク質合成のために直接暗号化されている21種のアミノ酸の構造と略語を示している。下の構造は一般的な化学構造であり、水溶液中にて形成する双性イオンの状態は示していない。
21種のアミノ酸の構造、略語、pKa。
また、IUPAC/IUBMBは現在、以下の2種のアミノ酸について次のような略称を推奨している。
化学的性質
下の表はアミノ酸の一文字表記および三文字表記と側鎖の性質についてまとめたものである。それぞれの分子量は同位体の天然存在比に基づいてその平均値から求めている。アミノ酸がペプチド結合を形成すると水を脱離するため、タンパク質鎖内のアミノ酸単位の分子量は18.01524 Daだけ小さくなることに留意されたい。
アミノ酸
|
一文字表記
|
三文字表記
|
分子量 (Da)
|
pI
|
pK1 (α-COOH)
|
pK2 (α-+NH3)
|
アラニン
|
A
|
Ala
|
89.09404
|
6.01
|
2.35
|
9.87
|
システイン
|
C
|
Cys
|
121.15404
|
5.05
|
1.92
|
10.70
|
アスパラギン酸
|
D
|
Asp
|
133.10384
|
2.85
|
1.99
|
9.90
|
グルタミン酸
|
E
|
Glu
|
147.13074
|
3.15
|
2.10
|
9.47
|
フェニルアラニン
|
F
|
Phe
|
165.19184
|
5.49
|
2.20
|
9.31
|
グリシン
|
G
|
Gly
|
75.06714
|
6.06
|
2.35
|
9.78
|
ヒスチジン
|
H
|
His
|
155.15634
|
7.60
|
1.80
|
9.33
|
イソロイシン
|
I
|
Ile
|
131.17464
|
6.05
|
2.32
|
9.76
|
リシン
|
K
|
Lys
|
146.18934
|
9.60
|
2.16
|
9.06
|
ロイシン
|
L
|
Leu
|
131.17464
|
6.01
|
2.33
|
9.74
|
メチオニン
|
M
|
Met
|
149.20784
|
5.74
|
2.13
|
9.28
|
アスパラギン
|
N
|
Asn
|
132.11904
|
5.41
|
2.14
|
8.72
|
ピロリシン
|
O
|
Pyl
|
|
|
|
|
プロリン
|
P
|
Pro
|
115.13194
|
6.30
|
1.95
|
10.64
|
グルタミン
|
Q
|
Gln
|
146.14594
|
5.65
|
2.17
|
9.13
|
アルギニン
|
R
|
Arg
|
174.20274
|
10.76
|
1.82
|
8.99
|
セリン
|
S
|
Ser
|
105.09344
|
5.68
|
2.19
|
9.21
|
トレオニン
|
T
|
Thr
|
119.12034
|
5.60
|
2.09
|
9.10
|
セレノシステイン
|
U
|
Sec
|
168.053
|
|
|
|
バリン
|
V
|
Val
|
117.14784
|
6.00
|
2.39
|
9.74
|
トリプトファン
|
W
|
Trp
|
204.22844
|
5.89
|
2.46
|
9.41
|
チロシン
|
Y
|
Tyr
|
181.19124
|
5.64
|
2.20
|
9.21
|
側鎖の性質
アミノ酸
|
一文字表記
|
三文字表記
|
側鎖
|
疎水性
|
pKa
|
極性
|
pH
|
小さい
|
極小さい
|
芳香族性/脂肪族性
|
ファンデルワールス半径
|
アラニン
|
A
|
Ala
|
-CH3
|
X
|
-
|
-
|
-
|
X
|
X
|
-
|
67
|
システイン
|
C
|
Cys
|
-CH2SH
|
X
|
8.18
|
-
|
酸性
|
X
|
-
|
-
|
86
|
アスパラギン酸
|
D
|
Asp
|
-CH2COOH
|
-
|
3.90
|
X
|
酸性
|
X
|
-
|
-
|
91
|
グルタミン酸
|
E
|
Glu
|
-CH2CH2COOH
|
-
|
4.07
|
X
|
酸性
|
-
|
-
|
-
|
109
|
フェニルアラニン
|
F
|
Phe
|
-CH2C6H5
|
X
|
-
|
-
|
-
|
-
|
-
|
芳香族性
|
135
|
グリシン
|
G
|
Gly
|
-H
|
X
|
-
|
-
|
-
|
X
|
X
|
-
|
48
|
ヒスチジン
|
H
|
His
|
-CH2-C3H3N2
|
-
|
6.04
|
X
|
弱塩基
|
-
|
-
|
芳香族性
|
118
|
イソロイシン
|
I
|
Ile
|
-CH(CH3)CH2CH3
|
X
|
-
|
-
|
-
|
-
|
-
|
脂肪族性
|
124
|
リシン
|
K
|
Lys
|
-(CH2)4NH2
|
-
|
10.54
|
X
|
塩基性
|
-
|
-
|
-
|
135
|
ロイシン
|
L
|
Leu
|
-CH2CH(CH3)2
|
X
|
-
|
-
|
-
|
-
|
-
|
脂肪族性
|
124
|
メチオニン
|
M
|
Met
|
-CH2CH2SCH3
|
X
|
-
|
-
|
-
|
-
|
-
|
-
|
124
|
アスパラギン
|
N
|
Asn
|
-CH2CONH2
|
-
|
-
|
X
|
-
|
X
|
-
|
-
|
96
|
ピロリシン
|
O
|
Pyl
|
|
|
|
|
|
|
|
|
|
プロリン
|
P
|
Pro
|
-CH2CH2CH2-
|
X
|
-
|
-
|
-
|
X
|
-
|
-
|
90
|
グルタミン
|
Q
|
Gln
|
-CH2CH2CONH2
|
-
|
-
|
X
|
-
|
-
|
-
|
-
|
114
|
アルギニン
|
R
|
Arg
|
-(CH2)3NH-C(NH)NH2
|
-
|
12.48
|
X
|
強塩基
|
-
|
-
|
-
|
148
|
セリン
|
S
|
Ser
|
-CH2OH
|
-
|
-
|
X
|
-
|
X
|
X
|
-
|
73
|
トレオニン
|
T
|
Thr
|
-CH(OH)CH3
|
-
|
-
|
X
|
弱酸
|
X
|
-
|
-
|
93
|
セレノシステイン
|
U
|
Sec
|
-CH2SeH
|
X
|
5.73
|
-
|
-
|
X
|
-
|
-
|
|
バリン
|
V
|
Val
|
-CH(CH3)2
|
X
|
-
|
-
|
-
|
X
|
-
|
脂肪族性
|
105
|
トリプトファン
|
W
|
Trp
|
-CH2C8H6N
|
X
|
-
|
-
|
-
|
-
|
-
|
芳香族性
|
163
|
チロシン
|
Y
|
Tyr
|
-CH2-C6H4OH
|
-
|
10.46
|
X
|
-
|
-
|
-
|
芳香族性
|
141
|
注:アミノ酸のpKaはタンパク質中にあるときとは若干異なる。
遺伝子発現と生化学
アミノ酸
|
一文字表記
|
三文字表記
|
コドン
|
真正細菌タンパク質中の存在率(%)&
|
古細菌タンパク質中の存在率(%)&
|
真核生物タンパク質中の存在率(%)&
|
ヒトタンパク質中の存在率(%)&
|
ヒトの必須アミノ酸‡
|
アラニン
|
A
|
Ala
|
GCU, GCC, GCA, GCG
|
10.06
|
8.2
|
7.63
|
7.01
|
-
|
システイン
|
C
|
Cys
|
UGU, UGC
|
0.94
|
0.98
|
1.76
|
2.3
|
準必須アミノ酸
|
アスパラギン酸
|
D
|
Asp
|
GAU, GAC
|
5.59
|
6.21
|
5.4
|
4.73
|
-
|
グルタミン酸
|
E
|
Glu
|
GAA, GAG
|
6.15
|
7.69
|
6.42
|
7.09
|
準必須アミノ酸
|
フェニルアラニン
|
F
|
Phe
|
UUU, UUC
|
3.89
|
3.86
|
3.87
|
3.65
|
必須アミノ酸
|
グリシン
|
G
|
Gly
|
GGU, GGC, GGA, GGG
|
7.76
|
7.58
|
6.33
|
6.58
|
準必須アミノ酸
|
ヒスチジン
|
H
|
His
|
CAU, CAC
|
2.06
|
1.77
|
2.44
|
2.63
|
必須アミノ酸
|
イソロイシン
|
I
|
Ile
|
AUU, AUC, AUA
|
5.89
|
7.03
|
5.1
|
4.33
|
必須アミノ酸
|
リシン
|
K
|
Lys
|
AAA, AAG
|
4.68
|
5.27
|
5.64
|
5.72
|
必須アミノ酸
|
ロイシン
|
L
|
Leu
|
UUA, UUG, CUU, CUC, CUA, CUG
|
10.09
|
9.31
|
9.29
|
9.97
|
必須アミノ酸
|
メチオニン
|
M
|
Met
|
AUG
|
2.38
|
2.35
|
2.25
|
2.13
|
必須アミノ酸
|
アスパラギン
|
N
|
Asn
|
AAU, AAC
|
3.58
|
3.68
|
4.28
|
3.58
|
-
|
ピロリシン
|
O
|
Pyl
|
UAG*
|
|
|
|
|
-
|
プロリン
|
P
|
Pro
|
CCU, CCC, CCA, CCG
|
4.61
|
4.26
|
5.41
|
6.31
|
-
|
グルタミン
|
Q
|
Gln
|
CAA, CAG
|
3.58
|
2.38
|
4.21
|
4.77
|
-
|
アルギニン
|
R
|
Arg
|
CGU, CGC, CGA, CGG, AGA, AGG
|
5.88
|
5.51
|
5.71
|
5.64
|
準必須アミノ酸
|
セリン
|
S
|
Ser
|
UCU, UCC, UCA, UCG, AGU, AGC
|
5.85
|
6.17
|
8.34
|
8.33
|
-
|
トレオニン
|
T
|
Thr
|
ACU, ACC, ACA, ACG
|
5.52
|
5.44
|
5.56
|
5.36
|
必須アミノ酸
|
セレノシステイン
|
U
|
Sec
|
UGA**
|
|
|
|
|
-
|
バリン
|
V
|
Val
|
GUU, GUC, GUA, GUG
|
7.27
|
7.8
|
6.2
|
5.96
|
必須アミノ酸
|
トリプトファン
|
W
|
Trp
|
UGG
|
1.27
|
1.03
|
1.24
|
1.22
|
必須アミノ酸
|
チロシン
|
Y
|
Tyr
|
UAU, UAC
|
2.94
|
3.35
|
2.87
|
2.66
|
準必須アミノ酸
|
終止コドン†
|
-
|
Term
|
UAA, UAG, UGA
|
-
|
-
|
-
|
-
|
-
|
- * UAGは通常はアンバー終止コドンであるが、PYLISエレメントが存在した場合ピロリシンがエンコードされる。
- ** UGAは通常はオパール(またはアンバー)終止コドンであるが、SECISエレメントが存在した場合セレノシステインがエンコードされる。
- † 終止コドンはアミノ酸ではないが便宜上挿入している。
- ‡ 必須アミノ酸はヒトが体内で生合成できないアミノ酸であるため食事により摂取しなければならない。準必須アミノ酸は食事による摂取は必要ではないが、体内での生合成量が不足したときは十分な量を摂取しなければならない。
- & 豊富なアミノ酸は、古細菌135種、細菌3775種、真核生物614種、ヒトプロテオーム(21006種)に基づいている[7]。
出典
- ^ Ambrogelly A, Palioura S, Söll D (Jan 2007). “Natural expansion of the genetic code”. Nat Chem Biol 3 (1): 29–35. doi:10.1038/nchembio847. PMID 17173027. http://www.nature.com/nchembio/journal/v3/n1/abs/nchembio847.html.
- ^ Rodin, Andrei S.; Szathmáry, Eörs; Rodin, Sergei N. (2011-02-22). “On origin of genetic code and tRNA before translation”. Biology Direct 6: 14. doi:10.1186/1745-6150-6-14. ISSN 1745-6150. PMC 3050877. PMID 21342520. https://www.ncbi.nlm.nih.gov/pubmed/21342520.
- ^ Yarus, Michael; Widmann, Jeremy Joseph; Knight, Rob (2009-11). “RNA-amino acid binding: a stereochemical era for the genetic code”. Journal of Molecular Evolution 69 (5): 406–429. doi:10.1007/s00239-009-9270-1. ISSN 1432-1432. PMID 19795157. https://www.ncbi.nlm.nih.gov/pubmed/19795157.
- ^ Weber, A. L.; Miller, S. L. (1981). “Reasons for the occurrence of the twenty coded protein amino acids”. Journal of Molecular Evolution 17 (5): 273–284. ISSN 0022-2844. PMID 7277510. https://www.ncbi.nlm.nih.gov/pubmed/7277510.
- ^ Rosenthal, G. A. (1977-6). “The biological effects and mode of action of L-canavanine, a structural analogue of L-arginine”. The Quarterly Review of Biology 52 (2): 155–178. ISSN 0033-5770. PMID 331385. https://www.ncbi.nlm.nih.gov/pubmed/331385.
- ^ Schwarzer, Dirk; Finking, Robert; Marahiel, Mohamed A. (2003-6). “Nonribosomal peptides: from genes to products”. Natural Product Reports 20 (3): 275–287. ISSN 0265-0568. PMID 12828367. https://www.ncbi.nlm.nih.gov/pubmed/12828367.
- ^ Kozlowski, Lukasz P. (2017-01-04). “Proteome-pI: proteome isoelectric point database”. Nucleic Acids Research 45 (D1): D1112–D1116. doi:10.1093/nar/gkw978. ISSN 1362-4962. PMC 5210655. PMID 27789699. https://www.ncbi.nlm.nih.gov/pubmed/27789699.
関連項目
|