蛋白质(protein)作为生物体的重要组成物质之一,具有多种生物学功能。如:参与催化、免疫、凝血、肌收缩等动态生化反应;也行使构成结缔组织、骨基质,形成组织形态等结构功能。蛋白质在人体内分布广泛、种类繁多,但其元素组成大致相同:主要有碳(C)、氢(H)、氧(O)、氮(N)和硫(S)。某些蛋白质还含有磷(P)或金属元素,如:铁(Fe)、锌(Zn)、镁(Mg)、锰(Mn)、铜(Cu)等。这些金属元素多以离子形式存在于蛋白质内部,往往在蛋白质发挥生物学功能过程中起着关键作用,在进行分子模拟及药物设计时,应重点关注。
人体内的蛋白质均由20种L-α-氨基酸(amino acid)(除甘氨酸外)组成。根据氨基酸的结构和理化性质可将这20中氨基酸分成5大类:(1)非极性脂肪族氨基酸;(2)芳香族氨基酸;(3)极性中性氨基酸;(4)酸性氨基酸及(5)碱性氨基酸。如表1所示。
表1 氨基酸分类
Chinese Name | English Name | Symbol | Structural Formula | Isoelectric point, pI |
Nonpolar amino acids with aliphatic side chains | ||||
甘氨酸 | Glycine | Gly[G] | 5.97 | |
丙氨酸 | Alanine | Ala[A] | 6.00 | |
缬氨酸 | Valine | Val[V] | 5.96 | |
亮氨酸 | Leucine | Leu[L] | 5.98 | |
异亮氨酸 | Isoleucine | Ile[I] | 6.02 | |
脯氨酸 | Proline | Pro[P] | 6.30 | |
Polar neutral amino acids | ||||
丝氨酸 | Serine | Ser[S] | 5.68 | |
半胱氨酸 | Cysteine | Cys[C] | 5.07 | |
甲硫氨酸 | Methionine | Met[M] | 5.74 | |
天冬酰胺 | Asparagine | Asn[N] | 5.41 | |
谷氨酰胺 | Glutamine | Gln[Q] | 5.65 | |
苏氨酸 | Threonine | Thr[T] | 5.60 | |
Amino acids containing aromatic rings | ||||
苯丙氨酸 | Phenylalanine | Phe[F] | 5.48 | |
酪氨酸 | Tyrosine | Tyr[Y] | 5.66 | |
色氨酸 | Tryptophan | Trp[W] | 5.89 | |
Amino acids with side chains containing acidic groups | ||||
天冬氨酸 | Aspartic acid | Asp[D] | 2.97 | |
谷氨酸 | Glutamic acid | Glu[E] | 3.22 | |
Amino acids with side chains containing basic groups | ||||
精氨酸 | Arginine | Arg[R] | 10.76 | |
赖氨酸 | Lysine | Lys[K] | 9.74 | |
组氨酸 | Histidine | His[H] | 7.59 |
其中Pro为亚氨基酸,在蛋白质合成加工时可被修饰为羟脯氨酸(Hyp)。Lys也可被修饰为羟赖氨酸(Hyl)。Cys中的巯基有较强的失质子倾向,是极性最强的氨基酸;两个Cys通过脱氢反应以二硫键(disulfide bond)相连形成胱氨酸(cystine)。蛋白质分子中的Cys多以胱氨酸的形式存在,二硫键的形成可以使原本距离较远的Cys在空间上相互靠近,是蛋白质分子更加紧密,对维持蛋白质构象稳定等方面有重要意义。
图1 胱氨酸与二硫键
除此以外,硒代半胱氨酸(selenocysteine)在某些情况下也可参与蛋白质的合成,如过氧化物酶等。人体内也存在不参与蛋白质合成但具有其他生理活性的氨基酸,如:鸟氨酸(ornithine)、瓜氨酸(citrulline)和精氨酸代琥珀酸(argininosuccinate)等,图2给出了上述特殊氨基酸的结构式。
图2 部分特殊氨基酸的结构式
1分子氨基酸的α-羧基与另1分子α-氨基脱水形成酰胺键称为肽键(peptide bond),生成的产物则称为肽(peptide),如图3所示。根据脱水生成肽的氨基酸数量(n)将肽称为“n肽”,如4个氨基酸脱水形成的肽可称为四肽。通常将10个及以内的氨基酸形成的肽称为寡肽(oligopeptide),超过10个但少于50个氨基酸形成的肽称为多肽(polypeptide),50个以上的氨基酸组成的肽则称为蛋白质。如胰岛素(insulin)由51个氨基酸构成,属于蛋白质;而促肾上腺皮质激素由39个氨基酸组成,属于多肽。
无论是肽还是蛋白质,在它们的末端均含有一个游离的α-氨基和一个α-羧基。含有游离α-氨基的末端常称为N-端,而含有游离α-羧基的末端常称为C-端。由于在形成肽键的过程中,氨基酸因脱水而不再完整,故又将肽或蛋白质中的氨基酸称为残基(residue)。
图3 肽与肽键
在蛋白质分子中,从N-端至C-端的氨基酸序列被称为蛋白质的一级结构(primary structure)。一级结构是理解蛋白质高级结构与生物学功能的重要基础。需要强调的是,蛋白质的一级结构中除了肽键信息外,还包括二硫键的位置。