生物学のセントラルドグマは、DNAにコード化された情報がメッセンジャーRNA(mRNA)に伝達され、mRNAがタンパク質の合成を指示するというものです。このmRNAの塩基配列をアミノ酸に変換するための命令を「遺伝情報(遺伝暗号)」と呼びます。この遺伝情報の普遍性が、科学研究、農業、医療の発展につながっています。
1900年代初頭、科学者たちは、DNAが細胞機能に必要なすべての情報を格納し、タンパク質がその機能のほとんどを担っていることを発見しました。しかし、遺伝情報が機能的なタンパク質に変換されるメカニズムは、長年にわたって解明されていませんでしました。当初は、1つの遺伝子がそのコード化されたタンパク質に直接変換されると考えられていました。しかし、真核細胞における2つの重要な発見が、この理論に疑問を投げかけました。1つ目は、タンパク質の生成は核の中では行われないこと、2つ目は、DNAは核の外には存在しないことです。これらの発見により、DNAとタンパク質の生成をつなぐ中間分子の探索が始まりました。核と細胞質の両方に存在し、タンパク質の生成に関係する中間分子、それがRNAです。
転写の際には、DNAを鋳型として核内でRNAが合成されます。真核生物では、この一次転写産物をさらに加工し、タンパク質非コード領域を取り除き、5’末端をキャップし、3’ポリAテールを追加してmRNAを作成し、細胞質へと運びます。
翻訳は、細胞質内のリボソームで行われ、mRNAにコード化された情報がアミノ酸の鎖に翻訳されます。3つのヌクレオチドが1つのアミノ酸をコードしており、この3つのヌクレオチドの並びをコドンと呼びます。どのコドンが特定のアミノ酸を指定するかを示す一連の規則が、遺伝暗号を構成しています。
真核生物では、20種類のアミノ酸からタンパク質が作られます。4つのヌクレオチドを3つセットで組み合わせると、64(43)個のコドンが可能になります。つまり、1つのアミノ酸が複数のコドンでコードされる可能性があるということです。このため遺伝暗号は、冗長であるまたは縮退していると言われます。多くの場合、同じアミノ酸を指定するコドンは、コドンの3番目のヌクレオチドだけが異なるが、必ずしもそうではないです。例えば、GUU、GUC、GUA、GUGというコドンは、いずれもアミノ酸のバリンを表します。しかし、AUGはアミノ酸のメチオニンを表す唯一のコドンです。AUGは、タンパク質の合成を開始するコドンでもあり、開始コドンと呼ばれています。システムの冗長性は、突然変異の有害な影響を最小限に抑えます。これは、コドンの3番目の位置に変異(=変化)があっても、必ずしもアミノ酸が変化するとは限らないからです。
一部の例外を除いて、ほとんどの原核生物と真核生物は、同じ遺伝暗号を使ってタンパク質を合成しています。この遺伝暗号の普遍性が、科学研究、農業、医療の発展を可能にしました。例えば、ヒトのインスリンはバクテリアで大規模に製造できるようになりました。これには組換えDNA技術が使われています。組換えDNAは、異なる種の遺伝物質から構成されています。ヒトインスリンをコードする遺伝子をバクテリアのDNAと結合させ、バクテリアの細胞に挿入します。細菌細胞は転写と翻訳を行い、組換えDNAにコードされたヒトインスリンを生成します。できあがったヒトインスリンは、糖尿病の治療に用いられます。