El dogma central de la biología afirma que la información codificada en el ADN se transfiere al ARN mensajero (ARNm), que luego dirige la síntesis de proteínas.El conjunto de instrucciones que permiten que la secuencia de nucleótidos de ARNm se descodifique en aminoácidos se denomina código genético. La naturaleza universal de este código genético ha estimulado los avances en la investigación científica, la agricultura y la medicina.
A principios de 1900, los científicos descubrieron que el ADN almacena toda la información necesaria para las funciones celulares y que las proteínas realizan la mayoría de estas funciones. Sin embargo, los mecanismos de conversión de la información genética en proteínas funcionales permanecieron desconocidos durante muchos años. Inicialmente, se creía que un solo gen se convierte directamente en su proteína codificada. Dos descubrimientos cruciales en células eucariotas desafiaron esta teoría: En primer lugar, la producción de proteínas no tiene lugar en el núcleo. En segundo lugar, el ADN no está presente fuera del núcleo. Estos hallazgos provocaron la búsqueda de una molécula intermedia que conecte el ADN con la producción de proteínas. Esta molécula intermedia, que se encuentra tanto en el núcleo como en el citoplasma, y asociada con la producción de proteínas, es el ARN.
Durante la transcripción, el ARN se sintetiza en el núcleo, utilizando el ADN como plantilla. El ARN recién sintetizado es similar en secuencia a la cadena de ADN, excepto que la timidina en el ADN es reemplazada por uracilo en ARN. En eucariotas, esta transcripción primaria se procesa aún más, eliminando las regiones no codificantes de proteínas, limitando el extremo de 5′ y añadiendo una cola de poli-A de 3′, para crear ARNm que luego se exporta al citoplasma.
La traducción se produce en los ribosomas en el citoplasma, donde la información codificada en el ARNm se traduce en una cadena de aminoácidos. Un conjunto de tres códigos de nucleótidos para un aminoácido y estos trillizos se llaman codones. El conjunto de reglas que describen qué codones especifican un aminoácido en particular componen el código genético.
Las proteínas se crean a partir de 20 aminoácidos en eucariotas. La combinación de cuatro nucleótidos en conjuntos de tres proporciona 64 (43) posibles codones. Esto significa que es posible que el aminoácido individual puede ser codificado por más de un codón. Se dice que el código genético es redundante o degenerado. A menudo, pero no siempre, los codones que especifican los mismos aminoácidos difieren sólo en el tercer nucleótido del trillizo. Por ejemplo, los codones GUU, GUC, GUA y GUG representan el aminoácido valina. Sin embargo, AUG es el único codón que representa el aminoácido metionina. El codón AUG es también el codón donde comienza la síntesis de proteínas y por lo tanto se llama el codón de inicio. La redundancia en el sistema minimiza los efectos nocivos de las mutaciones. Una mutación (es decir, cambio) en la tercera posición del codón podría no resultar necesariamente en un cambio del aminoácido.
Con algunas excepciones, la mayoría de los organismos procariotas y eucariotas utilizan el mismo código genético para la síntesis de proteínas. Esta universalidad del código genético ha permitido avanzar en la investigación científica, la agricultura y la medicina. Por ejemplo, la insulina humana ahora se puede fabricar a gran escala en bacterias. Esto se hace utilizando la tecnología de ADN recombinante. El ADN recombinante consiste en material genético de diferentes especies. Los genes que codifican la insulina humana se unen con el ADN bacteriano y se insertan en una célula bacteriana. La célula bacteriana realiza la transcripción y traducción para producir la insulina humana codificada en el ADN recombinante. La insulina humana resultante se utiliza para tratar la diabetes.