Desde que se demostró que las proteínas eran producto de los genes, y que cada gen estaba formado por fracciones de cadenas de ADN, los científicos llegaron a la conclusión de que debe haber un código genético mediante el cual el orden de las cuatro bases nitrogenadas en el ADN podría determinar la secuencia de aminoácidos en la formación de polipéptidos; en otras palabras, debe haber un proceso mediante el cual las bases nitrogenadas transmitan la información que dicta la síntesis de proteínas. Este proceso podría explicar cómo los genes controlan las formas y funciones de las células, tejidos y organismos. Como en el ADN sólo hay cuatro tipos de nucleótidos, y, sin embargo, las proteínas se constituyen con 20 clases diferentes de aminoácidos, el código genético no podría basarse en que un nucleótido especificara un aminoácido; las combinaciones de dos nucleótidos sólo podrían especificar 16 aminoácidos (42 = 16), de manera que el código debe estar formado por combinaciones de tres o más nucleótidos sucesivos; el orden de los tripletes, o como se han denominado, codones, podría definir el orden de los aminoácidos en el polipéptido.

Diez años después de que Watson y Crick determinaran la estructura del ADN, el código genético fue descifrado y verificado; su solución dependió en gran medida de las investigaciones llevadas a cabo sobre otro grupo de ácidos nucleicos, los ácidos ribonucleicos (ARN); se observó que la obtención de un polipéptido a partir del ADN se producía de forma indirecta a través de una molécula intermedia conocida como ARN mensajero (ARNm); parte del ADN se desenrolla de su empaquetamiento cromosómico, y las dos cadenas se separan en una porción de su longitud; una de ellas actúa como plantilla sobre la que se forma el ARNm (con la ayuda de una enzima denominada ARN polimerasa). El proceso es muy similar a la formación de una cadena complementaria de ADN durante la división de la doble hélice, salvo que el ARN contiene uracilo (U) en lugar de timina como una de sus cuatro bases nucleótidas, y el uracilo (similar a la timina) se une a la adenina en la formación de pares complementarios; por esta razón, una secuencia de adenina – guanina – adenina – timina – citosina (AGATC) en la cadena codificada de ADN, origina una secuencia de uracilo – citosina – uracilo – adenina – guanina (UAUAG) en el ARNm.