Investigadores han descubierto un proceso clave por el que los nuevos genes procedentes de ADN no codificante de proteínas sufren mutaciones que permiten su exportación del núcleo al citoplasma celular, donde el nuevo gen puede traducirse en nuevos polipéptidos. En el nuevo estudio, los investigadores han demostrado que, lejos de ser accesorios, los nuevos productos génicos suelen ser integrantes de características fenotípicas clave, como cerebros más grandes en genes de novo específicos de humanos a partir de ADN no codificante de proteínas. Pero antes de que esos genes se conviertan en nuevos productos proteicos, deben cambiar para escapar de la localización nuclear prevista para las secuencias largas de ARN no codificante: el estudio dilucida las mutaciones que permiten la exportación nuclear, donde el nuevo gen puede acceder a la maquinaria traduccional del ribosoma, y demuestra mediante experimentos de knock-out y sobreexpresión el papel funcional de los genes de novo procedentes de ADN no codificante de proteínas en el desarrollo de los organismos, como el agrandamiento de la corteza cerebral en humanos.
El origen de nuevos genes codificadores de proteínas de novo se consideraba antes tan improbable que rayaba en lo imposible. Esta era una de las principales razones por las que se favorecía la evolución gradual frente a la especiación puntuada, ya que se consideraba que debían pasar millones de años para que surgiera un producto génico útil a través de los procesos ciegos y aleatorios favorecidos por la teoría convencional. Sin embargo, en menos de una década, y especialmente en los últimos cinco años, este punto de vista ha quedado invalidado por las numerosas pruebas de duplicación génica, mecanismos de splicing alternativo y preadaptación del ADN no codificante en diversos linajes de eucariotas para generar nuevos productos génicos funcionales. Más que un hecho extremadamente raro, ahora es evidente que existe un goteo relativamente constante de protogenes liberados en el campo de pruebas de la selección natural. Curiosamente, se ha descubierto que la neosíntesis de productos génicos puede producirse a partir de secciones de ADN que codifican transcritos largos de ARN aparentemente inútiles (lo que se denomina ARN no codificante largo, o lncARN).
El fenómeno del nacimiento de genes de novo a partir de ADN no codificante de proteínas es sorprendente, porque la forma estructural genérica de la proteína es el amiloide, de modo que se espera que los polipéptidos aleatorios sean tóxicos, como las placas amiloides que caracterizan el Alzheimer y las enfermedades neurodegenerativas. Sin embargo, ha quedado claro que los productos génicos útiles y no tóxicos pueden originarse de novo a partir de secuencias codificantes no proteicas [1], y que estos nuevos productos a menudo emergen como productos génicos plenamente funcionales sin apenas fases intermedias de aclimatación, en un tipo de emergencia de todo o nada, lo que invalida las teorías de exaptación evolutiva gradual y apoya el modelo de preadaptación, que propone la existencia de características exageradas similares a las de los genes nuevos y una transición de todo o nada a la funcionalidad [2].
Aunque la duplicación génica se ha señalado como el mecanismo predominante del origen de nuevos genes [3, 4], en la actualidad abundan los datos que demuestran que las nuevas proteínas también evolucionan a partir de regiones de ADN no codificantes de proteínas [5, 6, 7]. A diferencia de la duplicación génica -en la que muchos de los elementos de iniciación de la transcripción, empalme/edición del ARN mensajero (ARNm) y exportación nuclear de ribonucleoproteínas ya están presentes-, el proceso de nacimiento de genes de novo a partir de secuencias largas de ARN no codificante es sorprendente porque muchos de los elementos de transcripción y procesamiento del ARNm necesarios para generar una transcripción génica funcional no están presentes. Deben generarse desde cero (síntesisde novo ), lo que requiere mutaciones funcionales clave para permitir el empalme y la edición adecuados de las secuencias de ARN en transcritos de ARNm válidos.
Para dilucidar este proceso y seguir demostrando cómo se generan productos génicos funcionales a partir de secuencias de ADN no codificantes de proteínas, un estudio publicado en Science [y publicado en Nature Ecology & Evolution, 8] ha identificado un gen específico humano que desempeña un papel clave en el desarrollo de cerebros complejos de gran tamaño que surgió a partir de ARN no codificante largo. Los autores del estudio pudieron demostrar cómo el gen se originó a partir de lncRNA, mostrando homología entre el gen y secuencias específicas de lncRNA, e identificando cambios clave en secuencias relacionadas con el empalme de ARN que permitieron la exportación nuclear de ARN. Mediante la introducción de nuevos elementos de empalme, las secuencias de lncARN se modifican para poder abandonar el núcleo donde hay acceso al ribosoma, convirtiéndose así en transcritos funcionales de ARNm. Quizá el resultado más sorprendente del estudio es que estos genes recién generados (de novo) a partir de secuencias largas de ARN no codificante tienen funcionalidad biológica.

Para esta última característica, el equipo de investigación identificó 74 genes nuevos específicos de humanos/homínidos, la mitad de los cuales surgieron tras la escisión ancestral de los linajes humano y chimpancé. Seleccionando uno de estos 74 genes, específico del ser humano y expresado en el desarrollo cerebral, el equipo de investigación demostró experimentalmente que la knock-out o la sobreexpresión del gen en células madre embrionarias humanas aceleraba o retrasaba, respectivamente, la maduración neuronal de los organoides corticales. Es más, cuando el gen se expresaba ectópicamente en ratones transgénicos, los organismos de prueba desarrollaban cerebros agrandados con una estructura cortical superior, como el enfolding, una característica humana típica de la morfología cerebral de la corteza cerebral.
Por tanto, el estudio demuestra cómo un conjunto de protogenes de secuencias de ADN no codificantes de proteínas puede exaptarse rápidamente en ARNm funcional y proteínas novedosas que subyacen a cambios fenotípicos clave en la especiación, como el desarrollo de cerebros complejos agrandados, significativo en el linaje humano. La preadaptación del reservorio de protogenes es muy intrigante y sin duda plantea más preguntas, ya que sugiere que la exaptación de secuencias de ADN no codificantes de proteínas puede no ser totalmente fortuita, sino que existe un mecanismo natural operativo para generar protogenes que pueden ser rápidamente exaptados en el modo todo o nada de la preadaptación.
Referencias
[1] McLysaght, A. & Guerzoni, D. New genes from non-coding sequence: the role of de novo protein-coding genes in eukaryotic evolutionary innovation. Phil. Trans. R. Soc. B 370, 20140332 (2015), DOI: 10.1098/rstb.2014.0332
[2] Wilson, B. A., Foy, S. G., Neme, R. & Masel, J. Young genes are highly disordered as predicted by the preadaptation hypothesis of de novo gene birth. Nat. Ecol. Evol. 1, 0146–0146 (2017) https://doi.org/10.1038/s41559-017-0146
[3] Chen, S., Krinsky, B. H. & Long, M. New genes as drivers of phenotypic evolution. Nat. Rev. Genet. 14, 645–660 (2013)
[4] Long, M., Betran, E., Thornton, K. & Wang, W. The origin of new genes: glimpses from the young and old. Nat. Rev. Genet. 4, 865–875 (2003)
[5] Li, C. Y. et al. A human-specific de novo protein-coding gene associated with human brain functions. PLoS Comput. Biol. 6, e1000734 (2010)
[6] Xie, C. et al. Hominoid-specific de novo protein-coding genes originating from long non-coding RNAs. PLoS Genet. 8, e1002942 (2012)
[7] Carvunis, A. R. et al. Proto-genes and de novo gene birth. Nature 487, 370–374 (2012)
[8] N. A. An et al., “De novo genes with a lncRNA origin encode unique human brain developmental functionality,” Nat Ecol Evol, pp. 1–15, Jan. 2023, doi: 10.1038/s41559-022-01925-6


