Sustainability Now

La revolución de la información en la genética

Jun 20, 2003 Russell F. Doolittle

Averiguar los secretos del genoma humano sería imposible sin la manipulación computadorizada de cantidades ingentes de datos, incluida la mayoría de los tres mil millones de unidades químicas que componen el plan maestro genético de nuestra especie, pero lo que esa revolución de la "bioinformática" ha aportado, por encima de todo, es la confirmación absoluta de la base evolutiva de toda la vida en la Tierra.

Virtual Migration Could Revive Growth
Getty Images

Quarterly 0

Virtual Migration Could Revive Growth

Carl Benedikt Frey explains how new technologies can drive growth in rich and poor countries at the same time.
Getting Abundance Right
Bettmann Contributor/Getty Images

Longer Reads 0

Getting Abundance Right

Sandeep Vaheesan urges the creation of public utilities to accelerate decarbonization and improve living standards.
Paydays and Maydays in the Global South
Getty Images

Quarterly 0

Paydays and Maydays in the Global South

Romina Bandura surveys the biggest risks and opportunities facing workers across developing countries.

Los datos sobre secuencias, ya se refieran a proteínas o a ácidos nucleicos, se prestan muy bien al tratamiento informático, porque son fáciles de digitalizar y descomponer en sus unidades constitutivas. Programas informáticos simples pueden comparar dos o más ristras de dichas unidades y evaluar los grados de similitud, buscar en enormes bases de datos para comparar las nuevas secuencias con las ya conocidas y juntar grupos de secuencias en forma de árbol genealógico.

Las consecuencias de la investigación de las primeras proteínas estudiadas hace casi medio siglo fueron profundas. Todas aquellas secuencias eran bastante pequeñas -la insulina tiene unos cincuenta aminoácidos, según las especies-, pero la variación entre las especies resultaba clara.

Mi interés comenzó con una de esas moléculas simples hace cuarenta años, cuando era un estudiante posdoctoral en Suecia. Los fibrinopéptidos son secuencias breves que resultan relativamente fáciles de purificar y tienen la virtud de cambiar en gran medida de especie a especie. Gracias a ello, pudimos demostrar una clara correspondencia entre el registro de fósiles y la mayoría de los cambios observados en las secuencias de fibrinopéptidos. De modo que resultó posible, evidentemente, interpretar el pasado evolutivo desde el punto de vista de las secuencias genéticas existentes .

Pero fueron necesarios los progresos informáticos para seguir avanzando. En 1965, Robert Ledley inició la primera base auténtica de datos sobre secuencias, el Atlas de la Estructura y la Secuencia de las Proteínas. En 1967, los investigadores prepararon un árbol genético de una veintena de animales y hongos que tenían prácticamente el mismo orden de ramificación que el que habría trazado un biólogo clásico, pese a que su computadora desconocía totalmente la anatomía, la paleontología y la embriología comparativas y otras características no moleculares de esos seres. Por último, en 1970, una espléndida innovación informática permitió la alineación apropiada de secuencias de aminoácidos (que es decisiva para todos los tratamientos de datos posteriores).

Después se desarrolló la interpretación de los datos secuenciados a lo largo de dos dimensiones. Primero, hubo un interés natural por las relaciones entre organismos. Se formuló la hipótesis que a lo largo de todas las ramas de un árbol genético se producen cambios aleatorios, pero, según la proteína de que se trate, sólo sobrevive una pequeña fracción. Si esas tasas de supervivencia fueran constantes, se podrían calcular las distancias que separan las secuencias existentes. El segundo tipo de comparación se centró en proteínas parálogo , que descienden de un antepasado común dentro del mismo ser a consecuencia de duplicaciones de genes.

Introductory Offer: Save 30% on PS Digital

Introductory Offer: Save 30% on PS Digital

Access every new PS commentary, our entire On Point suite of subscriber-exclusive content – including Longer Reads, Insider Interviews, Big Picture/Big Question, and Say More – and the full PS archive.

Subscribe Now

Los dos tipos de comparación mostraron que las nuevas proteínas proceden de las antiguas, conforme a la predicción de la teoría evolucionista. En todos los organismos se producen constantemente duplicaciones de partes del genoma del ADN, principalmente a consecuencia de episodios aleatorios de desmembración y reunión. La mayoría de esos segmentos duplicados están condenados al olvido, porque cualesquiera proteínas que produzcan sus genes son superfluas. Sin embargo, a veces el producto de un gen ligeramente modificado resulta beneficioso para la adaptación y nace una nueva proteína. Con frecuencia su función es muy similar a la antigua, pero a veces se produce un cambio radical.

Después, en 1978, se generalizó el uso de la secuenciación del ADN. Casi inmediatamente, una avalancha de nueva información genética llenó hasta rebosar la base de datos existente sobre la secuencia de las proteínas. Se creó un segundo depósito, GenBank, pero al principio se centró exclusivamente en las secuencias de ADN. Y, sin embargo, la información interesante estribaba en las secuencias de ADN traducidas , es decir, sus equivalentes en proteínas.

Fue uno de esos momentos poco frecuentes en que un aficionado tenía la oportunidad de competir con los profesionales. Conque comencé mi propia base de datos, utilizando sobre todo secuencias de ADN traducidas; la llamé NEWAT (Nuevo Atlas). Provistos de una computadora muy primitiva y algunos programas muy simples preparados por un estudiante universitario, comenzamos a comparar todas las secuencias nuevas con las secuencias anteriormente conocidas y descubrimos muchas relaciones totalmente inesperadas. Cuando se lanzó la Iniciativa del Genoma Humano al final del decenio de 1980, la cantidad de datos ya no era el factor limitador para la obtención de nuevos conocimientos; de repente lo era su manejo .

Muchos científicos se mostraron escépticos ante el proyecto del genoma humano. Señalaban que el genoma humano contenía cien veces más secuencias de aminoácidos que las bases de datos existentes. Conque, ¿cómo se identificarían los genes? ¿Cómo se puede comparar algo que nunca se ha encontrado?

Pero cada uno de los genes de un genoma no es un concepto enteramente nuevo y no todas las secuencias de proteínas son posibles: de lo contrario, el número de secuencias diferentes sería muchísimo mayor que el de átomos en el Universo. Sólo una fracción minúscula de las secuencias posibles se ha producido alguna vez, mediante duplicación, multiplicación y modificación de un pequeño conjunto inicial de genes. A consecuencia de ello, la mayoría de los genes está emparentada con otros genes.

Yo confiaba en que la bioinformática nos permitiera identificar todos los genes mediante la simple inspección de las secuencias, pero, después de que se completara la primera docena de genomas microbianos, la mitad, aproximadamente, de los genes siguen inidentificados, nivel que ha persistido en el caso de los cien primeros genomas completados, incluido el genoma humano. Incluso uno de los organismos más estudiados, la E. coli , tiene una abundancia de genes cuya función nunca se ha descubierto.

Aun así, las ventajas del desciframiento de los genomas han sido inmensas. Puede que las promesas de rápidas aplicaciones médicas fueran exageradas, pero el valor inherente es inconmensurable: la capacidad para entender quiénes somos, de donde venimos y qué genomas tenemos los seres humanos en común con el resto del mundo vivo.

Featured

new comment has been posted. new comments have been posted.

0 Comments on this paragraph, 0 Comments on this article

https://prosyn.org/LCRkIu5es

La revolución de la información en la genética

Introductory Offer: Save 30% on PS Digital

Featured

Will the World Keep Buying US Treasuries?

America Looks Like a Troubled Emerging-Market Economy

How Much “Weaponization” Can the Global Economy Take?

Is Trump Engineering the Decline and Fall of the Dollar?

Making Sense of the Tariff Chaos

New Comment

Email this piece to a friend

Contact us

Log in/Register

La revolución de la información en la genética

Introductory Offer: Save 30% on PS Digital

Featured

Edit Newsletter Preferences

Set up Notification