0

El lenguaje de la genómica

DALIAN, CHINA – La semana pasada, una empresa llamada Complete Genomics anunció 10 nuevos clientes para su servicio de secuenciación del genoma. El precio no se especificó, pero la compañía dijo que su objetivo es ofrecer el servicio por 5.000 dólares de aquí a un año.

Lo que me llamó la atención no fue el anuncio en sí, sino el nombre del CEO: Cliff Reid. Cuando yo lo conocí en los años 1980, era el CEO de una empresa de búsqueda de texto llamada Verity. La conexión me sorprendió casi de inmediato. Los genes son, en un sentido, el lenguaje de instrucción para crear seres humanos (o cualquier otra cosa viviente). Y el lenguaje son símbolos que interactúan para crear significado. Y, sí, por supuesto, era el mismo Cliff Reid que conocí a fines de los años 1980.

Chicago Pollution

Climate Change in the Trumpocene Age

Bo Lidegaard argues that the US president-elect’s ability to derail global progress toward a green economy is more limited than many believe.

Lo que Complete Genomics está haciendo con los 91 millones de dólares que lleva recaudados hasta el momento es emocionante. Ha creado una fábrica de secuenciación del genoma y piensa construir varias más en los próximos años. Muchas instalaciones de investigación académica y comercial quieren una, al igual que varios países.

Lo que encuentro interesante son las implicancias. Ahora mismo, un genoma es similar a una novela escrita en un idioma desconocido. Existe una gran cantidad de información allí, pero no podemos entenderla. Imaginemos obtener una copia de La guerra y la paz de Tolstoi en ruso y, suponiendo que no podemos leer ruso, intentar entender la historia. Imposible. Es una situación muy similar a la de entender el lenguaje natural en el momento en que Reid se sumó a Verity.

Por otro lado, hemos empezado a reconocer algunas palabras -variantes genéticas específicas- que parecen corresponder a ciertos incidentes en la historia. En el caso de la genética, esos incidentes son enfermedades y malestares. Y de la misma manera que hacen falta varios individuos para causar un incidente, suelen hacer falta varias variaciones genéticas, además de factores ambientales, para causar una enfermedad. Los genes suelen trabajar juntos, a veces ayudados por factores como la dieta o el comportamiento de una persona, para causar un malestar.

Existen dos desafíos clave en la genómica. Uno consiste simplemente en detectar los genes, solos o en combinación, que parecen derivar en determinadas enfermedades. Eso por sí sólo puede resultar útil. Con suficientes datos, podemos determinar que la misma ampquot;enfermedadampquot; es, de hecho, una variedad de diferentes trastornos, algunos susceptibles a determinados tratamientos conocidos y algunos susceptibles a otros o simplemente incurables.

Para esto, la simple correlación es suficiente. Las personas con cáncer de mama derivado del gen BRCA obtienen buenos resultados con un tratamiento con herceptina, mientras que aquellas personas con otros tipos de cáncer de mama, no. No sabemos por qué, pero la correlación es clara.

El segundo desafío consiste en entender de qué manera los genes interactúan entre sí o con otros factores para producir la enfermedad, lo que debería permitir el desarrollo de nuevas medidas preventivas o tratamientos basados en los detalles de cómo empieza el trastorno y cómo progresa. Eso, por supuesto, es mucho más interesante -y más difícil de lograr-. En un sentido, es la diferencia entre emparentar palabras y entender un texto.

De manera que no sorprende que Reid haya encontrado un papel que ejercer en este nuevo mercado. Complete Genomics y sus competidores están por crear cantidades gigantescas de datos. La ventaja de CGI no consiste exclusivamente en secuenciar los genomas a bajo costo, sino también depurar los datos en listas de variaciones. En otras palabras, en gran parte de la investigación, los interrogantes no giran alrededor de un genoma entero, sino de las diferencias relevantes del genoma de algún individuo con respecto a la norma.

Existen diferencias comunes, como las diferencias entre los ojos azules y los ojos marrones, o incluso entre la gente con tendencia a tener el mal de Crohn y aquellas personas que improbablemente lo tengan. Luego existen diferencias que resultan simplemente de un gen ampquot;rotoampquot;, que no es una variante sino simplemente un error. La mayoría de estos genes son inofensivos; los verdaderamente nocivos no sobreviven lo suficiente como para manifestarse.

La tarea de los investigadores es encontrarle significado a todos estos datos. Estamos apenas en el comienzo de este proceso, que llevará muchos años. Mientras algunos investigadores buscan correlaciones estadísticas, otros estudian de qué manera interactúan los genes individuales.

Para todos ellos, el acceso a las secuencias del genoma es importante. Pero los genomas significan poco sin las correspondientes historias clínicas, de la misma manera que la novela rusa -en cualquier idioma- significa poco sin el conocimiento correspondiente de la historia rusa.

Para obtener esa historia clínica, hace falta el consentimiento de los individuos cuyos genomas se están secuenciando. También existe una buena dosis de procesamiento de datos para que las historias clínicas puedan usarse. Gran parte de la información simplemente no está registrada. Y otra buena parte todavía está en papel, o en imágenes escaneadas, registros de compañías de seguro y transacciones farmacéuticas. Existe un idioma estándar para representar las enfermedades, pero en muchos casos las historias clínicas que contienen este idioma podrían estar ocultas debajo de algún colchón.

El movimiento actual en muchos países desarrollados hacia historias clínicas electrónicas mejorará la atención médica de manera directa, pero también conducirá a una liquidez de información muy mejorada para ayudar en la investigación genética y médica.

Fake news or real views Learn More

Ahora tenemos la capacidad de secuenciar genomas a costos cada vez más bajos, y lentamente estamos logrando que la correspondiente información médica se pueda leer en una computadora. Empresas como Complete Genomics están desarrollando programas que puedan procesar la información.

Todavía existe, por supuesto, una enorme cantidad de datos por recavar y procesar, y grandes cantidades de investigación y descubrimientos por suceder. Pero es difícil no ser optimista respecto de nuestro creciente conocimiento médico. El desafío de aquí a cinco años será transformar todo ese conocimiento en práctica a través de mejores medidas preventivas, mejores medicamentos y mejor atención  médica.