0

Jazyk genomiky

TA-LIEN, ČÍNA – Společnost nazvaná Complete Genomics minulý týden oznámila, že pro svou službu sekvenování genomu má 10 nových zákazníků. Cena uvedena nebyla, ale společnost prohlásila, že jejím cílem je do roka službu nabízet za 5000 dolarů.

Nezaujalo mě samotné oznámení, nýbrž jméno ředitele společnosti: Cliff Reid, jehož jsem v 80. letech znala jako ředitele Verity, společnosti zaměřené na prohledávání textu. Ta spojitost mě téměř okamžitě udeřila. Geny jsou v jistém smyslu jazykem instrukcí ke stavbě lidských bytostí (či jiných živých organismů). A jazyk tvoří symboly, které svou interakcí vytvářejí smysl. A ovšemže se jednalo o téhož Cliffa Reida, jehož jsem znala na konci 80. let.

Práce, již Complete Genomics za doposud získaných 91 milionů dolarů odvádí, je vzrušující. Postavila továrnu k sekvenování genomu a v nadcházejících letech se chystá vybudovat ještě několik dalších. Mít takový provoz by si přála řada akademických i komerčních výzkumných ústavů a rovněž několik států.

Co mě na tom zajímá, jsou důsledky. V současnosti se genom podobá románu napsanému v neznámém jazyce. Obsahuje obrovské množství informací, ale my jim nerozumíme. Představte si, že máte v ruce výtisk Tolstého Vojny a míru v ruštině a (za předpokladu, že neumíte rusky) chcete příběhu porozumět. Je to beznadějné. Právě tak vypadala situace ohledně porozumění přirozenému jazyku v době, kdy Reid vstupoval do Verity.

Na druhou stranu, začínáme už rozumět některým slovům – konkrétním genetickým variantám – která podle všeho odpovídají jistým událostem z minulosti. V případě genetiky jsou těmito událostmi choroby a zdravotní obtíže. A právě tak jako je ke vzniku události obvykle zapotřebí několika osob, i vznik nemoci často vyžaduje několik genetických variant, plus vnější okolnosti. Na vyvolání zdravotních potíží se často podílí společné působení genů, občas za přispění faktorů, jako jsou strava či návyky dané osoby.

V genomice jsou dvě klíčové výzvy. První je prostá detekce genů, samotných nebo v kombinacích, které pravděpodobně vedou k určitým chorobám. Už to samotné může být prospěšné. S dostatkem údajů budeme schopni zjistit, že určitá „nemoc“ je ve skutečnosti škálou různých chorob, z nichž některé dokážou potlačit konkrétní známé léky a další zase potlačí jiné léky anebo jsou prostě nevyléčitelné.

K tomu postačuje pouhá korelace. Osobám s rakovinou prsu zapříčiněnou genem BRCA prospívá léčba Herceptinem, kdežto osobám s jinými druhy rakoviny prsu tento přípravek nepomáhá. Nevíme sice proč, ale souvztažnost je jasná.

Druhou výzvou je porozumět tomu, jak vzájemným působením genů či vlivem dalších faktorů chorobný stav vzniká, což by mělo umožnit vývoj nových preventivních opatření či terapií vycházejících z podrobností o tom, jak daná zdravotní komplikace vzniká a jak se vyvíjí. To je samozřejmě mnohem zajímavější – a mnohem těžší. V jistém smyslu jde o rozdíl mezi odhadováním významu slov a porozuměním textu.

Není tedy divu, že si Reid našel úlohu právě na tomto novém trhu. Complete Genomics a její konkurenti se chystají vytvářet obrovská množství dat. Předností Complete Genomics je nejen levné sekvenování genomů, ale i schopnost pročistit data do výčtů variací. Jinými slovy, u většiny výzkumů se otázky netočí kolem celého genomu, nýbrž kolem relevantních odlišností genomu konkrétního jedince od normy.

Existují běžné odlišnosti, třeba rozdíly mezi modrýma a hnědýma očima, nebo dokonce mezi lidmi s náchylností ke Crohnově chorobě a bez takového sklonu. Pak existují odlišnosti, které jsou důsledkem „rozbitého“ genu, jenž není variantní, ale prostě chybný. Ty jsou většinou neškodné; ty skutečně zhoubné nepřežijí tak dlouho, aby se někde projevily.

Úkolem výzkumníků je odhalit význam všech těchto dat. Jsme na samém počátku tohoto procesu, který bude trvat mnoho let. Zatímco někteří badatelé hledají statistické korelace, jiní se zabývají způsobem interakce konkrétních genů.

Pro všechny je důležité mít přístup k sekvencím genomů. Bez souvisejících lékařských anamnéz ale genomy neznamenají mnoho, tak jako ruský román – v jakémkoli jazyce – neznamená mnoho bez odpovídajících znalostí ruských dějin.

Získat tyto anamnézy vyžaduje souhlas jedinců, jejichž genomy se sekvenují. Dále je zapotřebí tato data rozsáhle zpracovávat, aby byly záznamy přínosné. Mnoho informací zaznamenáno není. A mnoho jich je stále na papíře nebo na skenovaných obrázcích, v záznamech pojišťoven a ve výpisech lékárenských transakcí. K označování nemocí se používá zavedený jazyk, ale záznamy psané touto řečí se v mnoha případech mohou ukrývat pod matracemi.

Současné směřování k elektronickým lékařským záznamům v mnoha vyspělých zemích zlepší jednak přímo zdravotní péči, ale významně posílí i likviditu informací, jež pomohou genetickému a dalšímu lékařskému výzkumu.

Dnes už dokážeme čím dál laciněji sekvenovat genomy a odpovídající zdravotnické informace pomalu převádíme do podoby čitelné pro počítače. Společnosti jako Complete Genomics vyvíjejí software, který tyto informace dokáže zpracovat.

Ovšemže před sebou stále máme obrovská množství dat, která je třeba shromáždit a zpracovat, a obrovský rozsah výzkumu a řadu objevů, k nimž dojde. Je však těžké se při pohledu na narůstající lékařské znalosti ubránit optimismu. Za pět let budeme čelit výzvě jak všechny tyto poznatky prostřednictvím lepších preventivních opatření, dokonalejších léků a kvalitnější péče promítnout do praxe.