Vinte e dois anos após a conclusão do projeto do genoma humano, os cientistas revelaram o catálogo mais expansivo da variação genética humana já compilada.
Em dois novos artigos publicados quarta -feira (23 de julho) na revista Nature, os cientistas sequenciaram o DNA de 1.084 pessoas em todo o mundo. Eles aproveitaram os recentes avanços tecnológicos para analisar longos trechos de materials genético de cada pessoa, costuraram esses fragmentos e compararam os genomas resultantes em detalhes.
Os resultados aprofundam nossa compreensão das “variantes estruturais” dentro do genoma humano. Em vez de afetar uma única “letra” no código do DNA, essas variações afetam grandes pedaços do código – eles podem ser excluídos ou adicionados ao genoma ou abranger locais onde o DNA foi virado ou movido para um native diferente.
Os estudos revelaram características “ocultas” do genoma humano que antes eram tecnologicamente muito desafiadoras para estudar, disseram Jan Korbelo chefe interino de Laboratório Europeu de Biologia Molecular (EMBL) Heidelbergque é co-autor de ambos os novos trabalhos. Por exemplo, grandes porções do genoma contêm códigos que se repetem repetidamente, e estes foram considerados não funcionais.
“Cerca de 20 anos atrás, pensamos sobre isso como ‘DNA lixo’ – demos um termo muito ruim”, disse Korbel à Dwell Science. “Há cada vez mais a percepção de que essas seqüências não são lixo”, e o novo trabalho lança luz sobre essas sequências de DNA longitudadas.
Além disso, todos os dados gerados nos novos estudos são de acesso aberto, para que outros no campo agora possam tomar “as descobertas, algumas das ferramentas que desenvolvemos e as usamos para seus propósitos para entender a base genética da doença”, disse Korbel à Dwell Science. “Acredito completamente que os avanços que estamos publicando hoje na Nature, um subconjunto deles também entrará em diagnósticos”.
Relacionado: As identidades raciais e étnicas das pessoas não refletem sua ascendência genética
Mais de 1.000 genomas
Quando o primeiro rascunho de um genoma humano “completo” foi publicado em 2003, estava realmente faltando cerca de 15% de sua sequência devido a limitações tecnológicas da época. Em 2013, os cientistas conseguiram fechar essa lacuna pela metade. E finalmente, em 2022, o primeiro genoma humano “sem hole” foi publicado.
Em 2023, os pesquisadores publicaram o Primeiro rascunho de um pangenome humanoque incorporou o DNA de 47 pessoas em todo o mundo, em vez de serem predominantemente baseadas no DNA de uma pessoa. E no mesmo ano, os pesquisadores publicaram o Primeiro cromossomo Y que já havia sido sequenciado de ponta a pontaporque o genoma anterior “sem hole” ainda estava faltando o cromossomo sexual masculino.
Nos últimos anos, o campo continuou a avançar, graças a novas tecnologias e esforços para expandir a amostragem de DNA além das populações de descendência principalmente européia. Esses avanços anunciaram os dois artigos publicados na Nature nesta semana.
No primeiro estudo, pesquisadores sequenciou o DNA de 1.019 pessoas representando 26 populações em cinco continentes. Para analisar o DNA, os pesquisadores coletaram “Lengthy Reads”, cada uma composta por dezenas de milhares de pares de bases; Um par de bases corresponde a um degrau na escada em espiral de uma molécula de DNA.
“Com leituras curtas de cerca de 100 pares de bases, é difícil distinguir entre regiões genômicas que parecem iguais”, explicou a coautora do estudo Jesus Emiliano Sotelo-Fonsecaum estudante de doutorado no Centro de Regulamentação Genômica (CGR) em Barcelona, Espanha. Isso é especialmente verdadeiro em regiões repetitivas do genoma. “Com leituras mais longas, de cerca de 20 mil pares de bases, atribuir cada leitura a uma posição única no genoma fica muito mais fácil”, disse ele à Dwell Science em um electronic mail.
Mais da metade da nova variação genômica descoberta no estudo foi encontrada nessas regiões repetitivas complicadas, inclusive em transposons, também conhecidos como genes de salto. Os transposons podem saltar para diferentes locais no genoma, copiando e colando seu código. Às vezes, dependendo de onde eles pousam, podem desestabilizar o genoma, introduzir mutações nocivas e contribuir para doenças como o câncer.
“Nosso estudo revela que alguns desses transposons podem seqüestrar sequências regulatórias para aumentar sua atividade, contribuindo para entender os mecanismos biológicos por trás de sua mutagenicidade” ou capacidade de desencadear mutações, estudar co-autor Bernardo Rodríguez-Martínum membro independente da CGR e um ex -pós -doutorado no laboratório EMBL de Korbel, disse ao Dwell Science em um electronic mail.
Os genes de salto podem essencialmente pegar uma carona com certas moléculas regulatórias – RNAs não codificadores – e usar esse truque para fazer muito mais cópias de si mesmas do que normalmente. “Esse é um mecanismo muito surpreendente para nós”, disse Korbel.
Relacionado: Os cientistas acabaram de descobrir uma nova maneira como as células controlam seus genes
De 95% a 99%
O segundo estudo apresentou muito menos genomas – apenas 65 no whole – mas sequenciou esses genomas de maneira mais abrangente do que o primeiro estudo. O primeiro estudo capturou cerca de 95% de cada genoma analisado, enquanto o segundo estudo gerou genomas de 99%.
“Pode parecer uma pequena diferença, mas é enorme da perspectiva do cientista do genoma”, disse Korbel. “Para obter as últimas porcentagens, é uma grande conquista”.
Esse salto exigia diferentes técnicas de sequenciamento, bem como novas abordagens analíticas. “Este projeto usou o software program de ponta para montar genomas e identificar variação genética, muitas das quais simplesmente não existiam há alguns anos”, co-autor Charles Leeum professor do Laboratório Jackson para Medicina Genômica, disse ao Dwell Science em um electronic mail.
As técnicas de sequenciamento incluíram uma que gerou leituras longas com muito poucos erros e um que gerou leituras ultralonong que eram um pouco mais propensas a erros. À custa da análise de menos genomas, essa abordagem permitiu que o segundo estudo capturasse trechos de DNA que foram totalmente perdidos no primeiro, disse Rodríguez-Martín.
Aquelas regiões “ocultas” incluíram o centrômerosestruturas importantes nos centros de cromossomos que são fundamentais para a divisão celular. Enquanto uma célula se prepara para se separar, as fibras se prendem aos centrômeros e depois puxam o cromossomo em dois. O estudo constatou que, em cerca de 7% dos centrômeros, provavelmente existem dois lugares onde essas fibras podem anexar, em vez de apenas uma.
“Isso poderia significar que esses cromossomos são mais instáveis? Porque se o eixo (fibra) se conectar a dois pontos, pode ficar confuso”, disse Korbel. Essa é uma idéia puramente especulativa, acrescentou, mas agora é uma que pode ser explorada. O próximo passo será estudar os efeitos dessas variações de centrômero experimentalmente, concordou Lee.
Problemas com divisão cromossômica podem levar a várias condições. Por exemplo, “a síndrome de Down é o resultado de um erro de segregação cromossômica durante a divisão celular na meiose”, quando as células se dividem para formar esperma e ovos, co-autor Dr. Miriam Konkelum professor assistente do Centro de Genética Humana da Clemson College, disse ao Dwell Science em um electronic mail.
Como o primeiro estudo, o segundo estudo também forneceu uma aparência sem precedentes de genes de salto, catalogando mais de 12.900. Além do câncer, genes de salto também podem desencadear várias doenças genéticas Ao causar mutações, bem como provar mudanças mais sutis em como os genes são ligados e desligados, observou Konkel. Uma melhor compreensão da diversidade de genes de salto pode ajudar a descompactar sua função na saúde e nas doenças humanas.
Olhando para os dois estudos, os cientistas agora podem comparar os genomas recém -sequenciados com outros conjuntos de dados que incluem dados de genoma e saúde, observou Korbel. Este seria o primeiro passo para vincular as novas variações estruturais aos resultados tangíveis de saúde e, eventualmente, incorporar essas idéias sobre a prática médica.
“Certos estudos clínicos não serão capazes de ignorar essas técnicas (sequenciamento), porque elas lhes darão maior sensibilidade para identificar variação”, disse Korbel. “Você não quer perder variantes.”
Ainda há mais trabalho a ser feito para melhorar os dados genômicos também, acrescentou Lee. Mais DNA pode ser incorporado a partir de populações sub -representadas, e as técnicas e o software program de sequenciamento podem ser refinados para tornar o processo mais eficiente e preciso. Enquanto isso, o par de novos estudos marca um grande feito tecnológico.
“Essas ferramentas avançadas foram desenvolvidas recentemente para lidar com as enormes quantidades de dados de leitura longa que estamos usando agora para cada genoma”, disse Lee. “Alguns anos atrás, reunir um cromossomo humano completo de ponta a ponta, especialmente incluindo os centrômeros, period praticamente inatingível porque o software program e os algoritmos ainda não estavam maduros”.