Biólogos e químicos têm uma nova linguagem de programação para descobrir poluentes ambientais anteriormente desconhecidos em velocidade vertiginosa – sem exigir que eles codificam. Ao facilitar a pesquisa de conjuntos de dados químicos maciços, a ferramenta já identificou compostos tóxicos escondidos à vista.
Os dados de espectrometria de massa são como uma impressão digital química, mostrando aos cientistas quais são as moléculas em uma amostra como ar, água ou sangue e em que quantidades. Ajuda a identificar tudo, desde poluentes na água até produtos químicos em novos medicamentos.
Desenvolvido na UC Riverside, Language de consulta em massa ou MassQL, funções como um mecanismo de pesquisa para dados de espectrometria de massa, permitindo que os pesquisadores encontrem padrões que, de outra forma, exigiriam habilidades avançadas de programação. Detalhes técnicos sobre o idioma e um exemplo de como ele ajudou a identificar produtos químicos retardadores de chama em vias navegáveis públicas, são descritas em um novo Métodos da natureza Artigo da revista.
“Queríamos dar a químicos e biólogos, que geralmente não são cientistas da computação, a capacidade de extrair seus dados exatamente como desejam, sem ter que passar meses ou anos aprendendo a codificar”, disse Mingxun Wang, professor assistente de ciência da computação da UCR, que criou o idioma.
Demonstrando a eficácia do idioma, Nina Zhao, uma estudante de pós -doutorado da UCR agora na UC San Diego, usou o MassQL para examinar os dados de espectrometria de massa do mundo inteiro sobre amostras de água que foram disponibilizadas ao público. Ela estava procurando ésteres de organofosfato, que geralmente são encontrados em retardadores de chama.
“Existem literalmente um bilhão de medições de moléculas nesses dados. Você não pode passar por eles manualmente”, disse Wang. “No entanto, o idioma age como um filtro, em certo sentido, para esses produtos químicos, e retirou milhares deles”.
Além de encontrar produtos químicos conhecidos nas amostras de água, eles também encontraram compostos organofosfato que não foram descritos ou catalogados anteriormente, e alguns produtos químicos que são o produto de organofosfatos quebrando com o tempo.
“Esses produtos químicos podem causar muitos problemas para a saúde humana e animal e para ecossistemas inteiros. Eles foram projetados para serem retardadores ou plastificantes chamas, mas podem causar interrupções endócrinas e sexuais do sistema, além de problemas cardiovasculares”, disse Zhao.
Antes que possam ser feitos planos para lidar ou remover produtos químicos tóxicos do nosso meio ambiente, os cientistas precisam saber o que está presente. É aí que o MassQL é útil para cientistas como Zhao.
“O idioma me permite rastrear tudo o que já foi detectado em todos os dados sobre ar, solo, água e até no corpo humano. O que existe, podemos procurar produtos químicos lá”, disse ela.
Um dos desafios na criação de MassQL foi em obter um consenso de cientistas da vida para concordar com a definição de termos que o software program usaria. “Tanto os químicos quanto os cientistas da computação precisam entendê -lo, e o software program precisa ser capaz de operar”, disse Wang.
Por esse motivo, cerca de 70 cientistas consultaram na fase de desenvolvimento. Todos eles deram seus comentários sobre os termos de informação mais importantes e como expressá -los no idioma MassQL.
A equipe de pesquisa também queria demonstrar que o idioma poderia ser útil em uma variedade de situações da vida actual. Além do projeto de Zhao, o artigo detalha mais de 30 aplicações nas quais o MassQL poderia ser aplicado.
Os casos de uso de amostras incluem a detecção de ácidos graxos como marcadores de envenenamento por álcool, procurando novos medicamentos para resolver a iminente crise de resistência ao antibiótico, aprendendo sobre os produtos químicos que as bactérias usam para se comunicar e encontrar produtos químicos para sempre nos playgrounds.
No passado, Wang recebia solicitações de software program que pudessem procurar padrões de dados específicos para todos esses diferentes tipos de aplicativos.
“Eu pensei que poderia fazer algo para me economizar tempo”, disse ele. “Eu queria criar um idioma que pudesse lidar com vários tipos de consultas. E agora temos. Estou animado ao saber das descobertas que poderiam vir disso”.