Tech

Leland Hyman, cientista-chefe de dados da Sherlock Biosciences – série de entrevistas

Leland Hyman é o principal investigador de dados da Sherlock Biosciences. Ele é um experiente investigador da computação e pesquisador com experiência em aprendizagem de máquina e diagnóstico molecular.

Sherlock Biosciences é uma empresa de biotecnologia com sede em Cambridge, Massachusetts, que desenvolve testes de diagnóstico usando CRISPR. O seu objectivo é perturbar o diagnóstico molecular com testes melhores, mais rápidos e acessíveis.

O que inicialmente atraiu você para a ciência da computação?

Comecei a programar muito jovem, mas meu interesse principal era fazer videogames com meus amigos. Meu interesse cresceu em outras aplicações da ciência da computação durante a faculdade e a pós-graduação, principalmente com todo o trabalho inovador de aprendizagem de máquina que aconteceu no início da dez de 2010. Todo o campo parecia uma novidade fronteira tão excitante que poderia impactar diretamente a pesquisa científica e a nossa vida diária – não pude deixar de permanecer fascinado por ele.

Você também fez doutorado. em Biologia Celular e Molecular, quando você percebeu pela primeira vez que os dois campos se cruzariam?

Comecei a fazer esse tipo de trabalho interseccional com ciência da computação e biologia ainda na pós-graduação. Meu laboratório se concentrou em resolver problemas de engenharia de proteínas por meio de colaborações entre bioquímicos radicais, cientistas da computação e todos os demais. Rapidamente reconheci que o aprendizagem de máquina poderia fornecer informações valiosas sobre sistemas biológicos e tornar a experimentação muito mais fácil. Por outro lado, também apreciei o valor da percepção biológica na construção de modelos de aprendizagem de máquina. Na minha opinião, enquadrar o problema com precisão é o elemento crucial no aprendizagem de máquina. É por isso que acredito que os esforços colaborativos em diferentes campos podem ter um impacto profundo.

Desde 2022 você trabalha na Sherlock Biosciences. Você poderia compartilhar alguns detalhes sobre o que sua função envolve?

Atualmente lidero a equipe computacional da Sherlock Biosciences. Nosso grupo é responsável por projetar os componentes que compõem nossos ensaios de diagnóstico, fazer interface com os experimentalistas que testam esses projetos no laboratório úmido e edificar novas capacidades computacionais para melhorar os projetos. Além de coordenar essas atividades, trabalho nas partes de aprendizagem de máquina de nossa base de código, experimentando novas arquiteturas de modelos e novas maneiras de simular a física do DNA e do RNA envolvidos em nossos ensaios.

O aprendizagem de máquina está no núcleo da Sherlock Biosciences. Você poderia descrever o tipo e o volume de dados que estão sendo coletados e porquê o ML analisa esses dados?

Durante o desenvolvimento do experimento, testamos dezenas a centenas de ensaios candidatos para cada novo patógeno. Embora a grande maioria desses candidatos não consiga passar em um teste mercantil, nós os vemos porquê uma oportunidade de aprender com nossos erros. Nestes experimentos, medimos duas coisas principais: sensibilidade e velocidade. Nossos modelos tomam porquê ingressão as sequências de DNA e RNA em cada experimento e depois aprendem a prever a sensibilidade e a velocidade do experimento.

Porquê o ML prevê quais componentes de diagnóstico molecular funcionarão com maior velocidade e precisão?

Quando pensamos em porquê um ser humano aprende, existem duas estratégias principais. Por um lado, uma pessoa poderia aprender porquê realizar uma tarefa por pura tentativa e erro. Eles poderiam repetir a tarefa e, depois de muitas falhas, acabariam descobrindo as regras da tarefa por conta própria. Essa estratégia era muito popular antes da internet. No entanto, poderíamos fornecer a essa pessoa um professor para lhe manifestar imediatamente as regras da tarefa. O aluno com o professor poderia aprender muito mais rápido do que com a abordagem de tentativa e erro, mas unicamente se tivesse um bom professor que entendesse perfeitamente a tarefa.

Nossa abordagem para treinar modelos de aprendizagem de máquina está no meio do caminho entre essas duas estratégias. Embora não tenhamos um “professor” perfeito para nossos modelos de aprendizagem de máquina, podemos iniciá-los com qualquer conhecimento sobre a física das cadeias de DNA e RNA em nossos ensaios. Isso os ajuda a aprender a fazer melhores previsões com menos dados. Para fazer isso, executamos várias simulações biofísicas nas sequências de DNA e RNA do nosso experimento. Em seguida, inserimos os resultados no protótipo e pedimos que ele preveja a velocidade e a sensibilidade do experimento. Repetimos esse processo para todos os experimentos que realizamos no laboratório, e o protótipo mostra a diferença entre suas previsões e o que realmente aconteceu. Através de repetição suficiente, ele eventualmente aprende porquê a física do DNA e do RNA se relaciona com a velocidade e a sensibilidade de cada experimento.

Quais são algumas outras maneiras pelas quais os algoritmos de IA são usados ​​pela Sherlock Biosciences?

Usamos algoritmos de aprendizagem de máquina para resolver uma ampla variedade de problemas. Alguns exemplos que vêm à mente estão relacionados à pesquisa de mercado e estudo de imagem. Para pesquisas de mercado, conseguimos treinar modelos que aprendem sobre diferentes tipos de clientes e quantas pessoas podem ter necessidades não atendidas de testes de doenças. Também construímos modelos para averiguar imagens de tiras de fluxo lateral (o tipo de teste comumente usado em testes de venda livre para COVID) e prever involuntariamente se uma margem positiva está presente. Embora pareça uma tarefa trivial para um ser humano, posso manifestar em primeira mão que é uma escolha incrivelmente profíquo para consignar manualmente milhares de imagens.

Quais são alguns dos desafios por trás da construção de modelos de ML que funcionam em conjunto com tecnologias de ponta em biociências, porquê o CRISPR?

A disponibilidade de dados é o principal repto na emprego de modelos de aprendizagem de máquina a qualquer tecnologia de biociências. As tecnologias CRISPR e baseadas em DNA ou RNA enfrentam um repto exímio, principalmente devido aos conjuntos de dados estruturais significativamente menores disponíveis para ácidos nucleicos em conferência com proteínas. É por isso que vimos grandes avanços no ML de proteínas nos últimos anos (com AlphaFold2 e outros), mas os avanços no ML de DNA e RNA ainda estão atrasados.

Qual é a sua visão para o porvir de porquê a IA se integrará ao CRISPR e à biociência?

Estamos a ver a um enorme boom de IA nos campos da engenharia de proteínas e da invenção de medicamentos, e espero que isto continue a apressar o desenvolvimento na indústria farmacêutica. Eu adoraria ver o mesmo sobrevir com o CRISPR e outras tecnologias baseadas em DNA e RNA nos próximos anos. Isso poderia ter um impacto incrível em diagnósticos, medicina humana e biologia sintética. Já vimos os benefícios das ferramentas computacionais no nosso desenvolvimento de diagnósticos e tecnologias CRISPR cá em Sherlock, e espero que nascente tipo de trabalho encoraje um efeito de “esfera de neve” para impulsionar o campo.

Obrigado pela ótima entrevista, os leitores que desejam saber mais devem visitar Sherlock Biosciences.

Unite AI Mobile Newsletter 1

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button