Anthony Deighton, CEO da Tamr – Série de entrevistas

Anthony Deighton é CEO da Tamr. Ele tem 20 anos de experiência na construção e expansão de empresas de software program empresarial. Mais recentemente, ele passou dois anos como Diretor de Advertising and marketing na Celonis, estabelecendo sua liderança na categoria de software program Course of Mining e criando programas de geração de demanda resultando em um crescimento de 130% do ARR. Antes disso, ele trabalhou por mais de 10 anos na Qlik, fazendo-a crescer de uma empresa de software program sueca desconhecida para uma empresa pública — em funções de liderança de produto, advertising and marketing de produto e, finalmente, como CTO. Ele começou sua carreira na Siebel Programs aprendendo como construir empresas de software program empresarial em uma variedade de funções de produto.

Você pode compartilhar alguns marcos importantes da sua jornada no setor de software program empresarial, particularmente seu tempo na Qlik e na Celonis?

Comecei minha carreira em software program empresarial na Siebel Programs e aprendi muito sobre como construir e escalar empresas de software program empresarial com a equipe de liderança de lá. Entrei para a Qlik quando ela period uma pequena e desconhecida empresa de software program sueca, com 95% da pequena equipe de 60 pessoas localizada em Lund, Suécia. Brinco que, como eu não period engenheiro nem vendedor, fui encarregado do advertising and marketing. Criei a equipe de advertising and marketing lá, mas com o tempo meu interesse e contribuições gravitaram em direção ao gerenciamento de produtos e, eventualmente, me tornei Diretor de Produtos. Abrimos o capital da Qlik em 2010 e continuamos como uma empresa pública de sucesso. Depois disso, queríamos fazer algumas aquisições, então comecei uma equipe de fusões e aquisições. Depois de uma longa e razoavelmente bem-sucedida corrida como uma empresa pública, eventualmente vendemos a Qlik para uma empresa de capital privado chamada Thoma Bravo. Foi, como gosto de dizer, o ciclo de vida completo de uma empresa de software program empresarial. Depois de deixar a Qlik, entrei para a Celonis, uma pequena empresa de software program alemã tentando obter sucesso vendendo nos EUA. Novamente, administrei o advertising and marketing como CMO. Crescemos muito rapidamente e construímos uma função de advertising and marketing international de muito sucesso.

Tanto a Celonis quanto a Qlik estavam focadas no front-end do desafio de análise de dados – como vejo e entendo os dados? No caso da Qlik, eram os painéis; no caso da Celonis, eram os processos de negócios. Mas um desafio comum em ambas eram os dados por trás dessas visualizações. Muitos clientes reclamaram que os dados estavam errados: registros duplicados, registros incompletos, silos de dados ausentes. Foi isso que me atraiu para a Tamr, onde senti que, pela primeira vez, poderíamos resolver o desafio dos dados corporativos confusos. Os primeiros 15 anos da minha carreira em software program corporativo foram gastos visualizando dados, espero que os próximos 15 possam ser gastos limpando esses dados.

Como suas primeiras experiências moldaram sua abordagem para criar e expandir empresas de software program empresarial?

Uma lição importante que aprendi na mudança do Siebel para o Qlik foi o poder da simplicidade. O Siebel period um software program muito poderoso, mas foi morto no mercado pela Salesforce.com, que fez um CRM com muito menos recursos (“um brinquedo”, como Siebel costumava chamá-lo), mas os clientes conseguiam colocá-lo em funcionamento rapidamente porque period entregue como uma solução SaaS. Parece óbvio hoje, mas na época a sabedoria period que os clientes compravam recursos, mas o que aprendemos é que os clientes investem em soluções para resolver seus problemas de negócios. Então, se seu software program resolver o problema deles mais rápido, você ganha. O Qlik period uma solução simples para o problema de análise de dados, mas period radicalmente mais simples. Como resultado, conseguimos vencer concorrentes mais ricos em recursos, como Enterprise Objects e Cognos.

A segunda lição importante que aprendi foi na minha transição de carreira de advertising and marketing para produto. Pensamos nesses domínios como distintos. Na minha carreira, descobri que me movo fluidamente entre produto e advertising and marketing. Há uma ligação íntima entre o produto que você constrói e como você o descreve para clientes em potencial. E há uma ligação igualmente importante entre o que os clientes em potencial exigem e o produto que devemos construir. A capacidade de se mover entre essas conversas é um fator crítico de sucesso para qualquer empresa de software program empresarial. Um motivo comum para o fracasso de uma startup é acreditar que “se você construir, eles virão”. Essa é a crença comum de que se você apenas construir um software program authorized, as pessoas farão fila para comprá-lo. Isso nunca funciona, e a solução é um processo de advertising and marketing robusto conectado ao seu processo de desenvolvimento de software program.

A última ideia que compartilharei conecta meu trabalho acadêmico com meu trabalho profissional. Tive a oportunidade na escola de negócios de fazer uma aula sobre a teoria de inovação disruptiva de Clay Christensen. No meu trabalho profissional, tive a oportunidade de experimentar ser o disruptor e ser interrompido. A principal lição que aprendi é que qualquer inovação disruptiva é resultado de uma mudança de plataforma exógena que torna o impossível finalmente possível. No caso da Qlik, foi a disponibilidade da plataforma de grandes servidores de memória que permitiu à Qlik interromper os relatórios tradicionais baseados em cubo. Na Tamr, a disponibilidade da plataforma de aprendizado de máquina em escala nos permite interromper o MDM baseado em regras manuais em favor de uma abordagem baseada em IA. É importante sempre descobrir qual mudança de plataforma está impulsionando sua interrupção.

O que inspirou o desenvolvimento do Grasp Information Administration (MDM) nativo de IA e como ele se diferencia das soluções MDM tradicionais?

O desenvolvimento do Tamr surgiu do trabalho acadêmico no MIT (Instituto de Tecnologia de Massachusetts) em torno da resolução de entidades. Sob a liderança acadêmica do vencedor do Prêmio Turing, Michael Stonebraker, a questão que a equipe estava investigando period “podemos vincular registros de dados em centenas de milhares de fontes e milhões de registros”. À primeira vista, esse é um desafio intransponível porque quanto mais registros e fontes, mais registros cada correspondência possível precisa ser comparada. Cientistas da computação chamam isso de “problema n-quadrado” porque o problema aumenta geometricamente com a escala.

Os sistemas MDM tradicionais tentam resolver esse problema com regras e grandes quantidades de curadoria guide de dados. As regras não escalam porque você nunca pode escrever regras suficientes para cobrir todos os casos extremos e gerenciar milhares de regras é uma impossibilidade técnica. A curadoria guide é extremamente cara porque depende de humanos para tentar trabalhar com milhões de registros e comparações possíveis. Em conjunto, isso explica a baixa adoção de mercado das soluções tradicionais de MDM (Grasp Information Administration). Francamente, ninguém gosta do MDM tradicional.

A ideia simples de Tamr period treinar uma IA para fazer o trabalho de ingestão de fonte, correspondência de registros e resolução de valor. A grande coisa sobre a IA é que ela não come, dorme ou tira férias; ela também é altamente paralelizável, então ela pode pegar grandes volumes de dados e se esforçar para torná-los melhores. Então, onde o MDM costumava ser impossível, é finalmente possível obter dados limpos, consolidados e atualizados (veja acima).

Quais são os maiores desafios que as empresas enfrentam com o gerenciamento de dados e como a Tamr aborda essas questões?

O primeiro, e sem dúvida o mais importante desafio que as empresas enfrentam no gerenciamento de dados é que seus usuários empresariais não usam os dados que geram. Ou dito de outra forma, se as equipes de dados não produzem dados de alta qualidade que suas organizações usam para responder a perguntas analíticas ou otimizar processos empresariais, então elas estão desperdiçando tempo e dinheiro. Uma saída primária do Tamr é uma página 360 para cada registro de entidade (pense: cliente, produto, peça, and many others.) que combina todos os dados primários e de terceiros subjacentes para que os usuários empresariais possam ver e fornecer suggestions sobre os dados. Como um wiki para seus dados de entidade. Esta página 360 também é a entrada para uma interface de conversação que permite que os usuários empresariais façam e respondam perguntas com os dados. Então, a tarefa um é dar os dados ao usuário.

Por que é tão difícil para as empresas darem aos usuários os dados que eles amam? Porque há três problemas difíceis principais subjacentes a esse objetivo: carregar uma nova fonte, combinar os novos registros com os dados existentes e corrigir os valores/campos nos dados. A Tamr facilita o carregamento de novas fontes de dados porque sua IA mapeia automaticamente novos campos em um esquema de entidade definido. Isso significa que, independentemente de como uma nova fonte de dados chama um campo específico (exemplo: cust_name), ele é mapeado para a definição central correta dessa entidade (exemplo: “nome do cliente”). O próximo desafio é vincular registros que são duplicados. Duplicação neste contexto significa que os registros são, de fato, a mesma entidade do mundo actual. A IA da Tamr faz isso e até usa fontes externas de terceiros como “verdade básica” para resolver entidades comuns, como empresas e pessoas. Um bom exemplo disso seria vincular todos os registros em muitas fontes para um cliente importante, como “Dell Pc”. Por fim, para qualquer registro fornecido, pode haver campos em branco ou incorretos. O Tamr pode imputar os valores de campo corretos de fontes internas e de terceiros.

Você pode compartilhar uma história de sucesso em que a Tamr melhorou significativamente o gerenciamento de dados e os resultados comerciais de uma empresa?

A CHG Healthcare é uma grande empresa no setor de pessoal de saúde, conectando profissionais de saúde qualificados com instalações necessitadas. Sejam médicos temporários por meio de Locums, enfermeiros com RNnetwork ou soluções mais amplas por meio da própria CHG, eles fornecem soluções de pessoal personalizadas para ajudar as instalações de saúde a funcionarem sem problemas e fornecer cuidados de qualidade aos pacientes.

Sua proposta de valor elementary é conectar os provedores de saúde certos com a instalação certa no momento certo. O desafio deles period que eles não tinham uma visão precisa e unificada de todos os provedores em sua rede. Dada sua escala (mais de 7,5 milhões de provedores), period impossível manter seus dados precisos com abordagens legadas e orientadas por regras sem gastar muito com curadores humanos. Eles também não podiam ignorar o problema, pois suas decisões de equipe dependiam disso. Dados ruins para eles podem significar que um provedor recebe mais turnos do que pode lidar, levando ao esgotamento.

Usando os recursos avançados de IA/ML da Tamr, a CHG Healthcare reduziu registros médicos duplicados em 45% e eliminou quase completamente a preparação guide de dados que estava sendo feita por recursos escassos de dados e análises. E o mais importante, ao ter uma visão confiável e precisa dos provedores, a CHG consegue otimizar a equipe, permitindo que eles ofereçam uma melhor experiência ao cliente.

Quais são alguns equívocos comuns sobre IA no gerenciamento de dados e como a Tamr ajuda a dissipar esses mitos?

Um equívoco comum é que a IA tem que ser “perfeita”, ou que regras e curadoria humana são perfeitas em contraste com a IA. A realidade é que as regras falham o tempo todo. E, mais importante, quando as regras falham, a única solução é mais regras. Então, você tem uma bagunça incontrolável de regras. E a curadoria humana também é falível. Os humanos podem ter boas intenções (embora nem sempre), mas nem sempre estão certos. O que é pior, alguns curadores humanos são melhores do que outros, ou simplesmente podem tomar decisões diferentes dos outros. A IA, em contraste, é probabilística por natureza. Podemos validar por meio de estatísticas o quão precisas são quaisquer dessas técnicas e, quando o fazemos, descobrimos que a IA é menos dispendiosa e mais precisa do que qualquer alternativa concorrente.

Tamr combina IA com refinamento humano para precisão de dados. Você pode elaborar sobre como essa combinação funciona na prática?

Os humanos fornecem algo excepcionalmente importante para a IA – eles fornecem o treinamento. A IA é realmente sobre escalar os esforços humanos. O que a Tamr procura nos humanos é o pequeno número de exemplos (“rótulos de treinamento”) que a máquina pode usar para definir os parâmetros do modelo. Na prática, o que isso parece é que os humanos gastam uma pequena quantidade de tempo com os dados, dando à Tamr exemplos de erros e enganos nos dados, e a IA executa essas lições em todo o(s) conjunto(s) de dados. Além disso, conforme novos dados são adicionados, ou os dados mudam, a IA pode revelar instâncias em que está lutando para tomar decisões com confiança (“correspondências de baixa confiança”) e pedir a contribuição do humano. Essa contribuição, é claro, serve para refinar e atualizar os modelos.

Qual o papel dos grandes modelos de linguagem (LLMs) nos processos de enriquecimento e qualidade de dados do Tamr?

Primeiro, é importante deixar claro em que os LLMs são bons. Fundamentalmente, os LLMs são sobre linguagem. Eles produzem sequências de texto que significam algo, e podem “entender” o significado do texto que lhes é entregue. Então, você poderia dizer que eles são máquinas de linguagem. Então, para Tamr, onde a linguagem é importante, usamos LLMs. Um exemplo óbvio está em nossa interface de conversação que fica em cima de nossos dados de entidade que chamamos carinhosamente de nosso CDO digital. Quando você fala com seu CDO da vida actual, eles entendem você e respondem usando uma linguagem que você entende. Isso é exatamente o que esperaríamos de um LLM, e é exatamente assim que o usamos nessa parte do nosso software program. O que é valioso sobre Tamr neste contexto é que usamos os dados da entidade como contexto para a conversa com nosso vCDO. É como se seu CDO da vida actual tivesse TODOS os seus MELHORES dados corporativos na ponta dos dedos quando responde às suas perguntas – isso não seria ótimo!

Além disso, há casos em que, ao limpar valores de dados ou imputar valores ausentes, queremos usar uma interpretação baseada em linguagem de valores de entrada para encontrar ou corrigir um valor ausente. Por exemplo, você pode perguntar no texto “rolamento de esferas de 5 mm” qual é o tamanho da peça, e um LLM (ou uma pessoa) responderia corretamente “5 mm”.

Por fim, os LLMs subjacentes estão incorporando modelos que codificam o significado da linguagem para tokens (pense em palavras). Eles podem ser muito úteis para calcular a comparação linguística. Então, embora “5” e “5” não compartilhem caracteres em comum, eles são muito próximos em significado linguístico. Então, podemos usar essas informações para vincular registros.

Como você vê a evolução do futuro do gerenciamento de dados, especialmente com os avanços em IA e aprendizado de máquina?

A period do “Large Information” do início dos anos 2000 deve ser lembrada como a period do “Small Information”. Embora muitos dados tenham sido criados nos últimos 20 anos, possibilitados pela comoditização do armazenamento e da computação, a maioria dos dados que tiveram impacto na empresa é de escala relativamente pequena — relatórios básicos de vendas e clientes, análises de advertising and marketing e outros conjuntos de dados que poderiam ser facilmente descritos em um painel. O resultado é que muitas das ferramentas e processos usados no gerenciamento de dados são otimizados para “small knowledge”, razão pela qual a lógica baseada em regras, suplementada com curadoria humana, ainda é tão proeminente no gerenciamento de dados.

A maneira como as pessoas querem usar dados está mudando fundamentalmente com os avanços em IA e aprendizado de máquina. A ideia de “agentes de IA” que podem executar autonomamente uma parte significativa do trabalho de uma pessoa só funciona se os agentes tiverem os dados de que precisam. Se você espera que um agente de IA atue na linha de frente do suporte ao cliente, mas tem cinco representações de “Dell Pc” em seu CRM e não está conectado com informações de produto em seu ERP, como você pode esperar que eles forneçam um serviço de alta qualidade quando alguém da Dell entra em contato?

A implicação disso é que nossas ferramentas e processos de gerenciamento de dados precisarão evoluir para lidar com a escala, o que significa adotar IA e aprendizado de máquina para automatizar mais atividades de limpeza de dados. Os humanos ainda desempenharão um grande papel na supervisão do processo, mas fundamentalmente precisamos pedir que as máquinas façam mais para que não sejam apenas os dados em um único painel que sejam precisos e completos, mas a maioria dos dados na empresa.

Quais são as maiores oportunidades para as empresas hoje quando se trata de aproveitar seus dados de forma mais eficaz?

Aumentando o número de maneiras pelas quais as pessoas podem consumir dados. Não há dúvida de que as melhorias nas ferramentas de visualização de dados tornaram os dados muito mais acessíveis em toda a empresa. Agora, os líderes de dados e análises precisam olhar além do painel para maneiras de entregar valor com dados. Interfaces como páginas internas 360, gráficos de conhecimento e assistentes de conversação estão sendo habilitadas por novas tecnologias e dão aos potenciais consumidores de dados mais maneiras de usar dados em seu fluxo de trabalho diário. É particularmente poderoso quando estes são incorporados nos sistemas que as pessoas já usam, como CRMs e ERPs. A maneira mais rápida de criar mais valor a partir de dados é trazendo os dados para as pessoas que podem usá-los.

Obrigado pela ótima entrevista. Os leitores que desejarem saber mais devem visitar Tamr.

Unite AI Mobile Newsletter 1