Tech

Por que os autocratas da IA ​​devem ser desafiados a fazer melhor

Se aprendemos alguma coisa com a Period da IA, é que a indústria está lidando com desafios de poder significativos. Esses desafios são tanto literais — como encontrar maneiras de atender às demandas vorazes de energia que os information facilities de IA exigem — quanto figurativos — como a concentração da riqueza da IA ​​em poucas mãos com base em interesses comerciais estreitos em vez de benefícios sociais mais amplos.

O paradoxo do poder da IA: custos elevados, controle concentrado

Para que a IA seja bem-sucedida e beneficie a humanidade, ela deve se tornar onipresente. Para se tornar onipresente, ela deve ser sustentável tanto econômica quanto ambientalmente. Esse não é o caminho que estamos seguindo agora. A batalha obsessiva por uma IA maior e mais rápida é motivada mais por ganhos de desempenho de curto prazo e domínio de mercado do que pelo que é melhor para uma IA sustentável e acessível.

A corrida para construir sistemas de IA cada vez mais poderosos está acelerando, mas isso tem um alto custo ambiental. Chips de IA de ponta, como o H100 da Nvidia (até 700 watts), já consomem quantidades significativas de energia. Espera-se que essa tendência proceed, com especialistas do setor prevendo que a arquitetura Blackwell de próxima geração da Nvidia pode empurrar o consumo de energia por chip para bem na faixa de quilowatts, potencialmente excedendo 1.200 watts. Com os líderes do setor prevendo que milhões desses chips serão implantados em information facilities em todo o mundo, as demandas de energia da IA ​​estão prestes a disparar.

O custo ambiental da corrida armamentista da IA

Vamos colocar isso em um contexto cotidiano. A eletricidade que alimenta sua casa inteira poderia fazer todos os seus aparelhos funcionarem a todo vapor simultaneamente – não que alguém faria isso. Agora think about apenas um rack Nvidia de 120kw demandando a mesma quantidade de energia – especialmente quando pode haver centenas ou milhares em grandes information facilities! Agora, 1.200 watts equivalem a 1,2 kw. Então, na verdade, estamos falando de um bairro de médio porte. Um único rack Nvidia de 120kW – essencialmente 100 desses chips famintos por energia – precisa de eletricidade suficiente para abastecer cerca de 100 casas.

Essa trajetória é preocupante, dadas as restrições de energia que muitas comunidades enfrentam. Especialistas em information heart preveem que os Estados Unidos precisarão de 18 a 30 gigawatts de nova capacidade nos próximos cinco a sete anos, o que faz com que as empresas se esforcem para encontrar maneiras de lidar com esse aumento. Enquanto isso, meu setor continua criando mais aplicativos de IA generativa que consomem mais energia do que o teoricamente necessário para o aplicativo ou o que é viável para a maioria das empresas, muito menos desejável para o planeta.

Equilibrando Segurança e Acessibilidade: Soluções de Knowledge Middle Híbrido

Essa autocracia de IA e “corrida armamentista”, obcecada com velocidade e poder brutos, ignora as necessidades práticas dos information facilities do mundo actual – ou seja, o tipo de soluções acessíveis que diminuem as barreiras de mercado para os 75% das organizações dos EUA que não adotaram IA. E sejamos realistas, à medida que mais regulamentações de IA são implementadas em torno da privacidade, segurança e proteção ambiental, mais organizações exigirão uma abordagem de information heart híbrido, salvaguardando seus dados mais preciosos, privados e sensíveis em áreas altamente protegidas no native, longe da IA ​​e dos ataques cibernéticos recentes. Sejam registros de saúde, dados financeiros, segredos de defesa nacional ou integridade eleitoral, o futuro da IA ​​empresarial exige um equilíbrio entre segurança no native e agilidade na nuvem.

Este é um desafio sistêmico significativo e que requer hipercolaboração em vez de hipercompetição. Com um foco esmagador em GPUs e outros chips aceleradores de IA com métricas brutas de capacidade, velocidade e desempenho, estamos perdendo consideração suficiente para a infraestrutura acessível e sustentável necessária para que governos e empresas adotem capacidades de IA. É como construir uma nave espacial sem ter para onde decolar ou colocar uma Lamborghini em uma estrada rural.

Democratizando a IA: colaboração industrial

Embora seja animador que os governos estejam começando a considerar a regulamentação – garantindo que a IA beneficie a todos, não apenas a elite – nossa indústria precisa de mais do que regras governamentais.

Por exemplo, o Reino Unido está alavancando a IA para aprimorar as capacidades de aplicação da lei, aprimorando o compartilhamento de dados entre agências de aplicação da lei para melhorar a previsão e prevenção de crimes orientadas por IA. Eles se concentram em transparência, responsabilização e justiça no uso de IA para policiamento, garantindo a confiança pública e a adesão aos direitos humanos – com ferramentas como reconhecimento facial e policiamento preditivo para auxiliar na detecção e gerenciamento de crimes.

Em setores altamente regulamentados como biotecnologia e saúde, colaborações notáveis ​​incluem a Johnson & Johnson MedTech e a Nvidia trabalhando juntas para aprimorar a IA para procedimentos cirúrgicos. A colaboração visa desenvolver capacidades de análise e tomada de decisão em tempo actual e orientadas por IA na sala de cirurgia. Esta parceria alavanca as plataformas de IA da NVIDIA para permitir a implantação escalável, segura e eficiente de aplicativos de IA em ambientes de saúde.

Enquanto isso, na Alemanha, a Merck formou alianças estratégicas com a Exscientia e a BenevolentAI para avançar na descoberta de medicamentos orientada por IA. Eles estão aproveitando a IA para acelerar o desenvolvimento de novos candidatos a medicamentos, particularmente em oncologia, neurologia e imunologia. O objetivo é melhorar a taxa de sucesso e a velocidade do desenvolvimento de medicamentos por meio dos poderosos recursos de design e descoberta da IA.

O primeiro passo é reduzir os custos de implantação de IA para empresas além da BigPharma e Large Tech, particularmente na fase de inferência de IA — quando as empresas instalam e executam um modelo de IA treinado como Chat GPT, Llama 3 ou Claude em um information heart actual todos os dias. Estimativas recentes sugerem que o custo para desenvolver o maior desses sistemas de próxima geração pode ser de cerca de US$ 1 bilhão, com custos de inferência potencialmente 8 a ten vezes maiores.

O custo crescente de implementação de IA na produção diária impede muitas empresas de adotar totalmente a IA — os “desprovidos”. Uma pesquisa recente descobriu que apenas uma em cada quatro empresas lançou iniciativas de IA com sucesso nos últimos 12 meses e que 42% das empresas ainda não viram um benefício significativo de iniciativas de IA generativas.

Para realmente democratizar a IA e torná-la onipresente — ou seja, adoção empresarial generalizada — nossa indústria de IA deve mudar o foco. Em vez de uma corrida pelos maiores e mais rápidos modelos e chips de IA, precisamos de mais esforços colaborativos para melhorar a acessibilidade, reduzir o consumo de energia e abrir o mercado de IA para compartilhar seu potencial pleno e positivo de forma mais ampla. Uma mudança sistêmica elevaria todos os barcos, tornando a IA mais lucrativa para todos, com tremendo benefício ao consumidor.

Há sinais promissores de que cortar os custos da IA ​​é viável – diminuindo a barreira financeira para reforçar iniciativas nacionais e globais de IA em larga escala. Minha empresa, NeuReality, está colaborando com a Qualcomm para atingir até 90% de redução de custos e 15 vezes mais eficiência energética para várias aplicações de IA em texto, linguagem, som e imagens – os blocos de construção básicos da IA. Você conhece aqueles modelos de IA sob chavões da indústria como visão computacional, IA conversacional, reconhecimento de fala, processamento de linguagem pure, IA generativa e grandes modelos de linguagem. Ao colaborar com mais provedores de software program e serviços, podemos continuar personalizando a IA na prática para aumentar o desempenho e reduzir os custos.

Na verdade, conseguimos diminuir o custo e a potência por consulta de IA em comparação com a infraestrutura tradicional centrada em CPU, da qual todos os chips aceleradores de IA, incluindo GPUs Nvidia, dependem hoje. Nosso NR1-S AI Inference Equipment começou a ser enviado durante o verão com aceleradores Qualcomm Cloud AI 100 Extremely pareados com NAPUs NR1. O resultado é uma arquitetura NeuReality alternativa que substitui a CPU tradicional em information facilities de IA – o maior gargalo no processamento de dados de IA hoje. Essa mudança evolutiva é profunda e altamente necessária.

Além do Hype: Construindo um Futuro de IA Sustentável e Econômico

Vamos além do hype da IA ​​e levar a sério o enfrentamento dos nossos desafios sistêmicos. O trabalho duro está por vir no nível do sistema, exigindo que toda a nossa indústria de IA trabalhe com — e não contra — uns aos outros. Ao focar em acessibilidade, sustentabilidade e preço acessível, podemos criar uma indústria de IA e uma base de clientes mais ampla que beneficie a sociedade de maneiras maiores. Isso significa oferecer opções de infraestrutura sustentáveis ​​sem a riqueza da IA ​​concentrada nas mãos de poucos, conhecidos como os Large 7.

O futuro da IA ​​depende de nossos esforços coletivos hoje. Ao priorizar a eficiência energética e a acessibilidade, podemos evitar um futuro dominado por uma infraestrutura de IA faminta por energia e uma oligarquia de IA focada em desempenho bruto às custas de benefícios generalizados. Simultaneamente, devemos abordar o consumo insustentável de energia que impede o potencial da IA ​​de revolucionar a segurança pública, a saúde e o atendimento ao cliente.

Ao fazer isso, criamos um poderoso ciclo de investimento e lucratividade em IA, alimentado por ampla inovação.

Quem está conosco?

Unite AI Mobile Newsletter 1

Artigos relacionados

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button