Como a Amazon quer baratear o treinamento de IAs

Siga o Olhar Do dedo no Google Discover

Tudo sobre Lucidez Sintético

A Amazon Web Services (AWS) ampliou sua ofensiva para reduzir o dispêndio do treinamento de perceptibilidade sintético (IA) com o lançamento do chip Trainium3 e do serviço Novidade Forge, anunciados durante a conferência re:Invent, em Las Vegas (EUA).

As iniciativas reforçam a estratégia da empresa de oferecer alternativas mais baratas e escaláveis para companhias que buscam treinar modelos cada vez mais complexos sem recorrer a investimentos de centenas de milhões — ou até bilhões — de dólares.

chip da Trainium3 da AWS — Trainium3 UltraServers reúnem até 144 chips em um único sistema (Imagem: Divulgação/Amazon)

Amazon e seu projecto por IAs mais escaláveis e baratas

O pilar meão dessa ofensiva é o Trainium3, novidade geração de chips de IA desenvolvidos pela Amazon. Disponível nos Trainium3 UltraServers, o processador é fabricado em tecnologia de três nanômetros e promete desempenho até 4,4 vezes maior que o do Trainium2, além de quase quatro vezes mais largura de orquestra de memória;
Segundo a AWS, os ganhos reduzem tanto o tempo de treinamento quanto os custos operacionais. Em testes internos com o padrão de código ingénuo GPT-OSS, o chip registrou três vezes mais throughput por chip e respostas até quatro vezes mais rápidas;
A eficiência energética também entra na conta da economia: o Trainium3 oferece muro de 40% mais eficiência que sua geração anterior. Essa melhoria, afirma a AWS, reduz não unicamente despesas diretas com robustez, mas também o impacto ambiental dos data centers;
Os UltraServers reúnem até 144 chips em um único sistema, somando 362 PFLOPs em FP8, enquanto a novidade arquitetura de rede — com o NeuronSwitch-v1 e a evolução da Neuron Fabric — diminui a latência para menos de 10 microsegundos.

Com os novos EC2 UltraClusters 3.0, empresas podem conectar milhares desses sistemas, alcançando até um milhão de chips Trainium, dez vezes mais que na geração anterior.

Para alguns clientes, os ganhos já aparecem: a AWS afirma que empresas, porquê Anthropic, Metagenomi e Ricoh, registraram reduções de até 50% nos custos de treinamento e inferência ao transmigrar para a família Trainium. A startup Decart relatou desempenho quatro vezes superior e dispêndio pela metade em verificação a GPUs tradicionais.

Logomarca do Amazon Nova — Novidade Forge permite às empresas personalizarem modelos de IA da Amazon desde o estágio inicial de treinamento (Imagem: Divulgação/AWS)

Bulha por chips distintos da Nvidia

O lançamento ocorre no momento em que o mercado procura alternativas aos chips da Nvidia — ainda padrão da indústria. Analistas citados pela Bloomberg afirmam que a AWS mira clientes que procuram menor dispêndio totalidade de operação.

A empresa, porém, diz não querer substituir a Nvidia, mas ampliar as opções disponíveis. Ainda assim, o movimento se alinha à tendência observada pelo The Wall Street Journal: companhias de IA vêm diversificando fornecedores para evitar sujeição de um único trabalhador.

Paralelamente à novidade geração de chips, a AWS apresentou o Novidade Forge, serviço que permite às empresas treinarem modelos da Amazon desde estágios iniciais, pagando US$ 100 milénio (R$ 530,7 milénio, na conversão direta) anuais.

A proposta é oferecer “treinamento ingénuo”, no qual clientes acessam checkpoints exclusivos no pré-treinamento, treinamento e pós-treinamento. Em vez de unicamente realizar fine-tuning, as empresas podem incorporar seus próprios dados em múltiplas fases do desenvolvimento — o que, segundo a Amazon, reduz significativamente os custos em verificação a erigir um grande padrão de linguagem (LLM, na {sigla} em inglês) do zero.

O CTO do Reddit, Chris Slowe, afirmou que um padrão Novidade apropriado com dados da plataforma “já está entregando resultados impressionantes”, segundo transmitido divulgado pela Amazon.

Entre as organizações que utilizam o Forge estão Booking.com, Cosine AI, Nimbus Therapeutics, Nomura Research Institute, OpenBabylon, Reddit e Sony. O sistema também é usado internamente pelas equipes das lojas da Amazon e da assistente Alexa.

Fachada de um galpão da Amazon — Amazon diz não querer substituir a Nvidia, mas ampliar as opções disponíveis (Imagem: Marcos del Mazo/Shutterstock)

Leia mais:

Os modelos personalizados gerados pelo serviço — chamados “Novellas” — podem ser implantados no Amazon Bedrock, que já opera cargas de produção em Trainium3. A AWS também apresentou a família Novidade 2, destacando o padrão Novidade 2 Pro, descrito porquê o mais inteligente da empresa, e o Novidade 2 Omni, primeiro padrão multimodal de raciocínio capaz de processar texto, imagens, fala e vídeos, além de gerar imagens e texto.

“Um ano detrás, havia dúvidas se tínhamos perdido a vaga, mas agora, a maioria das pessoas está construindo seus sistemas de produção na AWS por justificação do que construímos nos últimos anos”, disse o CEO da AWS, Matt Garman, ao Axios.

A companhia já trabalha na próxima geração: o Trainium4, que trará ao menos seis vezes mais desempenho em FP4, três vezes mais em FP8 e largura de orquestra de memória quatro vezes maior. Em parceria com a Nvidia, o porvir chip integrará o NVLink Fusion, permitindo racks híbridos com Trainium, Graviton e EFA.

Os Amazon EC2 Trn3 UltraServers já estão disponíveis para clientes da AWS.

Assista a filmes e séries

Assine Amazon Prime para ver a filmes e séries populares, incluindo Amazon Originals premiados. O Amazon Prime também inclui a entrega GRÁTIS e rápida de milhares de itens elegíveis, mais de 2 milhões de músicas sem anúncios e muito mais. Clique cá e comece seu teste GRÁTIS por 30 dias!

Participe do nosso Grupo VIP

Como a Amazon quer baratear o treinamento de IAs

Amazon e seu projecto por IAs mais escaláveis e baratas

Bulha por chips distintos da Nvidia

Comentários (0)