Google Cloud e NVIDIA anunciam infraestrutura para a criação de modelos massivos de GenIA – TI INSIDE Online

28 de abril de 2024 Tabloide Paulista

O Google Cloud e a NVIDIA anunciam uma nova infraestrutura e software de IA para os clientes criarem e implantarem modelos massivos para IA generativa e acelerarem cargas de trabalho de ciência de dados.
Em um bate-papo no Google Cloud Next, o CEO do Google Cloud, Thomas Kurian, e o fundador e CEO da NVIDIA, Jensen Huang, discutiram como a parceria está trazendo serviços de machine learning de ponta a ponta para os maiores clientes de IA do mundo, inclusive facilitando a execução e implementação de Supercomputadores de IA com ofertas do Google Cloud baseadas em soluções da NVIDIA. As novas integrações de hardware e software utilizam as mesmas tecnologias NVIDIA empregadas nos últimos dois anos pelo Google DeepMind e pelas equipes de pesquisa do Google.
"Essa otimização facilitará a execução das cargas de trabalho e a implementação cada vez mais eficiente da IA generativa para os clientes. Essa parceria reforça nosso compromisso em contribuir cada vez mais para o avanço de novas tecnologias", ressalta Marcio Aguiar, diretor da divisão Enterprise da NVIDIA para América Latina.
Integrações
A estrutura do Google para a construção de grandes modelos de linguagem (LLMs), PaxML, agora está otimizada para computação acelerada NVIDIA. Originalmente desenvolvido para abranger várias fatias do acelerador Google TPU, o PaxML agora permite que os desenvolvedores usem GPUs NVIDIA H100 e A100 Tensor Core para experimentação e escalabilidade avançadas e totalmente configuráveis.
Um contêiner PaxML otimizado para GPU já está disponível no catálogo de software NVIDIA NGC. Além disso, o PaxML é executado em JAX, que foi otimizado para GPUs que utilizam o compilador OpenXLA.
O Google DeepMind e outros pesquisadores do Google estão entre os primeiros a usar PaxML com GPUs NVIDIA para pesquisas exploratórias.
O contêiner otimizado para PaxML da NVIDIA estará disponível imediatamente no registro de contêiner NVIDIA NGC para pesquisadores, startups e empresas em todo o mundo que estão construindo a próxima geração de aplicações baseadas em IA.
Além disso, as empresas anunciaram a integração do serverless Spark do Google com GPUs NVIDIA por meio do serviço Google's Dataproc. Isso ajudará os cientistas de dados a acelerarem as cargas de trabalho do Apache Spark para preparar dados para o desenvolvimento de IA.

Salve meu nome, e-mail e site neste navegador para a próxima vez que eu comentar.
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

Δ

source

Deixe um comentário Cancelar resposta