NVIDIA Enterprise estabelece recordes de inferência de IA e apresenta GPUs A30 e A10 para servidores empresariais
Plataforma de Inteligência Artificial da NVIDIA se destaca em todas as categorias do MLPerf, do data center ao edge
O MLPerf é o benchmark consagrado do setor que mede o desempenho de IA em várias cargas de trabalho, como as de visão computacional, diagnósticos por imagens, sistemas de recomendação, reconhecimento de fala e processamento de linguagem natural.
Avaliadas pela primeira vez no MLPerf, as GPUs NVIDIA A30 e A10 proporcionam alto desempenho e baixo consumo de energia, oferecendo às empresas opções convencionais para diversas cargas de trabalho de inferência de IA, treinamento, gráficos e computação empresarial tradicional. A expectativa é de que as GPUs venham integradas aos servidores mais avançados dos fornecedores Hewlett Packard Enterprise, Inspur e Lenovo a partir do próximo trimestre.
A NVIDIA Enterprise conquistou esses resultados graças à abrangente plataforma de IA da empresa, com várias GPUs e softwares de IA, como o TensorRT™ e o Servidor de Inferência NVIDIA Triton™. A plataforma é implementada pelas principais organizações, como a Microsoft, o Pinterest, a Postmates, a USPS e a WeChat.
“A IA continua transformando os setores, e o MLPerf está se tornando uma ferramenta ainda mais importante para as empresas tomarem decisões informadas sobre seus investimentos em infraestrutura de TI. Agora que todos os principais OEMs estão enviando seus dados para o MLPerf, a NVIDIA e os parceiros da empresa estão se dedicando ao fornecimento do melhor desempenho do mundo para IA e à democratização dessa tecnologia com uma nova onda de servidores empresariais com as GPUs A30 e A10”, conta Ian Buck, gerente geral e vice-presidente de computação acelerada da NVIDIA.
“A NVIDIA Enterprise continua se destacando como líder em soluções para Inteligência Artificial ao redor do globo. Os desempenhos registrados no MLPerf são mais uma conquista nessa jornada, tanto para a NVIDIA como a todos os parceiros. Continuamos inovando em plataformas de hardware e software para que o acesso à tecnologia seja cada vez mais democratizado”, explica Marcio Aguiar, diretor da NVIDIA Enterprise para América Latina.
Resultados no MLPerf
A NVIDIA é a única empresa a enviar resultados para todos os testes das categorias de data center e edge, garantindo as melhores pontuações de desempenho em todas as cargas de trabalho do MLPerf.
Diversos produtos avaliados também usam o servidor de inferência Triton, que simplifica a implementação de IA em aplicações. Ele é compatível com modelos de todos os principais frameworks executados em GPUs e CPUs, além de ser otimizado para diferentes tipos de consulta, como as em lote, em tempo real e de streaming. Os produtos que usam o Triton tiveram um desempenho próximo ao das implementações de GPU mais otimizadas e ao das implementações de CPU com configurações similares.
A NVIDIA também quebrou outro recorde com produtos que têm o recurso GPU Multi-Instância (MIG — Multi-Instance GPU) da arquitetura NVIDIA Ampere. Ela executou, simultaneamente, todos os sete testes off-line do MLPerf em uma única GPU com sete instâncias da MIG. A configuração mostrou um desempenho quase idêntico ao de uma única instância da MIG.
Os produtos apresentaram o desempenho e a versatilidade da MIG, que permite que os gerentes de infraestrutura provisionem a quantidade certa de computação de GPU para que aplicações específicas aproveitem ao máximo as GPUs do data center.
Além da NVIDIA, os parceiros Alibaba, Dell EMC, Fujitsu, Gigabyte, HPE, Inspur, Lenovo e Supermicro apresentaram, ao todo, mais de 360 resultados com GPUs NVIDIA.
Plataforma de IA da NVIDIA em expansão
As GPUs NVIDIA A30 e A10 são as novidades da plataforma de IA da NVIDIA Enterprise, que conta com GPUs da arquitetura NVIDIA Ampere, o NVIDIA Jetson™ AGX Xavier e o Jetson Xavier NX, além de um pacote completo de softwares da NVIDIA otimizados para acelerar a IA.
A A30 oferece um desempenho versátil para servidores-padrão, contribuindo para várias cargas de trabalho de inferência de IA e computação empresarial convencional, como as de sistemas de recomendação, IA de conversação e visão computacional.
A GPU NVIDIA A10 acelera a inferência de deep learning, a renderização interativa, o desenho assistido por computador e os games na nuvem. Assim, as empresas podem executar cargas de trabalho mistas de IA e gráficos em uma infraestrutura comum. Com os softwares de GPU virtual da NVIDIA, é possível simplificar o gerenciamento para melhorar o uso e o provisionamento de desktops virtuais acessados por designers, engenheiros, profissionais e cientistas.
A plataforma NVIDIA Jetson, baseada no sistema em módulo NVIDIA Xavier™, oferece um desempenho de IA de nível de servidor no edge, possibilitando diversas aplicações em robótica, área da saúde, varejo e cidades inteligentes. Criado com a arquitetura unificada da NVIDIA e o pacote de softwares CUDA-X®, o Jetson é a única plataforma que executa todas as cargas de trabalho no edge em designs compactos consumindo menos de 30W de energia.
Disponibilidade
As GPUs NVIDIA A100 estão disponíveis nos servidores de fabricantes líderes e na nuvem de todos os principais fornecedores de serviços em nuvem. Elas também se encontram nos produtos do portfólio de sistemas NVIDIA DGX™, que inclui a NVIDIA DGX Station A100, a NVIDIA DGX A100 e o NVIDIA DGX SuperPOD.
A A30 e a A10 devem vir integradas aos servidores a partir do próximo semestre, inclusive em NVIDIA-Certified Systems™ que passam por testes rigorosos para garantir alto desempenho em várias cargas de trabalho.
O Jetson AGX Xavier e o sistema em módulo Jetson Xavier NX podem ser adquiridos de distribuidores ao redor do mundo.
O NVIDIA Triton e o NVIDIA TensorRT estão disponíveis no catálogo de softwares do NGC da NVIDIA.
Sobre a NVIDIA
Com a invenção da GPU pela NVIDIA (NASDAQ: NVDA), em 1999, redefinimos os gráficos de computadores modernos e revolucionamos a computação paralela. Mais recentemente, o deep learning com base em GPU deu início à inteligência artificial moderna — a próxima era da computação — com a GPU atuando como o cérebro dos computadores, robôs e carros autônomos que podem perceber e compreender o mundo.
Nenhum comentário