Frontier: O supercomputador mais rápido do mundo falha todos os dias e a culpa é da AMD
No mundo existem vários tipos de de computadores e supercomputadores. No segmento destes últimos, sabemos que existem diferentes modelos, mas alguns destacam-se dos demais, como o Frontier que é o supercomputador mais rápido do mundo.
Contudo, esse título tem ficado um pouco condicionado com alguns problemas que o equipamento apresenta. Segundo as informações, o Frontier falha todos os dias e a culpa é apontada às placas gráficas da AMD.
Supercomputador Frontier apresenta falha por causa das GPUs AMD
Frontier é o nome do supercomputador mais rápido e poderoso do mundo. O sistema pertence ao Oak Ridge National Laboratory (ORNL), localizado no Tennessee, nos Estados Unidos, e conta com um desempenho de 1.685 ExaFLOPs em FP64. E para conseguir oferecer todo esse poder, o monstruoso equipamento vem equipado com 9.472 processadores AMD EPYC 7453 com 64 núcleos cada um, ou seja, conta com um total de 606.208 núcleos internos. Para além disso, o Frontier tem também umas impressionantes 37.888 placas gráficas Radeon Instinct MI250X também da AMD.
No entanto, embora seja imbatível ao nível da velocidade, este supercomputador tem vários momentos de instabilidade e não há um dia em que não apresente falhas. E a culpa é apontada, em parte, às GPUs profissionais AMD Instinct.
Segundo as recentes informações, o Frontier apresenta problemas de hardware diários que impedem o supercomputador mais rápido do mundo de funcionar corretamente ao exibir cargas de trabalho de aproximadamente 1 ExaFLOP FP64.
De acordo com Justin Whitt, diretor do Oak Ridge Leadership Computing Facility (OLFC), atualmente a equipa está a trabalhar para determinar quais os problemas de hardware existentes e o motivo pelo qual acontecem. Whitt adianta ainda que estas falhas são tão frequentes que ocorrem numa questão de horas e não de dias. E a principal culpa para esta situação é apontada às placas gráficas AMD Instinct MI250X.
Por outro lado, o executivo reforça que as GPUs da AMD não são culpadas por todos os problemas. Esta é uma situação que está então a ser explorada e há alguns rumores que apontam o dedo a uma outra peça que poderá estar a condicionar o estável funcionamento deste supercomputador.
Este artigo tem mais de um ano
https://overclock3d.net/gfx/articles/2021/11/08190607621l.jpg
🙂
Existe um sistema parecido a funcionar na Finlândia (LUMI), que é só o supercomputador mais rápido da Europa,
e não há notícias de tais problemas…