Será que podemos concluir grande coisa sobre as futuras consolas sem conhecermos a fundo o que será a arquitectura Navi?

A especulação nos fóruns sobre o que poderão ser as futuras consolas é enorme, e nesse sentido diz-se absolutamente tudo. Mas a realidade das coisas vai-se alterando conforme mais dados concretos vão sendo conhecidos, e eles podem alterar completamente tudo aquilo que se toma como certo. Agora a realidade é que sem se conhecer o que a arquitectura Navi trará de novo, tudo é especulação!

Ser Navi ou não ser Navi Eis a questão!

Uma das situações mais abordadas sobre o que poderá ser a próxima geração é a performance. Qual será a performance em Tflops das novas consolas?

Com a passagem para a nova litografia de 7 nm, aplicando matemática da mais básica, teremos um ganho teórico de uso de espaço que permitiria colocar no mesmo espaço de um chip de 14 nm, dois de 7 nm. E esta situação permitiu a ideologia de vermos as performances dobrar em chips da mesma dimensão.

Mas infelizmente, na prática, esta realidade matemática não se traduz exactamente assim! Certas componentes de um chip, nomeadamente os espaçamentos associados às ligações de interconexão interna, não podem ser reduzidas da mesma forma, e é nesse aspecto que os 7 nm EUV poderão ajudar a melhorar a redução ao permitir existirem ganhos maiores na redução da área usada por essa essas componentes.

Mas esta situação não impede que se possa pensar nessa redução, especialmente se existirem outros factores em jogo. Por exemplo, se olharmos para um APU como o da Xbox One X, e considerarmos a hipótese de duplicar as suas performances vemos duas realidades adicionais que, mesmo perante o problema de cima, podem permitir a situação.



1- A litografia do APU da Xbox One X não é 14 nm, mas sim 16 nm, o que quer dizer que na passagem para 7nm há uma margem adicional que poderá compensar as partes que não reduzem da mesma forma. Se é certo que, pelo exposto em cima, sabemos que um GPU a 14 nm não reduziria em 50%, um de 16nm, ao passar para 7 nm, certamente ficará mais perto desse valor, apesar de não ser possível dizer exactamente qual ele seria.

2- A duplicação das capacidades do GPU não requer a colocação de um segundo APU. Se quiséssemos um APU com o mesmo CPU (ou outro com a mesma área), mas o dobro da performance gráfica (e aqui vamos esquecer o limite no número de CU no GCN uma vez que estamos a falar teoricamente), não precisávamos de duplicar os núcleos de CPU, não precisávamos de duplicar os controladores de memória, não precisávamos de duplicar as bridges de comunicação, etc, etc, mas sim apenas os elementos que constituem a pipeline gráfica do GPU, e mesmo esses, nem todos.

Basicamente um duplicação das capacidades do GPU não iria, de forma alguma, requerer o dobro do espaço, o que quer dizer que, com a passagem para 7 nm, para um caso como este APU da Xbox One X, teoricamente, seria possível criar-se um outro com o dobro da performance GPU da Xbox One X, e que no global não ocuparia mais área de silicone.

Acontece que, actualmente, e apesar de a proporção não ser 1:1, a realidade é que o grande custo de um chip está directamente associado à sua área. O número de transístores basicamente traduz-se em maior ou menos área, o acréscimo de novas tecnologias traduz-se no acréscimo de mais ou menos transístores, e consequentemente, maior ou menor área. Basicamente a área acaba por estar directamente ligada ao custo de uma forma bastante proporcional, e não é errado concluir-se que quanto maior for o APU, mais caro ele é!. A redução de litografia permite reduzir a dimensão dos componentes, pelo que, para uma mesma área, o material gasto acaba por ser o mesmo, apesar de na prática o número de transístores duplicar. Há depois outros custos que, esses sim, acabam por variar!

Mas voltando ao que nos interessa, um GPU baseado no da X, mas com o dobro da performance (12 Tflops), poderia eventualmente ser feito ocupando a mesma área, ou até menos, pelo que não podemos dizer que este tipo de performances é forçosamente algo problemático a nível de custo graças aos 7 nm.

Infelizmente, se tal é verdade, a questão expande-se a outras vertentes que também necessitam de análise!



Ignorando o simples facto que um novo APU viria dotado de um conjunto de novidades que não estão presentes na X, e que naturalmente requerem mais transístores que se traduzem em área extra, a simples duplicação referida em cima implicaria a passagem do número de CUs para o dobro. Tendo a Xbox One X 40 CUs, passaríamos para um total de 80 CUs, e tal esbarra no limite de 64 CU que o GNC suporta (e que não sabemos se o Navi mantêm).

Basicamente, aceitando o limite do GCN, isso implica que a duplicação das performances não passaria forçosamente pela duplicação dos CUs, mas sim por um equilíbrio no aumento do número de CUs até um máximo de 60 (4 teriam de vir desligados por questões de aproveitamento de produção), que seria acompanhado de um subida das velocidades de relógio.

Tal superaria a questão do limite de CU, podendo no entanto apresentar outros problemas ao poder esbarrar nos limites de consumo energético e dissipação térmica que são ideais para uma consola.

Mas mesmo que ultrapassados todos estes problemas de energia, dissipação térmica e custo do APU, há um outro factor a ter-se em conta: O preço final da consola! O problema de um APU mais potente não passa apenas pela possibilidade de o construir dentro de um custo, consumos e dissipação térmica aceitáveis. Um APU ao ser mais potente necessita de ser acompanhado de uma memória rápida o suficiente para alimentar as suas capacidades. E tal implica o uso de novas memórias, não só com maior capacidade de armazenamento (GB), mas igualmente com grandes larguras de banda. Nesse aspecto, atualmente, a GDDR6 é a solução mais económica, sendo que, apesar de solucionar o problema, para grandes larguras de banda ela requer o uso de um bus de comunicação com grande largura em bits, o que sobe os custos.

Mas um CPU e um GPU rápido, capazes de resoluções elevadas, necessitam igualmente de um disco rápido e de grandes dimensões de armazenamento, que teria ele também de ser acelerado por uma tecnologia cache qualquer (a tecnologia StoreMi da AMD, ou uma componente SSD), o que se torna em mais um custo para uma futura geração de consolas.



Basicamente, quando a ideia é a construção de um sistema equilibrado, e dentro de um determinado orçamento, o equilíbrio entre todos estes componentes é a parte mais problemática, sendo que poderão surgir limites a certos componentes que acabam por ser indirectos e derivados de outros componentes. A maior performance obriga a maiores larguras de banda, mas maiores larguras de banda obrigam a um bus de comunicação maior. Ou seja, caso o custo forçe o bus a ter uma largura menor, de nada adianta ao APU ter maiores performances do que aquelas que o bus pode alimentar.

É uma realidade que maior potência permite maiores aventuras, mas isso implica igualmente que a quantidade de memória não pode limitar o sistema. Infelizmente mais memória traz mais custo, especialmente quando associada ao bus largo acabado de referir. E não vamos esquecer o disco que tem de ir alimentado tudo sem limitar as performances.

Daí que por muito que se fale, não é possível sabermos com o que poderemos contar, sem vermos respondida uma questão base: O que é a arquitectura Navi! Que melhorias e tecnologias ela traz, e que especificações e limites possui.

E somente com essa resposta podemos começar a ter uma ideia do que esperar.

Basicamente, dê-se as voltas que se der, acabamos por cair sempre numa situação onde para obtermos respostas se torna necessário conhecer, pelo menos, o que se esperar do Navi. Se estivermos perante um GPU clássico GCN, sem novidades de maior, tal como visto as dificuldades em se atingir elevadas performances acabam por esbarrar sempre em qualquer situação. Mas se a Navi trouxer novidades como o acabar com o limite de CUs e/ou for realmente tão surpreendente a nível de consumos, como referido (alternativa), tudo muda de figura, e certas situações podem ser possíveis podendo criar algumas surpresas. Mas sem novidades o que quer parecer é que esbarraremos em problemas diversos que podem condicionar a performance final da consola, e podem mesmo decepcionar muitos ao a atirar para algo que poderá, no máximo, ir entre os 8 Tflops e os 10 Tflops (60 CUs a 1040Mhz ou 1300 Mhz, respectivamente). Isto aceitando que a Navi não traz novidades de peso ao GCN.



Acrescenta-se uma nota relativa ao que que tem sido dito sobre uma possível utopia relativa a performances das consolas, baseando a comparação com a Radeon VII, e o seu custo, que muitos usam. E ela acaba por ser inválida por vários motivos:

Uma das razões que podemos referir é que não podemos comparar o custo de um APU/GPU para um criador de consolas/GPUs e o custo de um produto desses no mercado de retalho! A Radeon VII é efectivamente cara, mas o seu preço de venda não é o preço que o fabricante dos GPUs paga à AMD.

Um segundo motivo prende-se com o facto de cerca de metade da área do Chip do Vega 20 que equipa a Radeon VII ser ocupado com situações que não se prendem com a parte gráfica do GPU, e que podem parcialmente ser eliminados numa configuração APU para consola. O xGMI, o infinity fabric, e muitos dos controladores que numa configuração discreta acabam duplicados no CPU e GPU, não sendo usados podem ser removidos, o que diminuiria a área, e consequentemente o preço.

Conclusões:

Estar a especular a performance das futuras consolas sem o conhecimento do que será a Navi é basicamente atirar paleio para o ar. Há dados que permitem pensar que a Navi pode conter algumas surpresas, e umas visitas ao Linkedin deixam muito o que pensar.

Por exemplo, recentemente surgiu uma patente AMD que refere um stream processor de baixo consumo e elevada largura de banda. Será que vamos ver esse processador numa futura geração de GPUS, ou será que o vamos ver já na Navi?



Se pensarmos que dificilmente veremos consolas com VLIW nos próximos 6 anos, especialmente se a PS5 e a Xbox One X saírem equipadas com GCN, esta patente teria toda a lógica ser aplicada agora. Seria na sua aplicação à futura geração de consolas que a AMD tiraria verdadeiro partido desta patente.

Numa outra nota, um utilizador do Neogaf, de nome Urian, programador, lançou um esquema daquilo que acredita poder vir a ser a futura PS5:

Nota: CAKE significa Coherent AMD socKet Extender.

A esquemática apresenta um total de 40 CUs! O que levaria esta pessoa a criar um sistema com 40 CUs?



Se aceitarmos que a Sony manterá a proporção 2:1 entre a velocidade do CPU e o GPU, e correndo o CPU a 3.2 Ghz, o GPU correria a 1.6 Ghz.

Ora com 1600 Mhz, e 40 CUs teríamos 8.1 Tflops! Uma das performances tão faladas!

Será que é isso que a PS5 terá? Esta seria uma opção muito conservadora e que dificilmente cativaria muitas pessoas face aos 6 Tflops da One X. Daí que o criador foi questionado pelas suas escolhas, ao que ele respondeu:

Well… The diagram is simplified in the CU part where I believe that the Super SIMD patent is going to be applied. The result could be a Volta/Turing like CU where the ALUs could be used in traditional way or as tensor cores.

O esquema é uma versão simplificada nas partes dos CUs, onde entraria a tecnologia Super SIMD…

Voltamos à questão base: Será que o Super Simd irá aparecer com a Navi, ou apenas com a futura geração?



A resposta só a AMD a saberá, mas a discussão revela uns dados extra interessantes, nomeadamente o seguinte:

Mark Leather, one of the signers of the new stream processor patent, is the chief architect of the new AMD efficiency centric architecture and as his linkedin says finished its design in December 2017. More than enough time to be taped out into Navi. 

Segundo este post, Mark Leather, arquitecto chefe das arquitecturas eficientes da AMD terminou o design do Super SIMD em 2017, tendo referido isso no seu Linkedin. Isso quer dizer que a possibilidade de esta tecnologia aparecer no Navi se torna mais real.

Ora se com o Super SIMD os CUs melhorassem a sua eficiencia, o valor em Tflops final poderia revelar-se superior, permitindo assim a obtenção de mais Tflops sem o aumento do número de CUs.

Mas recorde-se que estamos a especular. Não temos dados oficiais do Navi ou que ele possua sequer essa capacidade. Mas realidade é que esta é uma possibilidade, entre outras, que está neste momento em aberto na arquitectura Navi.

Mesmo que estas novidades não apareçam no PC, elas podem ser uma das surpresas do Navi nas consolas. Daí que se torna mesmo necessário saber o que a arquitectura Navi irá trazer para podermos abordar a performance possível de forma mais realista!





error: Conteúdo protegido