Que tamanho terá o APU da PS5 e da Xbox Anaconda

Actualmente uma das discussões que corre nos foruns é a dimensão dos APUs das consolas. Os rumores apontam para algo na ordem dos 350 mm2 para o APU Xbox e 300 mm2 para o APU da PS5. Será que esta diferença implica diferenças na performance? E o que poderá incluir um chip com 300 mm2?

Quem o tamanho que se referem virem a ter os GPUs da PS5 e Xbox Anaconda?

Se tem prestando atenção aos rumores, terão visto que o que tem vindo a ser apontando para o GPU da próxima Xbox são 350 mm2, sendo que o da PS5 teria 300 mm2.

Mas sendo isto rumores, nada nos garante que estes valores sejam exactos… e mais do que isso, que sejam sequer correctos.

Daí que surgem várias questões:



1 – Terão estes valores alguma lógica?
2 – Que implicações pode ter essa diferença?
3 – Essa diferença implica diferenças de performances claras para algum dos lados?
4 – Que diferenças internas podem justificar essa diferença?

São essas questões que vamos tentar abordar!

Qual o área que um APU para uma consola de próxima geração deveria ter?

Para respondermos à primeira questão, teremos de fazer algum cálculo!

Terão os valores alguma lógica?

Sendo que actualmente a performance mais abordada nos fóruns é algo na ordem dos 11 Tflops para ambas as consolas, vamos tentar perceber qual seria a dimensão necessária para um GPU com essa performance.



Para este cálculo, vamos usar alguma matemática invertida, partindo da velocidade de relógio anunciada para o Gonzalo/Flute/Oberon, referido como sendo o GPU da PS5, ou seja… 2 Ghz!

E para algo na ordem dos 11 Tflops (Neste caso 1,264 Tflops) vemos que com a velocidade de 2 Ghz, um GPU necessitaria de ter 44 CUs activos, o que implicaria o uso de algo bastante semelhante à Radeon RX 5700 XT, mas com mais velocidade de relógio.

44 Cus x 64 SEs x 2 operações por ciclo de relógio x 2000 =  11,264 Tflops

Esta semelhança com a RX 5700 permite termos muita papinha feita, dado que a AMD nos anuncia que o GPU Navi que equipa a Radeon RX 5700 XT possui uma área de 251 mm^2.

Claro que este GPU não possui qualquer alteração ao hardware para o Ray Tracing, mas convenhamos que não sabemos como isso vai ser implementado, pelo que não podemos dizer que área extra esse hardware vai ocupar. O que podemos dizer é que face à RX 5700 XT muitos controladores ali existentes serão partilhados com o CPU no caso de um APU, pelo que ao tomarmos esta valor como base, no valor final que vamos obter podemos considerar que o que se ganha em área com a remoção de redundâncias e o que se perde com o acréscimo do RT poderá muito bem ser igual.



Mas o facto é que sem esses dados concretos, o que vamos referir é apenas um exercício teórico, mas mesmo assim, um exercício interessante. Até porque diga-se que 300 mm2 e 350 mm2 são valores exactos demais, e como tal certamente são aproximações algo grosseiras.

Mas vamos continuar. Estávamos então com uma área de 251 mm2, à qual teremos de acrescentar os dois CCX dos CPUs.

Sabemos agora oficialmente que a PS5 usará núcleos Zen 2! e aqui a AMD vem em nosso socorro novamente ao dar a conhecer que um chiplet com dois CCX com 16 GB de cache, ocupam 74 mm2.

Se olharmos para o Zen a 12 nm, ele ocupava, com dois CCX e os mesmos 16 MB, 213 mm2. Como vemos, a redução de área é maior do que a mudança de litografia permite. Porque?

Bem, o Zen 2 possui 4 links Infinity Fabric, que foram reduzidos no Zen 2 para apenas um. E mais ainda, o ZEN 2 não requer controladores de memória, e não possui extras para Input Output uma vez que com ele há um chip à parte na board para isso. De notar que este dado é relevante, e voltaremos a pegar nele.



A realidade é que agora, com as duas áreas temos então os dados para calcular o tamanho de um APU. E ele será 251+74 = 325 mm^2

Estamos aqui então com um APU que apresenta 25 mm2 a menos na Xbox Anaconda e 25 mm2 a mais na PS5.

Vamos olhar para o caso da Xbox Anaconda primeiro!

O grande problema desta cálculo que fizemos é que ele foi efectuado tendo como base uma velocidade de relógio de 2 Ghz. Um valor que os rumores referem que a Xbox não alcançará, ficando-se por algo na ordem dos 1800 Mhz.

E essa informação bate certo com a maior dimensão. Um chip maior aquece mais, e como tal, não pode alcançar tanta velocidade. E nesta futura geração tanto Microsoft como Sony apostaram extensivamente na refrigeração, pelo que a dimensão do APU deverá ser o factor diferenciador.



Aliás esta situação tem vindo a ser referida também em rumores. A Sony terá apostado mais em velocidade, a Microsoft em processamento paralelo (mais CU). Dizem os rumores que o resultado final seria muito próximo, com ligeira vantagem para a Sony.

Ora pegando nessa informação, que claro, por ser um rumor, deve ser tratada com uma pitada de sal, podemos ver então o que poderá ser o hardware da Xbox Anaconda. E para um valor próximo dos 11 Tflops, com a velociade máxima de 1.8 Ghz, que se refere, a Xbox teria então um total de 48 CU activos (52 no total).

Estamos a valar de mais 4 CU que a PS5, ou seja… mais 20.12 mm2 de áres, para uma performance de 11,059 Tflops. Basicamente idêntico à PS5, mas com a vantagem do lado da Sony. Tal como os rumores apontam.

Isto somado aos 74 mm2 do CPU daria 345.12 mm2. No caso da Xbox a área estaria explicada!

Ou seja, como resposta à primeira questão, do lado da Xbox, a resposta é: Sim, a área tem lógica!



Vamos agora ver a PS5.

A PS5 tem uma situação diferente! Está com 24 mm2 a mais!

Isso quer dizer que aqui vamos ter de tirar qualquer coisa!

Onde vamos buscar então 25 mm2 sem afectar as performances?

Há várias alternativas, mas não quero entrar por algumas delas sem mais dados.



Daí que vou apenas referir uma das muitas hipóteses existentes que retiram esses 25 mm2 ao APU.

O que poderíamos então tirar? Bem, o Zen 2 possui 24 pistas PCIe. Algo muito relevante para um PC, mas se calhar menos relevante numa consola com hardware fixo! E algumas destas pistas poderão sair, reduzindo ainda mais a área do CPU. Para a Microsoft, essa remoção não seria de grande interesse devido ao uso partilhado do hardware com as racks.

A outra situação passa por uma remoção dos controladores de memória do GPU, usando uma versão alterada dos controladores do CPU que no Zen 2 se encontram num chip externo na motherboard. Esta situação poderá ser uma das personalizações da Sony.

Basicamente o que interessa aqui perceber-se é que há formas de se manter 44 CUs, com acréscimo de RT, e mantendo o chip com 300 mm2.

Daí que a resposta à primeira questão, do lado da PS5: Sim, a área é possível.



No entanto, acreditamos que 300 mm2 é um valor por defeito, e que a área andará mais perto dos 315 mm2. Tal e qual refere o rumor de baixo!

PS5 devkit PCB specs from OQA from PS5

 

Que implicações pode ter essa diferença?

Conforme já vimos, na prática podem ser basicamente nenhumas, podendo a única implicação aparente ser que uma empresa apostou em processamento mais rápido, a outra em processamento mais amplo.



Mas os resultados em Tflops poderão ser muito, muito semelhantes, ao ponto de poderem ser considerados idênticos.

Seja como for, há uma outra situação possível de explicar as diferenças de cima que será menos agradável para os utilizadores. O corte de caches! Tal teria implicações na performance do CPU, e parece por isso um contra-senso. tornando o CPU bem menos capaz do que aquilo que se esperaria de um Ryzen.

Refiro esta situação por ser uma possibilidade que também existe e está em aberto, havendo mesmo um rumor nesse sentido, apesar de não ser a única explicação por existirem situações alternativas que ainda estão em aberto e que podem justificar a diferença de áreas, sem cortes nas performances. Mas a realidade é que tal também pode acontecer e não podemos ignorar isso, uma situação que colocaria a PS5 bem abaixo da Xbox a nível de CPU caso esta use as caches completas.

Aliás o benchmark do Flute mostra um APU com 8 núcleos, 16 Threads com velocidades entre 1.6 e 3.2 Ghz, e um GPU a 2 GHz. Nesse benchmark vemos que o CPU possui apenas 1/4 das caches, e uma performance semelhante a um CPU 1700X. Bem longe das performances dos Ryzen 2 actuais, mas mesmo assim um ganho de quase 4 vezes face ao actual jaguar.

Uma redução das caches para 1/4 do valor (4 MB por CCX) seria uma solução adequada para uma consola, reduzindo a área para 20 mm2 por CCX, o que daria 24 mm2 de redução, explicando só por si os 300 mm2.



É uma hipótese que não pode ser descartada!

Essa diferença implica diferenças de performances claras para algum dos lados?

Tal depende do que foi cortado! Teoricamente existem explicações que permitem que o sistema com menor área possa ter performances ao mesmo nível do maior outro. Mas para uma resposta exacta a esta, e a todas as outras questões, teremos de saber exactamente o que o RT vai acrescentar, e que cortes foram feitos. Como referido, tudo isto é, nesta fase, teórico, e apenas pretende tentar responder às questões, mas sem se poder garantir que as respostas são as correctas.

A possibilidade de corte de caches, essa sim teria implicações. Não a nível gráfico, mas a nível de CPU. Se a PS5 cortar os mesmos, mas a Xbox não, tal criará disparidade entre as performances de CPU das consolas. E dada esperada semelhança de performance gráfica, só por aqui a Xbox poderia usar o título de a consola mais potente do mercado.

Que diferenças internas podem justificar essa diferença?



Maiores ou menores cortes, sendo que a Microsoft nesse aspecto poderá estar mais limitada ao não poder tirar capacidades aos processadores por os usar em servidores. Já do lado da Sony, ao ter hardware fixo, e um uso específico, as coisas podem ser cortadas na medida daquilo que será o uso do hardware.

Para além do mais, os produtos são personalizados, e as situações alteradas são sempre feitas na relação performance custo… daí que o que puder ser optimizado para manter ou melhorar performances, diminuindo áreas (custo) é feito. Mas claro que nem todos tem as mesmas ideias, e a Microsoft está mais limitada no que pode cortar pela compatibilidade com o PC e servidores.

No entanto existe também a possibilidade de o corte ser nas caches. Com as implicações que já abordamos.

Conclusões

Basicamente, tanto para uma noção das áreas, mas para uma noção das performances, era necessário perceber-se o que foi cortado, o que foi alterado, e que implicações isso tem nas performances e áreas. Da mesma forma era necessário saber-se o que acrescenta o RT. A alteração pode ser feita ao nível dos CU, o que implicaria maior aumento de área do que uma unidade central partilhada pelos CUs.

Daí que este artigo apenas tente abordar as hipóteses todas que poderemos ter, para dar fundamento aos rumores existentes.



30 Comentários
Antigos
Recentes
Inline Feedbacks
Ver todos os comentários
Brunoab
Brunoab
11 meses atrás

Sobre o cache na CPU, não era necessário pq o Zen depende muito da largura de banda da RAM? Que eu lembre o cache maior era para compensar isso.

Mas a gente não sabe como vai ser a memória do PS5… Se for HBM com 1TB/s de banda talvez o corte de cache não faca diferença?

A Sony, ao contrário da MS, ainda não anúncio nada sobre RAM…

Ainda tenho na cabeça aquela parente do cooler da Sony, que tinha um “monte de coisa empilhada”

Será possível a Sony e MS virem com APU empilhadas? RDNA2 para o fim de 2020 seria apenas RDNA1 para ser empilhada?

Eu ainda acho q a Sony vai se arriscar muito mais no PS5 que no PS4 e a MS vai ter q seguir isso para não ficar para traz.

Sobre o Azure… Xbox deixou de ser subordinado ao Windows e agora é subordinado ao Azure? HAHAHAHHAHAH

Libera os EXclusivos no PC no software, e agora no hardware tem que agradar o Azure?

bruno
bruno
11 meses atrás

Eis as minhas previsoes quanto aos specs da PS5:

CPU: Zen 2 8 core/16 threads at 3.2 Ghz.

GPU: 72 CUs at 1822 mhz. Aprox. 16.8 Tflops (desapontante na minha opiniao, dai defender 2021, mas bastante bom para o que a maioria das previsoes considera possivel)

Memoria Ram: (aqui tenho mais um pouco de dificuldade, porque nao me recordo como calcular a bandwidth, mas ca vai) 16 GB at 450 Gb/s, GDDR6 + SSD. + 4GB OS DDR4 (da mais barata possivel.)

Edit: nao acho que a sucessora da Xbox tenha 44 CUs. Tao pura e simplesmente porque nao bate certo com a arquitetura Navi. A ONE X possui 44 CUs mas so tem activos 40.

Tendo em conta os rumores, dar-lhe-ia 88 CUs. 8 inactivos. Quanto a velocidade de relogio, talvez ligeiramente inferior relativamente a da PS5 com 1672 mhz. Ficaria uma consola mais poderosa, mas relativamente perto da PS5. Seja como for, um valente monstro.

Ah, e os CUs referidos para a PS5 sao so os activos.

bruno
bruno
Responder a  Mário Armão Ferreira
11 meses atrás

Mede a area efectiva do que e a 5700Xt, na apresentacao da Navi com o resto dos controladores de memoria.

Pelas minhas medicoes, aquilo que efectivamente sao CUs e outro hardware do GPU sem controladores, ocupa pouco mais de metade da area do GPU. Isto e, ocupa pouco mais de metade dos 251 mm2.

Isto foi algo que nao consideraste no artigo. Falaste na poupanca da area do Zen vs Zen 2, no que se poupou ao por os controladores de memoria a parte num chip separado (controladores a 12 nm), mas nao consideraste essa realidade para o GPU.

E li algures, que os controladores de memoria na 5700 sao a 12 nm.

Nos 7 nm EUV para alem de poupares 15 a 20% na area, ainda terasa reducao dos controladores de memoria.

Eu so dupliquei o GPU (so o hardware GPU mesmo, sem CUs), removi metade para incorporar o CPU e inclui por cada grupo de 5 double compute units mais 2. E depois considerei que por cada um destes grupos uma esta desactivada para incrementar o rendimento no processo de fabrico.

E acredita, mesmo estes specs sao incrivelmente desapontantes para a next-gen.

Carlos Zidane
Carlos Zidane
Responder a  bruno
11 meses atrás

Caramba Bruno você está bem otimista, pra um console essas specs são bem intensas, espero que você esteja certo mas acho que vai ser bem menos, as Navi não tem um aproveitamento superior em relação as atuais (a ficar nível NVidia)? nesse caso os tflops talvez não sejam tantos e já se tenha bastante potência, claro que você entende muito mais, porém acho que por questão de marketing poderão até não querer mais falar tanto em Tflops porquê o pessoal é mais ignorante desses dados que eu, tanto que se vê em canais grandes os caras falando que os novos consoles terão SSD, num tom assim de “taca um desses Kingston básicos lá e é isso”.
Então quando ouvirem algo como 9.7 teraflop vão achar que é praticamente igual ao Scorpio e que não vale a pena “investir” na “nova geração flopada”.
Ou talvez agora os fanboys possam brigar por GigaRays e o Ray tracing que ninguém liga agora se torne o novo argumento.
Kkk

AlexandreR
AlexandreR
Responder a  bruno
11 meses atrás

Sinceramente até podia ter 20 tflops….
Eu não quero só performance!
Eu quero é inovações no gaming.
Como será o ssd, que ira reduzir drasticamente os loadings.
E também falam que a física nesta geração estará algo excecional!
Não sei se foi neste tópico que tinha visto uma discussão sobre se os exclusivos são importantes…
São os exclusivos que vendem consolas, até poderás ter um hardware superior, mas se não tens exclusivos de peso…
É preferível ter uma alternativa com hardware menos potente com exclusivos de peso

Brunoab
Brunoab
Responder a  bruno
11 meses atrás

Tomara que vc esteja certo hahahha

bruno
bruno
Responder a  Mário Armão Ferreira
11 meses atrás

So para referencia, a tua solucao, com ray tracing activdado, da o mesmo que a Pro ou X a sub 4K e com raytracing.

Ou seja, os mesmos jogos so com ray tracing.

Achas isso suficiente para a next gen?

Se for para lancar essa treta que desistam e continuem com as atuais.

bruno
bruno
Responder a  Mário Armão Ferreira
11 meses atrás

Mario, a nVidia introduziu duas solucoes para raytracing em termos de hardware. Uma foram os tensor cores e outra os RT cores. Os tensor cores sao potentes para calculo matricial, algo de que o raytracing depende e muito e os RT cores fazem as operacoes de branching.

Eu nao estou familiarizado com a solucao da AMD mas o que descreves parece ser apenas um acrescimo que incrementa as capacidade de calculo face ao que ja existe. Ou seja um acrecimo a rasterizacao. E apenas uma ALU mais, contra dois processadores cheios delas e espacializados no tipo de calculo requerido para o RT.

Com o Raytracing ativado… ou ele e minimo, ou teras quebras enormes da performance com o resto a compensar.

Pior, estas a considerar mais os 60% referidos pelo estudo… em PC. Ja devias saber que medicoes em PC nao representam nada. No fim teras o mesmo numero de CUs com mais 50% da performance, so com a arquitetura.

E sim, parece pouco tendo em conta o salto que se espera numa nova geracao.

bruno
bruno
Responder a  Mário Armão Ferreira
11 meses atrás

E um acrescimo a rasterizacao e por defeito, a computacao generica. As ALUs estao incluidas no stream processor. E dado que referes um acrescimo de ALUs por CU, imagino que seja acrescentar uma unidade adicional com uma ALU extra por CU. Estas a fazer 64 x clock para esses 3.2 GPUs a mais. Essa ALU extra e mais um stream processor.

Relativamente a computacao generica e tao simples quanto isso – quando necessario, dedicar-se-a ao RT.

O meu ponto e… a nVidia ja tem isso… e tem os tensor cores.

E preciso muito mais poder computacional – o que descreves e um meio termo e nada bom.

Mais uma vez.. 9.7 Tflops RDNA correspondem a 12.1 Tflops GCN testado no PC, que nao usa nem ACEs nem metade das caracteristicas unicas da AMD… AS consolas fizeram muito mais rentabilizacao da GCN – sera a diferenca a mesma?

bruno
bruno
Responder a  Mário Armão Ferreira
11 meses atrás

Exacto.

RT e um algoritmo completamente distinto da rasterizacao que obriga a imenso trabalho adicional e iteraccoes. Em RT a cena tem que ser analisada imensas vezes pare recolher a informacao. por isso so aidicionar ALUs… e pouco, muito pouco. E preciso criar no hardware, cores e processadores especificos para essa carga. As ALUs so fazem aritmetica.

Sobre o preco dos GPUs…

Eis o que se passou depois do Ryzen chegar…

A intel finalmente comecou a por mais que 4 cores nos GPUs (antes do ryzen os i7 estavam ainda nos 4 nucleos) e tem repetidamente descido os precos.

Eis o que ocorreu com a nVidia quando depois tempo das vacas gordas (leia-se, epoca dourada da mineracao) e quando a AMD lanca a RX 5700.

– As vendas de GPUs cairam 50%;
– A empresa corta o preco das placas normais e lanca a versao super.

O ponto onde quero chega e este: o mercado esteve estagnado devido a bitcoin. Como ja me fartei de repetir aqui… onde estao as super placas, as Fury X, as dual GPU dos 14 nm (nem pergunto dos 7 nm)..

Tu so viste uma a ser lancada e foi para o desktop da apple. Fora isso… nada!

Agora os 7 nm precisam de maturar, e tornar-se acessiveis.

E com a chegada dos EUV chegamos a essa altura. A AMD nao foi concorrencial com a RX 5700. Entregou uma placa que apenas faz quase tao bem, sem entregar algo que suplantasse o que existia antes. E eu suspeito que foi devido a impedimentos tecnicos da versao dos 7 nm que usou. Com os 7 nm EUV, e as vendas da RX 5700 a subirem (esotu curiosissimo para ver o relatorio fiscal da nVidia), o que se espera e que chegemos ao cenario que tinhamos em 2012 com as duas empresas a concorrerem taco a taco e a colocarem duplos GPUs e sei la mais o que.

bruno
bruno
Responder a  Mário Armão Ferreira
11 meses atrás

Nao me entendeste. OS RT cores nao sao so ALUs. Estao incluidos num sistema que toma em consieracao a interaccao e o calculo dos raios. Os GPU atuais foram desenhados com o algoritmo de rasterizacao em mente. Nao com o RT. A nVidia e num caso superior a Img. Tech. criaram pipelines especificas para o processamento dos raios. Isto e uma necessidade.

bruno
bruno
Responder a  Mário Armão Ferreira
11 meses atrás

Ok. Preciso de ler mais para entender melhor.

O que me disseste no outro artigo sobre o info_ms pos me a pensar.

Um tipo da digital foundry na egx 2019 confirmou o nome próspero para o dev kit.

No Gizmodo próspero foi relacionado com o Oberon.

Eis o que se sabe do Oberon:

Gen 2: 2000 MHz
Gen 1: 911 MHz
Gen 0: 800 MHZ

Agora uns números:

6×3 = 18

6×2 = 12

12×2 = 24

24 x 3 = 72

72÷2 = 36

18x64x800x2= 1,843 TFLOPS

72x64x2000x2= 18,43 TFLOPS

Pode ser algo, pode não ser nada.

bruno
bruno
Responder a  Mário Armão Ferreira
10 meses atrás

Interessante realmente, especialmente, os flops.

E agora basta tambem pensar que estamos a falar de pipelines especialmente desenhadas para o processo de renderizacao RT..

bruno
bruno
Responder a  Mário Armão Ferreira
10 meses atrás

O intersection engine?

AlexandreR
AlexandreR
11 meses atrás

Podemos considerar que ambas as consolas já tem o hardware definido para a próxima geração?
Ou ainda poderá haver alterações de última hora?
Se for como o Mario diz,11 tflops, um bom ssd e com a ram e cpu a acompanharem o salto…
Ficará ótimo!!

error: Conteúdo protegido