Há algo de muito errado com os requisitos mínimos de Quantum Break!

Analisando com detalhe os requisitos mínimos de Quantum Break há coisas que chamam à atenção. Ou há erro da Remedy, ou então o DirectX 12 não é o que se esperava e a AMD irá dominar com a presença do mesmo.

NOTA: Este artigo foi acrescentado face ao original, com uma possível explicação para as incongruências. Ver nota no final

Quantum Break é um jogo DirectX 12 e extremamente optimizado para a Xbox One e DirectX 12, que sabemos agora sairá igualmente para PC.

Ora ontem apresentamos um artigo onde apresentávamos o custo de um PC que cumprisse com os diversos requisitos do jogo, e durante a sua execução deparamos-nos com várias incongruências, algumas das quais já foram referidas no dia de ontem. Por exemplo, as velocidades referidas para os processadores indicados, pura e simplesmente não existem!

Mas essas não foram as únicas incongruências! Na realidade, como o artigo que se segue demonstra, há muitas mais, e aqui ou há um erro grosseiro da Remedy na indicação do hardware, ou então o DirectX 12 não é o que foi prometido, e a AMD dominará completamente com a presença do mesmo.



É certo que a AMD sempre se queixou que o DirectX 11 estava a prender as performances das suas placas gráficas e processadores, e dada a inoperância da Microsoft, chegou mesmo a avançar com o seu próprio API, o Mantle. Entretanto a Microsoft apresentou o DirectX 12 com as mesmas características do Mantle, mas trazendo os seus ganhos a um lote bem superior de hardware que o suporta e de forma supostamente equitativa, motivo pelo qual a AMD não deveria de forma alguma sair beneficiada (exclui-se o caso do uso do GPGPU onde sabemos que as placas da Nvidia possuem problemas).

Vamos então ver e analisar esses requisitos:

Caso 1: O GPU

Os requisitos mínimos indicados para este jogo a nível de GPU são uma Nvidia Geforce GTX 760 ou uma AMD Radeon R7-260X.

Quando referimos requisitos mínimos, o que indicamos é o hardware mínimo dos principais fabricantes que cumprem com as performances e características necessárias para a apresentarem o jogo com uma determinada qualidade estabelecida. Não quer dizer assim necessáriamente que as placas dos fabricantes indicados possuam necessariamente performances semelhantes, apesar de ser lógico que, sendo possível, se tente aqui criar algum equilíbrio na escolha. E esta é uma realidade para qualquer requisito, seja ele o mínimo, recomendado ou outro.

Facto 1

Basta ver alguns benchmarks entre estas duas placas indicadas e realizados com o DirectX 11 para rapidamente percebermos que elas não são exatamente concorrentes diretas, com a 760 a revelar-se pelo menos 30% mais rápidas que a 260X.

https://www.youtube.com/watch?v=8QwS9pf8OuA

Aliás o consenso geral é que nas placas Nvidia a gama x60 representa o início da gama média, ao passo que na AMD isso só começa nas x70.  A 260x é assim gama média baixa, sendo que a concorrente mais directa da 760 é já uma placa da gama R9, a R9-270.

A correspondência a nível de placas concorrentes é assim a que se segue:

760 -> R9-270, 760 Ti -> R9-270X, 770 -> R9-280, 770 Ti -> R9-280x, 780 -> R9-290, 780 Ti -> R9-290X

Facto 2

No entanto, os vários benchmarks realizados com placas AMD e Nvidia e o DirectX 12 tem vindo a mostrar duas realidades:

  • As placas Nvidia, pela sua extrema optimização na serialização de trabalhos criado com as suas drivers DirectX 11 ganham muito pouco com o DirectX 12
  • Em alguns benchmarks as placas AMD ganham em média bastante mais do que as Nvidia com o DirectX 12 (até 30%) – Fonte (entre muitas)
  • As placas Nvidia possuem problemas com o uso do GPGPU podendo causar grandes sobrecargas no uso do CPU caso o activem

Estes dois factos, quando analisadas em conjunto podem ocultar a incongruência existente. É que com a diferença real entre as placas a poder ser superada pelo DirectX 12, então estaríamos aqui perante algum equilíbrio com duas placas com performances semelhantes, e que poderiam até ser as mínimas requeridas. E até aqui, nada de anormal!

Facto 3

No entanto é preciso ver que há um terceiro elemento em causa, a Xbox One.

Com a atual situação da Xbox One, esta está equipada com o Windows 10 como sistema operativo. E o seu API é exactamente o mesmo que equipa os PCs (salvo uma ou outra optimização específica adicional).

Ora isto significa que, mesmo contabilizando eventuais ganhos específicos da consola, estas placas necessitam forçosamente, mesmo que podendo precisar de um pouco mais, de se aproximar das performances da Xbox One.

E é aqui que a porca torce o rabo!

Vamos ver a performance da placa gráfica da Xbox One (856 Mhz, 768 pipelines e 2 comandos por ciclo)

856*768*2=1314 816 flops ou 1,314 Tflops.

Agora vamos ver as placas recomendadas!

A R7-260X – 896 pipelines a 1100 Mhz:

896 pipelines*1100 Mhz*2 comandos por ciclo= 1,971 Tflops

Geforce GTX 760 – 1152 pipelines a 980 Mhz:

1152 pipelines *980 Mhz *2 comandos/ciclo =2,257 Tflops

Ora com este hardware, sistema operativo e API, os mínimos indicados terão de permitir ao PC, na pior das hipoteses, correr o jogo com a mesma qualidade da Xbox One. Mas e então, como se justifica esta diferença brutal nas performances requeridas?

Seria lógico pensar que a escolha ideal para a placa gráfica da AMD seria uma R7-260 (sem o X). Esta versão possui os mesmos pipelines da placa gráfica da Xbox One, e corre a 1 Ghz, o que lhe permite superar a potência da gráfica da consola:

1000*768*2=1536000 ou 153,6 Tflops

No entanto esta placa até compreendemos que esteja de lado. É que a mesma apenas apresenta uma largura de banda de 94 GB/s, o que face às larguras de banda presentes na consola é claramente insuficiente.

Mas já a escolha da 760 parece-nos estar forçada ao ir acima do que seria realmente necessário. Uma Geforce 650 Ti por exemplo, parece-nos que seria suficiente.

Caso 2: O CPU

As especificações dos CPUs mínimos são a maior das surpresas.

Se analisarmos qualquer programa de benchmarks (como por exemplo o Passmark) vemos que com o DirectX 11 o FX 6300 e o i5 4460 até nem possuem uma diferença assim tão significativa de performances em casos reais (apesar de em alguns casos a diferença ser menor, noutros maior, mas sempre com vantagem para o processador da Intel).



A questão é que este jogo é DirectX 12 e deveria tirar o máximo partido do CPU, o que nos cria aqui uma incongrência. E junto com ela temos ainda a questão das velocidades pois o 4460 nem sequer existe a 2.7 Ghz, correndo a 3.2 Ghz.

Vamos então ver as performances teóricas de ambos os CPUs, mesmo com o i5 underclocked para 2.7 Ghz e que com o DirectX 12 se deveriam refletir em diferença notória:

(Capacidade de cálculo teórica)= (Velocidade do CPU em GHz) x (número de núcleos) x (Flops por ciclo)

Vamos analisar primeiro o FX 6300, um processador Piledriver:

Aqui temos um processador a 3.5 Ghz, com 6 núcleos e 16 flops por cada conjunto de 2 núcleos.

Assim, das especificações oficiais tiramos:

AMD Bulldozer/Piledriver/Steamroller, por módulo (cada dois núcleos):

  • 8 DP FLOPs/cycle: 4-wide FMA
  • 16 SP FLOPs/cycle: 8-wide FMA

O que nos dá: 3500 Mhz*6 núcleos*16/2 flops por ciclo e por núcleo = 168 000 ou 168 Gflops!

Vamos agora ver o Intel i5 4460, um Haswell de 4 núcleos.

Intel Haswell/Broadwell/Skylake:

  • 16 DP FLOPs/cycle: two 4-wide FMA (fused multiply-add) instructions
  • 32 SP FLOPs/cycle: two 8-wide FMA (fused multiply-add) instructions

Assim, temos:

2700 Mhz * 4 núcleos * 32 flops/ciclo = 345,6 Gflops

Ou à sua velocidade real de 3,2 Ghz, 409,6 Gflops.

Ora se antes do DirectX 12 a aplicação real fazia com que estas diferenças se revelassem em alguns casos com alguma aproximação, a realidade é que aqui, perante duas arquitecturas x86 e o DirectX 12, não só a diferença é gigantesca, como o i5 é em tudo mais versátil e superior. Não se compreende! O DirectX 12 deveria ressaltar as diferenças e não beneficiar assim tanto a AMD.

Como é possível que um processador AMD de 168 Gflops seja apresentado lado a lado com um outro Intel (mesmo que teórico pois essa velocidade não existe) de 345, 6 Gflops (mais do dobro)?



E pior ainda, como se compreende que com o mesmo OS e API esses sejam os requisitos para igualarem o processador de 112 Gflops da Xbox One?

AMD Jaguar (Xbox One):

  • 3 DP FLOPs/cycle: 4-wide AVX addition every other cycle + 4-wide AVX multiplication in four cycles
  • 8 SP FLOPs/cycle: 8-wide AVX addition every other cycle + 8-wide AVX multiplication every other cycle

1750 Mhz * 8 * 8 = 112 000 flops  ou 112 Gflops.

Como já referido, ou a Remedy chutou meramente especificações para o ar! Ou há algo de muito errado com o DirectX 12 que não só não está a criar equilíbrios entre o hardware como está a favorecer tremendamente a AMD.

Nota de última hora: Ao que tudo indica a Remedy atirou mesmo um pouco as especificações para o ar, o que explicaria todas as incongruências.

Esta ideia surge das especificações mínimas indicadas para Gears of War: Ultimate, um outro exclusivo Xbox One que passará para o para PC e onde o indicado é:

Processor: Intel Core i5 @ 2.7Ghz or AMD FX 6-core
Memory: 8 GB RAM (2 GB VRAM)
Graphics: Geforce GTX 650 Ti or Radeon R7 260x

Como vemos há aqui muitas semelhanças, mas igualmente as diferenças suficientes para explicar tudo! E havendo o conceito da criação de uma plataforma Xbox no PC, estas especificações não podem mudar de jogo para jogo, mas sim ser fixas, pelo que vamos comparar as duas!

Para começar, a placa gráfica. Aqui, tal como puderam perceber se leram o texto de cima, as duas placas são as que esperávamos por serem as que mais se assemelham realmente à Xbox One.

A R7-260 ainda cumpre com as especificações de performance, mas peca na largura de banda (94 GB/s) tornando a R7-260X o modelo mais baixo que cumpre com os requisitos.

A GTX 760 desaparece e aparece a GTX 650 Ti. A GTX 750 Ti curiosamente é pior que a GTX 650 Ti ao apresentar apenas 640 pipelines a 1020 Mhz (1,3 Tflops –  um pouco à justa especialmente considerando as optimizações consola não existentes no PC), e a GTX 650 já fica bastante aquém (384 pipelines a 1058 Mhz = 406 Gflops).

A GTX 650 Ti fica assim perfeita ao apresentar 768 pipelines a 928 Mhz (1,425 Tflops), apenas se aceitando a 760 caso Quantum Break necessite de computação assincrona, caso em que esta placa será melhor.

Isto significa que mesmo que a R72360X possa ganhar mais do que a GTX 650 Ti com o DirectX 12, ambas as placas cumprem com os requisitos mínimos e são as ideais para figurarem na tabela.

A indicação da 760 em Quantum Break parece assim, perante estes factos, atirada para o ar, pelo lado da segurança. Alternativamente o jogo requer um nível de suporte ao DirectX 12 que as série 6xx não pode fornecer com a mesma performance.

Mas o certo é que a ideia de especificações pouco pensadas voltam à ideia quando analisamos os CPUs para este caso. É que perante as indicações dos requisitos de Gears of War: Ultimate, as velocidades dos CPUs passam a fazer sentido pois deixa de haver referências aos modelos. E vamos já ver porque fazem sentido!

A nível da AMD só se pede um processador FX de 6 núcleos, sem referência ao modelo.

Ora o modelo de 6 núcleos mais baixo é o FX 6100, um modelo Bulldozer a 3.3 Ghz.

AMD Bulldozer/Piledriver/Steamroller, por módulo (cada dois núcleos):

  • 8 DP FLOPs/cycle: 4-wide FMA
  • 16 SP FLOPs/cycle: 8-wide FMA

3300*6*16/2=158.4 Gflops – perfeitamente capaz!

Mas porque não considerarmos um CPU AMD com 4 núcleos? Basta fazer a conta:

3300*4*16/2=105600 ou 105,6 Gflops… Inferior à Xbox One!

Ou seja, o FX 6100 é o mínimo, o que faz perceber o pedido de 6 núcleos. E dado que apresenta uma performance superior à da One, percebe-se que esse seja o único requisito!

E quanto ao Intel?

Sendo a velocidade o único requisito, o i5 mínimo passa a ser um i5 2500s, um Sandy Bridge com 4 núcleos.

Intel Sandy Bridge/Ivy Bridge:

  • 8 DP FLOPs/cycle: 4-wide AVX addition + 4-wide AVX multiplication
  • 16 SP FLOPs/cycle: 8-wide AVX addition + 8-wide AVX multiplication

Ou seja, 2700*4*16=127 800 flops ou 172.8 Gflops

Sem dúvida um valor muito mais aceitável face ao AMD, e perfeitamente capaz!

Poderá um i3 bater isto? Sim! Mesmo com apenas dois núcleos, se for Haswell ou mais recente (32 flops/ciclo), e a 2,7 Ghz ou mais, sim! Mas isso obrigava a referir modelos, algo que nesta lista não existe. A Remedy é que tentou fazê-lo e pelos vistos não saiu lá muito bem!

A realidade é que com esta explicação as coisas parecem fazer sentido, e daí que certamente as especificações da Remedy foram um pouco atiradas para o ar. Porque se não foram… então continua-se sem se as compreender!

Mas o certo é que apostamos que as indicações de Gears servirão plenamente em Quantum Break.



Posts Relacionados