torsdag 30. juni 2011

Hvorfor minne er det svake leddet i AMDs nyeste Fusion chip

Interessante nyheter på url:http://feeds.arstechnica.com/~r/arstechnica/everything/~3/SiW2M9M0onE/another-look-at-amds-llano.ars:

Llano, AMD nest oppføring i sin Fusion familien av prosessorer som kombinerer en CPU og GPU på samme dør, ble lansert tidligere denne måneden til moderat positive anmeldelser. Men inntil nå, var det lite detalj kjent om nøyaktig hvor AMD hadde håndtert integreringen av CPU og GPU på Llano er dø.

David Kanter på RealWorldTech har gjort noen graving og satt sammen en grundig titt på Llano, sammenligne sin CPU / GPU integrasjon til at av Intels Sandy Bridge. Kanter brikke svar på noen spørsmål om Llano som ble reist av anmeldelser.

Bortsett fra den svake CPU kjerne, er den viktigste brist Llano at anmeldelser fremhevet at prosessorens GPU kjerne er utrolig begrenset av minnebåndbredde. Den Cypress GPU som brukes for Llano ble designet for en diskret grafikkort, hvor det ville ha tilgang til en gigabyte eller to av høy båndbredde, dedikert GDDR minne. På Llano, i motsetning, ble GPU aksjer største minne med CPU, og resultatet at ytelsen var bottlenecked alvorlig. Kanter artikkel gir et innblikk i hvorfor dette er.

I stedet for å knytte Llano er CPU og GPU med høy båndbredde ring buss og la dem dele en L3 cache (Sandy Bridge tilnærming), forlot AMD de to delene relativt usammenhengende internt. I stedet, CPU og GPU bruker hovedminne å kommunisere uten å kopiere data fra ett sted til den andre. Ved oppstart, får GPU tilgang til 512 MB hovedminne i en egen minne, CPU får resten av RAM.

Internt er det en liten toveis buss som forbinder GPU til å sette av sammenhengende minne køer, og det er en annen buss som forbinder GPU til DDR-kontrolleren, men det er det. CPU snakker til GPU med grafikkdriver og hovedminne, og GPU kan snakke til CPU bruk sammenhengende forespørsler til spesielle regioner av minne, men sistnevnte er ganske treg.

I alle, da, mangelen på en høy båndbredde intern kobling mellom CPU og GPU, og avhengighet av hovedminnet for kommunikasjon, betyr at Llano er grafikkytelsen er ganske mye kvalt av brikken sin dual-kanals DDR3 kontroller.

Når det gjelder fremtiden for Llano, hadde jeg foreslått at AMD kan vurdere en pool av eDRAM at CPU og GPU kunne bruke for delt minne og on-die kommunikasjon, men Kanter tilbyr et mer gjennomførbart alternativ for å forsterke en fremtidig Fusion prosessorens grafikkytelse: bruke 3D chip stabling teknikker for å sette en liten mengde minne i samme pakke som prosessoren. Mengden minne ville ikke være mye selv 256 høy båndbredde, lav latency minne vil dramatisk øke Llano ytelse.

Alt dette, igjen, viser bare hvor stor av en binde NVIDIA nå er i, og hvorfor selskapet har til å gjøre et forsøk på plass på skrivebordet med Project Denver. Sandy Bridge og Fusion stave begynnelsen på slutten for den diskrete GPU markedet, som fortsatt er NVIDIAs brød og smør.

Les kommentarene på dette innlegget


Ingen kommentarer:

Legg inn en kommentar