procesoare multi-core post

76
PROCESORUL Procesorul este una dintre cele mai importante componente a unui calculator, fiind cel care stabileşte cine, ce şi când sa facă. Deoarece se pot obţine performanţe destul de bune şi cu un procesor care nu este vârf de gama, ne poate da falsa impresie că el nu are un rol foarte important. De exemplu,un împătimit al jocurilor va pune un accent mai mare pe placa video decât pe procesor. Totul depinde de destinaţia calculatorului, acest lucru însemnând că nu avem mereu nevoie de cel mai performant procesor. Vom întâlni des denumirea de CPU în cazul procesorului (Central Processing Unit ), sau UCP, aceasta fiind traducerea în limba română (Unitate Centrală de Prelucrare). INTRODUCERE Produsele dual si multi-core sunt concepute prin includerea a doua sau mai multe core-uri complete de CPU (unitate centrala de procesare) in interiorul unui singur procesor, care permite astfel gestionarea simultana a mai multor activitati.Unele modele de procesoare folosesc o memorie cache pentru fiecare nucleu, de exemplu AMD dual-core, sau o memorie comună pentru toate nucleele, cum sunt modelele Intel Core 2 Duo acelaşi cache L2. Procesoarele care au toate nucleele pe un singur circuit integrat se numesc procesoare monolitice. Procesoarele multi-core îşi dovedesc eficienţa când sunt puse în sarcina mai multor thread-uri.Cand se combina cu tehnologia HT, care permite unui procesor sa se prezinte sub forma a doua procesoare logice, produsele de tipul Pentium Processor Extreme Edition pot procesa patru apliatii software simultan, utilizand intr-un mod mult mai eficient resurse care, in alte conditii, ar ramane neexploatate.

Upload: procopciuc-vasile

Post on 02-Jan-2016

328 views

Category:

Documents


7 download

DESCRIPTION

procesorul multinuclear

TRANSCRIPT

Page 1: Procesoare Multi-Core Post

PROCESORUL

Procesorul este una dintre cele mai importante componente a unui calculator, fiind cel care stabileşte

cine, ce şi când sa facă. Deoarece se pot obţine performanţe destul de bune şi cu un procesor care nu este vârf de

gama, ne poate da falsa impresie că el nu are un rol foarte important. De exemplu,un împătimit al jocurilor va

pune un accent mai mare pe placa video decât pe procesor. Totul depinde de destinaţia calculatorului, acest

lucru însemnând că nu avem mereu nevoie de cel mai performant procesor. Vom întâlni des denumirea de CPU

în cazul procesorului (Central Processing Unit ), sau UCP, aceasta fiind traducerea în limba română (Unitate

Centrală de Prelucrare).

INTRODUCERE

Produsele dual si multi-core sunt concepute prin includerea a doua sau mai multe core-uri complete de

CPU (unitate centrala de procesare) in interiorul unui singur procesor, care permite astfel gestionarea simultana

a mai multor activitati.Unele modele de procesoare folosesc o memorie cache pentru fiecare nucleu, de exemplu

AMD dual-core, sau o memorie comună pentru toate nucleele, cum sunt modelele Intel Core 2 Duo acelaşi

cache L2. Procesoarele care au toate nucleele pe un singur circuit integrat se numesc procesoare monolitice.

Procesoarele multi-core îşi dovedesc eficienţa când sunt puse în sarcina mai multor thread-uri.Cand se combina

cu tehnologia HT, care permite unui procesor sa se prezinte sub forma a doua procesoare logice, produsele de

tipul Pentium Processor Extreme Edition pot procesa patru apliatii software simultan, utilizand intr-un mod

mult mai eficient resurse care, in alte conditii, ar ramane neexploatate.

Un procesor multi-core combină două sau mai multe nuclee (core) într-un singur circuit integrat sau mai

multe pachete de circuite integrate la un loc. Unele modele de procesoare folosesc o memorie cache pentru

fiecare nucleu, de exemplu AMD Dual-Core, sau o memorie comună pentru toate nucleele, cum sunt modelele

Intel Core 2 Duo acelaşi cache L2. Procesoarele care au toate nucleele pe un singur circuit integrat se

numesc procesoare monolitice. Procesoarele multi-core îşi dovedesc eficienţa când sunt puse în sarcina mai

multor thread-uri.

Procesoare Intel Multi-core

   Ce este un procesor Multi-Core?

   Un procesor multi-core este compus din doua sau mai multe nuclee independente, fiecare capabil sa proceseze

instructiuni individuale. Un procesor dual-core contine doua nuclee, un procesor quad-core contine patru nuclee

si un procesor hexa-core contine sase nuclee.

Page 2: Procesoare Multi-Core Post

Calculatoare de patru ori mai puternice: Intel Corporation a incheiat pregatirile initiale pentru demararea

productiei de procesoare dual-core si a oferit detalii suplimentare despre planurile sale pentru procesoare multi-

core, anuntand inceputul unei noi ere, in care PC-urile vor avea in interior doua sau mai multe "creiere". Intel

intentioneaza sa livreze produse separate dual-core, precum si cipseturi dual-core pentru familiile de procesoare

din clasa Pentium,incluzand procesorul Pentium Extreme Edition.Intel are deja in derulare peste zece proiecte

pentru produse multi-core si intentioneaza sa creasca nivelul de calitate al software-ului si solutiilor care permit

obtinerea de linii de produse, tools, investitii si programe, pentru a aduce la un nou nivel calitativ design-ul de

software.

Ideea de procesor cu mai multe nuclee este o consecinţă a efectelor, din punct de vedere al

performanţei, pe care le are folosirea unui PC cu mai multe procesoare în locul unuia singur. Dar un sistem

bazat pe o placă de bază multiprocesor devine foarte scump şi neatractiv pentru majoritatea utilizatorilor.

Folosirea mai multor nuclee pe aceeaşi pastilă de siliciu permite creşterea performanţei cu costuri minime,

deoarece liniile de comunicare între cele două nuclee sunt mult mai scurte, deci mai rapide, în acelaşi timp

dispărând şi necesitatea construirii unei infrastructuri pentru interconectarea nucleelor.

Iniţial, această idee era foarte greu de pus în practică din cauza procesului de fabricaţie a cip-urilor, ce

presupunea creşterea dimensiunilor pastilei de siliciu prin folosirea unui număr mai mare de tranzistori, implicit

şi a consumului. Odată cu micşorarea dimensiunilor tranzistorilor a devenit posibilă introducerea unui număr

mai mare de tranzistori în acelaşi spaţiu pe pastilă, păstrându-se în acelaşi timp şi caracteristicile termice.

Primul procesor dual-core a fost conceput şi construit de IBM în anul 2000, odată cu lansarea celei de-a

patra generaţii de procesoare PowerPC: Power 4. Acesta aducea, în premieră, mai multe nuclee pe aceeaşi

pastilă, fiind vorba în fapt de două nuclee pe 64 biţi PowerPC AS. Memoria cache Level 2 era împărţită în trei

părţi egale, fiecare nucleu având acces la oricare dintre ele.

   De ce am nevoie de mai multe nuclee?

   Nucleele multiple pot fi folosite pentru a rula doua programe deodata si atunci când un program mai intensiv

se executa (AV scan, conversie video, CD ripping, etc.) puteti utiliza alt nucleu pentru a rula browser-ul dvs.(de

exemplu pentru a verifica adresa dvs. de email).

   Mai multe nuclee vor straluci cu adevarat atunci când utilizati un program care utilizeaza mai mult de un

nucleu (numit Parallelization) pentru a îmbunatati eficienta programului. Programe precum software de grafica,

jocuri etc. pot rula mai multe instructiuni în acelasi timp si sa livreze mai rapid rezultatele.

   Deci, daca utilizati software-uri care folosesc procesorul intens, nucleele multiple va vor oferi probabil o

experienta mai buna atunci când utilizati PC-ul. Daca utilizati PC-ul dvs. pentru a verifica e-mailurile si pentru

a privi un video ocazional, chiar nu aveti nevoie de un procesor multi-core.

Page 3: Procesoare Multi-Core Post

Aşa cum am văzut, proiectanţii tind să înghesuie din ce în ce mai multe circuite peaceeaşi pilulă de

siliciu. O evoluţie naturală este de a face saltul de la mai multe procesoare legate printr-

o magistrală comună (ca în cazul sistemelor cumultiprocesoare simetrice, pe care le-am descris în PC Report

din noiembrie 1998)în procesoare strâns cuplate, pe aceeaşi pilulă de siliciu.De fapt, astfel de scheme există

deja: procesorul pentru mainframes IBM S/390 aredouă nuclee identice, care execută sincron acelaşi program:

în cazul în carerezultatele nu sunt identice se execută o excepţie şi programul este reluat. Acestaeste un exemplu

în care mai multe resurse sunt folosite pentru o fiabilitate sporită,dar IBM a anunţat că viitorul lor procesor G5

va conţine două nuclee independente pe aceeaşi pilulă, permiţând realizarea unor sisteme multi-procesor cu un

singur cip.

Multithreading

O evoluţie naturală ar fi spre a exploata alte forme de paralelism decât cel la nivelde instrucţiune (ILP).

Calculatoarele moderne exploatează excelent paralelismul lanivel de proces, dar există forme intermediare,

şi trebuie să ne aşteptăm să vedemarhitecturi din ce în ce mai orientate spre acestea:

Paralelism la nivel de buclă: în care iteraţii succesive ale unei bucle suntexecutate în paralel.

Paralelism la nivel de thread ;

Există o sumă de inovaţii arhitecturale legate de aceste tehnologii, încă ne-integrateîn produse comerciale.

Să privim cîteva dintre ele:

Thread-level data speculation: este o metodă de a implementa paralelismulla nivel de buclă,

lansând câte un thread pentru fiecare iteraţie a buclei. Deexemplu, proiectul STAMPede de la Universitatea

Carnegie Mellon, condusde profesorul Todd Mowry explorează această alternativă(http://www.cs.cmu.edu/

~tcm/STAMPede.html).

Simultaneous multi-threading , propus la universitatea din Seattle în 1995.Această tehnologie

menţine starea fiecărui thread în hardware şi permite comutarea rapidă între thread-uri. Putem distinge două

variante, ca în caseta"Multithreading": într-una din variante, în fiecare ciclu de ceas putemexecuta instrucţiuni

dintr-un alt thread, şi alta, în care în fiecare ciclu,instrucţiuni din thread-

uri diferite candidează pentru unităţi funcţionalediferite.Avantajul unor astfel de scheme este că, dacă un thread

execută operaţii care aunevoie de mult timp (de exemplu accese la memorie), putem alte thread-uri caresunt

gata de execuţie, folosind mai eficient unităţile funcţionale ale procesorului.

Dincolo de legea lui Moore

În fine, voi încheia acest articol cu o privire extrem de sumară asupra unor proiectede cercetare

ambiţioase, care încearcă să privească nu numai în viitorul imediat, cisă anticipeze peisajul calculatoarelor peste

zece ani şi mai mult. La acea dată barierele impuse de fizică vor fi atinse, aşa că trebuie să ne aşteptăm la o

încetinirea vertiginoasei creşteri de performanţă. Dar chiar şi aşa, numărul uriaş de resurse puse la dispoziţie

trebuie să fie folosit cumva; iată unele posibilităţi:

Page 4: Procesoare Multi-Core Post

IRAM, Smart Memory

Proiectul IRAM ( Intelligent RAM ) de la Berkeley este condus de David Patterson(http://iram.cs.

berkeley.edu/) şi îşi propune integrarea tehnologiilor de fabricaţie a

memoriilor şi procesoarelor (la ora actuală liniile de fabricaţie sunt completdiferite). IRAM încearcă să evite

disparitatea de acces la memorii împingând o multitudine de procesoare micuţe printre celulele de memorie,

unde pot lucra independent.Un proiect foarte asemănător este cel de la Stanford, al profesorului Mark Horowitz,

numit Smart Memories (http://velox. stanford.edu/smart_memories/).Aceste proiecte încearcă să depăşească

problema accesului lent la memorie prindistribuirea unităţilor de procesare printre memorii, astfel încât accesul

să fie paralel şi rapid. De asemenea, astfel de scheme, în care calculul este distribuit înmulte unităţi

independente, face ca impactul "sârmelor lungi" să fie redus.

RAW

Proiectul RAW de la MIT (http://www.cag.lcs.mit.edu/raw/) atacă problema dintr-un cu totul alt punct de

vedere: maşina RAW constă din foarte multe procesoare,relativ simple, construite pe aceeaşi pilulă de siliciu.

Aceste procesoare cooperează pentru a executa o singură aplicaţie, care este paralelizată automat de compilator.

Imagine

Un proiect foarte interesant este Imagine (http://cva.stanford.edu/imagine/cva_imagine.html), dezvoltat la

universitatea Stanford sub conducerea luiWilliam Dally. Proiectul, orientat mai degrabă pe procesarea de

semnal, propuneun nou model de programare, orientat spre multimedia, în care paralelismul datelor este făcut

explicit prin noţiunea de flux ( stream). De exemplu, pentru a afişa scenecomplicate pe ecran, prelucrarea

transformă datele dintr-un flux de obiecte într-unflux de poligoane, care devin un flux de triunghiuri, apoi un

flux de pixeli şi aşamai departe.

PipeRench şi Brass

În fine, menţionez două proiecte care încearcă să îmbine hardware-ul

reconfigurabil cu procesoarele tradiţionale: proiectul Brass de la Berkeley(http://http.cs.berkeley. edu/projects/

brass/), condus de John Wawrzynek, şi proiectul PipeRench de la Carnegie Mellon, condus de Seth Goldstein şi

HermanSchmit (http://www.ece. cmu.edu/research/piperench/).Am vorbit altă dată pe larg despre hardware-ul

reconfigurabil (PC Report din iulie1998). Fiecare poartă universală poate fi programată să execute orice

funcţielogică, iar comutatoarele pot cupla şi decupla sârmele (vezi figura"Hardwarereconfigurabil" ). Porţile

universale se pot implementa din mici celule RAM. Astfelse pot sintetiza unităţi funcţionale extrem de

complexe, care pot opera uneori multmai eficient decât un procesor de uz general.

Avantajele procesoarelor multi-core

În cazul arhitecturii single-core există mai multe optimizări cu scopul de a creşte viteza de execuţie a unui

program şi vizează, de obicei, paralelismul la nivel de instrucţiune, ce presupune executarea simultană a cât mai

Page 5: Procesoare Multi-Core Post

multor instrucţiuni. Acest lucru este posibil atâta timp cât o instrucţiune nu depinde de rezultatul alteia ce se

doreşte executată în paralel.

În cazul arhitecturii multi-core se urmăreşte optimizarea paralelismului la nivel de thread. Un thread este un

fir de execuţie al unui program, program care poate avea mai multe fire de execuţie, fiecare cu setul său de

instrucţiuni ce pot fi şi ele rulate în paralel. Viteza unei arhitecturi multi-core depinde de modul în care sunt

scrise programele şi de compilatorul care furnizează date procesorului.

Ca specific al arhitecturii multi-core, fiecare nucleu execută un flux independent de instrucţiuni din cadrul

unei zone comune de memorie. Conţinutul acestei zone este administrat prin arbitrare, în funcţie de conţinutul

memoriei cache a fiecărui nucleu. Nivelurile de cache pentru fiecare nucleu se justifică prin structura

procesoarelor actuale, optimizate pentru creşterea lăţimii de bandă a interfeţei cu memoria. Fără aceste niveluri

de cache locale, fiecare nucleu ar rula la maximum jumătate din potenţial. Managementul conţinutului

memoriilor cache este realizat prin intermediul unui protocol de asigurare a coerenţei datelor stocate. Celelalte

avantaje constau în localizarea mai precisă a datelor, comunicarea mai rapidă între unităţile de procesare,

economisirea spaţiului şi consumului de curent şi un raport cost/performanţă mai bun decât în cazul unui

procesor single-core.

Ce limiteaza viteza de procesare

Procesoarele au atins o limita tehnologica pe la viteza de 3Ghz. Intr-o cuanta de timp atat de mica

(1s/3.000.000.000), lumina (si orice alt semnal) poate parcurge doar aproximativ 10cm, ordinul de marime al

unui procesor. Procesorul nu poate functiona mai repede pentru ca atat ii ia semnalului electric sa faca o tura

prin procesor. 

Procesorul reordoneaza executia unor instructiuni care nu depind unele de altele, pentru a putea

executa mai multe operatii intr-o singura cuanta de timp, in paralel. De multe ori insa operatia urmatoare

depinde de rezultatul celei precedente, deci nu se poate lansa a doua operatie pana nu se termina prima.

Pentru a creste performanta, s-a inceput crearea procesoarelor multi-core, care incearca sa imparta

procesarea pe mai multe unitati procesor. Din cauza interdependenti intre operatii, un program rulat pe 2

procesoare obtine de obicei mult sub dublul performante.

Un program care are doar un fir de executie (thread) obtine pe doua procesoare sub 10% in plus fata

de a rula pe un singur procesor. Pe de alta parte se pot rula doua programe in paralel la aceeasi viteza cu a le

rula pe fiecare singure pe un procesor. Este vorba de programe care consuma mult CPU fiecare, nu programe

care stau deschise fara sa faca nimic.

Page 6: Procesoare Multi-Core Post

Memoria RAM functioneaza cam de 100 ori mai lent decat procesorul, la fel cum Hard-Discul este

mult mai lent fata de RAM. Pentru ca procesorul sa poata executa instructiuni la viteza maxima, exista cache-ul

L1 care functioneaza aproximativ la viteza procesorului.

Cache-ul este o fereastra spre memorie. El incarca zona de memorie care este in executie, iar cat timp

executia nu iese din acea zona procesorul poate functiona la viteza maxima.

Imediat ce executia iese din fereastra de cache, procesorul asteapta echivalentul a peste 100 de

instructiuni sa se incarce o noua bucata din memorie in cache. De aceea un cache L1 mai mare inseamna o

viteza mai mare de executie. Cache-ul L1 este foarte scump, deci mic. Unele procesoare au si cache L2 (de 10

ori mai lent si de 10 ori mai mare/ieftin).

Exista si cache L3 care este doar de aproximativ 2 ori mai rapid decat memoria RAM, dar care ajuta

sistemele multiprocesor sa nu congestioneze accesul la memoria RAM.

Viteza de executie a unui program nu mai depinde atat de tare de frecventa procesorului, cat de

numarul de accesari ale memoriei pe care nu le gaseste in cache. Algoritmi complexi incearca sa pre-incarce in

cache memoria necesara in viitorul apropiat, totusi in multe cazuri nu reuseste.

Chiar si un 5% de "cache miss" (accesari ale memoriei in afara zonei cache) scade performanta

drastic. In loc ca 100 operatii sa dureze 100 cuante timp, vor dura 95+5*100, deci aproape de 6 ori mai mult

decat ar dura executate 100% in cache. S-ar putea ca un cache L1 mai mare sa ajute mai mult decat arata

benchmark-urile, intrucat programele  benchmark sunt relativ mici, putand sa incapa complet in cache.

Viteza cu care ruleaza un program tine foarte mult de felul in care sunt aranjate instructiunile in

memorie. Compilatoarele si masinile virtuale incearca sa ajute la aceasta operatie. Salturile in structuri mari de

date si "indirectarile" produc totusi foarte multe salturi in afara zonei de memorie incarcate in cache, deci scad

performanta.

Programarea orientata pe obiecte (C++) tinde sa genereze multe obiecte distribuite in zone de

memorie ne-alaturate, deci un cod care iese mai des din cache. Programarea C foloseste in general functii mai

mari, indirectari mai putine, zone de date mai compact distribuite, deci are sanse sa genereze un cod care

foloseste cache-ul mai eficient.

Atunci cand procesorul asteapta dupa memoria RAM, procesorul va arata incarcat 100%, desi el de

fapt ... sta degeaba. Este aproape inposibil de detectat impactul iesirilor din cache asupra vitezei, altfel decat

prin teste cu diferite procesoare. 

Arhitectura multi-core

Page 7: Procesoare Multi-Core Post

Procesoare multi-core poat fi clasificate în funcție de prezența coerenței cache sprijin între nuclee.

Momentan sunt procesoare cu un astfel de sprijin si fără ea.

Metoda de comunicare între nuclee:

Bus partajat

de rețea (plasă) pentru punct-la-punct

retea cu comutator

memorie cache totala

Constrangeri fizice

Page 8: Procesoare Multi-Core Post

Problemele cu care se confrunta proiectantii de microprocesoare nu sunt insurmontabile, insa solutiile

sunt din ce in ce mai greu de gasit.

Printre altele, exista doua lucruri importante care limiteaza microprocesoarele: decalajul transmisiei in

interiorul cipului si temperatura.

Decalajul se datoreaza datorita firelor ce conecteaza toate tranzistoarele intr-un cip. “Firele” sunt

incredibil de mici. Un cip reprezinta practic un grup de tranzitoare conectate intre ele, iar un tranzistor

functioneaza precum un intrerupator.

Atunci cand un tranzistor isi schimba starea din pornit in oprit sau invers, incarca firul ce este legat de

urmatorul tranzistor. Insa aceste operatiuni necesita timp. Cu cat “firul” este mai lung, cu atat va dura mai mult.

Reducerea dimensiunilor are o consecinta importanta: traseele pe care trebuie sa le parcurga curentul

electric intre componente sunt mai scurte, deci se pot parcurge mai rapid. Proiectantii au putut face astfel

procesorul sa functioneze cu un ceas mai rapid.

Insa nu doar distanta dintre doi tranzistori e singura problema: comutarea intre doua stari a tranzistorului

necesita si ea timp. Aceasta limiteaza viteza unui microprocesor. Mai mult, tranzistorii sunt legati in lant,

asadar, cu fiecare tranzistor, timpul se mareste.

O alta problema ce limiteaza viteza unui microprocesor este temperatura ridicata. De fiecare data cand

tranzistorii isi schimba starea, comuta de pe 0 pe 1 sau invers, pierd putina electricitate. Aceasta creeaza

caldura, si cu cat ruleaza mai rapid, cu atat genereaza mai multa caldura. Un cip care se supraincalzeste se

blocheaza sau cauzeaza erori. Calculatorul poate “ingheta” pentru mici perioade de timp, se poate restarta

automat, sau pot aparea asa numitele BSOD (Blue Screen of Death) pe sistemele de operare Windows.

Microprocesoarele au ajuns sa contina un numar impresionant de tranzistori, ajungand pana la cateva sute

de milioane. Astfel de circuite sunt foarte greu de verificat si testat. Cheltuielile pentru verificare si testare chiar

ajung sa depaseasca pe cele de proiectare si dezvoltare.

Miniaturizarea nu va putea si ea continua in acelasi ritm exponential. S-ar ajunge la necesitatea de a

realiza un tranzistor mai mic decat un atom, ceea ce e imposibil. Insa pana acolo, mai sunt alte probleme de

confruntat.

Mark Horowitz, profesor la Universitatea Stanford a scris un articol intitulat “Viitorul sarmelor” si in care

porneste de la caracteristicile electrice ale semiconductorilor si analizeaza o serie de scenarii posibile pentru

tehnologiile de fabricatie. Textul ia in considerare mai multi factori precum geometria firelor, capacitati si

resistente, disiparea puterii, etc. Mark Horowitz a ajuns la o concluzie interesanta, cum ca nu firele ar constitui

un impediment in functionarea sa corecta.

Suprafata circuitelor nu a scazut, din cauza ca designerii au adaugat noi module, insa o problema sunt

firele care traverseaza mai multe module. Lungimea acestora ramanand constanta, in milimetri. Ori, cum viteza

ceasului creste mereu, asta inseamna ca semnalele electrice nu mai au timp sa parcurga firele de la un capat la

Page 9: Procesoare Multi-Core Post

altul. Circuitele viitorului nu vor mai putea comunica prin semnale globale: pur si simplu va fi imposibil pentru

un fir sa uneasca diferite parti ale circuitului. 

Pe masura ce tranzistorii sunt tot mai mici, firele sunt mai subtiri si consumul de putere este mai mare,

circuitele sunt mai sensibile la zgomot, fie el termic, din mediu sau probabil in curand, chiar efecte cuantice.

Fenomenele de transport din semiconductori pe care se bazeaza tranzistorul sunt fenomene statice: ori cand

dimensiunile devin atat de mici incat numai cativa electroni produc semnale, statistica nu mai opereaza iar

exceptiile incep sa apara.

Performanta microprocesoarelor s-a situat pe o curba exponentiala, iar miniaturizarea si tehnicile folosite

au contribuit in mod egal la aceste spectaculoase cresteri. Insa aceasta crestere se apropie de sfarsit datorita unor

bariere fizice fundamentale. Asta pana la aparitia unor noi generatii de procesoare ce vor depasi aceste

probleme.

Microarhitecturile procesoarelor cu mai multe nuclee

Page 10: Procesoare Multi-Core Post

Penrym

Nehalem

Westmere

Sandy Brydge

Ivy Bridge

Microarhitectura Nehalem a firmei Intel

Pe numele de cod ³Nehalem´, noua arhitectura inglobeaza variante imbunatatite ale unitatilor de executie

din arhitectura Conroe, asezonate cu multiple aditii pe care le voi expune maitarziu dar din care amintesc cache-

ul pe 3 nivele sau controller-ul de memorie integrat. Daca Penryn avea doua pastile a cate doua nuclee pe

acelasi suport organic pentru a oferi un totalde 4 procesoare per socket, echivalentul din generatia Nehalem

va veni cu 4 nuclee integratein aceeasi pastila si dupa cum unii prefera sa il numeasca, va fi quad-core nativ.

Page 11: Procesoare Multi-Core Post

As vrea mai intai sa vedem din punct de vedere fizic cum e posibila o arhitectura atat de complexa.

Modelul ³tick-tock´ pe care eminentele din Santa Clara si l-au propus a debutat in cel mai serios mod

anul trecut, odata cu lansarea procesului de fabricatie pe 45nm. Din punctde vedere al performantelor momentul

nu a fost crucial, insa o introspectiva in schimbarile tehnologice aduse de generatia Penryn ne ajuta sa punem

mai bine in perspectiva evolutiile viitoare.

 Tick-ul

 Astfel, micsorarea dimensiunii tranzistoarelor de la 65nm la 45nm a fost posibila doar datorita unei

cuceriri a stiintei mult mai importante, adusa la cunostinta lumii intregi sub numele de ³high-k metal gate´. De

aproximativ 30 de ani toate aparatele electronice folosesc tranzistoare MOS-FET (sau mai corect, IG-FET)

construite cu aceleasi materiale, mai precis strat izolator din oxid de siliciu si poarta din polisilicati. Tehnologia

a ajuns insa la o limita si miniaturizarea chiar si la 65nm a fost o reala problema, primele revizii confruntandu-

se cu probleme termice grave cauzate de curentii de scurgere. E si normal, tranzistorii sunt atat de mici incat

incap 400 de milioane intr-un centimetru patrat de chip, iar stratul izolator de oxid de siliciu a ajuns la o

grosime de maxim 100 de diametre atomice. Va dati seama cum electronii voiosi mai sar gardul in partea

cealalta, facand ca la inceput mai bine de jumatate din puterea consumata de un procesor pe 65nm sa fie doar

³leakage current´, iar spre rafinarea tehnologiei valorile sa coboare sub 30%.

In contextul asta, o noua tehnologie de fabricare se impunea si aici faptul ca esti un gigant economic care

isi permite sa cheltuie miliarde de dolari pe research & development se pare ca ajuta. Dupa ani de cercetare si

testare de sute de materiale si combinatii, baietii de la Intel au stabilit ca dioxidul de siliciu si polisilicatii

trebuie sa se retraga la pensie si in locul lor sa treaca la treaba portile metalice si izolatorii bazati pe hafniu. Mi-

ar placea sa va spun exact despre ce metal e vorba si cineva sa imi confirme ca izolatorii sunt mai exact silicati

nitriti de hafniu (HfSiON ± pentru fanii lui Mendeleev), macar pentru a avea subiect de discutie la coada la

Carrefour, insa companiile astea mari se pare ca au un obicei prost in a nu imparti secretele industriale cu restul

lumii. Cert e insa ca in loc de 100 de diametre atomice acum se pot folosi intre 3 si 10, iar la aceeasi grosime a

izolatorului curentii de scurgere sunt de 100de ori mai mici. Destul de impresionant, dupa parerea mea.

Page 12: Procesoare Multi-Core Post

Tock-ul

 Deschizandu-si astfel o cale noua, urmatorul pas e evident evolutia arhitecturala a procesoarelor astfel

incat sa beneficieze din plin de avantajele create. Si cum paralelismul etrendy in 2008, nu vom vedea un

procesor mult mai rapid, ci mai degraba mai versatil si mai eficient. Nu putem nega prezenta unor optiuni ce au

fost introduse de AMD da-a lungul timpului, cum ar fi controllerul de memorie integrat sau sistemul de power

management cetrateaza fiecare nucleu separat. Si parca Ronak Singhal, liderul echipei ce a creat Nehalem

avazut produsul concurentei si s-a ambitionat sa arate ca poate face mai bine.Rezultatul e unul impresionant din

foarte multe puncte de vedere si asta e mare lucru mai ales pentru cei care au avut scara de valori data peste cap

odata cu lansarea arhitecturii Conroe.Daca pana acum existau niste piedici tehnologice, acum faptul ca se pot

inghesui pe o pastilade siliciu inspre un miliard de tranzistori odata cu trecerea la procesul de fabricatie pe

45nm permite in sfarsit ca puternica masina de calcul care este nucleul de executie Conroe sa fie pusa la munca

exact asa cum trebuie, fara limitari de bandwidth cauzate de bus-ul invechit tehnologic de ceva vreme. Si ca sa

nu ne mai invartim in jurul cozii, sa vedem mai exact care sunt punctele importante ale noii arhitecturi:

- quad-core si octo-core native

- controller de memorie DDR3 integrat

- o noua conexiune point-to-point, denumita ³Quick Path Interconnect´ (QPI pe scurt)

- sistem de power management inteligent, independent pe fiecare nucleu, ³power gating´

- turbo mode- L3 cache shared

- accelerator grafic on-package

- hyperthreading

- o imbunatatire cu 33% a numarului de micro-ops facute in-flight fata de nucleele Conroe

- branch prediction si TLB-uri pe cate doua nivele.

Procesoare Nehalem contin cel putin 731 de milioane de tranzistori, 10% mai putin decât Yorkfield

procesor. Dar dimensiunea de cristal a crescut semnificativ în comparaţie cu predecesorul său, cu 214 şi 263

mm2.

Si tot in tendinta catre imbunatatirea lucrului cu bazele de date avem si reorganizarea TLB-ului

(Translation Lookaside Buffer). Acest buffer are rolul de a stoca corespondentele intre adresele virtuale de

memorie si cele fizice, pentru a micsora timpul de acces al celor mai frecvent utilizate. Nehalem mareste

capacitatea TLB-ului de instructiuni din Conroe la 128 de intrari pentru pagini mici (4k marime) si 7 intrari

pentru pagini mari(2M/4M marime), iar alcelui de date la 64 de intrari pentru pagini mici si 32 pentru pagini

mari. Deasemenea, apare si un TLB de al 2-lea nivel, ce poate stoca 512 intrari de pagini mici.In Conroe a fost

intercalat un detector de bucle (Loop Stream Detector ± LSD) intre etajul deaducere si cel de decodare a

instructiunilor pentru a actiona in situatia in care urma un sir deinstructiuni repetitive, oprind etajele de predictie

Page 13: Procesoare Multi-Core Post

si aducere si servind direct instructiunile din buffer-ul propriu; astfel se eliminau timpi de asteptare totodata cu

economisirea de energie. Nehalem insa are acest etaj dupa partea de decodare, si in timp ce LSD-ul lui Conroe

putea stoca 18 instructiuni cel al lui Nehalem stocheaza acum pana la 28 de micro-ops si le serveste direct in

reorder buffer, oprind si etajul de decodare in acest timp. Spre deosebire dehyperthreading de exemplu,

aceasta modificare va avea un impact egal in orice tip de mediude lucru si va imbunatati consumul de energie

cat si performanta.

Arhitectura Nehalem va oferi un design robust, universal, de nucleu de procesare, ce va putea fi folosit

atat in device-uri mobile, cat si in servere de mare putere. Procesoarele din familia Nehalem, care vor ajunge

pana la 8 nuclee, vor include mai multe functionalitati pe care AMD le are deja cu Barcelona.

Este vorba in primul rand despre Hyper Threading, cu o functionalitate dinamica a acestora, permitand

oprirea de threaduri individuale fara a le afecta pe celelalte. De asemenea, vor fi controlate dinamic nucleele si

memoria cache, fiecare putand fi activate/deazactivate separat, in functie de necesitati. Nehalem va include

controllere de memorie si un bus dinamic, “QuickPath” (anterior numit CSI).

Nehalem, primul procesor “quad-core nativ” de la Intel (desi compania se fereste sa foloseasca aceasta

denumire, insusita de catre AMD), va avea 820 milioane de tranzistori, inclusi pe o placuta de doar 107 mm2, cu

36 mm2 mai putin decat Penryn, care are tot 820 milioane de tranzistori in versiunea quad-core.

Procesorul "Nehalem-EX" Xeon cu 8 nuclee a fost proiectat pentru serverele care pot folosi mai mult

de două procesoare ( cu două socket-uri), conţine 2.3 miliarde de tranzistori şi este capabil să rezolve 16 sarcini

diferite în acelaşi timp. Procesorul va folosi tehnologiaNehalem – aceeaşi arhitectură folosită la linia de procesoare Core i7 şi va fi fabricat pe 45 de nanometri şi

va integra aşa numitele "power gates", pentru reducerea consumului de putere.

Folosind noua

tehnologie Intel QuickPath Interconnect – care înlocuieşte clasica arhitectură FSB – cipul Nehalem-EX va

transmite o cantitate mai mare de date în decursul aceleaşi perioade de timp şi va creşte performanţele

sistemului, cele 8 nuclee permiţând executarea a 16 sarcini în acelaşi timp.

Sandy Bridge microarchitectura de procesoare, proiectata de Intel.

Bazata pe tehnologia de 32 nanometri.

Contine un video accelerator integrat.

Primul disain de proiectare bazat pe această arhitectură reprezintă o combinaţie de CPU de până la 3.5

GHz, cu 2-4 nuclee si GPU high-end cu până la 1.35 Ghz (Intel HD Graphics 2000, K seria HD Graphics 3000),

de asemenea, în chip integrat North Bridge stabilit sistemul de logica (controler PCI Express 2. 0 şi dual-

channel DDR3 SDRAM memorie standard controller cu până la 1333 MHz FSB).

Page 14: Procesoare Multi-Core Post

Fiecare nucleu are un 256 KB L2 cache şi până la 8 MB integrate cache de nivel 3. Procesor, grafica,

controlere de memorie şi cache sunt implementate pe un singur substrat de siliciu cu 216 mm ². Consumul de

energie al acest design nu depășește 130 Watts pentru modele de top.

Noile procesoare Intel Core bazate pe arhitectura Sandy Bridge

Arhitectura Sandy Bridge a fost anunţată de ceva timp, iar acum Intel a venit cu lista de procesoare şi

chipset-uri aferentă. Pe scurt, Intel ne oferă a doua generaţie de procesoare Core i3, i5 şi i7. Folosind

procesul de construcţie pe 32 de nanometri, cele 29 de procesoare pentru desktop-uri şi laptopuri

prezentate iniţial au denumirile cu o cifră mai lungi decât cele din prima generaţie.  Spre exemplu, printre

modelele dedicate segmentului portabil avem Core i7-2630QM, i5-2410M şi i3-2310M. Pentru cei care au

urmărit procesorele din prima generaţie Core, cifra 2 a fost adăugată în faţa indicativului de până acum.

Page 15: Procesoare Multi-Core Post

Arhitectura Sandy Bridge este prima care integrează în acelaşi chip unitatea de procesare, controller-ul de

memorie şi unitatea de procesare grafică. Poate vă întrebaţi dacă nu cumva aveam aceeaşi configuraţie şi până

acum. Răspunsul este nu. Procesorul era separat de chip-ul care integra placa video şi controller-ul de memorie,

fiind însă amplasate în aceeaşi capsulă.Intel oferă acum două plăci grafice integrate, HD 2000 şi HD 3000,

despre care susţine că pot atinge o performaţă de două ori mai mare decât cea oferită de GMA

4500. Odată cu ele sunt introduse şi tehnologii precum Intel Quick Sync Video (procesare video hardware) şi

InThru 3D (vizionarea filmelor Blu-ray 3D cu ajutorul ochelarilor stereoscopici).

Page 16: Procesoare Multi-Core Post

Detalii despre Sandy Bridge

Procesoarele din noua familie Intel Core 2011, cunoscute si sub numele de cod Sandy Bridge, sunt

destinate incorporarii in notebook-uri, datorita faptului ca permit integrarea unor caracteristici grafice direct pe

chip-uri, dupa cum au dezvaluit producatorii in cadrul primei zile a Intel Developer Forum 2010.

Concret, chip-urile se bazeaza pe noua microarhitectura Intel “visibly smart”, de 32nm, ce include a doua

generatie de tranzistori cu poarta de metal si constanta dielectrica ridicata. Iar arhitectura “inel” va permite

motorului grafic integrat sa partajeze resurse (precum memoria cache) cu nucleul de procesare, pentru a mari

performanta de calcul si cea grafica, mentinand in acelasi timp eficienta energetica.

Page 17: Procesoare Multi-Core Post

A doua generatie de procesoare Intel Core include si o varianta imbunatatita a tehnologiei Turbo Boost,

care permite realocarea resurselor si distribuirea sarcinilor nucleelor, pentru a asigura utilizatorului un plus de

putere atunci cand este nevoie.

Din punct de vedere grafic, noile procesoare se concentreaza asupra zonelor cel mai des folosite de

utilizatori: video HD, 3D, socializare online, multi-tasking, gaming si multimedia. Iar functionalitatea

Advanced Vector Extensions (AVX) ofera o performanta sporita,care permite o gestionare mai buna a datelor,

precum si rearanjarea si sortarea lor. Noul set de instructiuni pe 256 biti accelereaza floating point-ul unor

aplicatii cu cerinte mari de sistem, cum ar fi programele de editare a fotografiilor sau cele ce permit crearea de

continut video.SANDY BRIDGE – O NOUA ARHITECTURA INTEL – PARTEA I

Lasand insa toate aceste detalii de suprafata la o parte, sa vedem mai exact cum arata Sandy Bridge la interior si

sa punem lupa pe detaliile care nu se vad in foaia de specificatii tehnice. Inainte de asta, trebuie sa stim ca

Sandy Bridge nu e chiar un urmas al lui Nehalem asa cum s-ar putea crede, ci mai degraba o evolutie destul de

radicala a ramurii Core 2 Duo. Desi Nehalem e o arhitectura foarte puternica si inteligenta, uneori ne inspira

sentimentul de elefant intr-un magazin cu portelanuri, fiind o arhitectura gandita in primul rand pentru

paralelism si eficienta maxima in medii server. Ei bine, Core 2 Duo la vremea lui venise din directia opusa,

pastrand ceva din eficienta stramosului Dothan destinat platformelor mobile, dar avand dezavantajul scalarii

modeste in zona sistemelor multiprocesor. Sandy Bridge ajunge astazi ca o solutie ce imbina avantajele ambelor

concepte de arhitectura, reusind sa imbine cumva eficienta si puterea bruta, fiind o masinarie foarte rafinata si

rapida. Cum reuseste ?

Page 18: Procesoare Multi-Core Post

Mai sus avem o schema generala a arhitecturii unui nucleu dintr-un procesor Sandy Bridge. Partea de sus,

ce include Instruction Cache, Pre-decode, Instruction Queue, Decoders, uOP cache si Branch Predictor se

numeste Front End si are ca rol traducerea sirului de date ce curge catre procesor in micro-operatii. In prima

parte a front-end-ului nu au aparut mari diferente fata de Conroe sau Nehalem: aceiasi 32K Instruction cache,

aceleasi 4 decodoare (1 complex, 3 simple), micro-fusion, macro-fusion. Ce a disparut e insa Loop Stream

Detector-ul, inlocuit acum de un cache de micro-ops, ce in esenta are acelasi rol: opreste partea de decodare

atunci cand detecteaza o instructiune care a fost deja decodata si rezultatul se afla in cache, economisind astfel

destul de multa energie; are un hit-rate de aproximativ 80%. Cea mai mare schimbare din front end e insa zona

de Branch Prediciton, care a fost reconstruita de la zero. Daca la Nehalem fusese introdus un al 2-lea nivel, mai

lent dar mai incapator decat primul, ce ajuta mult in lucrul cu baze de date si informatii voluminoase in general,

in Sandy Bridge s-a renuntat la acest al 2-lea nivel dubland insa numarul de tinte urmarite.

Page 19: Procesoare Multi-Core Post

Dupa decodarea din front end si pregatirea micro-ops, acestea ajung in zona out-of-order, care se ocupa

cu alocarea lor catre unitatile de executie in ordinea optima. Aici avem iarasi o inovatie importanta fata de

arhitecturile anterioare, si anume folosirea unui registru fizic pentru operanzi, acestia nemaifiind alaturati

micro-ops; acest registru fizic e important pentru performanta AVX, unde operanzii au dimensiuni mari si faptul

ca nu mai insotesc micro-ops pe tot traseul permite o economie importanta de energie, precum si o imbunatatire

a performantei.

Pentru ca operanzii AVX pot avea 256 biti si stack-ul SIMD Floating Point are doar 128 biti,  solutia

folosita in Sandy Bridge este aceea de a permite utilizarea celor 128 biti ai stack-ului SIMD Integer la nevoie,

permitand astfel si o eficienta energetica foarte buna.

O ultima imbunatarire a nucleului din Sandy Bridge e la nivelul lucrului cu memoria; daca Nehalem avea

3 port-uri, Load, Store Address si Store Data, in Sandy Bridge rolurile se schimba putin, doua dintre port-uri pot

face acum fie Load fie Store Address, al 3-lea pastrandu-si rolul in Store Data.

Cu ce vine nou Sandy Bridge ? Privind in ansamblu, cea mai vizibila noutate pe care o aduce fata de

generatia anterioara e integrarea nucleului grafic in pastila procesorului, si precum vom vedea mai departe nu e

vorba numai de o mutare a unor circuite ci de o integrare in adevaratul sens al cuvantului, cu modificari

Page 20: Procesoare Multi-Core Post

arhitecturale la multe nivele ce fac ca partea grafica sa nu mai penalizeze performanta memoriei asa cum se

intampla la Clarkdale. Din acest motiv au avut loc schimbari radicale in interiorul procesorului, in modul cum

diversele componente comunica intre ele precum si in aranjarea si functionarea acestora.

Grosul memoriei cache, denumit LLC (last level cache) are atat rol de L3 cache pentru procesor cat si rol

de cache pentru alte componente cum ar fi nucleul grafic, iar comunicarea intre componentele din pastila

procesorului se face acum printr-un bus de tip “ring” bidirectional.

O alta noutate importanta este introducerea Advanced Vector Extension (AVX), o extensie a setului de

instructiuni x86 ce va oferi un salt foarte consistent de performanta in aplicatiile ce le vor folosi pe viitor. Pe

partea de power management au fost aduce imbunatatiri importante, atat prin ajustarea arhitecturii pentru un

consum mai redus cat si prin optimizarea mai buna a tehnologiei Turbo Boost.

Bineinteles, au avut loc si imbunatatiri directe ale performantei per clock atat la partea CPU cat si la

GPU, si odata cu partea a doua a acestui articol o sa vedem exact si cat de consistente sunt. Pana atunci,

modelele pe care le vom astepta pentru piata desktop sunt urmatoarele:

Page 21: Procesoare Multi-Core Post

Precum observati, avem doua modele K, si daca va aduceti aminte de generatiile anterioare sufixul “K”

identifica un model mainstream cu multiplicator deblocat. Ei bine, nu degeaba avem doua asemenea modele

inca de la lansare, Intel vrea sa compenseze ceva: datorita noii arhitecturii, unde generatorul de tact e integrat in

procesor, ridicarea frecventei Bclock peste valoarea nominala de 100Mhz mai mult de cateva procente va cauza

serioase probleme. Cu alte cuvinte, overclocking-ul prin ridicarea Bclock-ului va fi foarte limitat, si pentru cei

care vor sa faca overclocking un model K e oarecum obligatoriu; in afara de asta, chiar si cu modelele K

overclockingul va fi destul de limitat, existand o limitare constructiva a multiplicatorului la 57X.

Faptul ca noi suntem foarte pasionati de overclocking nu mai e un secret pentru nimeni, si desi uneori

trebuie sa folosim componente scumpe pentru a atinge anumite rezultate nu inseamna ca am uitat care e spiritul

care alimenteaza aceasta practica: atingerea sau depasirea performantelor unor produse de top folosind cele mai

ieftine modele ofera o satisfactie extraordinara, si limitarea practicarii overclockingului doar la unele modele

special facute pentru asa ceva (si cu un pret pe masura) nu face decat sa omoare aceasta pasiune, care a impins

atatia producatori sa realizeze produse mai fiabile si mai performante. Sa speram ca totusi producatorii de placi

de baza vor gasi ceva artificii pentru a rezolva macar partial aceasta problema, avand in vedere ca procesoarele

Sandy Bridge au potentialul de a rula stabil la frecvente apropiate de 5 Ghz cu racire pe aer.

Pe langa multiplicatorul deblocat insa, modelele K vor veni si cu chip-ul grafic mai puternic, insa si aici e

un mic secret: chip-ul grafic se poate folosi pe placile de baza destinate acestui lucru, mai exact cele construite

in jurul chipset-ului H67. Numai ca H67, fiind pozitionat ca o platforma value, nu suporta feature-urile high-end

ale modelelor K, asa ca daca vom dori utilizarea graficii integrate a modelelor K va trebui sa renuntam la

multiplicatorul deblocat.

De prima data cand am pus ochii pe detaliile arhitecturii Sandy Bridge, mi s-a parut ca ring bus-ul e cea

mai inteligenta chestie aplicata de Intel intr-o arhitectura. Prima varianta de procesor cu grafica integrata,

Clarkdale, avea o problema vizibila pentru astia ca noi, care stau si compara cifre de performanta toata ziua:

pentru ca si IGP-ul si CPU-ul trebuiau sa lucreze cu acelasi controller de memorie era evident ca niciunul nu va

beneficia de maximul de performanta prea usor, asa ca au hotarat sa dea IGP-ul prioritate. Astfel, performanta

grafica nu era penalizata prea rau, iar procesorul suferea doar in aplicatiile in care era necesara o latime de

Page 22: Procesoare Multi-Core Post

banda mare a memoriei, oarecum atipice pentru o platforma destinata in principal laptop-urilor sau sistemelor

low-end. Ei bine, in Sandy Bridge au reusit sa repare aceasta problema, ba chiar sa compenseze cu varf si

indesat, prin folosirea unui ring bus pe care se afla atat controller-ul de memorie, cat si cache-ul LLC,

procesoarele si nucleul grafic. Astfel, fiecare componenta comunica cu oricare alta direct pe cea mai scurta cale,

minimizand impactul asupra celorlalte componente si folosind la maxim resursele disponibile.

Ring bus-ul e alcatuit din 4 trasee circulare, Request, Acknowledge, Snoop si un Data Ring de 32 byte.

Executia fizica nu are impact asupra suprafetei procesorului, fiind in esenta vorba de un set de trasee ce trec pe

deasupra componentelor, fiind permisa si scalabilitatea catre arhitecturi cu mult mai multe nuclee fara penalizari

importante de performanta.

Conectarea fiecarei componente la ring bus se face prin intermediul unei interfete, care se ocupa de

coordonarea traficului de informatii prin intermediul bus-ului. Aceste interfete functioneaza la frecventa si

voltajul nucleelor procesorului.

In afara de cache-urile prezente in fiecare nucleu, accesibil fiecarei componente din Sandy Bridge prin

intermediul ring bus-ului este Last Level Cache; rolul lui ar putea fi asimilat cu cel al L3 cache din Nehalem,

insa in realitate functiile sunt mai complexe pentru ca este folosit si de nucleul grafic. Ba chiar, alocarea

utilizarii se face de catre driverul video, desi poate fi accesat de oricare componenta.

Ultima unitate functionala din Sandy Bridge este System Agent, ce se ocupa de interfata cu restul

sitemului, continand controller-ul de memorie, PCI-e, DMI si partea de display. Deasemenea, aici regasim si

complexa unitate de power management, in esenta o varianta evoluata a celeia din Nehalem, ce coordoneaza pe

langa nuclee, procesor grafic sau LLC si iesirea de display, componentele PCI-e sau RAM. System Agent are

propria frecventa de lucru si tensiune de alimentare fata de nuclee sau de procesorul grafic.

Page 23: Procesoare Multi-Core Post

Procesoarele Ivy Bridge pe 22 nm

Intel Ivy Bridge este a treia generaţie de procesoare Core i

Ivy Bridge este versiunea pe 22 nm a familiei de procesoare Sandy Bridge, apreciate pentru nivelul de

performanţă competitiv şi consum de energie redus.

Noile chip-uri sunt mult mai mici decat predecesorii lor, avand o suprafata de numai 160 mm2 (75%

dintr-un quad core Sandy Bridge), in ciuda unei cresteri a numarului de tranzistori pana la 1.4 miliarde (cu 20%

mai multi). Si cel mai mult s-a investit la nivel de GPU, care are acum 16 Stream Processors si 2 unitati de

texturare in varianta cea mai performanta (HD 4000).

Trecerea la procesul de fabricaţie pe 22 nm are o importanţă mult mai mare pentru Intel deoarece, dă

startul unei noi ere în industria microprocesoarelor, prin introducerea tehnologiei tranzistoarelor 3D.

Potrivit Intel, tranzistoarele 3D sunt cu până la 37% mai performante decât cele planare, folosite în

actuala generaţie de procesoare pe 32 nm. Mai mult decit atit, sporul de performanţă este obţinut cu voltaje mai

mici decit cele necesare pentru procesoarele actuale, fapt ce reduce consumul de energie chiar şi cu 50%.

Page 24: Procesoare Multi-Core Post

Procesoarele Ivy Bridge mostenesc în mare parte micro-arhitectura Sandy Bridge, dar cu un număr

semnificativ de îmbunatatiri. Astfel, sporul de performanta în comparaţie cu actuala generaţie de procesoare

Core i3/i5/i7 va fi de aproximativ 20 % pentru nucleele de calcul şi 30 % pentru interfaţa grafică integrată.

În timp ce interfaţa grafică integrată primeşte suport pentru specificaţiile DirectX 11 şi

tehnologiile OpenCL 1.1, pentru instalarea unei soluţii grafice dedicate avem la dispoziţie conectivitate PCI

Express 3.0 x16. Pentru periferice avem la dispoziţie şi un controller PCIe 2.0 x4.

Page 25: Procesoare Multi-Core Post

Printre beneficiile procesoarelor din a treia generatie Core “i” se numara:

- suport nativ pentru USB 3.0 (4 porturi)

- suport pentru PCIe 3.0

- procesoarele quad-core (cu 4 nuclee de calcul) vor intra si in gama mainstream

- poate folosi memorii DDR3 de pana la 1600 MHz

- procesorul grafic integrat o sa aiba 16 EU (shadere) fata de 12 cate are acum – realizand un salt de

performanta de  cel putin 30%

- procesorul grafic o sa fie compatibil DirectX 11

- se speculeaza ca unele laptopuri din generatia actuala vor putea fi upgradate cu procesoare din noua generatie

Ivy Bridge

Desi poate parea la prima vedere un simplu Tick, Intel denumeste Ivy Bridge ca fiind defapt un Tick+

datorita unor imbunatatiri atat in ceea ce priveste performanta cat si in ceea ce priveste consumul energetic (desi

conform calculelor mele Ivy Bridge este Tock, nu Tick, nu ne putem impotrivi dorintei celor de la Intel de a

ordona evolutia propriilor procesoare dupa cum isi doresc). Astfel putem vedea noutati ca: “pipelined divider”,

Page 26: Procesoare Multi-Core Post

“next page prefetcher”, adaugiri la ISA pentru conversiile in virgula mobila pe 16biti, “fast string moves” dar si

acces rapid la registrele de baza FS/GS.

Pentru a economisi energie atunci cand memoria este in mod self-refresh, procesorul poate opri parti ale

bufferelor DDR I/O. O alta facilitate utila in special procesoarelor destinate portabilelor este prezenta mai

multor TDP-uri, ce pot fi comutate manual din Windows sau automat in functie de starea de incarcare a bateriei.

Cu toate acestea, Ivy Bridge nu reprezinta o noutate pentru nimeni, fiind anuntat inca din momentul

lansarii Sandy Bridge. Arhitectura de baza in acest caz este arhitectura Sandy Bridge, translatata pe un proces

de fabricatie pe 22nm, si imbunatatita asa cum aminteam mai sus. Evident, nu vorbim doar despre un die-

shrink, cei de la Intel imbunatatind solutia grafica integrata (HD 4000), care suporta acum DX 11 si aduce un

spor de performanta considerabil fata de HD 3000. Despre grafica puteti afla mai multe detalii din articolul

colegului meu Matei, Ivy Bridge – Partea II – Studiu al graficii integrate.

In afara de imbunatatirile aduse partii de grafica, si partea de CPU beneficiaza de pe urma unor

imbunatatiri, procesoarele Ivy Bridge fiind dotate acum cu controller-e PCI-E 3.0, un controller de memorie mai

performant, multiplicator maxim crescut, de la 57x la 63x, dar si un alt potential de overclocking in conditii

extreme, datorita multiplicatorului mai mare si procesului de fabricatie.

Chipset-ul Z77, pe de alta parte, integreaza acum un controller USB 3.0 (pentru a vedea cum se comporta

in practica puteti citi acest articol). Partea cea mai frumoasa in cazul acestei lansari este compatibilitatea dintre

platforme. Astfel, placile de baza dotate cu Z77 sunt compatibile cu procesoarele Sandy Bridge, in timp ce Ivy

Bridge poate fi folosit si pe placile de baza dotate cu chipset Z68 sau P67 B3. Evident, atunci cand vorbim de o

noua generatie de procesoare Intel, vorbim si despre o noua platforma mobile, iar acest subiect a fost tratat mai

pe larg de catre colegul meu Orlov in articolul IVY Bridge – Partea III – Asus K55J.

Page 27: Procesoare Multi-Core Post

Ce urmează după Ivy Bridge?

Sandy Bridge, Ivy Bridge… Ce urmează?

Urmatoarea generaţie de procesoare Intel va avea numele de cod Haswell. Procesoarele Haswell vor fi

fabricate pe tehnologia 22nm la fel ca şi procesoarele Ivy Bridge.

De mulţi ani Intel foloseşte modelul de dezvoltare ”tick-tock” în fabricarea procesoarelor. În acest model

fiecare tick reprezintă folosirea unui nou proces de fabricaţie pentru a produce o versiune mai rafinată a

arhitecturii existente iar fiecare tock introduce o microarhitectură nouă pe procesul de fabricaţie

existent. Ultimul “tick” a fost micro-arhitectura Ivy Bridge lansată cu câteva luni în urmă. Urmatorul tock va fi

arhitectura Haswell.

Page 28: Procesoare Multi-Core Post

Procesoare Haswell vor avea noi caracteristici, cum ar fi instrucţiuni AVX 2.0, îmbunătăţirea GPU şi

overclocking-ului, regulator de tensiune integrat, consum redus. Procesoarele vor utiliza socket-uri, socket H3

(LGA1150) pe desktop, şi socket G3 pe platforma mobilă. Procesoarele Haswell vor fi lansate probabil în luna

aprilie, deşi există şansa ca unele produse Haswell să fie disponibile mai devreme.

Procesoarele Haswell vor avea trei versiuni de unităţi de grafică: GT1, GT2 şi GT3. GT1 va avea cea mai

mică performanţă din toate cele trei, şi va fi folosit doar pe cipuri dual-core. Desktop-urile quad-core vor avea o

grafică mai bună folosind GT2 şi quad-core-urile mobile produse vor veni cu GT2 sau grafică

GT3. Procesoarele desktop şi mobile quad-core echipate cu GPU GT2 vor fi lansate anul viitor în luna aprilie.

Intel Haswell, primele detalii despre noua (micro) arhitectura

Inainte ca procesoarele Intel Ivy Bridge sa soseasca pe piata, producatorul american ofera deja

primele detalii despre noua arhitectura, Intel Haswell.

Haswell este succesorul pe 22 nm a lui IB(Ivy Bridge) si este preconizat că va apărea în 2013. Haswell va

include suport pentru Intel’s Transactional Synchronization Extensions (TSX), un nou set de instrucţiuni menite

să mărească performanţa procesoarelor multi-core.

Page 29: Procesoare Multi-Core Post

Stabilirea sarcinilor fiecărui procesor, pentru a nu risca erori de date, este prioritatea Intel, care plănuieşte să

mute acest proces de la nivelul software la cel hardware prin Intel Haswell.

Pentru a beneficia la maxim de funcţiile oferite de noua arhitectură Intel, programatorii vor fi nevoiţi să

adapteze aplicaţiile deja existente.

Schimbările aduse prin arhitectura Intel Haswell vor duce atât la o îmbunătăţire a performanţei CPU fără

depăşirea substanţială a vitezelor clock, dar şi un consum mai eficient de energie.

Page 31: Procesoare Multi-Core Post

Tehnologiile celei de-a doua generatii de procesoare Intel sunt: 

Intel Turbo Boost Technology 2.0,

 Intel Hyper-Threading Technology,

 Intel HD Graphics,

 Intel Wireless Display.

Intel® Turbo Boost Technology        Intel® Turbo Boost Technology aduce performanțe inteligente, chiar dacă lucrezi la sarcini simple

ce folosesc un singur nucleu al procesorului, sau dacă rulezi sarcini intensive ce necesită utilizarea simultană a mai multor nuclee!

      Iată cum poti sa beneficiezi si tu de performanțe sporite pentru o varietate de moduri de lucru :

Nu trebuie să fii expert pentru a rula multitask deoarece zilnic faci asta aproape fara sa-ti dai seama.

De la upload-ul de fotografii la auduția muzicală, de la navigatul pe internet la scrierea de texte, folosesti zilnic

facilitatea de  multitasking si ai nevoie performanță pentru a putea rula mai repede mai multe aplicatii simultan, 

fără sa stii neapărat cum funcționează.

Daca esti pasionat de media digitală ( ... si cine nu este acum cind fiecare dintre noi avem unul sau

mai multe camere foto digitale si camere video digitale performante ... ), ai nevoie de performanțe care să-ti

permită să lucrezi la mai mult de o aplicație în același timp, de la transmiterea de filme la descărcarea de fișiere

audio la uploadul de filme sau editarea fișierelor video.

Page 32: Procesoare Multi-Core Post

Daca esti Gamer ( ... si cine nu are nevoie si de o aventura in lumea jocurilor virtuale ca sa se destinda

... )  trebuie doar sa stii cite ceva despre cele mai noi tehnologii, pe care apoi abia vei așteapa să le testezi. Noua

familie 2010 de Procesoare Intel Core i3, i5 si i7  iti asigura performanțele de care ai nevoie pentru a sta

conectaț la joc tot timpul si a obtine satisfactie maxima.     Intel® Turbo Boost Technology este un concept simplu: orice procesor are o frecvență de bază.

Majoritatea procesoarelor pot atinge frecvențe mai mari în anumite condiții. Intel® Turbo Boost Technology crește automat frecvența nucleelor active după cum este necesar. Poti astfel sa obtii viteză maximă atunci cind rulezi aplicatii intensive (media digitala, jocuri ...etc.) O dată ce sistemul are Intel® Turbo Boost Technology, procesorul determină automat frecvența maximă la care poate funcționa în funcție de condițiile de funcționare. Intel® Turbo Boost Technology permite automat nucleelor procesorului să ruleze mai rapid față de frecvența de operare de bază dacă procesorul rulează la o temperatură scăzută, curent sau limitele de energie si numai atunci cind este nevoie.

       Bazându-se pe cea mai nouă microarhitectură Intel, Intel® Turbo Boost Technology este unica

pentru procesoarele Intel® Core™ i5 și Intel® Core™ i7. Aceasta tehnologie este creeată să intre în acțiune în funcție de nivelul de incarcare la care este supus procesorul sau de momentul în care este necesară mai multă putere.

           Intel® Turbo Boost Technology crește inteligent frecvența procesorului pentru a oferi performanțe

maxime și distribuie puterea în functie de nivelul de activitate. Se activează automat orice număr de nuclee active sau procesoare virtuale. De asemenea, aceasta tehnologie  permite procesorului să crească frecvența nucleelor asigurându-se că nu se depășesc limitele electrice și termale specificate.

 

Page 33: Procesoare Multi-Core Post

     Să ne uităm la trei situații unde Intel® Turbo Boost Technology aduce performanțe: 

Performanță Single Task : când doar un nucleu este în uz — ca atunci când doar o singură aplicație

single-threaded este activă —Intel® Turbo Boost Technology oferă performanțe doar unui singur nucleu, celui

activ.

Multitasking moderat : când două dintre cele patru nuclee ale unui procesor quad-core sunt activate,

Intel® Turbo Boost Technology crește automat frecvența celor două nuclee active ceea ce rezulă în performanțe

foarte bune pentru ambele sarcini.

Multitasking complex : chiar dacă toate nucleele sunt active, Intel® Turbo Boost Technology crește

performanțele pentru toate sarcinile atâta timp cât procesorul funcționează sub specificațiile termice și

electrice. Ce este tehnologia Turbo Boost?Acesta tehnologie  permite automat ca  nuclee  procesorului sa  poata rula cu o frecventa mai mare decat

frecventa de baza (nominala), dar atentie, doar daca procesorul functioneaza in cadrul limitelor de putere, curent si temperatura.

Astfel Turbo Boost impreuna cu tehnologia HT aduc o crestere de performana atat in procese multi-threaded cat si single -threaded. Turbo Boost se activeaza atunci cand  sistemul de operare (OS) solicita performanta maxima din partea procesorului.

Frecvenţa maximă atinsa depinde de numărul de nuclee active iar  cantitatea de timp petrecuta de procesor inTurbo Boost depinde de volumul de muncă şi mediul de operare.

Oricare dintre urmatoarele poate seta limita superioara a  Turbo Boost  pe un volum de munca dat: numarul de nuclee active consumul de curent estimat consumul de energie estimat temperatura procesorului

Atunci cand procesorul ruleaza sub aceste limite si volumul de munca cere performanta suplimentara, frecventa procesorului va creste dinamic cu increment de 133MHz pe intervale scurte şi regulate pana cand limita superioara este atinsa sau pana cand cresterea  frecventei  pentru numarul activ de nuclee  este atins.

Este oarecum o explicatie stufoasa si poate greu de inteles, de aceea am sa vedem un exemplu concret.Exemplu concretLuam ca exemplu un procesor cu 4 nuclee si tehnologie HT : Intel Core i7-870. Frecventa nominala a

procesorului este de 2.93 GHz, avand tehnologie HT,  practic in sistemul de operare va aprea ca si cum ar avea 8 nuclee.

Pentru procesorul de mai sus Intel ne da urmatoarele date pentru Turbo Boost: 2/2/4/5. Ce inseamna acesta?

Este multiplicatorul cu care se realizaeaza cresterea de frecventa…si se calculeaza in felul urmator: am mentionat mai sus ca toate cresterile de frecventa se realizeaza cu increment de 133 MHz, deci:2*133MHz/2*133MHz/4*133MHz/5*133MHz.

Mai avem de stiut un singur lucru, valoarea multiplicatorului (2/2/4/5) se refera mereu in ordine inversa, adica:4/3/2/1. (nuclee active) Adica:

-la 4 nuclee active ale procesorului, prin Turbo Boost frecventa  poate creste cu 2*133Mhz, ajungand la frecventa maxima de 3200Mhz ( 2933MHz+266MHz). Aceeasi crestere de frecventa o poate arata si daca are 3 nuclee active.

-la 2 nuclee active, Turbo Boost intra putin mai agresiv, frecventa poate creste cu 4*133MHz, la valoarea maxima de 3466MHz (2933MHz+532 MHz)

-la 1 nucleu activ al procesorului, frecventa poate creste cu 5*133MHz, astfel se atinge frecventa maxima de 3600MHz (2933MHz+665Mhz).

Page 34: Procesoare Multi-Core Post

Nu-i rau nu-i asa? Overcklocking dinamic, fara interventia utilizatorului,  in functie de necesarul de performanta de care avem nevoie si in functie de mediul de lucru…de la 2933MHz poate ajunge la 3600MHz, pe un singur nucleu, dar fara sa i se modifice parametrii procesorului. (totul se va incadre mereu in TDP-ul dat)

Ce face Turbo Boost?Sa zicem ca  folosim o aplicatie sau un program care este bine optimizat pe procesoare cu mai multe

nuclee (Photoshop CS4) si poate beneficia de performantele lor; inseamna ca toate cele 4 nuclee ale procesorului vor fi active (ocupate) asadar nu prea ramane loc si pentru o crestere semnificativa a frecventei (Turbo Boost), pentru ca atunci procesorul nu s-ar mai incadra in limitele de care spuneam mai sus. Dar,  daca totusi  chiar si in aceste conditii (e posibil) aceste limite nu sunt atinse atunci, o crestere a frecventei (2*133MHz) este posibila.

Scenariul de mai sus insa, din pacate nu se regaseste la majoritatea aplicatiilor…sa nu uitam ca procesorul luat ca si exemplu este capabil sa lucreze la 8 thread-uri (“fire”) simultan….deci asta este un paralelism fantastic, si numai datorata tehnologiei HT. Procesoarele AMD nu pot lucra simultan decat la atatea thread-uri, cate nuclee au.

Si dorim sa jucam un Crysis, si este binestiut ca majoritatea jocurilor nu prea sunt optimizate pe tehnologie multi-core (mai ales peste 3-4 nuclee, ce-i drept situatia se imbunatateste). Si atunci practic avem un procesor foarte performant, cu 4 nuclee dar care din pacate nu ne va ajuta sa atingem performante mai bune…De obicei la jocuri, frecventa conteaza mai mult, decat prezenta mai multor nuclee. Si asa, un dual-core cu frecventa mai mare, produce FPS-uri mai mari decat un quad-core…strigator la cer!!!

Dar Turbo Boost incearca sa rezolve un pic situatia…Din moment ce jocul respectiv nu prea poate folosi celelalte doua nuclee,  ele devin inactive, iar ca sa compenseze acest lucru Turbo Boost, va mari frecventa nucleelor active…in cazul nostru, daca procesorul nostru va avea doua nuclee inactive si doua active, frecventa poate creste cu 4*133MHz+frecventa nominala.

Pentru o exemplificare grafica rulati animatia de mai jos:

Page 35: Procesoare Multi-Core Post

Sa nu uitam totusi ca nu e un lucru linear….nuclee inactive=crestere de frecventa…Turbo Boost intervine doar daca e cazul si daca performante maxime sunt necesare, altfel ar fi inutil sa ruleze la frecvente mari, caci pe langa faptul ca trebuie sa fie performant procesorul trebuie sa functioneze si eficient.

Sistemul Turbo Boost introdus de Intel odata cu Nehalem a permis utilizarea mult mai buna a rezervei termice si energetice puse la dispozitie procesorului, permitand un consum mai redus de energie in situatiile de incarcare medie precum si o performanta crescuta in aplicatiile single-threaded. Odata cu venirea lui Clarkdale si subsistemu lgrafic a fost introdus in ecuatie, acesta fiind partial controlat in functie de incarcarea pe CPU sau IGP si rezerva de putere disponibila. Ei bine, a doua generatie a sistemului Tubo Boost face mai mult de atat, folosind inertia termica a sistemului de racire pentru a impinge si mai sus performanta disponibila pentru o scurta perioada de timp.

Page 36: Procesoare Multi-Core Post

Intel® Hyper-Threading Technology

Intel Hyper-Threading Technology permite o utilizare mai eficienta a resurselor procesorului si ofera performante imbunatatite in aplicatiile multithread (care suporta procesoare cu multe nuclee). Astfel poti rula simultan o multime de aplicatii desktop cu cerinte ridicate, fara incetiniri de viteza.     Noua familie de procesoare Intel® Core™ din 2010 este construită pe arhitectura de 32nm, ce permite echiparea acestora cu un număr de doua ori mai mare de tranzistori pe aceeaşi suprafaţă pentru a creea procesoare mai mici şi mai puternice. Aceasta perimte integrarea unor tehnologii inteligente asa cum este si Intel Hyper-Threading Technology (Intel® HT Technology), disponibilă pe noile procesoare Intel® Core™ i3, Intel® Core™ i5 şi Intel® Core™ i7 din 2010 (pentru a avea certitudinea ca si computerul pe care il veti achizitiona dispune si de aceasta tehnologie, apelati la specialistii de la SC PROCONS SRL Braila , care va pot explica ce procesoare si placi de baza au inclusa aceasta tehnologie si ce elemente trebuie  sa contina PC-ul pentru a beneficia de aceasta tehnologie) - mentionam aici ca simpla prezenta a unui procesor ce ate Intel HT nu este suficienta) .

 

     Tehnologiile din procesoarele Intel Core pot fi complexe, ceea ce poate fi dificil să înţelegeti valoarea imensă pe care o au. Dar câştigurile de performanţă imense, timpul de răspuns uimitor, sunt motive excelente pentru Dvs. să aflati mai multe despre tehnologia Intel Hyper-Threading - şi să va doriti un PC echipat cu un nou procesor Intel Core din 2010.

     Intel HT Technology permite procesoarelor să ruleze două sarcini în acelaşi timp, deoarece foloseşte resursele procesorului mai eficient.Veti putea astfel sa rezolvati mai multe când rulati multitasking şi veti termina cea aveti de făcut mai rapid.Veti putea rula multitask mai inteligent cu tehnologia Intel HT. Aceasta din cauză că Intel HT Technology creează nuclee "virtuale", permiţân procesorului să execute eficient procesare multithread în nucleele sale. Aşadar, atunci când folositi computerele pentru activităţi intense cum ar fi multitaskingul, crearea sau editarea de fişiere grafice, multithreading-ul simultan oferă o cale adiţională pentru ca informaţiile să circule prin fiecare nucleu. Aceasta înseamnă că orice rulati se va rezolva mai repede. De exemplu, noul procesor dual-core Intel® Core™ i5 din 2010 poate rula 4 sarcini simultan - folosind inteligent toate resursele din cele 2 nuclee.

Page 37: Procesoare Multi-Core Post

     Procesarea fără tehnologia Intel HT este mai lenta. Rularea aplicatiilor este înceata şi durează mult să rulezi chiar şi o sarcină simplă. Rulând aplicaţii intense pe un nou procesor Intel Core din 2010 echipat cu tehnologia Intel HT asigura un plus de viteza deoarece nucleele sunt complet incarcate. Sarcinile sunt rezolvate mult mai rapid, aşadar se rezolvă mai multe într-un timp mai scurt.     Multitaskerii, fanii media digitalaşi pasionaţii de multimedia vor aprecia tehnologia Intel HT. Entuziaştii ce utilizeaza aplicatii grafice pot crea, edita şi encoda fişiere grafice performante în timp ce rulează aplicaţii în fundal cum ar fi programe antivirus - toate acestea fără a compromite performanţele. Şi utilizatorii de internet obtin răspuns mai rapid pentru aplicaţiile online.     PC-ul tau nu trebuie să încetinească doar pentru că ai câteva aplicaţii deschise. Cu Intel HT Technology, poti beneficia de performanţele inteligente chiar acum si asta deoarece Intel® Hyper-Threading Technology permite folosirea mult mai eficientă a resurselor procesorului vei rezolva totul mai rapid, vei vedea o creştere importantă în performanţe şi vei fi pregătit pentru viitoarele aplicaţii.

      Software-ul multithread de astăzi necesită performanţe îmbunătăţite. Mulţumită Intel® Hyper-

Threading Technology, vei putea rula aplicaţii cum ar fi Adobe Photoshop* sau Quicktime* fără a pierde din performanţe sau din putere.      Aceasta este mai eficient decât a adăuga mai multe nuclee procesorului (ceea ce inseamna o investitie suplimentara) . Noile procesoare Intel® quad-core folosesc Intel® Hyper-Threading Technology pentru a transforma patru nuclee performante în performanţă uimitoare pentru 8 sarcini.

 

Page 38: Procesoare Multi-Core Post

Intel® Smart Cache      Sistemul Intel® Smart Cache includes cache L1 şi L2 cache, dar şi L3 cache, exclusiv pentru

procesoarele Intel® Core ™ i5 and Core™ i7.      În aceste noi procesoare, fiecare nucleu are propria memorie cache L1 şi L2 pentru instrucţiuni şi date. Toate cele patru nuclee împart această memorie cache L3 - o memorie imensă de 8MB L3 care este integrată în structura de memorie a procesorului şi care îmbunătăţeşte performanţele. Intel® Smart Cache creşte probabilitatea ca fiecare procesor să acceseze date de la subsistemul cache care este mult mai rapid şi mai eficient decât de la memoria sistemului. Dacă un nucleu necesită să acceseze mai multă informaţie, poate accesa toată memoria de 8MB din memoria cache L3. Dacă toate nucleele necesită accesarea datelor, memoria cache este partajată. Intel® Smart Cache păstrează mai multe informaţii mai aproape de procesor pentru o execuţie mai rapidă şi pentru maximizarea utilizării memoriei cache.

 

     Avantajele tehnologice ale Intel® Smart Cache cresc memoria totală a sistemului şi resursele cache, astfel încât aplicaţiile rulează mai rapid. Cu Intel® Smart Cache, clienţii pot rula multitask mai eficient şi se pot bucura de jocuri 3D intense sau pot edita fişiere video fără probleme.

     Iata deci cum îmbunătăţeşte Intel® Smart Cache performanţele :

Fiecare nucleu poate accesa memoria cache L3, aşadar utilizarea memoriei cache este

maximizată.

Nucleele de procesare pot stoca şi accesa rapid informaţiile utilizate frecvent.

Memoria cache este mai rapidă şi mai eficientă decât memoria sistemului 

Page 39: Procesoare Multi-Core Post

Intel® HD Graphics      Mulți dintre clientii cu care discut despre achizitia unui computer nou cred că au nevoie de o placă

grafică adițională pentru a beneficia de cele mai bune performanțe vizuale. Ceea ce spun tuturor celor cu care discut aceasta problema este ca pentru majoritatea sarcinilor - incluzând redarea video HD și chiar editarea video HD - procesorul are mai mult de a face cu performanțele vizuale decât placa video. Este o informație foarte importantă pentru clienții care caută calitate video îmbunătățită pentru multimedia și experiențe de gaming. 

     Trebuie totusi sa stiti despre perfrormanțele video îmbunătățite oferite de noua familie de procesoare Intel® Core™ din 2010. Ati putea avea mai multe beneficii daca ati efectua upgrade-ul procesorului decât achiziționarea unei plăci grafice separate. Si asta deoarece, la anumite modele, Intel® HD Graphics este construit direct în procesor.

Ce este atât de tare la Intel® HD Graphics?     Din fericire, Intel® HD Graphics oferă atât de multe beneficii încât trebuie sa intelegeti modul cum opereaza. Functie de ceea ce doriti să faceti cu noul PC sau Laptop este bine sa stiti urmatoarele :

Noile procesoare Intel® Core™ din 2010 sunt inteligente - fac simplă bucuria graficii uimitoare

deoarece o au încorporată. Nu este nevoie de o placă grafică în plus. Intel HD Graphics este disponibil pe

anumite modele ale familiei de procesoare Intel® Core™ din 2010.

Intel® HD Graphics oferă putere grafică pentru sistemul tău laptop sau desktop atunci când ai

nevoie de ea pentru jocuri, divertisment și multe altele.

Trebuie deasemeni stiut că Intel® HD Graphics oferă suport total pentru Windows 7, oferind o

multitudine de avantaje .

Daca optati sa achiziționati un PC echipat cu un nou procesor din familia Intel® Core™ din 2010

cu Intel® HD Graphics, vă veți bucura de imagini clare, culori bogate și calitate audio incredibilă.

Intel® HD Graphics include suport puternic pentru grafica 3D pentru a oferi o experiență realistă

la rularea jocurilor.

Intel® HD Graphics include Intel® Clear Video Technology care oferă o experiență de

divertisment bogată. Vă veți bucura de redare video HD optimizată, calitate uimitoare și audio pe mai multe

canale.

Intel® HD Graphics și noua familie de procesoare Intel® Core™ din 2010 permit o experiență

media HD totală.

Veți fi uimiți de calitatea video și audio - este ca și când ecranul PC-ului devine un TV HD!

Page 40: Procesoare Multi-Core Post

Cu Intel® HD Graphics puteți viziona toate filmele Blu Ray* preferate și filme pe internet în HD.

Daca sunteti pasionat de jocuri puteți juca cele mai tari jocuri mainstream și vă veți bucura de cea

mai bună experiență video.

Veți putea sa va jucati cu milioane de alți jucători online beneficiind de grafică bună și

performanță.

Pe anumite modele de procesoare, Intel® HD Graphics oferă memorie video de până la 1.7GB

deci te poți juca fără întârzieri sau întreruperi.       Deoarece mulți clienți cred că singurul mod de a te bucura de culori bogate, video incredibil și

experiențe multimedia realiste este să cumperi o placă video discretă. În timp ce aceasta ar părea soluția ideală vreau sa va spun ca rezultatele oferite de Intel® HD Graphics sunt de top pentru majoritatea dintre Dvs. De aceea am recomandat de cele mai multe ori ca, la achizitionarea unui computer nou, clientul sa opteze pentru o placa de baza cu grafica integrata (si un procesor corespunzator echipat) , sa pastreze posibilitatea achizitionarii unei placi video separate in viitor , prin prezenta unui slot PCI-X 16 (facind acum o economie de bani). Am observat ca peste 80% dintre clienti nu au mai achizitionat o placa video suplimentara, spunind ca sunt multumiti de rezultatele graficii integrate si nu au deocamdata aplicatii care sa necesita o placa grafica suplimentara       Retineti ca pentru majoritatea sarcinilor de computing - incluzând redarea HD și chiar editarea HD- procesorul are mai mult de a face cu performanțele vizuale decât o placă video. Și când vorbim de un procesor din noua familie Intel® Core™din 2010 cu Intel® Turbo Boost Technology, Intel® Hyper-threading technology și Intel® HD graphics, chiar nu există competiție.

     Concluzionind, trebuie sa cunoasteti beneficiile oferite de noua familie de procesoare Intel® Core™ din 2010 - ce includ Intel® HD Graphics, cum ar fi:

1. Imagini mai clare, culori mai bogate și sunet excelent.

2. Abilitatea de a juca cele mai bune jocuri mainstream

3. Experiență media HD totală

4. Experiență high-quality a Microsoft* Windows* 7

Intel HD Graphics permite rularea fluenta a filmelor HD, la cea mai buna calitate; de asemenea, ofera

capacitati 3D avansate si supot complet pentru sistemul de operare utilizat, fara necesitatea unei placi grafice

dedicate.

Page 41: Procesoare Multi-Core Post

Clasificarea procesoarelor multi-core

La momentul actual, clasificarea de procesoare ar putea fi rezumata astfel:

Procesoare pentru clasa medie

Procesoare pentru clasa de varf

Procesoare pentru clasa ultraportabile

Procesoare pentru netbook

Generalitati

i3, i5, i7, Quad Core, Dual Core – Ce înseamnă toate acestea? 

-Ce este un procesor?-Ce este un nucleu?-Ce este un procesor multi-core?-De ce nu am nevoie de mai multe nuclee?-Câte nuclee au procesorele i3, i5 si i7?-Am nevoie de un Dual/Quad core sau un i3/i5/i7?

   Ce este un procesor?   Procesorul sau Central Processing Unit(CPU) este componenta PC-ului care îndeplineste instructiunile date de catre sistemul de operare instalat (Windows.) Ganditi-va la procesor ca la un creier care primeste instructiuni si mesaje (de exemplu, “Ardeeee!”) si trimite instructiuni la alte componente hardware (de exemplu “mana: ridica mana” sau “gura: deschisa; corzile vocale: tipa”).

   Ce este un nucleu?   Un procesor standard are un singur nucleu(single-core.). Procesoarele single core proceseaza o singura instructiune la un moment dat (desi nu utilizeaza conducte interne, care permit mai multe instructiuni, care pot fi prelucrate împreuna, cu toate acestea, ele ruleaza cate unul la un moment dat).

   Ce este un procesor Multi-Core?   Un procesor multi-core este compus din doua sau mai multe nuclee independente, fiecare capabil sa proceseze instructiuni individuale. Un procesor dual-core contine doua nuclee, un procesor quad-core contine patru nuclee si un procesor hexa-core contine sase nuclee.

   De ce am nevoie de mai multe nuclee?   Nucleele multiple pot fi folosite pentru a rula doua programe deodata si atunci când un program mai intensiv se executa (AV scan, conversie video, CD ripping, etc.) puteti utiliza alt nucleu pentru a rula browser-ul dvs.(de exemplu pentru a verifica adresa dvs. de email).   Mai multe nuclee vor straluci cu adevarat atunci când utilizati un program care utilizeaza mai mult de un nucleu (numit Parallelization) pentru a îmbunatati eficienta programului. Programe precum software de grafica, jocuri etc. pot rula mai multe instructiuni în acelasi timp si sa livreze mai rapid rezultatele.   Deci, daca utilizati software-uri care folosesc procesorul intens, nucleele multiple va vor oferi probabil o experienta mai buna atunci când utilizati PC-ul. Daca utilizati PC-ul dvs. pentru a verifica e-mailurile si pentru a privi un video ocazional, chiar nu aveti nevoie de un procesor multi-core.

Page 42: Procesoare Multi-Core Post

   Câte nuclee au procesoarele i3, i5 si i7?Un procesor dual-core are doua nuclee.Un procesor Quad-core are patru nuclee.Un procesor i3 are 2 nuclee.Un procesor i5 are 2 sau 4 nuclee (în functie de model).Un procesor i7 are 2, 4 sau 6 nuclee (în functie de model).

   Am nevoie de un Dual/Quad core sau un i3/i5/i7?

   Motivul pentru care cititi acest ghid este pentru a afla ce tip de procesor aveti nevoie. Vreau sa dau un raspuns simplu si, daca aveti ceva de spus, va rugam sa ne spui în sectiunea comentarii. Ca si în cazul tuturor componentelor computerului, tipul de procesor de care aveti nevoie depinde de nevoile dumneavoastra, cat timp

Page 43: Procesoare Multi-Core Post

doriti sa folositi computerul, precum si bugetul dumneavoastra.Iata o defalcare foarte simpla a ceea ce ar trebui sa caute sa cumperati în functie de necesitatile dumneavostra. Toate sugestiile presupun veti cumpera un PC deja montat (astfel încât nu va trebui sa va faceti griji in legatura cu placa de baza si specificatiile RAM si nu va trebui sa va faceti griji cu privire la compatibilitatea de upgrade).Daca:-Navigati pe Internet, verificati e-mailul si jucati un joc flash ocazional (cum ar fi Farmville): Cumpara-ti un netbook single core sau un desktop (si sa nu cheltui mai mult de 350$).-Folositi procesoare de text, calcul tabelar, ascultati muzica de multe ori si vizionati filme, achizitionati un dual core sau i3.-Jucati jocuri ocazional si sunteti multumiti cu rezolutie mai mica si grafica de calitate inferioara (sugestia mea presupune procesorul grafic de pe PC-ul pre-construite se va potrivi pentru sugestiile procesorului), vizionati filme HD, etc., achizitionati un dual-core sau i5.-Daca veti face editari grafice, creati muzica, programati (si compilati), vizionati filme HD, si va plac jocurile cu grafica ridicata, achizitionati un quad core, i5 sau i7.-Daca va place sa folositi cele mai bune hardware-uri si sa se jucati jocuri la rezolutii foarte mari, achizitionati un i7 Extreme.

PROCESORUL DUAL-CORE

     

     Ideea de procesor cu mai multe nuclee este o consecinta a efectelor, din punct de vedere al

performantei, pe care le are folosirea unui PC cu mai multe procesoare in locul unuia singur. Dar  un sistem

bazat pe o placa de baza multiprocesor devine foarte scump si neatractiv pentru majoritatea

utilizatorilor. Folosirea mai multor nuclee pe aceeasi pastila de siliciu permite cresterea performantei cu costuri

minime, deoarece liniile de comunicare intre cele doua nuclee sunt mult mai scurte, deci mai rapide, in acelasi

timp disparand si necesitatea construirii unei infrastructuri pentru interconectarea nucleelor.

Initial, aceasta idee era foarte greu de pus in practica din cauza procesului de fabricatie a cip-urilor, ce

presupunea cresterea dimensiunilor pastilei de siliciu prin folosirea unui numar mai mare de tranzistori, implicit

si a consumului. Odata cu micsorarea dimensiunilor tranzistorilor a devenit posibila introducerea unui numar

mai mare de tranzistori in acelasi spatiu pe pastila, pastrandu-se in acelasi timp si caracteristicile termice.

        Primul processor dual-core a fost conceput si construit de IBM in anul 2000, odata cu lansarea celei

de-a patra generatii de procesoare PowerPC:  Power 4 . Acesta aducea, in premiera, mai multe nuclee pe aceeasi

Page 44: Procesoare Multi-Core Post

pastila, fiind vorba in fapt de doua nuclee pe 64 biti PowerPC AS. Memoria cache Level 2 era impartita in trei

parti egale, fiecare nucleu avand acces la oricare dintre ele.

 Avantajele procesorului dual-core

       In cazul arhitecturii single-core exista mai multe optimizari cu scopul de a creste viteza de executie a

unui program si vizeaza, de obicei,  paralelismul la nivel de instructiune , ce presupune executarea simultana a

cat mai multor instructiuni.  Acest lucru este posibil atata timp cat o instructiune nu depinde de rezultatul alteia

ce se doreste executata in paralel.

    In cazul arhitecturii multi-core se urmareste optimizarea  paralelismului la nivel de thread . Un  thread  este

un fir de executie al unui program, program care poate avea mai multe fire de executie, fiecare cu setul sau de

instructiuni ce pot fi si ele rulate in paralel. Viteza unei arhitecturi multi-core depinde de modul in care sunt

scrise programele si de compilatorul care furnizeaza date procesorului.    

Ca specific al arhitecturii multi-core, fiecare nucleu executa un flux independent de instructiuni din cadrul unei

zone comune de memorie. Continutul acestei zone este administrat prin arbitrare, in functie de continutul

memoriei cache a fiecarui nucleu. Nivelurile de cache pentru fiecare nucleu se justifica prin structura

procesoarelor actuale, optimizate pentru cresterea latimii de banda a interfetei cu memoria. Fara aceste niveluri

de cache locale, fiecare nucleu ar rula samaximum jumatate din potential. Managementul continutului

memoriilor cache este realizat prin intermediul unui protocol de asigurare a coerentei datelor stocate. Celelalte

avantaje constau in localizarea mai precisa a datelor, comunicarea mai rapida intre unitatile de procesare,

economisirea spatiului si consumului de curent si un raport cost/performanta mai bun decat in cazul unui

procesor single-core.        

Concluzii

    In acest moment oferta software nu include foarte multe aplicatii optimizate pentru procesoarele multi-

core, iar cele care necesita rularea a doua task-uri simultane sunt si mai putine. Nici dezvoltatorii de software nu

se inghesuie sa lanseze aplicatii optimizate pentru noile procesoare, in prezent fiind extrem de putine cele care

sunt optimizate chiar si numai pentru Hyper Threading-ul de la Intel, nu mai vorbim pentru dual-core. Nici

jocurile nu sunt intr-o situatie mai buna, neexistand nici macar unul optimizat pentru procesoare multi-core. E

adevarat ca asta ar necesita schimbarea totala a modului de programare al aplicatiilor, ceea ce ar costa enorm si

ar duce la cresterea, oarecum artificiala, a pretului aplicatiilor respective si asa scumpe, in marea lor majoritate.

Din pacate, de acest lucru depinde foarte mult rata de adoptare a procesoarelor multi-core, care inca nu sunt

foarte cerute pe piata, neexistand si suportul software aferent, care sa le descatuseze adevarata putere.

Page 45: Procesoare Multi-Core Post

Procesoarele Dual-core ! 

Procesoarele dual-core sunt ceva relativ nou pe piata PC-urilor domestice. Dar este oare noua tehnologia? 

Cu siguranta, nu. Ce inseamna dual-core? Practic, doua procesoare intr-unul singur. Vom reveni cu detalii la

aceasta definitie simplificata pe parcursul articolului. 

Computerele cu mai multe procesoare sunt printre noi de foarte multa vreme si problemele pe care le-a pus de-a

lungul timpului aceasta configuratie au fost multe si suficient de greu de rezolvat. 

 

intel, amd si... 

Marii producatori de procesoare au introdus in ultima perioada procesoare dual-core pentru PC-urile domestice. 

Dar au fost ei primii care au introdus aceasta tehnologie? Desi ambele companii au site-uri Web care prezinta cu

mare tam-tam dual-core, conceptul este foarte vechi, el derivand din SMP (Symmetric Multiprocessing). Ce este

SMP? Doua sau mai multe procesoare erau instalate pe aceeasi placa de baza, impartind atat memoria RAM a

sistemului, cat si toate celelalte resurse. 

Pentru procesoarele Intel, cea mai frecventa problema a configuratiei era alegerea procesoarelor, care trebuia sa

faca parte din acelasi lot (de pe acelasi "die"). 

Totusi, IBM a reusit sa aiba primul procesor dual-core in 2001. Este vorba de Power 4, pentru serverele RISC

ale companiei. In orice caz, Intel si AMD au reusit sa construiasca primele procesoare x86 dual-core. Anuntate

in 2004, ele au intrat pe piata in 2005. 

La capitolul procesoare mobile, tot IBM a castigat cursa cu procesorul low-power PowerPC 970FX, prezentat in

2005, care nu a fost nici disponibil pentru public, nici x86. Batalia x86 a fost castigata de Intel, cu Centrino

Duo, care motorizeaza, de asemenea, si noul iMac - primul produs Apple cu procesor Intel. 

Acesta, desi este un desktop, este construit ca un laptop, cu componente optimizate pentru a fi mobile. 

Page 46: Procesoare Multi-Core Post

Motivul conceperii procesoarelor dual-core 

Dual-core nu a intrat in lumea PC-urilor desktop din cererea pietei pentru astfel de procesoare, ci pentru ca

altfel nu se putea merge mai departe. 

A devenit clar pentru toata lumea ca frecventa de 4000 MHz nu poate fi atinsa inca de un procesor racit cu aer. 

Ca dovada in acest sens avem retragerea proiectului Tejas al Intel - procesorul de 4000 MHz si chiar daca

Tomshardware a reusit sa atinga 5000 MHz, acesta a fost racit cu azot lichid. 

Puterea consumata a procesoarelor care se departeaza de 3 GHz a amenintat sa depaseasca 100 Wati. Cum

puterea consumata mai mare se traduce in caldura disipata mai mare, posibilitatile de racire ale momentului se

dovedesc insuficiente pentru a trece de bariera de 4 GHz. 

Pentru a putea oferi mai multa putere de calcul, Intel si AMD au ajuns la concluzia ca trebuie sa dubleze

numarul de procesoare, daca frecventa nu mai poate creste. 

Desi distanta intre tranzistorii dintr-un procesor este in continua scadere, efectele benefice ale acesteia -

temperatura scazuta si frecvente mai mari de ceas - intarzie sa se faca simtite. 

Procesoarele dual-core au fost o adevarata mana cereasca pentru producatorii de procesoare. Acestea au o putere

mare de calcul la frecvente mai scazute decat cele single-core, drept urmare se incalzesc mai putin. 

In termeni de frecventa, procesorul dual-core este mai lent decat cel single-core. Cel mai rapid dual-core Intel

are frecventa de 3,2 GHz (3,6 este pe drum), pe cand cel mai rapid single-core lucreaza la 3,8 GHz. 

Pentru AMD, lucrurile sunt si mai clare: single-core au aceeasi frecventa cu dual-core. 

Cel mai rapid dual-core nu este cel mai rapid procesor, ci doar are o putere de calcul mai mare... pentru

aplicatiile optimizate. Celelalte aplicatii nu vor beneficia in nici un fel de pe urma celui de-al doilea procesor,

dar acesta va ramane liber pentru alte aplicatii. Windows XP permite selectarea afinitatii unei aplicatii pentru un

procesor sau altul, astfel incat acestea pot fi rulate utilizand doar un core. 

In orice caz, nu trebuie sa insumam frecventele core-urilor pentru a ne face o idee despre performanta unui

dual-core, exact cum nu puteam sa facem aceasta socoteala nici pe baza unei configuratii SMP. 

Factorul de scalare al performantei este undeva intre 1,4 si 1,8. De ce? Simplu. Explicatia este impartirea

resurselor. Aceasta induce pierderi de performanta. 

Cheia este multithreading-ul 

Nici un procesor dual-core nu ar putea sa functioneze cu software neoptimizat. Primul program, care ruleaza

constant pe oricare PC, este sistemul de operare. 

Daca acesta nu este optimizat pentru multithreading, atunci cel de-al doilea core va ramane inactiv. 

Drept urmare, nu incercati sa utilizati un dual-core cu MS-DOS sau Windows 95, 98 sau Me, pentru ca veti

pierde puterea de calcul suplimentara data de al doilea core. 

Page 47: Procesoare Multi-Core Post

Windows 2000, XP, 2003 si oricare distributie de Linux pot sa beneficieze de pe urma mai multor procesoare. 

In plus, programele care ruleaza pe aceste sisteme trebuie, de asemenea, sa fie optimizate. 

Intel a propus tehnologia HyperThreading, care umple golurile de procesare ale unui procesor single-core prin

falsificarea unui al doilea procesor. Introducerea acestei tehnologii a accelerat optimizarea aplicatiilor standard

pentru Windows pentru multithreading. 

Desi, pentru moment, Intel nu a scos pe piata procesoare dual-core HyperThreading, acestea vor putea rula 4 (!)

thread-uri simultan, utilizand la maxim puterea de calcul a procesorului. 

Dual-core este doar inceputul 

Dupa cum va puteti inchipui, acesta este doar inceputul unui drum. Intel pregateste deja un procesor four-core

(patru core) pentru servere. Acesta va intra pe piata in 2007. AMD nu ramane in urma si lucreaza si el la un

procesor quad-core. 

Mai departe, planurile Intel scot la iveala un procesor eight-core (Yorkfield) pentru 2008, in timp ce declaratiile

AMD sunt mai putin specifice: compania va trece la procesoare cu mai mult decat doua core in 2007. 

Putere consumata vs. performanta 

Daca procesoarele Intel si-au dovedit eficienta pentru executarea mai multor aplicatii simultan, cele AMD au

aratat ca pot sa fie mai eficiente pentru aplicatii single-thread care necesita putere de calcul. In urma acestei

afirmatii, concluzia ar fi ca AMD tinteste gamer-ul (majoritatea jocurilor nu sunt aplicatii multi-threading), iar

Intel s-a orientat catre clientii din zona profesionala (aplicatiile grafice, sa spunem, sunt optimizate multi-

threading). 

Energia consumata nu a fost o problema luata prea mult in seama pana acum. Totusi, daca suntem in situatia de

a achizitiona sisteme de calcul, in afara de afinitatea procesorului pentru un anumit tip de aplicatie, ar fi bine sa

tinem seama si de puterea consumata de procesoare. Energia costa! Putem vedea din tabelul de mai jos

consumul procesoarelor AMD si Intel. 

Daca facem un calcul sumar, observam ca, in cazul unei companii care are peste 50 de PC-uri, daca acestea sunt

cu procesor dual-core AMD sau Intel, are o mare insemnatate in termeni de costuri pentru energie electrica. 

Intel Core 2 Duo

    Procesoarele Core 2 Duo sint fabricate folosind doua tipuri de nuclee, anume Conroe si Allendale, care

difera intre ele doar prin marimea memoriei cache de tip L2 (2 MB pentru Allendale si 4 MB pentru Conroe).

Ele folosesc instructiunile pe 64 de biti (EM64T) si suporta tehnologiile de virtualizare (Intel Virtualization

Technology) si de eficientizare a consumului energetic (Intel Enhanced SpeedStep Technology), dar nu si

tehnologia Hyper-Threading. Aceste procesoare au nevoie de placi de baza cu soclu LGA775, insa aceste PB nu

Page 48: Procesoare Multi-Core Post

sint compatibile cu procesoarele Pentium 4 sau Pentium D. Modelele ieftine (E4400, E4300) nu suporta

tehnologiile de virtualizare si au frecventa magistralei principale (FSB) de 800 MHz, spre deosebire de

modelele mai scumpe la care aceasta este de 1066 MHz.

    Fiecare nucleu are viteza specificata in tabelul de mai jos, dar asta nu inseamna ca un procesor cu 2

nuclee la frecventa de 1,80 GHz este echivalent cu un procesor cu un singur nucleu la frecventa de 3,6 GHz. O

crestere mare de performanta este valabila doar atunci cind procesoarele sint folosite pentru softuri optimizate

pentru lucrul cu mai multe nuclee (de ex. programele de grafica 3D).

PROCESOARE  INTEL  CORE  CVADRINUCLEATE ("quad core" - cu patru nuclee) 

     Intel Core 2 Quad

    Procesoarele Core 2 Quad sint fabricate pe baza nucleului Kentsfield (compus din doua nuclee Conroe

puse unul linga altul) si au frecventa magistralei principale (FSB) de 1066 MHz. Ele folosesc instructiunile pe

64 de biti (EM64T) si suporta tehnologiile de virtualizare ("Intel Virtualization Technology") si de eficientizare

a consumului energetic ("Enhanced SpeedStep Technology"), dar nu si tehnologia Hyper-Threading. Aceste

procesoare au nevoie de placi de baza cu soclu LGA775.

Procesoarele Intel pentru laptop: Clasa medie

Procesoarele din clasa medie ofera un nivel satisfacator de performanta, la un pret pe care marea

majoritate a consumatorilor si-l pot permite. Aceste procesoare au un consum situat in zona 25-35W, ceea ce

inseamna ca pot oferi in jur 3 pana la 5 ore de utilizare atunci cand laptopul este alimentat de la baterie (depinde

de capacitatea bateriei si modul de utilizare), iar sistemul de racire nu trebuie sa fie unul foarte performant.

Producatorii pot astfel sa opteze pentru un sistem de racire mai ieftin care in final se reflecta intr-un pret mai

Page 49: Procesoare Multi-Core Post

mic al laptopului. Aceste motive fac ca majoritatea lapopturile de pe piata sa foloseasca procesoare din clasa

medie.

Informatii specifice procesoarelor din clasa medie

Cea mai mare imbunatatire pe care o aduc noile procesoare Core “i” este integrarea completa a

procesorului grafic, controlerului de memorie si o parte a chipsetului in procesorul principal. Acest lucru

sporeste performantele laptopului printr-o interoperabilitate mai buna a acestor componente. De asemenea

producerea procesorului grafic integrat folosind procesul de fabricatie de 32nm si nu 45nm cum era pentru

generatia precedenta, permite frecvente mai mari nu numai pentru procesorul grafic dar si pentru procesorul

principal. Aceste imbunatatiri, alturi de optimizarile de arhitectura precum si implementarea functiei Turbo 2.0,

fac ca in 2011 procesoarele pentru laptopurile din clasa medie sa fie cam cu 20-25% mai performante fata de

generatia precedenta si cu 50-60% mai rapide fata de generatia Core 2 de acum 2 ani (2009).

Procesoarele pentru laptop : Clasa de varf

Clasa de varf este dedicata entuziastilor si profesionistilor. Aceasta categorie ofera performante deosebite,

uneori foarte apropiate de cele ale unui desktop de performante medii. Evident ca pretul unui procesor din clasa

de varf este destul de mare, incepand de la €320 (cu toate taxele) si urcand pana la €1000 pentru cel mai

performant model. De asemenea consumul de curent si caldura degajata sunt in jur de 45W (55W consum max)

sau 55W (65W consum max) pentru varful de gama. In continuare, aceste valori reprezinta un consum de curent

mic fata de desktop, dar foarte mare in comparatie cu celelalte procesoare pentru laptop. Acesta este si motivul

pentru care putine modele de laptop ofera optiunea utilizarii unui astfel de procesor, pe motiv ca necesita o

solutie de racire performanta. Mai trebuie mentionat ca datorita consumului relativ mare, laptopul nu va

functiona mai mult de doua ore alimentat de la baterie. Durata medie de utilizare folosind alimentarea de la

baterie este de 60-90 de minute. De asemenea, laptopurile care utilizeaza astfel de procesoare sunt de obicei

Page 50: Procesoare Multi-Core Post

mari, avand o greutate de 3-4 kg la care se adauga o sursa de alimentare de minim 120W (cantarind la randul ei

in jur 0.2-0.3 Kg).

Cele mai perfomante procesoare din aceasta gama vor contine litera „X” in denumire. Aceste procesoare

nu au o frecventa clar stabilita , adica sunt „multiplier-unlocked” . In mod normal utilizatorul poate, prin BIOS-

ul laptopului (meniul cu functiile de baza), sa creasca frecventa procesorului pentru un plus de performanta.

Cresterea se poate face cat timp sistemul ramane stabil (nu apar erori in functionare). Spre deosebire

de overclocking-ul clasic, atingerea acestui punct critic nu prezinta riscuri pentru procesor sau alte componente

ale laptopului. Printr-o usoara reducere a frecventei procesorului, acesta se poate aduce din nou in parametrii

normali de functionare, parametrii ce vor oferi oricum performante excelente (mult peste ale altor procesoare

din gama).

Pana recent, gama de varf a procesoarelor mobile a fost exclusiv ocupata de Intel, motiv pentru care

preturile practicate de acest producator sunt inca destul de ridicate. Din mai 2010, AMD a intrat si el pe acest

segment de piata cu doua procesoare care vor fi prezentate ulterior. Inainte, vom prezenta oferta din mai

cunoscuta gama de varf a celor de la Intel , adica procesoarele din cea de a doua generatie Intel® Core™i

(2011)  si cele din prima generatie Intel® Core™ i (2010).

A doua generatie Intel® Core™ i7/5/3 (2011)

Un procesor pentru laptopuri din a doua generatie Core "i"

Ultima generatie de procesoare Intel pentru laptopuri s-a lansat in ianuarie 2011 si reprezinta a doua

generatie de procesore Intel Core “i”. Printre imbunatatirile aduse de noua platforma se numara trecerea

integrala la procesul de fabricatie de 32nm pentru toata gama de procesoare, inclusiv pentru procesorul grafic

integrat (pentru generatia precedenta procesoarele grafice integrate erau facute pe 45nm). Astfel noile

procesoare ofera performante mai mari fata de generatia precedenta si consumuri mai mici de curent. De

Page 51: Procesoare Multi-Core Post

asemenea Intel a lucrat la imbunatatirea arhitecturii, astfel incat procesoarele care lucreaza la aceeasi frecventa

cu cele din prima generatie Core “i” (2010) au un plus de performanta de 10-15%.

Cea mai mare inovatie pe care o aduce noua platforma este implementarea functiei Turbo 2.0, o varianta

imbunatatita a functiei Turbo 1.0. Pentru generatia din 2010, functia Turbo 1.0 functiona astfel (exemplu):  la

un dual-core (doua nuclee), cand cele 2 nuclee sunt utilizate in mod egal de o aplicatie, ele vor functiona la o

viteza de 2.40 GHz. Cand o aplicatie foloseste doar un singur nucleu, procesorul va opri functionare celuilalt si

va aloca curentul economisit la nucleul care are nevoie, marindu-i in acelasi timp viteza de la 2.40 GHz la 2.93

GHz.

Noua functie Turbo 2.0, nu numai ca variaza frecventa nucleelor in functie de utilizarea lor dar si in

functie de caldura pe care o degaja procesorul. Exemplu: la un dual-core (doua nuclee) cu frecventa de baza de

2.50 GHz, daca o aplicatie utilizeaza la maxim ambele nuclee, atunci procesorul va creste frecventa ambelor

nuclee de la 2.50 GHz la 3.00 GHz (viteza maxima care poate fi atinsa in acest fel depinde si de sursa de

alimentare deoarece frecventele mai mari necesita mai mult curent) iar pe masura ce procesorul se incalzeste,

frecventa acestora va scadea treptat pana cand temperatura se stabilizeaza. Astfel, daca sistemul de racire este

bun, atunci este foarte probabil ca procesorul sa functioneze in mod constant la frecvente mai mari decat cele de

baza. Insa acest lucru nu inseamna ca nu mai are sens achizitionarea unui procesor mai scump care lucreaza la

frecvente mai mari. Daca intr-un sistem, un procesor de 2.50 GHz va putea functiona in mod constant la 2.70

GHz, in acelasi sistem si in aceleasi conditii, un procesor de 2.70 GHz va lucra la frecventea mai mari, undeva

in jur 2.90 – 3.00 GHz. In acest fel performantele laptopurilor care folosesc a doua generatie de procesoare Core

“i” depind in mod direct de sistemul de racire.

Alte specificatii ale celei de a doua platforme Core i (2011):

- Hyperthreading (transformarea unui nucleu de calcul fizic in doua nuclee de calcul virtuale ceea ce

sporeste eficienta procesorului)

- HDMI 1.4

- Sata III

- Intel Gigabit LAN 10/100/1000 integrat in Chipset

- Memorii DDR3 de 1333 MHz

Informatii specifice procesoarelor din clasa medie

Cea mai mare imbunatatire pe care o aduc noile procesoare Core “i” este integrarea completa a

procesorului grafic, controlerului de memorie si o parte a chipsetului in procesorul principal. Acest lucru

sporeste performantele laptopului printr-o interoperabilitate mai buna a acestor componente. De asemenea

producerea procesorului grafic integrat folosind procesul de fabricatie de 32nm si nu 45nm cum era pentru

generatia precedenta, permite frecvente mai mari nu numai pentru procesorul grafic dar si pentru procesorul

Page 52: Procesoare Multi-Core Post

principal. Aceste imbunatatiri, alturi de optimizarile de arhitectura precum si implementarea functiei Turbo 2.0,

fac ca in 2011 procesoarele pentru laptopurile din clasa medie sa fie cam cu 20-25% mai performante fata de

generatia precedenta si cu 50-60% mai rapide fata de generatia Core 2 de acum 2 ani (2009).

Platforma Intel® Core™ i7/5/3 (2010)

Printre cele mai importante inovatii aduse de procesoarele pentru laptopuri din seria Core “i”  se afla

functia de hyper-threading (transformarea unui nucleu de calcul fizic in doua nuclee virtuale) care sporeste

eficienta si performantele procesorului si functia „Turbo” (performanta nucleelor de calcul variaza cu

intensitatea folosirii lor). Functia “Turbo” a fost implementata pentru ca desi acum aproape toate procesoarele

de pe piata au cel putin doua nuclee de calcul, majoritatea aplicatiilor inca nu stiu sa le foloseasca eficient. De

aceea functia “Turbo” schimba automat frecventa diferitelor nuclee de calcul in functie de utilizarea

acestora. Exemplu:  la un quad-core, cand toate cele 4 nuclee sunt utilizate in mod egal de o aplicatie, ele vor

functiona la o viteza de 1.73GHz. Cand o aplicatie foloseste doar un singur nucleu, procesorul va opri

functionare celorlalte 3 si va aloca curentul economisit la nucleul care are nevoie, marindu-i in acelasi timp

viteza de la 1.73GHz la 3.06 GHz. Procesoarele din generatia Core “i” sunt fabricate folosind tehnologia de

32nm (generatia precedenta Core 2 folosea 45nm), astfel acestea ofera performante mai mari la un pret ma mic

si cu un consum de curent mai mic sau cel putin egal cu cel al generatiei precedente. Drept urmare, generatia de

procesoare Core “i” pentru laptopurile din clasa medie ofera o performanta cu aproximativ 20-25% mai mare

fata de procesoare Core 2, pastrand insa acelasi pret. O alta inovatie importanta a procesoarele Core™ i

pentru laptopurile din aceasta clasa este implementarea unui procesor grafic pe acelasi chip cu

procesorul principal.Acest procesor grafic ofera destula putere de calcul pentru aplicatiile grafice de baza, cum

ar fi navigarea pe internet, vizionarea de DVD-uri (nu si Blu-ray) si rularea unor jocuri mai vechi sau mai putin

pretentioase.

Un procesor i7 pentru laptopurile din clasa medie (stanga) si un procesor Core 2 din 2008 tot pentru acelasi gen de laptopuri (dreapta). Se poate observa ca procesorul i7 este mai mare, in mare parte datorita

procesorului grafic (chipul mai mare din stanga pe care scrie Intel).

Page 53: Procesoare Multi-Core Post

Imbunatatiri specifice aduse clasei de varf

Toate procesoarele din clasa de varf sunt facute folosind procesul de fabricatie de 32nm. Acest lucru

permite frecvente mult mai mari fata de generatia precedenta, fara insa a modifica consumul de curent, caldura

degajata si pastrand aceleasi preturi. Astfel procesoarele Core i7 quad-core din 2011 au in medie frecvente cam

cu 500 MHz mai mari fata de cele din 2010. Acest lucru, combinat cu imbunatarile de arhitectura si functia

Turbo 2.0, fac ca noile procesore sa fie cu peste 50% mai performante fata de generatia precedenta.

De asemenea, trebuie mentionat ca acum toate procesoarele, inclusiv cele din clasa de varf au integrate in

procesorul principal si un procesor grafic care ofera performante foarte bune. In plus, memoria RAM pe care o

utilizeaza laptopul foloseste acum frecvente de 1600 MHz fata de 1333 MHz pentru generatia precedenta.

Toate procesoarele din gama de varf folosesc placi de baza cu chipsetul HM67.

Procesoarele pentru laptop: Clasa Ultraportabile

Laptopurile ultraportabile, numite si CULV (Consumer Ultra-Low Voltage), sunt dedicate

consumatorilor care au nevoie de un maxim de portabilitate si  de o utilizare indelungata pe baterie. Sunt

considerate produse de nisa si se vand la preturi ridicate in comparatie cu laptopurile normale de performante

similare. Procesoarele din laptopurile ultraportabile au in general frecvente foarte reduse si performante mai

mici fata de procesoarele din clasa medie, dar au si un cosum redus de curent (18W-25W). Din fericire, pentru

ca majoritatea programelor din ziua de azi nu necesita o putere de calcul deosebita, frecventa (viteza) redusa a

acestor procesoare nu este o deficienta foarte mare pentru utilizatorul normal. Preturile acestor procesoare sunt

un pic mai mari fata de cele din clasa medie, in jur de €150-€350. Este bine de retinut ca datorita consumului

redus de curent, nu numai ca utilizarea laptopului pe baterie este mai indelungata, dar si sistemul de racire este

mai simplu. Din acest motiv laptopurile din acesta gama au o greutate redusa si dimensiuni mai mici (in general

sunt foarte subtiri), devenind mai placute ca design.

Page 54: Procesoare Multi-Core Post

A doua generatie Intel® Core™ i7/5/3 (2011)

Un procesor dual-core pentru laptopuri din a doua generatie Core "i"

Oferta de procesoare Intel pentru laptopurile ultraportabile nu este altceva decat o varianta a

procesoarelor din clasa medie dar optimizata pentru un consum redus de curent. Desi Intel a lansat oficial aceste

procesoare in ianuarie 2011, primele laptopuri care le vor implementa vor apare abea in iunie 2011. La fel ca

procesoarele din clasa medie,  noile procesoare ofera performante mai mari fata de generatia precedenta si

consumuri mai mici de curent. De asemenea Intel a lucrat la imbunatatirea arhitecturii, astfel incat noile

procesoarelor care lucreaza la aceeasi frecventa cu cele din prima generatie Core “i” (2010) au un plus de

performanta de 10-15%.

Cea mai importanta inovatie pe care o aduc noile procesoare o reprezinta implementarea functiei Turbo

2.0, o varianta imbunatatita a functiei Turbo 1.0. Noua functie Turbo 2.0, nu numai ca variaza frecventa

nucleelor in functie de utilizarea lor dar si in functie de caldura pe care o degaja procesorul.Exemplu: la un

dual-core (doua nuclee) cu frecventa de baza de 2.50 GHz, daca o aplicatie utilizeaza la maxim ambele nuclee,

atunci procesorul va creste frecventa ambelor nuclee de la 2.50 GHz la 3.00 GHz (viteza maxima care poate fi

atinsa in acest fel depinde si de sursa de alimentare deoarece frecventele mai mari necesita mai mult curent)

iar pe masura ce procesorul se incalzeste, frecventa acestora va scadea treptat pana cand temperatura se

stabilizeaza. Toate aceste aspecte sunt discutate mai pe larg in articolul despre procesoarele Intel pentru clasa

medie.

Alte specificatii ale celei de a doua platforme Core i (2011):

- Hyperthreading (transformrea unui nucleu de calcul fizic in doua nuclee de calcul virtuale care

sporeste eficienta procesorului)

- HDMI 1.4

Page 55: Procesoare Multi-Core Post

- Sata III

- Intel Gigabit LAN 10/100/1000 integrat in Chipset

- Memorii DDR3 la 1333 MHz

Ce este important de mentionat in cazul procesoarelor ultraportabile ale acestei generatii este faptul ca

procesorul grafic intergrat in acestea ofera performante aproape duble fata de generatia precedenta fara insa a

mari consumul de curent. In aceste conditii, laptopurile care folosesc aceste procesoare vor putea reda fara

probleme filme Blu-ray si vor putea fi folosite pentru a jucat jocuri mai vechi sau chiar si unele mai noi dar cu

setarile la minim.

Platforma Intel® Core™ i7/5/3 (2010)

Un procesor Intel Core i7 pentru laptopurile ultraportabile (spate/fata). In partea stanga este procesorul principal cu doua nuclee si in partea dreapta este procesorul grafic.

Generatia din 2010 de procesoare Intel pentru laptopuri ultraportabile este practic o varianta a gamei

medii (adica include functiile de hyper-threading si „Turbo”), dar cu frecventele si voltajele mult reduse pentru

un consum cat mai mic de curent. Beneficiile generale ale procesoarelor  din gama Core “i” le-am mai discutat

in articolul de prezentare al procesoarele Intel din clasa medie si sunt aceleasi pentru procesoarele Intel  Core

“i” ultraportabile (CULV). Trebuie amintit totusi ca actuala generatie Core “i” este produsa folosind procesul de

fabricatie de 32nm, ceea ce ii confera un plus substantial de performanta fata de alte procesoare de pe piata.   De

asemenea, procesoarele Core “i” pentru ultraportabile incorporeaza un procesor grafic pe acelasi chipset cu

procesorul normal.  Daca pentru laptopurile din clasa medie aceasta caracteristica este mai putin importanta, ea

aduce beneficii vizibile laptopurilor ultraportabile. Acest procesor grafic, chiar daca ofera doar performante de

baza, are un consum de curent foarte mic. Astfel, in cazul laptopurilor ultraportabile,  un procesoar Intel

consuma doar 15-25W incluzand si procesorul grafic, ceea sporeste semnificativ timpul de utilizare pe

baterie si diminueaza caldura degajata.

Page 56: Procesoare Multi-Core Post

Procesoarele pentru laptop (2011-2012)

Pentru cei inca nehotarati daca sa cumpere un laptop acum sau sa astepte modelele urmatoare, acest articol

ofera cateva informatii despre generatiile urmatoare de procesoare. Atragem insa atentia ca discutam despre

produse care nu sunt inca lansate oficial. Prin urmare, specificatiile finale ale procesoarelor discutate aici pot

sa difere fata de informatiile preliminare.

Procesoarele Intel in 2011-2012

A doua generatie Core “i” – 2011

A doua generatie de procesoare pentru laptop Core “i”, lansata la CES in ianuarie 2011, va primi cel mai

probabil un resfresh in vara lui 2011 (iunie-iulie). Acest lucru inseamna ca Intel va lansa niste procesoare noi

care la acelasi pret cu modelele actuale vor avea viteza cam cu 100 MHz mai mare (gen de la 2.40 GHz  sare la

2.50 GHz). Restul de specificatii vor ramane neschimbate. Evident nu este vorba de un salt spectaculos de

performanta, dar pentru cei care vor sa astepte este un bonus binevenit.

Platforma Chief River (Ivy Bridge) – 2011 / 2012

- a treia generatie Core “i” -

Page 57: Procesoare Multi-Core Post

Platforma Intel din 2012 nu va aduce schimbari majore in materie de arhitectura sau functii, din acest punct de

vedere fiind doar o varianta imbunatatita a platformei actuale. Dar acest lucru nu inseamna ca nu va oferi un salt

substantial de performanta. De fapt, procesoarele Ivy Bridge urmeaza sa fie facute utilizand integral procesul de

fabricatie de 22nm, ceea ce inseamna ca acestea o sa aiba performante mai mari cu aproximativ 20-30% fata de

procesoarele actuale si posibil si preturi mai mici.

Printre beneficiile procesoarelor din a treia generatie Core “i” se numara:

- suport nativ pentru USB 3.0 (4 porturi)

- suport pentru PCIe 3.0

- procesoarele quad-core (cu 4 nuclee de calcul) vor intra si in gama mainstream

- poate folosi memorii DDR3 de pana la 1600 MHz

- procesorul grafic integrat o sa aiba 16 EU (shadere) fata de 12 cate are acum – realizand un salt de

performanta de  cel putin 30%

- procesorul grafic o sa fie compatibil DirectX 11

- se speculeaza ca unele laptopuri din generatia actuala vor putea fi upgradate cu procesoare din noua generatie

Ivy Bridge

Arhitectura Haswell – 2013

Deocamdata nu se stiu foarte multe despre procesoarele care vor apare pe aceasta arhitectura. Dar multe din

elementele arhitecturii actuale for fi reproiectate sau imbunatatite. Ele vor fi produse folosind procesul de 22nm

si vor apare cel mai probabil in ianuarie-februarie 2013.