reprezentarea datelor alfanumerice

6
REPREZENTAREA DATELOR ALFANUMERICE REPREZENTAREA DATELOR ALFANUMERICE  Reprezentarea informatiei alfanumerice se face prin cuvinte de cod de 8 cifre binare. Lungimea de 8 cifre permite construirea a 256 cuvinte de cod diferite care acopera necesarul unei aplicatii. Lungimea de 8 cifre binare a devenit un standard impus de firma IBM, prin codul EBCDIC (Extended Binary Coded Decimal Interchange Code). Urmatorul cod care s-a impus a fost codul ASCII pe 8 biti. Codul ASCII (American Standard Code for Information Interchange) a devenit codul calculatoarelor compatibile IBM, PC si contine setul extins de caractere in numar de 256. Fiecare caracter (litera, cifra, blanc sau caracter special) este codificat printr-o frecventa de lungime fixa (8 cifre binare) folosind codul ASCII. Astfel, caracterul A va fi reprezentat prin secventa de 8 cifre binare 01000001, iar caracterul 9 prin secventa 00111001. Asupra datelor de tip alfanumeric se pot face operatii de CONCATERNARE si COMPARARE.  Reprezentarea Numerelor Reprezentarea interna a datelor numerice se face diferentiat, in functie de tipul informatiei : numere intregi cu semn sau fara semn; numere reale. Asupra datelor de tip numeric lucreaza operatorii aritmetici + , - , * , / , si de comparare < , > , =, #, >=, >=. Reprezentarea numerelor intregi. Fiecare numar intreg pozitiv sau negativ este codificat ca un numar binar de lungime fixa. Lungimea secventei, binare este multiplu de 8 biti : 8,16,32… . Pentru completarea secventei de biti se adauga zerouri nesemnificative. La reprezentarea intregilor cu semn, primul bit din stanga reprezentarii indica semnul numarului, astfel: 1 pentru numar negativ si 0 pentru numar pozitiv. Exemplu: daca se reprezinta un intreg fara semn, fie 9 acest numar, pe 16 biti atunci se obtine: 9(10)= 1001(2) 0000 0000 0000 1001. Rezulta ca domeniul de reprezentare a intregilor fara semn, utilizand 8 cifre binare este 0…255, iar pentru 16 cifre binare, 0… + 65535. Domeniul de definitie al unei date de tip numeric intreg cu semn, reprezentat pe 8 cifre binare(pe un octet sau un byte) este –128… +127, iar pe cuvinte de 16 biti este de –65536…+65535. Reprezentarea numerelor reale. Numerele reale sunt formate din semn, parte intreaga si parte fractionara. Acestea pot fi reprezentate in doua moduri in virgula fixa ( binary fixed print ) sau in virgula mobila ( binary floating print ). Ĩn reprezentarea in virgula fixa se presupune ca partea intreaga este despartita de partea fractionara printr-o virgula imaginara care se afla intr-o pozitie fixa. Ĩn acest caz sunt fixe atat numarul de pozitii ale partii intregi cat si numarul de pozitii ale partii fractionare. Acest mod de

Upload: simona-marin

Post on 06-Jul-2015

56 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: REPREZENTAREA DATELOR ALFANUMERICE

5/6/2018 REPREZENTAREA DATELOR ALFANUMERICE - slidepdf.com

http://slidepdf.com/reader/full/reprezentarea-datelor-alfanumerice 1/6

 

REPREZENTAREA DATELOR ALFANUMERICE

REPREZENTAREA DATELOR ALFANUMERICE

 

Reprezentarea informatiei alfanumerice se face prin cuvinte de cod de 8 cifre binare. Lungimea de 8cifre permite construirea a 256 cuvinte de cod diferite care acopera necesarul unei aplicatii. Lungimea de 8cifre binare a devenit un standard impus de firma IBM, prin codul EBCDIC (Extended Binary Coded DecimalInterchange Code).

Urmatorul cod care s-a impus a fost codul ASCII pe 8 biti. Codul ASCII (American Standard Code forInformation Interchange) a devenit codul calculatoarelor compatibile IBM, PC si contine setul extins decaractere in numar de 256.

Fiecare caracter (litera, cifra, blanc sau caracter special) este codificat printr-o frecventa de lungime fixa(8 cifre binare) folosind codul ASCII. Astfel, caracterul A va fi reprezentat prin secventa de 8 cifre binare01000001, iar caracterul 9 prin secventa 00111001.

Asupra datelor de tip alfanumeric se pot face operatii de CONCATERNARE si COMPARARE.

 

• Reprezentarea Numerelor

Reprezentarea interna a datelor numerice se face diferentiat, in functie de tipul informatiei :

• numere intregi cu semn sau fara semn;• numere reale.

Asupra datelor de tip numeric lucreaza operatorii aritmetici + , - , * , / , si de comparare < , > , =, #, >=,

>=.

Reprezentarea numerelor intregi. Fiecare numar intreg pozitiv sau negativ este codificat ca unnumar binar de lungime fixa. Lungimea secventei, binare este multiplu de 8 biti : 8,16,32… . Pentrucompletarea secventei de biti se adauga zerouri nesemnificative. La reprezentarea intregilor cu semn, primulbit din stanga reprezentarii indica semnul numarului, astfel: 1 pentru numar negativ si 0 pentru numarpozitiv.

Exemplu: daca se reprezinta un intreg fara semn, fie 9 acest numar, pe 16 biti atunci se obtine:

9(10)= 1001(2) 0000 0000 0000 1001.

Rezulta ca domeniul de reprezentare a intregilor fara semn, utilizand 8 cifre binare este 0…255, iarpentru 16 cifre binare, 0… + 65535.

Domeniul de definitie al unei date de tip numeric intreg cu semn, reprezentat pe 8 cifre binare(pe unoctet sau un byte) este –128… +127, iar pe cuvinte de 16 biti este de –65536…+65535.

Reprezentarea numerelor reale. Numerele reale sunt formate din semn, parte intreaga siparte fractionara. Acestea pot fi reprezentate in doua moduri in virgula fixa (binary fixed print ) sau invirgula mobila (binary floating print ). Ĩn reprezentarea in virgula fixa se presupune ca partea intreaga estedespartita de partea fractionara printr-o virgula imaginara care se afla intr-o pozitie fixa. Ĩn acest caz suntfixe atat numarul de pozitii ale partii intregi cat si numarul de pozitii ale partii fractionare. Acest mod de

Page 2: REPREZENTAREA DATELOR ALFANUMERICE

5/6/2018 REPREZENTAREA DATELOR ALFANUMERICE - slidepdf.com

http://slidepdf.com/reader/full/reprezentarea-datelor-alfanumerice 2/6

 

reprezentare a realilor este dezavantajos deoarece nu permit decat reprezentarea unei game restranse denumere reale.

 Ĩn virgula mobila, numerele sunt reprezentate prin exponent si mantisa in asa numita notatie stiintifica. Sestie ca orice numar poate fi scris explicitand diferite puteri ale lui 10 (exponenti). Ĩn acest fel poate ficontrolata pozitia virgulei zecimale, care isi schimba locatia in functie de valoarea exponentului.

Exemplul 1: 43,7 = 437 * 10(-1) = 437E-1. 437 este mantisa iar –1 este exponentul. Conform acesteiconventii, daca se foloseste un cuvant de 32 biti, pentru reprezentarea unui real in virgula mobila, atuncirepartizarea bitilor se va face astfel :1 bit pentru semnul numarului, 1 bit pentru semnul exponentului, 7 bitipentru exponent si 23 de biti pentru mantisa.

Exemplul 2: 12,5(10) =1100,1(2) =0,11001(2)*24=11001(2)*10(2)

100(2), mantisa este 11001; exponentul este

4(10)=100(2) ; bitul de semn al numarului = 0 ;bitul de semn al exponentului = 0 ; iar reprezentarea numaruluieste

0 0 0000100 11001 00 0000 0000 000 0000

bit semn bit semn exponent valoare biti nesemnificativi

numar exponent mantisa pentru completare

mantisa

Se poate demonstra ca domeniul de valori al unei date pe 32 biti din care 7 pentru exponent si 23pentru mantisa este: -1038… 1038, iar data va avea maxim 7 cifre semnificative. Reprezentarea in virgulamobila permite memorarea numerelor reale de diferite dimensiuni cu o precizie foarte mare.

 Ĩn functie de numarul de biti folositi pentru reprezentarea numarului exista :

• reprezentare in simpla precizie – pe 32 de biti;• reprezentare in simpla precizie – pe 64 de biti.

Reprezentarea desenelor si sunetelor. Desenele si sunetele sunt si ele codificate in secvente decifre binare. Pentru codificare se stabilesc niveluri de luminozitate pentru desene sau niveluri de semnalsonor pentru sunete. Aceste niveluri se codifica prin numere intregi care pot fi reprezentate in sistem binar.Acest procedeu se numeste digitizarea desenelor si sunetelor.

Unitatea centrala

Microprocesoarele difera intre ele prin :

• numarul de instructiuni executate in unitate de timp;• viteza de executie;• cantitatea de memorie pe care o pot adresa .

Indiferent de tip, orice procesor contine 4 mari blocuri functionale :

• unitatea de comanda si control (UCC);• unitatea aritmetica-logica (UAL);• registrele proprii;• unitatea de interfata cu celelalte componente ale sistemului (UI).

UCC-ul, UAL si registrele formeaza impreuna unitatea de executie (UE), care realizeaza efectiv operatiile.

Page 3: REPREZENTAREA DATELOR ALFANUMERICE

5/6/2018 REPREZENTAREA DATELOR ALFANUMERICE - slidepdf.com

http://slidepdf.com/reader/full/reprezentarea-datelor-alfanumerice 3/6

 

Unitatea de comanda si control coordoneaza si controleaza intreaga activitate de prelucrare lanivelul componentelor calculatorului. Acesta (UCC) executa instructiunile unui program (memorat inmemoria interna la adrese succesive) astfel:

• extrage din memoria interna a calculatorului o instructiune din program;• decodifica instructiunea pentru a afla ce operatie trebuie sa execute si ce date vor fi

folosite;• extrage din memoria interna datele necesare prelucrarii;• activeaza circuitele electronice corespunzatoare din UAL pentru a executa operatia

cu datele solicitate;• scrie la o anumita adresa de memorie rezultatul obtinut in urma executarii operatiei

solicitate.

Registrele folosesc ca memorie tampon in timpul executarii unei instructiuni.

Unitatea aritmetica-logica (UAL) reprezinta ansamblul de circuite electronice prin care se realizeazaprelucrarea datelor cerute prin instructiuni sau comenzi. Prelucrarea se face prin operatii aritmetice,logice si de comparare. Fiecare circuit este specializat sa realizeze un una din operatiile de baza.

Registrele proprii functioneaza ca o memorie proprie a procesorului in care acesta pastreaza temporarinformatiile .Exista mai multe tipuri de registre :

• registrul de date in care sunt stocate datele si rezultatele prelucrarii;• registrul de instructiuni in care se pastreaza codul instructiunii curente;• registrul contor – program in care este memorata adresa instructiunii care urmeaza

sa fie executata;• registrul contor – date in care se pastreaza adresa datelor care urmeaza sa fie

prelucrate.

Unitatea de interfata cu celelalte componente ale calculatorului (UI) asigura, prin intermediulmagistralei, legatura dintre procesor si celelalte componente ale sistemului: memoria interna si dispozitivelede intrare-iesire . Acesta (UI) realizeaza functia de transfer al datelor de la si spre procesor.

Comunicarea microprocesorului cu celelalte componente cum ar fi controlerul adaptorului de discuri,controlerul adaptorului video, etc., se face prin intermediul unor puncte de intrare in microprocesor numiteporturi. Acesta identifica printr-un numar unic ce functioneaza ca un numar telefonic.

Calculatorul si implicit microprocesorul desfasoara diferite activitati care au nevoie pe rand demicroprocesor. Rezulta ca mp. trebuie sa intrerupa o activitate pentru a executa alta activitate. De exemplu,actionarea unei taste determina o intrerupere. Intreruperile pot fi determinate prin mecanisme hardware sisoftware .

Intreruperea hardware este declansata de un semnal numit cerere de intrerupere, prin care i se ceremicroprocesorului sa actioneze ca urmare a unui eveniment.

Fiecare intrerupere are un numar de identificare. Prin acest numar, microprocesorul identifica

evenimentul.

Pentru a executa operatiile, mp. dispune si de stive (STACKS). Stiva este folosita ca o zona dememorie temporara a datelor pe care le prelucreaza mp. La o cerere de intrerupere, mp. trebuie sa-sisalveze datele din aplicatia curenta pentru a le putea folosi ulterior si comuta pe o alta aplicatie. Locul incare sunt salvate temporar datele curente se numeste STIVA.

Un mp. este caracterizat de urmatoarele atribute :

• tip;

Page 4: REPREZENTAREA DATELOR ALFANUMERICE

5/6/2018 REPREZENTAREA DATELOR ALFANUMERICE - slidepdf.com

http://slidepdf.com/reader/full/reprezentarea-datelor-alfanumerice 4/6

 

• frecventa de lucru;• lungimea cuvantului.

Tipul microprocesorului defineste apartenenta acestuia la o familie de microprocesoare care aucaracteristici comune, ce determina performantele calculatorului.

Piata sistemelor de calcul este dominata de doua familii mari de microprocesoare:

• INTEL sau COMPATIBILE, folosite de calculatoarele IBM – PC sau compatibile,fabricate de firma IBM sau alte firme ;

• MOTOROLA, folosite de calculatoarele Machintosh realizate de firma APPLE .Celedoua tipuri de mp. nu sunt compatibile, adica nu inteleg acelasi set de instructiuni.

Frecventa de lucru a mp.-lui este frecventa de tact a ceasului. Ceasul este cel care stabilestefrecventa impulsurilor pentru circuitele calculatorului, impulsuri prin care li se comanda acestor circuite saexecute operatii. Frecventa se masoara in MHz, adica in milioane de operatii pe secunda. Cu cat aceastafrecventa este mai mare, cu atat mp. este mai performant. Valorile frecventelor de tact sunt standardizate.

Cuvantul mp. reprezinta numarul de biti, multiplu de octet, care pot fi prelucrati la un moment dat de

catre mp. Dimensiunea cuvantului depinde de capacitatea de memorare a registrelor mp. Cu cat cuvantulmp. este mai mare cu atat viteza de lucru este mai mare si mp. mai performant.

Aceste caracteristici de mai sus determina viteza de lucru a mp., adica determina cat de repederealizeaza mp. un ciclu complet de executare a unei instructiuni. Viteza se masoara in milioane deinstructiuni pe secunda (M.I.P.S.).

Ultimele generatii de mp. INTEL folosesc cuvinte pe 32 si 64 de biti.

Prin cuvant intern se intelege numarul de biti care pot fi prelucrati de mp. printr-o singura operatie.

Prin cuvant extern se intelege numarul de biti care pot fi transmisi de mp. catre magistrala de datepentru a fi transportate in paralel.

Istoria Codărilor de Caractere

Cel mai comun (sau cel mai răspândit) set de caractere este ASCII (American Standard Code for InformationInterchange - Codul Standard American pentru Schimbul de Informaţie). Este cunoscut faptul că ASCII estemai reuşit standard software realizat vreodată. Codul ASCII modern a fost standardizat în 1986 (ANSI X3.4,RFC 20, ISO/IEC 646:1991, ECMA-6) de către American National Standards Institute (Institutul Naţional

American pentru Standarde).

ASCII este strict din şapte biţi, asta însemnând că foloseşte modele de biţi reprezentate cu şapte numerebinare, care pune la dispoziţie un interval de la 0 la 127 în decimal. Acestea include caracterele de controlnevizibile 32, cel mai multe fiind între 0 şi 31, cu caracterul final de control, DEL sau delete la 127. Caracterelede la 32 la 126 sunt caractere vizibile: un spaţiu, semne de punctuaţie, litere latine şi numere.

Al optulea bit din ASCII a fost folosit la început pentru bitul de paritate la verificarea erorilor. Dacă acest lucrunu este dorit, este lăsat ca 0. Asta înseamă că ASCII foloseşte pentru fiecare caracter un singur octet.

Page 5: REPREZENTAREA DATELOR ALFANUMERICE

5/6/2018 REPREZENTAREA DATELOR ALFANUMERICE - slidepdf.com

http://slidepdf.com/reader/full/reprezentarea-datelor-alfanumerice 5/6

 

Cu toate că ASCII era de ajuns pentru comunicaţiile în engleza modernă, în alte limbi europene care includcaractere accentuate, lucrurile nu erau aşa uşoare. Standardele ISO 8859 au fost create pentru a satisfaceaceste nevoi. Erau compatibile în sens invers cu ASCII, diferenţa este că se foloseşte al optulea bit pentru apermite alte 127 caractere în fiecare codare. Curând, limitările ISO 8859 au început să iasă la iveală,momentan sunt 15 variante al standardului ISO 8859 (începând cu 8859-1 şi terminând cu 8859-15). În afarăde raza octetului de compatibilitate ASCII al acelor seturi de caractere, erau conflicte dese în literelereprezentate de fiecare octet. Pentru a complica şi mai mult interoperabilitatea dintre codările caracterelor,

Windows-1252 este folosit în anumite versiuni de Microsoft Windows în loc de limbile Vest Europene. Acestaeste un superset al ISO-8859-1, dar este diferit în multe locuri. Totuşi, aceste seturi păstrează compatibilitateacu ASCII.

Dezvoltarea necesară unor codări diferite singur-octet pentru alfabetele nelatine, cum ar fi EUC (Extended UnixCoding) care sunt folosite pentru cel Japonez şi Corean (şi a celui Chinez de mărime mai mică) a creat şi maimultă confuzie, în timp ce sistemele de operare foloseau diferite seturi de caractere pentru acelaşi limbaj, deexemplu, Shift-JIS şi ISO-2022-JP. Utilizatorii care doreau să vadă simbolurile chirilice aveau de ales întreKOI8-R pentru cele ruseşti şi bulgăreşti sau KOI8-U pentru cele ucrainiene, sau între celelalte codări chirilicecum ar fi insuccesul ISO 8859-5, şi setul comun Windows-1251. Toate aceste seturi de caractere rupeaucompatibilitatea cu ASCII (cu toate că codarea KOI8 plasa caracterele chirilice în ordinea latină, deci în caz cănu se foloseşte al optulea bit, textul se poate citi pe un terminal ASCII.)

Asta a adus la confuzie, şi la inabilitatea unei comunicări în mai multe limbi, în special între mai multe alfabete.Intraţi în Unicode.

Ce Este Unicode?

Unicode elimină tradiţionala limită a unui singur octet pentru setul de caractere. Foloseşte 17 "planuri" de65,536 puncte de cod pentru a descrie un maxim de 1,114,112 caractere. Primul plan, cunoscut şi ca "BasicMultilingual Plane" (Planul de Bază Multi-lingv) sau BMP, conţine aproape tot ce vom folosi vreodată, mulţi aufăcut presupunerea greşită că Unicode foloseşte un set de caractere pe 16 biţi.

Unicode a fost reprezentat în diferite moduri, dar două dintre cele mai comune sunt UTF (UnicodeTransformation Format - Formatul de Transformare Unicode) şi UCS (Universal Character Set - Setul deCaractere Universale). Un număr după UTF indică numărul de biţi într-o unitate, în timp ce numărul de după

UCS indică numărul de octeţi. UTF-8 a devenit cel mai răspândit pentru schimbarea de text Unicode datoritănaturii sale simple pe opt biţi, şi este subiectul acestui document.

UTF-8

UTF-8 este o codare de caractere de lungime variabilă, ceea ce înseamă că foloseşte pentru fiecare simbol dela 1 la 4 octeţi. Deci, primul octet UTF-8 este folosit pentru codarea ASCII. UTF-8 înseamnă că caractereleASCII şi latine pot fi combinate cu o mică creştere a dimensiunii datelor, deoarece e folosit numai primul bit.Utilizatorii alfabetelor estice cum ar fi cel Japonez, cui i-a fost repartiţionat o porţiune mai mare de octeţi suntnefericiţi, deoarece are ca rezultat 50% de date redundante.

Ce Poate Face UTF-8 pentru Dumneavoastră

UTF-8 vă permite să lucraţi într-un mediu care respectă standardele, este internaţional acceptat şi puteţi folosimai multe limbi, cu irosire mică de date. UTF-8 este metoda preferată pentru a transmite caractere non-ASCIIpe Internet, prin poşta electronică, IRC sau oricare alt mediu. Cu toate astea, multă lume se comportă cuostilitate la folosirea UTF-8 pentru comunicaţii online. Este bine să cunoaşteţi atitudinea privind UTF-8 într-unanume canal, listă de discuţii sau grup Usenet înainte să utilizaţi non-ASCII UTF-8.

www.geografie.uvt.ro/educatie/admitere/mastergis2009/Tema%202.pdf