curs1 internet

24
Page 1 CURS 1 INTERNETUL Istorie şi evoluţie. Internetul îşi are originile în proiectele militare ale SUA din anii 60, perioadă de vârf a Războiului Rece, ca urmare a lansării primului satelit artificial (Sputnik) 1 de către URSS (4 octombrie 1957). Fig.1. Acest fapt a declanşat o îngrijorare deosebită în Statele Unite şi se înfiinţează o agenţie specială subordonată Pentagonului ARPA (Advanced Research Projects Agency). Apărând primele calculatoare, s-a pus problema interconectării acestora, adoptându-se soluţia de interconectare prin comutare de pachete (packet switching). Astfel, pentru a transmite informaţia, aceasta este mărunţită în porţiuni mici, denumite pachete. Ca şi la poşta clasică, fiecare pachet conţine informaţii referitoare la destinatar, astfel încât el să poată fi dirijat corect prin reţea. La destinaţie întreaga informaţie este reasamblată. În 1969 începe astfel să funcţioneze reţeaua ARPANET între 4 noduri: Universitatea California din Los Angeles (UCLA), Universitatea din Santa Ana, Universitatea din Utah şi Stanford Research Institute. Toate aceste reguli au fost codificate într-un protocol care reglementează transmisia de date. În forma sa finală, acesta era TCP/IP (Transmission Control Protocol/Internet Protocol) şi care este şi acum baza Internetului. TCP/IP face posibil ca modele diferite de calculatoare, folosind sisteme diferite de operare să se „înţeleagă” unele cu altele. 1 Al doilea satelit lansat de URSS – (Sputnik2) 3 noiembrie 1957- a purtat prima fiinţă pe orbită – un câine, Laika.

Upload: cristina-ciochina

Post on 10-Feb-2016

222 views

Category:

Documents


1 download

DESCRIPTION

CURS1 Internet

TRANSCRIPT

Page 1: CURS1 Internet

Page 1

CURS 1

INTERNETUL

Istorie şi evoluţie.

Internetul îşi are originile în proiectele militare ale SUA din anii 60, perioadă de vârf a Războiului Rece, ca urmare a lansării primului satelit artificial (Sputnik)1 de către URSS (4 octombrie 1957).

Fig.1.

Acest fapt a declanşat o îngrijorare deosebită în Statele Unite şi se înfiinţează o agenţie specială subordonată Pentagonului ARPA (Advanced Research Projects Agency). Apărând primele calculatoare, s-a pus problema interconectării acestora, adoptându-se soluţia de interconectare prin comutare de pachete (packet switching). Astfel, pentru a transmite informaţia, aceasta este mărunţită în porţiuni mici, denumite pachete. Ca şi la poşta clasică, fiecare pachet conţine informaţii referitoare la destinatar, astfel încât el să poată fi dirijat corect prin reţea. La destinaţie întreaga informaţie este reasamblată.

În 1969 începe astfel să funcţioneze reţeaua ARPANET între 4 noduri: Universitatea California din Los Angeles (UCLA), Universitatea din Santa Ana, Universitatea din Utah şi Stanford Research Institute. Toate aceste reguli au fost codificate într-un protocol care reglementează transmisia de date. În forma sa finală, acesta era TCP/IP (Transmission Control Protocol/Internet Protocol) şi care este şi acum baza Internetului. TCP/IP face posibil ca modele diferite de calculatoare, folosind sisteme diferite de operare să se „înţeleagă” unele cu altele.

1 Al doilea satelit lansat de URSS – (Sputnik2) 3 noiembrie 1957- a purtat prima fiinţă pe orbită – un câine,

Laika.

Page 2: CURS1 Internet

Page 2

Ca program al Ministerului Apărării al SUA, ARPANET s-a dezvoltat foarte repede, la el conectându-se din ce în ce mai multe calculatoare. În 1979 ARPA decide să separe reţeaua în două, una pentru lumea comercială şi universitară, şi una militară. Cele două reţele puteau comunica în continuare, construindu-se practic o inter-reţea (internet) denumită iniţial DARPA Internet şi consacrată ulterior sub denumirea Internet.

În 1978 se propune separarea protocolului de utilizare a reţelei în două părţi: un protocol TCP care ordonează pachetele de date în vederea unor legături fiabile între perechi de gazde şi un protocol IP care transmite pachetele individuale între calculatoare. Astfel protocolul TCP asigură partea de transport a informaţiei sub formă de pachete sau datagrame, făcând în aşa fel încât să ajungă la destinaţie. Pentru fiecare pachet de date transmis în reţea se primeşte „o confirmare de primire” iar dacă aceasta nu este primită pachetul este retransmis. Protocolul IP se ocupă de transportul datelor de la sursă la destinaţie, fiecare calculator din reţea având o adresă unică prin care poate fi identificat.

La începutul anului 1990 are loc încheierea oficială a ARPANET iar lumea a început să folosească furnizorii comerciali de Internet (ISP).

Internetul nu este proprietatea niciunei persoane sau organizaţii, autoritatea care dirijează evoluţia Internetului este ISOC (Internet Society), o organizaţie de voluntari înfiinţată în 1992. Răspândirea Internetului a atras după sine o explozie a infrastructurii de deservire, legată de creşterea permanentă a numărului de utilizatori şi a tipurilor de servicii oferite.

Pe scurt, Internet este numele dat unei imense interconectări de reţele de calculatoare şi calculatoare individuale, care formează un singur sistem global de comunicare.

Reţele de calculatoare.

O reţea este un grup de calculatoare interconectate care partajează servicii şi care interacţionează prin intermediul unor legături de comunicaţie. Astfel, o reţea necesită două sau mai multe calculatoare care au ceva de partajat (date), sistemele trebuie să fie conectate printr-o cale fizică (mediu de transmisie) şi să respecte un set comun de reguli (protocoale) pentru ca informaţia să ajungă cum trebuie şi unde trebuie.

Scopul unei reţele de calculatoare nu este doar simplul schimb de date ci şi de a putea înţelege şi folosi datele primite de la elementele reţelei.

Reţelele permit calculatoarelor să partajeze resursele oferind servicii altor calculatoare. Câteva dintre motivele care determină conectarea calculatoarelor în reţele ar fi următoarele:

- Partajarea fişierelor;

Page 3: CURS1 Internet

Page 3

- Partajarea imprimantelor şi a altor dispozitive;

- Posibilitatea administrării în comun;

- Folosirea aplicaţiilor de reţea gen poştă electronică, servicii de baze de date etc.

În general, reţelele de calculatoare pot fi grupate în două tipuri:

- Reţele bazate pe server;

- Reţele peer-to-peer.

Într-o reţea bazată pe server, resursele sunt localizate pe un server central sau un grup de servere. Un server este un calculator destinat să furnizeze servicii pentru celelalte calculatoare din reţea. Un client de reţea este un calculator care accesează resursele disponibile pe server. În general serverele sunt sisteme performante, optimizate pentru a furniza servicii altor calculatoare (servere de fişiere, servere de email, servere de printare, servere de aplicaţii).

Un server de fişiere este un server care stochează fişiere ale utilizatorilor reţelei. Sarcina unui server de fişiere este aceea de a acţiona ca un depozit pentru fişierele care sunt necesare utilizatorilor reţelei. Este posibil ca printre acestea să se găsească unele fişiere partajate de mai mulţi utilizatori. Aceste fişiere sunt de regulă depozitate într-un loc numit dosar public (public folder), care poate include şi dosare private, specifice unui anumit utilizator. Marele avantaj al utilizării unui server de fişiere este acela că fişierele importante se găsesc la un loc, făcând astfel extrem de uşoară salvarea periodică a datelor. Dezavantajul este acela că, atunci când serverul cade, utilizatorii nu-şi mai pot accesa fişierele.

Un server de tipărire organizează accesul la resursele reţelei de printare, astfel permiţând utilizarea unei imprimante de către mai mulţi clienţi.

Un server de aplicaţii este un server care rulează aplicaţii pentru calculatorul client. Un server de aplicaţii poate să caute într-o bază de date de dimensiuni considerabile pentru a răspunde unei cereri din partea unui client sau poate să fie parte a unei aplicaţii client/server în care atât clientul cât şi serverul execută anumite procese.

Într-o reţea peer-to-peer resursele sunt distribuite prin reţea pe calculatoare care pot să joace atât rolul de furnizori de servicii cât şi de clienţi. Utilizatorul fiecărui calculator este responsabil cu administrarea şi partajarea propriilor resurse.

Serviciul de comunicaţie oferit de reţea poate fi de tip conexiune sau tip transport de datagrame:

Page 4: CURS1 Internet

Page 4

• în cazul conexiunilor, în cadrul comunicaţiei între două procese se disting trei faze:

- deschiderea conexiunii, în cadrul căreia sunt făcute câteva pregătiri, inclusiv alocarea unor resurse pentru comunicaţie;

- comunicaţia propriu-zisă, în care unul sau ambele procese transmit un şir de pachete sau biţi celuilalt proces;

- închiderea conexiunii, în cadrul căreia se eliberează resursele alocate la deschidere.

• În cazul transportului de datagrame, procesul emiţător pregăteşte un ansamblu, numit datagramă, cuprinzând un şir de biţi destinat procesului receptor şi anumite informaţii necesare livrării (adresa destinatarului). Apoi transmite datagrame reţelei de calculatoare, care o transmite procesului receptor. Mai multe datagrame trimise de acelaşi proces sursă către acelaşi proces destinaţie sunt transmise independent una de alta, ceea ce duce, în general, la posibilitatea inversării ordinii de recepţie faţă de ordinea de emisie a datagramelor.

O clasificare a reţelelor după mărime ar fi următoarea:

- LAN – local area network – este un grup de calculatoare şi dispozitive de interconectare desfăşurate pe o suprafaţă geografică restrânsă (clădire, campus). O astfel de reţea foloseşte de obicei un singur tip de transmisie (cablu).

- WAN – wide area network – interconectează LAN-uri. Se poate desfăşura în întregime în cadrul unei ţări sau poate să fie interconectată pe tot globul.

Principalele elemente ale unei reţele de calculatoare

Pentru ca două dispozitive aflate la distanţă unul de celălalt să poată comunica, este nevoie ca cele două dispozitive să fie legate printr-un mediu de comunicaţie care permite propagarea variaţiei unei mărimi fizice. Mediul fizic, împreună cu dispozitivele de adaptare între reprezentarea locală a informaţiei şi reprezentarea pe mediul de transmisie constituie nivelul fizic al reţelei. Nivelul fizic este deci un modul care permite transmisia unui şir de biţi între două dispozitive legate direct unul de celălalt. Constructiv, nivelul fizic este constituit din: cablul electric, fibra optică sau, după caz, antenele de emisie-recepţie, eventuale amplificatoare sau repetoare, plăcile de reţea din calculatoare şi driver-ele plăcilor de reţea.

Page 5: CURS1 Internet

Page 5

De obicei, serviciul oferit de nivelul fizic suferă de anumite neajunsuri, cum ar fi probabilitatea mare a erorilor şi transmisia nesigură. Pentru contracararea acestora, de-o parte şi de alta a nivelului fizic se plasează câte un modul de adaptare; aceste două module constituie nivelul legăturii de date. Nivelul legăturii de date este construit parţial prin hard (parte a plăcii de reţea) şi parţial prin soft (parte a driver-ului plăcii de reţea).

Nivelul fizic împreună cu nivelul legăturii de date oferă o legătură bună între două calculatoare conectate direct printr-un mediu fizic. Ar fi neeconomic să cerem să existe o legătură directă între oricare două calculatoare. Este preferabil să putem transmite date prin intermediul unui lanţ de calculatoare legate fizic fiecare cu următorul din lanţ. Realizarea unei astfel de legături cade în sarcina nivelului reţea, constituit din câte un modul în fiecare calculator al reţelei. Modulul de reţea este construit prin soft, în nucleul sistemului de operare al fiecărui calculator din reţea.

De obicei, serviciul oferit direct de către nivelul reţea nu poate fi utilizat direct de către programele utilizator. De aceea, între modulul de reţea şi programul utilizator se mai interpune un modul, constituind nivelul transport. Nivelul transport este constituit din părţi ale nucleului sistemului de operare şi, uneori, biblioteci legate în programele utilizator.

Nod iniţial Nod intermediar Nod final

APLICAŢIE APLICAŢIE

Modul transport

Modul transport

Modul de reţea

Modul de reţea Modul de reţea

Modul legătură de

date

Modul legătură de date

Modul legătură de date

Modul legătură de date

Modul legătură fizică

Modul legătură fizică

Modul legătură fizică

Modul legătură fizică

Mediu fizic Mediu fizic

Fiecare dintre nivele oferă nivelului superior o interfaţă care cuprinde în principal funcţii de trimitere şi recepţie a datelor.

Construcţia fiecăruia dintre nivele este independentă de construcţia celorlalte (contează doar interfaţa dintre ele şi parametrii de calitate a serviciului oferit de un nivel celui imediat

Page 6: CURS1 Internet

Page 6

superior). De exemplu, în proiectarea nivelului reţea, nu ne interesează nici ce aplicaţii vor utiliza reţeaua (acelaşi nivel reţea din Internet este utilizat de aplicaţii de poştă electronică, web, telefonie prin Internet şi videoconferinţe), nici cum este construit nivelul fizic (perechi de conductoare, fibre optice sau legături radio prin satelit).

Modulele, de pe acelaşi nivel, din noduri diferite îşi transmit unul altuia (utilizând în acest scop serviciile oferite de nivelul inferior) două tipuri de date: date utile a căror transfer este cerut de nivelul superior şi date de control necesare coordonării activităţilor modulelor din cadrul nivelului. Regulile de reprezentare a acestor date, de organizare a acestora în mesaje, precum şi regulile după care se trimit mesajele între modulele aceluiaşi nivel alcătuiesc protocolul de comunicaţie al nivelului respectiv.

Nivelul fizic

Sarcina nivelului fizic este aceea de a transmite un şir de biţi produs de o sursă către o destinaţie. Pentru îndeplinirea scopului său, nivelul fizic dispune de un mediu de transmisie. Mediul de transmisie se întinde de la amplasamentul sursei până la amplasamentul destinaţiei şi este capabil să transmită la distanţă o anumită acţiune fizică.

Nivelul fizic cuprinde trei elemente: mediul de transmisie, emiţătorul şi receptorul. Emiţătorul primeşte biţii de la sursă şi, în conformitate cu valorile lor, acţionează asupra mediului. Receptorul sesizează acţiunile emiţătorului asupra mediului şi reconstituie şirul de biţi produs de sursă. Şirul de biţi reconstituit este livrat destinaţiei.

Mărimea fizică ce măsoară acţiunea produsă de emiţător şi transmisă de către mediu până la receptor şi care este utilizată efectiv ca purtătoare a informaţiei se numeşte semnal.

Semnalul este ales de proiectantul sistemului de comunicaţii dintre acele mărimi pe care mediul ales le poate propaga în condiţii bune. De exemplu, pentru transmisia prin perechi de conductoare, semnalul poate fi tensiunea electrică dintre conductoare.

Mediul de transmisie modifică în general semnalul transmis, astfel că semnalul primit de receptor de la mediu nu este identic cu semnalul aplicat de emiţător asupra mediului.

Transformările suferite de semnal sunt următoarele:

- întârzierea – constă în faptul că semnalul recepţionat urmează cu o anumită întârziere semnalul emis;

- atenuarea – constă în faptul că semnalul recepţionat are amplitudine mai mică decât cel emis;

Page 7: CURS1 Internet

Page 7

- distorsiunea – este o modificare deterministă a semnalului recepţionat faţă de cel emis, diferită de întârziere şi atenuare. (O modificare este deterministă dacă, oridecâteori transmitem un acelaşi semnal, modificarea se manifestă identic.)

- zgomotele – sunt modificări nedeterministe ale semnalului recepţionat, cauzate de factori externi sistemului de transmisie (fulgere, întrerupătoare electrice, alte sisteme de transmisie de date) sau de factori interni cu manifestări aleatoare.

Nivelul legăturii de date

Nivelul legăturii de date are ca rol realizarea unei comunicaţii stabile între calculatoare sau echipamente între care există o legătură directă la nivel fizic.

Nivelul fizic oferă servicii de transport de pachete, însă aceste servicii suferă de următoarele lipsuri:

- pachetele pot fi alterate sau chiar distruse complet din cauza zgomotului;

- dacă un acelaşi mediu de transmisie este utilizat de mai multe emiţătoare şi mai multe dintre aceste emiţătoare transmit simultan, pachetele transmise se alterează reciproc;

- dacă destinaţia nu poate prelucra datele în ritmul în care sunt transmise de către emiţător, o parte din date se vor pierde;

- construcţia legăturii fizice este scumpă. Ca urmare, este de dorit să putem să construim mai multe legături logice, care să transmită fluxuri independente de pachete, partajând aceeaşi legătură fizică.

Ca urmare, nivelul legăturii de date are sarcina de a realiza următoarele:

- detectarea sau corectarea erorilor de transmisie;

În vederea detectării sau, după caz, corectării erorilor, emiţătorul de la nivelul legăturii de date adaugă, la fiecare pachet generat de nivelul superior, un număr de biţi de control. Receptorul recalculează biţii de control conform conţinutului pachetului recepţionat şi-i compară cu cei de la finalul pachetului recepţionat. În caz de nepotrivire, receptorul deduce că s-a produs o eroare de transmisie.

- controlul accesului la mediu;

Problema controlului accesului la mediu se pune în situaţia în care pe un acelaşi mediu fizic acţionează mai multe emiţătoare, a căror emisie simultană interferează în aşa fel încât un

Page 8: CURS1 Internet

Page 8

receptor nu poate recepţiona corect niciuna dintre transmisii. În aceste condiţii, problema accesului la mediu constă în a elabora un protocol care să evită transmisia simultană.

Există două strategii de control al accesului la mediu: asigurarea unui interval exclusiv de emisie şi acceptarea posibilităţii coliziunilor şi retransmisia pachetelor distruse.

Aproape în orice sistem în care mai multe dispozitive sunt conectate la acelaşi mediu fizic este necesar ca fiecare dispozitiv să aibă un identificator unic. Acest identificator se numeşte adresă fizică sau adresă MAC (Media Access Control).

Cea mai simplă metodă din categoria celor cu asigurarea unui interval exclusiv de emisie este să existe o staţie desemnată ca arbitru, care să anunţe de fiecare dată ce staţie primeşte dreptul de emisie. Anunţul se face printr-un pachet emis de arbitru şi conţinând adresa fizică a staţiei ce poate emite. Staţia anunţată de arbitru are la dispoziţie un interval de timp în care poate să emită ceea ce are de transmis. Dacă staţia nu are nimic de transmis, protocolul poate prevedea fie că staţia nu emite nimic, fie că emite un pachet special. Încheierea perioadei alocate unei staţii se poate face fie la expirarea unei durate de timp prestabilite, fie prin anunţul explicit al staţiei că a încheiat transmisia. După încheierea perioadei alocate unei staţii, arbitrul anunţă staţia următoare.

Metoda cu arbitru este utilizată, de exemplu, în cadrul fiecărei celule GSM.

O altă metodă de control al accesului este metoda cu jeton. În cadrul acestei metode, în loc să existe un arbitru central care deţine lista completă a staţiilor, lista este distribuită, fiecare staţie cunoscând adresa staţiei următoare. În acest fel, în intervalul de emisie alocat, fiecare staţie emite datele utile, după care anunţă staţia următoare.

Cel mai simplu mecanism bazat pe coliziuni şi retransmitere presupune ca o staţie ce are date de transmis să le transmită imediat. În cazul unei coliziuni, staţia emiţătoare va repeta ulterior pachetul, până la o transmitere cu succes. Detectarea unei coliziuni, de către fiecare dintre staţiile emiţătoare, se poate face prin două metode: prin ascultarea mediului pentru a detecta o eventuală transmisie simultană şi prin lipsa confirmării, din partea receptorului, a primirii pachetului.

Repetarea unui pachet distrus de o coliziune se face după un interval de timp aleator. Dacă intervalul de timp până la retransmitere ar fi fix, două staţii ce au emis simultan vor emite simultan şi retransmiterile, ciocnindu-şi la infinit pachetele.

- retransmiterea pachetelor pierdute;

Dacă un pachet de date se pierde este necesară retransmiterea acelui pachet.

Page 9: CURS1 Internet

Page 9

Evident, emiţătorul nu are cum să „ghicească” dacă un anumit pachet ajunge intact la destinaţie sau este pierdut; ca urmare, trebuie stabilită o comunicaţie înapoi dinspre receptor spre emiţător. Rolul unui protocol de retransmitere este să asigure că la destinaţie ajung toate pachetele emise, în ordinea în care sunt emise şi fără duplicate. Pentru a obţine un algoritm corect, trebuie să furnizăm receptorului suficientă informaţie pentru ca acesta să distingă între repetarea pachetului precedent şi pachetul următor. O soluţie este ca emiţătorul să pună în fiecare pachet trimis numărul său de ordine în cadrul fluxului de date, acest număr de ordine se numeşte numărul de secvenţă al pachetului.

- controlul fluxului de date;

Prin controlul fluxului se înţelege procesul prin care o sursă de date este frânată astfel încât să nu transmită date cu debit mai mare decât este capabilă destinaţia să le prelucreze. În lipsa controlului fluxului, dacă sursa emite date mai rapid decât este capabilă destinaţia să le prelucreze, o parte din date se pierd.

Un mecanism primitiv de control al fluxului prevede ca receptorul să poată trimite emiţătorului cereri de suspendare a transmisiei şi cereri de continuare a transmisiei. Astfel, receptorul este prevăzut cu o memorie tampon. Dacă această memorie a receptorului este aproape plină, receptorul trimite emiţătorului un mesaj prin care cere acestuia să suspende transmisia de date. Ulterior, când destinaţia consumă datele din memoria tampon a receptorului, receptorul cere emiţătorului să continue transmisia. Acest mecanism este utilizat la transmisia prin linie serială, sub numele de software flow control sau de xon/xoff.

Un alt mecanism de control al fluxului presupune ca receptorul să semnalizeze emiţătorului când este pregătit să accepte următorul pachet. Emiţătorul trimite un singur pachet, apoi aşteaptă semnalizarea receptorului că este pregătit să primească următorul pachet, apoi trimite următorul pachet.

Este posibilă combinarea controlului fluxului cu retransmiterea pachetelor pierdute, combinând în acelaşi pachet confirmarea unui pachet de date cu anunţul de disponibilitate şi utilizând acelaşi număr de secvenţă pentru ambele mecanisme. Un exemplu clasic de astfel de mecanism combinat este protocolul TCP.

- multiplexarea mai multor legături logice prin aceeaşi legătură fizică.

În general, prin multiplexare se înţelege un procedeu prin care printr-un acelaşi canal fizic de comunicaţie se stabilesc mai multe comunicaţii care decurg relativ independent una de alta. Ideea multiplexării în timp este de a transmite intercalat, prin canalul fizic, pe rând, pachete sau şiruri de biţi aparţinând fiecărui canal logic. Evident, intercalarea trebuie făcută în aşa fel încât receptorul să poată separa datele corespunzătoare fiecărui canal logic.

Page 10: CURS1 Internet

Page 10

Separarea datelor corespunzătoare canalelor logice se poate face prin două metode:

- fiecare canal logic are asociat un identificator unic. Fiecare pachet are, în antet, identificatorul canalului logic căruia îi aparţin datele utile;

- se stabileşte o ordine de succesiune între canalele logice. Prin canalul fizic se transmite, pe rând, câte un pachet aparţinând fiecărui canal logic. De notat că, dacă sursa unui canal logic nu transmite pachete o perioadă mai lungă de timp, trebuie ca emiţătorul de la nivelul legăturii de date să trimită pachete vide în contul acelui canal (pentru a permite celorlalte canale logice să transmită pachete fără a încurca evidenţele receptorului).

Nivelul reţea şi nivelul transport

Dacă nişte dispozitive, relativ numeroase sau întinse pe distanţe mari, trebuie să poată comunica fiecare cu fiecare, este adesea prea costisitor să se construiască câte o legătură fizică între fiecare două dispozitive. Este necesar în acest caz să se poată stabili comunicaţii între dispozitive între care nu există o legătură fizică directă dar există legături indirecte prin intermediul unui şir de dispozitive legate fizic fiecare cu următorul.

Funcţia principală a nodurilor reţelei este aceea de a retransmite datele, asigurând continuitatea transportului lor de la nodul sursă la nodul destinaţie. Pentru retransmiterea datelor spre destinaţie, fiecare nod trebuie să decidă cărui vecin să retransmită datele; problema luării acestei decizii se numeşte problema dirijării (routing).

Rolul nivelului transport este de a face o adaptare între serviciile oferite de nivelul reţea şi nevoile aplicaţiilor. Funcţiile îndeplinite de nivelul transport sunt similare cu unele dintre funcţiile nivelului legăturii de date:

- transport sigur;

- controlul fluxului;

- multiplexarea.

Infrastructura Internetului

Am spus că istoria Internetului a început odată cu ARPAnet, dar uităm istoria de două secole a telegrafului care a condus la dezvoltarea primelor reţele de comunicaţie.

Page 11: CURS1 Internet

Page 11

Primele forme de trimitere a mesajelor la distanţă au fost vizuale şi acustice. Semnalele de fum ziua şi focurile noaptea au fost folosite de vechile popoare din China, Egipt, Grecia şi America.

Sistemele vizuale au avut o mai mare acoperire decât cele bazate pe sunete (tobe, clopote) fiind stimulate şi de descoperirea telescopului (secolul al XVII-lea). În 1791, inginerul francez Claude Chappe a inventat semaforul, un sistem optic de telegrafie care putea transmite mesaje de pe un deal pe altul utilizând telescopul.

Fig.2.

El a fost şi cel care a folosit termenul de telegraf, combinând cuvintele greceşti „tele” – distanţă şi „graphien” – scriere. Dezavantajul sistemului a fost dependenţa acestuia de condiţiile atmosferice şi de folosirea unui număr mare de operatori.

Dezvoltarea electricităţii a scos sistemul de pe piaţă. Un telegraf electric a fost dezvoltat şi patentat în SUA în 1837 de către Samuel Morse. Telegraful s-a răspândit foarte repede şi o reţea de sârme se întindea în întreaga lume. În 1866 s-a instalat un cablu transatlantic.

Page 12: CURS1 Internet

Page 12

Fig.3.

Reţeaua de telegraf a reprezentat infrastructura fizică pe care s-a aşezat Internetul.

Dimensiunea Internetului

Cât de mare este Internetul? Pare o întrebare simplă până încerci să răspunzi. Una dintre probleme ar fi că Internetul este un sistem distribuit şi nu centralizat (acesta fiind şi unul din motivele conceperii lui).

Conform internetworldstats.com în martie 2011 existau 2 miliarde de utilizatori, la care putem adăuga peste 80 milioane servere, 700 000 de pagini web adăugate în fiecare minut, etc.

Fig.4.

Page 13: CURS1 Internet

Page 13

Reprezentarea datelor

Pentru reprezentarea diverselor date, alegerea unui alfabet cu două simboluri este avantajoasă din două motive. Pe de o parte, este cel mai mic alfabet posibil, ca urmare alegerea unui alfabet cu două elemente aduce o anumită simplitate şi naturaleţe construcţiei matematice. Pe de altă parte, din punct de vedere practic, al construcţiei echipamentelor fizice, dispozitive cu două stări stabile sunt mult mai uşor de construit decât dispozitive cu mai multe stări. Starea de conducţie într-un circuit semiconductor reprezintă 1, iar când nu este în conducţie zero; în mediul magnetic, un fascicul magnetizat reprezintă 1 când câmpul magnetic este într-o direcţie şi zero când este în altă direcţie, etc.

Unitatea de bază de memorare a informaţiei se numeşte bit (Binary DigIT).

În cadrul unui şir de biţi, avem nevoie să identificăm fiecare bit al şirului. Pentru aceasta, se stabileşte o ordine a biţilor. Trebuie remarcat însă că ordinea este o convenţie: nu există o legătură directă între ordinea convenţională a unui şir de biţi şi amplasamentul dispozitivelor fizice care memorează acei biţi. Numărul de ordine al unui bit, în cadrul acestei ordini convenţionale, se numeşte în mod obişnuit poziţia (sau adresa, deplasamentul) bitului.

Reprezentarea numerelor naturale prin şiruri de biţi se bazează pe ceea ce matematicienii numesc reprezentarea poziţională în baza 2, pe care o presupunem cunoscută. În reprezentarea într-o bază de numeraţie, distingem cifra unităţilor, având ponderea 20=1, cifra de pondere 21=2 (în baza zece s-ar numi cifra zecilor, pentru baza 2 nu avem un nume), cifra de pondere 22=4, etc.

Există două alegeri posibile cu privire la legătura dintre ponderile cifrelor în număr şi poziţiile lor în şir:

- primul bit al şirului este cifra de pondere maximă. Această alegere este identică celei utilizate în scrierea numerelor în limbile indo-europene, cu scriere de la stânga spre dreapta. Se mai numeşte big endian. În această schemă de reprezentare, un şir de biţi b0 b1 ... bn-1 reprezintă numărul b02

n-1+b12n-2+...+bn-12

0.

- Primul bit al şirului este cifra de pondere 1. Această reprezentare este asemănătoare scrierii numerelor în limbile semite. Se mai numeşte little endian b02

0+b121+...+bn-12

n-1.

Fiind două scheme de reprezentare distincte, dacă un sistem transmite un număr în reprezentare little endian, iar celălalt sistem interpretează şirul de biţi primit ca fiind într-o reprezentare big endian, receptorul „înţelege” alt număr decât cel transmis de emiţător. Ca urmare, orice protocol care specifică transmitere binară a numerelor trebuie să precizeze dacă se utilizează o reprezentare little endian sau una big endian.

Page 14: CURS1 Internet

Page 14

În 1964 proiectanţii calculatorului IBM System au stabilit drept convenţie folosirea grupurilor de 8 biţi ca unitate de bază a memoriei calculatorului. Astfel a apărut octetul (denumire intrată pe filiera franceză) sau byte-ul („bait” filiera engleză) (1 Kilo octet (KB) = 210 octeţi, 1 Mega octet (MB) = 220octeţi (bytes) ).

Datele sunt reprezentate în calculator numai în sistem binar, sistemele octal, zecimal, hexazecimal fiind notţii folosite de către programatori pentru scurtarea notaţiilor prea lungi care ar rezulta în cazul reprezentării în binar a numerelor mari.

Ex. Să se convertească numărul N=779 din baza 10 în baza 2 şi 16.

B10->B2 779(10) = 1100001011(2)

7792121

20212020

20202121

01

2345

6789

=⋅+⋅++⋅+⋅+⋅+⋅+

+⋅+⋅+⋅+⋅

B10->B16 779(10) = 30B(16)

77916)11(

1601630

12

=⋅++⋅+⋅

B

1021

1123

0326

06212

012224

024248

148297

0972194

11942389

13892779

+⋅=+⋅=+⋅=+⋅=

+⋅=+⋅=+⋅=+⋅=+⋅=+⋅=

30163

031648

114816779

+⋅=+⋅=

+⋅=

Adresele IP

Protocolul Internet (Internet Protocol - IP) descrie formatul pachetelor transmise şi câteva aspecte privind activitatea nodurilor reţelei. Protocolul IP are două versiuni aflate curent în uz: versiunea 4 (cea mai utilizată în prezent, numită prescurtat Ipv4) şi versiunea 6 (care se răspândeşte relativ încet, Ipv6).

Fiecărui calculator conectat la Internet îi este atribuit un număr unic de identificare cunoscut ca un IP Adress. Acest număr nu este folosit exclusiv de calculatoare, el poate fi folosit de toate dispozitivele ce aparţin de tehnologia informaţiei (imprimante, routere, modemuri, etc.).

Page 15: CURS1 Internet

Page 15

Fig.5.

Adresa IP (conform standardului IPv4) se prezintă sub forma a patru numere zecimale, separate de câte un punct. Această notare zecimală ne arată, de fapt, adresa într-un format pe care noi îl înţelegem mai uşor. Calculatoarele şi alte dispozitive din reţea „văd” această adresă ca un flux de 32 de biţi, fiecare dintre cele patru părţi ale adresei fiind desemnate printr-un octet.

De exemplu, adresa IP 141.85.48.36 va fi folosită de dispozitivele din reţea după cum urmează: 10001101.01010101.00110000.00100100.

Dispozitivele dintr-o reţea trebuie să-şi poată spune ce parte din adresa IP furnizează informaţii despre reţeaua de care aparţine calculatorul cu o anumită adresă şi ce parte a adresei se referă de fapt la calculator sau la nodul în sine. Acest lucru se face prin masca de reţea (subnet mask). Dispozitivele din reţea folosesc masca de subreţea pentru a „masca” porţiunea din adresa IP care se referă la reţeaua în care se află calculatorul respectiv.

La început, adresele IP se împărţeau în 5 clase de adrese, notate de la A la E. Împărţirea se făcea în funcţie de configuraţia binară a primului octet al adresei:

Clasa Primul octet în binar Prima adresă Ultima adresă Observații

A 0xxxxxxx 0.0.0.1 127.255.255.255 folosește 8 biți pentru rețea și 24 pentru stația de lucru

B 10xxxxxx 128.0.0.0 191.255.255.255 folosește 16 biți pentru rețea și 16 pentru stație

Page 16: CURS1 Internet

Page 16

C 110xxxxx 192.0.0.0 223.255.255.255 folosește 24 biți pentru rețea și 8 pentru stație

D 1110xxxx 224.0.0.0 239.255.255.255 folosită pentru adresarea de tip multicast

E 11110xxx 240.0.0.0 255.255.255.255 utilizată în scopuri experimentale

Această metodă risipea însă multe adrese IP, iar odată cu răspândirea Internetului a apărut pericolul epuizării spaţiului de adrese (232). Pentru a elimina această problemă au fost concepute mai multe soluţii:

- adrese private;

- subreţelele;

- IPv6 – acesta este un protocol dezvoltat pentru a înlocui IPv4. Adresele au o lungime de 128 biţi (16 octeţi) ceea ce este considerat suficient pentru o perioadă. Teoretic există 2128 ~3.4 1038 adrese unice. Adresele IPv6 sunt scrise de cele mai multe ori sub forma a 8 grupuri de câte 4 cifre hexazecimale, fiecare grup fiind separat de 2 puncte:

2001:0000:5EF5:73BA:2452:1B25:72AA:CFDB

DNS (Domain Name System)

Utilizatorii preferă să folosească pentru adresare nu coduri numerice ci notaţii simbolice, nume, care pot fi ţinute minte mai uşor. Un sistem de nume pentru adrese este folosit ca o carte de telefon, cunoscând numele persoanei se poate afla numărul de telefon. În felul acesta numele reprezintă un corespondent al adreselor numerice asigurând utilizatorului o formă mai convenabilă de adresare.

Sistemul de nume folosit pentru adresare în Internet se numeşte Domain Name System (DNS) şi este organizat pe domenii. Adresa numerică corespunzătoare unui nume se găseşte cu ajutorul unui server de nume ce păstrează corespondenţa nume – adresă numerică.

Un domeniu poate să conţină, la rândul său, mai multe niveluri, subdomenii.

www.elth.pub.ro 141.85.254.48

În internet există domenii dedicate (standardizate). Iată câteva dintre ele:

Page 17: CURS1 Internet

Page 17

- .com folosit de companiile comerciale la început. Cu timpul extensia a început să fie folosită pe scară largă de site-uri cu orice profil;

- .net vine de la network şi se foloseşte în general pentru site-uri având ca domeniu de activitate internetul şi nişele aferente;

- .org prescurtare pentru organizaţie şi se presupune că îl folosesc doar organizaţiile non-profit;

- .mil organizaţiile militare;

- .gov domeniul guvernamental;

- .edu organizaţiile educaţionale;

- .ro, .es, .us, .at, .uk domenii folosite de anumite ţări ca şi domenii naţionale;

- .biz, .info, .name, .pro sunt extensii de domenii adăugate ulterior datorită faptului că au rămas puţine nume de domenii inteligibile.

Protocoalele Internetului

TCP/IP (Transfer Control Protocol/Internet Protocol) conţine o serie de protocoale membre care formează suita TCP/IP. Unele protocoale se ocupă de accesul la reţea, altele de transportul de date şi de adresarea logică a pachetelor de date când acestea sunt rutate printr-o reţea. TCP/IP asigură transmisia de date şi corectarea erorilor, permite transferul de date de la un calculator conectat la Internet la altul.

TCP descompune informaţia în mai multe piese mici, numite pachete. Fiecare pachet este introdus în câte un plic (IP Internet Protocol) ce conţine adresa IP a destinatarului. Un router primeşte pachetele şi determină cea mai eficientă cale de urmat pentru a ajunge la destinaţie. După ce au străbătut mai multe routere şi căi, pachetele ajung la destinaţie unde TCP verifică integritatea datelor din fiecare pachet. Dacă se găseşte o eroare, se trimite o cerere pentru a retransmite pachetul respectiv.

FTP (File Transfer Protocol) – reprezintă un set de reguli (protocoale) pentru a copia un fişier de pe un calculator conectat la Internet pe altul. Fişierele care pot fi transferate prin FTP se găsesc pe servere de FTP. Un program client de FTP este o interfaţă care permite utilizatorului să localizeze fişierul dorit şi să iniţieze transferul lui.

HTTP (HyperText Transfer Protocol) – protocolul de transfer al hypertextului defineşte formatul şi transmisia mesajelor utilizate de serverele web şi de browserele web.

Page 18: CURS1 Internet

Page 18

Conceptul de bază în definirea hypertextului este legătura (link-ul), fie în cadrul aceluiaşi document, fie către alt document. Un sistem hypertext permite autorului său să creeze aşa numite noduri şi să le lege între ele, iar unui utilizator navigarea de la un nod la altul.

Termenul World Wide Web numit scurt şi web este un sistem de documente şi informaţii de tip hypertext care pot fi accesate prin reţeaua Internet. Documentele care se află în diferite locaţii pe diverse calculatoare-server, pot fi găsite cu ajutorul unui URL (Uniform Resource Locator). Hypertextul este prelucrat cu un program de navigare numit browser care descarcă paginile web de pe un server web şi le afişează pe un terminal.

TELNET este protocolul care vă permite să conectaţi un calculator local la un calculator sau dispozitiv aflat într-un alt amplasament.

SMTP (Simple Mail Transport Protocol) – protocol ce oferă servicii de poştă electronică.

RIP (Routing Information Protocol) – este un protocol utilizat de rutere pentru a stabili traseul cel mai bun pentru pachetele cu informaţii.

Motoare de căutare

Un motor de căutare este un program care accesează Internetul în mod automat şi frecvent şi care stochează titlul, cuvinte cheie şi parţial chiar conţinutul paginilor web într-o bază de date. În momentul în care un utilizator apelează la un motor de căutare pentru a găsi o anumită frază sau cuvânt, motorul de căutare se va uita în această bază de date şi în funcţie de anumite criterii de prioritate va crea şi va afişa o listă de rezultate.

POŞTA ELECTRONICĂ

Poşta electronică sau e-mail-ul reprezintă modalitatea electronică de corespondenţă prin care una sau mai multe persoane schimbă mesaje în format text, eventual cu ataşare de fişiere (grafice, audio etc.) într-o reţea.

Page 19: CURS1 Internet

Page 19

E-mail-ul se bazează pe tehnologia client-server.

Programul client facilitează interacţiunile dintre utilizator şi serverul de e-mail şi poate fi:

- gen aplicaţie – instalată pe computerul utilizatorului (Microsoft Outlook, Eudora, ş.a.);

- gen pagină web – apare în fereastra unui browser web (Yahoo mail, Gmail, Hotmail, etc).

Funcţiile clientului de email includ abilităţi de a crea noi mesaje, afişarea şi salvarea mesajelor primite, gestionarea listelor de adrese, calendare, etc.

Serverele de e-mail funcţionează pe baza a câtorva protocoale din suita TCP/IP:

- SMTP (Simple Mail Transfer Protocol) – scopul protocolului este acela de a transfera mesajele de la un calculator expeditor la un calculator destinatar (server SMTP). Internetul nu este un mediu în care toate calculatoarele sunt online tot timpul. A trebuit să se dezvolte un protocol în care mesajele să poată fi păstrate pe un server până când un anumit utilizator se conectează pentru a-şi recupera mesajele – POP3;

- POP3 (Post Office Protocol) – serverul POP3 funcţionează precum o cutie poştală. El va avea o conexiune permanentă la Internet, care îi va permite să accepte şi să păstreze mesajele destinate clienţilor care folosesc serverul. În momentul în care clientul se conectează, toate mesajele de poştă electronică sunt eliminate de pe server şi descărcate pe calculatorul client.

- IMAP (Internet Message Access Protocol) – serverele IMAP nu descarcă imediat pe clientul IMAP toate mesajele disponibile atunci când clientul se conectează. El trimite o listă cu mesajele în aşteptare şi cu cele vechi, ele fiind pătrate pe server. IMAP este util atunci când un cont de poştă electronică poate fi accesat de pe mai multe calculatoare sau dispozitive.

O adresă de e-mail are două părţi: nume_utilizator@nume_domeniu.

Prima parte conţine identificatorul utilizatorului, după cum este el înregistrat pe serverul unde este creată căsuţa poştală, iar a doua parte reprezintă informaţiile de identificare în internet a serverului pe care este căsuţa poştală ([email protected]).

E-mailul este un mesaj format din trei zone distincte:

- antetul (header);

- corpul (body);

- semnătura (signature).

Page 20: CURS1 Internet

Page 20

Antetul este o secvenţă standard de informaţii cu care începe mesajul poştal:

- autorul (From) – defineşte expeditorul şi va conţine o adresă e-mail ce trebuie folosită dacă se doreşte trimiterea unui răspuns la mesaj;

- destinatarul (To) – defineşte destinatarul mesajului prin adresa de e-mail (din fericire, programele actuale ne permit să exprimăm adresa şi sub o formă mai inteligibilă, adică scriind în clar numele persoanei, dacă aceasta există în lista de adrese). De remarcat că aici pot fi trecute mai multe adrese de e-mail separate prin virgulă, efectul fiind acela că mesajul este transmis tuturor celor din listă;

- copie la indigo (Cc) – este prescurtarea de la Carbon copy, locul unde putem scrie adresele persoanelor care vrem să primească o copie a mesajului. Persoanele ale căror adrese sunt trecute în câmpul Cc se mai numesc şi destinatari secundari;

- copie confidenţială (Bcc) – este prescurtarea de la Blind carbon copy. Ca şi în cazul precedent, câmpul poate cuprinde adresele unor destinatari secundari. Diferenţa faţă de copia simplă constă în faptul că destinatarii primari şi secundari ai mesajului nu vor şti că mesajul este recepţionat de aceşti corespondenţi;

- trimis (Sent) – afişează data şi ora transmisiei mesajului;

- subiectul (Subject) – locul unde este descris pe scurt conţinutul mesajului.

Corpul este mesajul propriu-zis. Marea majoritate a aplicaţiilor de poştă electronică au propriul editor de texte cu care poate fi scris mesajul, iar ultimele versiuni de programe permit inserarea în mesaje a informaţiilor reprezentate în format multimedia şi a secvenţelor HTML, la fel ca în orice pagină web.

Semnătura este o secvenţă standard de informaţii (nume autor, afilierile, date de contact) care se adaugă la sfârşitul mesajului poştal. Toate aceste informaţii pot fi înregistrate într-un fişier şi adăugate automat la sfârşitul mesajului.

În linii mari, un client de e-mail trebuie să permită:

- să comunicăm cu serverul;

Page 21: CURS1 Internet

Page 21

Fig.6.

- să vizualizăm mesajele pe care le primim;

- să compunem mesajele pe care le expediem;

- să răspundem la mesajele primite – comandă disponibilă când citim un mesaj sau când am selectat un mesaj dintr-unul dintre dosarele tematice. Rezultatul comenzii este lansarea compunerii unui nou mesaj, completându-se automat anumite câmpuri ale antetului;

- să trimitem acelaşi mesaj mai multor destinatari;

- să retransmitem corespondenţa (citeşte şi dă mai departe) – se generează un mesaj în corpul căruia este citat întregul mesaj original, iar subiectul este prefixat cu „FW” (Forward);

- ataşarea fişierelor – posibilitatea de a ataşa unui mesaj fişiere de orice fel.

După o perioadă de folosire intensivă a poştei electronice, numărul mesajelor primite şi trimise creşte şi gestionarea contului devine dificilă. Acest aspect este bine cunoscut de producătorii de programe client de e-mail şi avem la dispoziţie diferite posibilităţi de organizare. Soluţia de bază o reprezintă crearea unor directoare în care putem plasa aceste mesaje. Conţinutul unui director este vizualizat sub formă de tabel, cu un mesaj pe fiecare rând.

Cele mai multe programe dispun de câteva directoare predefinite. Astfel, există întotdeauna un director unde sunt automat plasate noile mesaje primite (Inbox), un director unde sunt plasate copii ale mesajelor trimise (Outbox) şi un director pentru ciorne, cu mesaje neterminate care vor fi trimise mai târziu (Draft). În fine, un alt director predefinit este cel în

Page 22: CURS1 Internet

Page 22

care se păstrează mesajele pe care le-am şters (Deleted Items – Trash). Este bine de ştiut că mesajele pe care le ştergem mai sunt disponibile până când le ştergem definitiv (Empty trash).

În afară de directoarele predefinite, avem posibilitatea de a ne crea propriile directoare, specifice activităţilor pe care le desfăşurăm.

Standardul original pentru mesaje de poştă electronică (rfc 822) a suferit o serie de extensii. Acestea sunt cunoscute sub numele Multipurpose Internet Mail Extension (MIME). Extensiile MIME servesc în principal pentru a putea transmite fişiere ataşate unui mesaj de poştă electronică.

Securitatea poştei electronice

Principalele probleme privind securitatea sunt:

- spoofing-ul falsificarea adresei sursă;

- spam-urile – mesaje, de obicei publicitare, trimise unui număr mare de persoane şi fără a fi legate de informaţii pe care destinatarii le-ar dori;

- viruşii – programe executabile sau documente, ataşate unui mesaj electronic.

Falsificarea adresei sursă este extrem de simplă deoarece, în transmiterea obişnuită a mesajelor, nu este luată nicio măsură de autentificare a expeditorului.

Spamming-ul (spam) este procesul de expediere a mesajelor electronice nesolicitate, de cele mai multe ori cu caracter comercial, de publicitate pentru produse şi servicii dubioase.

Detalii legale referitoare la spam sunt prevăzute în Legea 506/2004 privind prelucrarea datelor cu caracter personal şi protecţia vieţii private în sectorul comunicaţiilor electronice.

Spamming-ul este o metodă foarte ieftină de a face reclamă în Internet, succesul campaniei este de obicei proporţional cu numărul de destinatari, de aceea mesajul respectiv este transmis la mii de adrese simultan.

Adresele de e-mail sunt colectate automat, în cea mai mare parte a cazurilor, deoarece spam-ul apare imediat după ce adresa de e-mail a fost folosită în spaţiul public al Internetului. Există câteva modalităţi prin care vă puteţi proteja de spam:

- Mascaţi-vă adresa de e-mail – implică introducerea unui cuvânt sau grup de cuvinte care va păcăli un program de colectare a adreselor dar nu şi o persoană ([email protected]).

- Folosiţi un nume pentru discuţiile online diferit de cel al adresei de e-mail.

Page 23: CURS1 Internet

Page 23

- Creaţi-vă adrese de e-mail de care vă puteţi debarasa ulterior.

- Folosiţi servicii de e-mail care au în sistem mecanisme de protecţie împotriva spamului.

- Creaţi-vă adrese de e-mail folosind atât litere cât şi cifre – anumite programe folosesc cuvinte din dicţionar în căutarea şi colectarea de adrese.

- Postaţi adresele de email în paginile web doar în forme dificil de procesat automat – de exemplu ca imagine.

Spam-urile dăunează deoarece consumă în mod inutil timpul destinatarului. În plus, există riscul ca un mesaj legitim, aflat între multe spam-uri, să fie şters din greşeală.

Termenul de virus poate desemna mai multe lucruri, înrudite dar distincte. În general, un virus informatic este un program a cărui execuţie duce la inserarea unor copii ale sale în alte programe de pe calculatorul pe care se execută virusul. Impropriu, prin virus se mai desemnează un fragment, inserat într-un program util, care execută acţiuni nocive utilizatorului în contul căruia se execută acel program. Denumirea corectă pentru un astfel de program este aceea de cal troian. Denumirea de virus poate fi dată, corect, doar fragmentelor de program capabile să se reproducă.

În contextul poştei electronice, un virus este un fragment dintr-un program plasat ca fişier ataşat la un mesaj electronic. Virusul se poate reproduce prin mijloace independente de poşta electronică, fie prin expedierea, către alţi utilizatori, a unor copii ale mesajului.

Pentru a păcăli destinatarul şi a-l determina să execute sau să vizualizeze fişierul ataşat, corpul mesajului este construit astfel încât să câştige încrederea utilizatorului. Astfel, mesajul este adesea construit ca şi când ar proveni de la administratorul de sistem sau de la un prieten al destinatarului.

Bibliografie:

[1] Reţele de calculatoare – Radu Lucian Lupşa – http://www.cs.ubbcluj.ro/~rlupsa/works/retele.pdf.

[2] Internetworking with TCP/IP – Douglas E. Comer – Prentice Hall, 2000.

Page 24: CURS1 Internet

Page 24