grid computing

51
STRUCTURI MODERNE DE GESTIUNE ŞI DISTRIBUŢIE A INFORMAŢIEI........1-14 1 ÎN CĂUTAREA UNOR RĂSPUNSURI NOI....................................1-14 2 GRID – ŞANSA GRAFITULUI DE A DEVENI DIAMANT !........................2-8 2.1.1 Paşii de grafit................................................2-8 2.1.2 Calea diamantului.............................................2-17 ANEXA I............................................................ 2-12 ANEXA II........................................................... 2-16 Structuri moderne de gestiune şi distribuţie a informaţiei 1 În căutarea unor răspunsuri noi 2 GRID – şansa grafitului de a deveni diamant ! Este binecunoscut faptul că cel două elemente chimice: grafitul şi diamantul sunt identice din punct de vedere chimic, dar ce le distinge unul de celălalt sunt calităţile aflate la antipozi; primul este unul dintre cele mai fragile materiale cunoscute, iar cel din urmă este cel mai dur element natural cunoscut preţuit pentru valoarea estetică cât şi pentru cea industrială. diama grafi

Upload: alex-andru

Post on 05-Jul-2015

65 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Grid Computing

STRUCTURI MODERNE DE GESTIUNE ŞI DISTRIBUŢIE A INFORMAŢIEI.........................1-14

1 ÎN CĂUTAREA UNOR RĂSPUNSURI NOI...........................................................................................1-142 GRID – ŞANSA GRAFITULUI DE A DEVENI DIAMANT !....................................................................2-8

2.1.1 Paşii de grafit....................................................................................................................................2-82.1.2 Calea diamantului...........................................................................................................................2-17

ANEXA I....................................................................................................................................................2-12

ANEXA II..................................................................................................................................................2-16

Structuri moderne de gestiune şi distribuţie a informaţiei

1 În căutarea unor răspunsuri noi

2 GRID – şansa grafitului de a deveni diamant !

Este binecunoscut faptul că cel două elemente chimice: grafitul şi diamantul sunt

identice din punct de vedere chimic, dar ce le distinge unul de celălalt sunt calităţile aflate

la antipozi; primul este unul

dintre cele mai fragile materiale

cunoscute, iar cel din urmă este

cel mai dur element natural

cunoscut preţuit pentru

valoarea estetică cât şi pentru

cea industrială.

Am apelat la această comparaţie pentru a pune accentul deopotrivă pe diferenţele

şi asemănările dintre lumea structurilor infodocumentare, care gestionează cultura şi

memoria umanităţii pornind de la istoria sa până la cunoaşterea ştiinţifică şi lumea

tehnologiei informatice de înalt nivel a cărei dezvoltare şi soluţii nu mai pot fi ignorate

atâta vreme cât creşterea exponenţială a documentelor tipărite dar şi a celor non-carte

tinde să depăşească puterea de stocare, prelucrare şi circulaţie prin diseminare pe care

structurile actuale le oferă.

diamantgrafit

Page 2: Grid Computing

Desigur, comparaţia nu are ca bază dimensiunile calităţii sau ale competitivităţii

domeniilor, ci pur şi simplu se doreşte a fi o bază de acceptare a faptului că domeniile

încep să descopere locuri familiare în ceea ce priveşte acumularea, prelucrarea, stocarea

şi diseminarea informaţiilor indiferent de suportul lor şi că încet, încet se produce o

întrepătrundere a câmpurilor de activitate. Ne gândim bineînţeles la faptul că în acest

moment există prea puţine biblioteci şi cu atât mai mult Agenţii Bibliografice Naţionale

care să nu fi dezvoltat după măsura puterilor financiare o bază de date sau chiar sisteme

complexe de stocare şi regăsire a informaţiilor multe dintre acestea fiind baza aplicaţiilor

şi serviciilor on-line prin intermediul cărora îşi deservesc utilizatorii şi clienţii când ne

referim la aplicaţiile comerciale. O parte dintre acestea vor fi dezvăluite pe măsură ce

analiza la nivel european şi global continuă.

2.1.1 Paşii de grafit

BIBLIOTECILE DIGITALE

Ce sunt bibliotecile digitale ?

„ Hei, voi bibliotecarilor, etc., producători ai propriei voastre informaţii, acea

lume e pe cale să se schimbe foarte mult odată cu computerizarea şi generaţia ei. Până şi

lumea utilizatorilor voştri e pe cale să se schimbe foarte mult. Nu veţi putea sta acolo în

mijlocul acestor schimbări gândind că veţi continua să monitorizaţi aceleaşi cantităţi şi

aceleaşi depozite aşa cum sunteţi obişnuiţi să o faceţi.”1

Câmpul de cercetare al bibliotecilor digitale implică creşterea civilizaţiei umane

prin aplicarea tehnologiei digitale la problemele adresate de instituţii precum biblioteci,

arhive, muzee, şcoli, editori şi alte organisme din sfera informaţiei. Înainte de a pune în

atenţie câteva formulări cu privire la bibliotecile digitale trebuie amintit faptul că sub

conceptul bibliotecii electronice se află un altul mai vechi şi anume cel al accesului

1 Englebart Douglas. 1959. [cugetare] apud. Marchionini, Gary. Progress toward digital libraries: Augmentation through integration. <http://www.ils.unc.edu/~march/IP&M_intro.pdf>

Page 3: Grid Computing

informaţional la „buricul degetelor”2 – cu rădăcinile în maşina lui Vannenar Bush:

Memex (1945)3

Deşi, la începutul cercetărilor, existau mai mulţi termeni care denumeau acelaşi

lucru („bibliotecă virtuală”, „bibliotecă electronică”, „biblioteca fără pereţi”), astăzi cel

care este unanim acceptat de specialişti şi folosit şi în literatura de specialitate este:

Biblioteca Digitală. Cleveland Gary continuă jalonarea începuturilor bibliotecilor digitale

aducând în atenţie faptul că la începuturi (Nurnberg, 1995) prin pleiada de denumiri

aduse aceluiaşi lucru (biblioteca digitală) se înţelegeau şi lucruri întrucâtva diferite, dar

care, de fapt, alcătuiesc tabloul complet a ceea ce o bibliotecă digitală este: din punctul de

vedere al proceselor de regăsire a informaţiei este o mare bază de date; pentru cei care se

ocupau de studiul tehnologiei hypertext, este una din aplicaţiile particulare a metodelor

hypertextului; pentru cei care lucrau în sfera serviciilor de furnizare de informaţii , era

doar o aplicaţie a Internetului; pentru domeniul biblioteconomic, este un alt pas în

continua automatizare a bibliotecilor care a început cu 25 de ani în urmă.

Se cuvin a fi amintite câteva repere istorice în ceea ce priveşte apariţia şi

dezvoltarea bibliotecilor digitale. Astfel, începând cu anul 1993, DARPA ( Departament

of Defence’s Advanced Research Projects Agency ), finanţează un proiect prin care se

urmărea dezvoltarea arhitecturii unei biblioteci virtuale cu asistenţa Computer Science

Technical Reports ( CS-TR ). Acest proiect se constituia în proiectul cadru având drept

ţintă dezvoltarea unei biblioteci digitale în care un număr mare de obiecte, cuprinzând

toate tipurile de materiale sunt accesibile prin intermediul reţelelor naţionale de

computere..

Concluziile şi principiile generale care guvernau structura conceptuală a acestei

noi organizaţii erau:

Cadrul tehnic să existe în cadrul mai larg al legalităţii şi spaţiului social

asociat.

D.p.d.v. legal trebuie urmărită natura obiectelor digitale în

contextul reprezentării lor sociale ca fiind expresia intelectuală

2 ? Cleveland, Gary. Martie 1998. Digital Libraries:Definitions, Issues and Challenges <http://www.ifla.org/VI/5/op/udtop8/udtop8.htm>

3 Director al Oficiului de Cercetare Ştiinţifică şi dezvoltare al SUA. 1945.

Page 4: Grid Computing

protejată prin reglementări legislative ( copyright, dreptul de

interpretare, etc. )

De asemenea, trebuie avut în vedere aspectul valoric şi cultural,

evitându-se calomnia, obscenitatea, etc. Societatea aşteaptă de la

creatorii operelor să fie responsabili pentru conţinutul difuzat.

Înţelegerea conceptelor bibliotecii digitale este limitată de terminologie.

Terminologia se dovedeşte a fi o barieră atunci când cuvinte

simple semnifică lucruri diferite pentru comunităţi. De exemplu,

cuvinte precum: „copiere” şi „publicare”, au sensuri diferite pentru

specialiştii în computere, editori şi jurişti.

În schema arhitecturii prezentată de Kahn şi Wilensky4 (vezi

schema mai jos), obiectele din biblioteca digitală sunt numite

„obiecte digitale”. Acestea sunt stocate în „depozite” şi sunt

identificate de „indici”. Informaţia stocată într-un obiect digital

este denumită „conţinut”, care este divizat în „date” şi informaţia

despre date numită „metadate”.

4 Kahn, Robert; Wilensky, Robert. 13 Mai 1995. A framework for distributed digital object services. <www.dlib.org> [cnri.dlib/tn95-01]

Page 5: Grid Computing

Arhitectura pe baza căreia se construieşte biblioteca digitală trebuie să fie

separată de conţinutul stocat în bibliotecă.

Obiectele unei biblioteci digitale sunt mult mai mult decât colecţii de biţi.

Numele şi identificatorul sunt cărămizile bibliotecii digitale.

Obiectul digital folosit este diferit de cel stocat.

Depozitele trebuie să poată menţine informaţia pe care o înglobează.

Utilizatorii vor produse intelectuale iar nu obiecte digitale.

Dintre cele mai multe definiţii cea mai completă se pare că a fost formulată de

Donald J. Waters (primul preşedinte al Digital Library Federation) în 1998, care denumea

bibliotecile digitale ca fiind:

„organizaţii care furnizează resursele, incluzând personal calificat, pentru a

selecta, structura şi oferi acces intelectual la interpretarea, pentru distribuirea,

menţinerea integrităţii şi garantarea prezervării în timp a colecţiilor de lucrări digitale

astfel încât aceste organizaţii să fie pregătite şi economic disponibile pentru a fi

utilizate de o comunitate definită sau un set de comunităţi”5

5 Waters, J. Donald. August 1998. What are Digital Libraries ? <http://www.clir.org/pubs/issues/issues04.html> [23 Februarie 2004]

Page 6: Grid Computing

În binecunoscutul document al UDT (Universal Dataflow and

Telecommunications ) – IFLA: Digital Libraries: Definitions, Issues and Challenges,

Gary Cleveland porneşte de la presupunerea că Bibliotecile Digitale sunt în primul şi în

primul rând biblioteci trecând în baza acestei aserţiuni la înşiruirea caracteristicilor unui

acest tip de bibliotecă:

o Bibliotecile Digitale sunt de fapt faţa digitală a bibliotecilor

tradiţionale, care includ deopotrivă în colecţiile sale materialele

tradiţionale dar şi cele digitale.

o Bibliotecile digitale vor include toate procesele şi serviciile, care

formează coloana vertebrală a unei biblioteci. În orice caz, aceste

procese tradiţionale vor suferi modificările tehnologice care se cer

pentru a deveni cu adevărat o bibliotecă digitală.

o La modul ideal, bibliotecile digitale furnizează o viziune coerentă

asupra tuturor informaţiilor conţinute indiferent de formă sau

format.

o Bibliotecile Digitale vor deservi anumite comunităţi pentru care au

fost create, aşa cum bibliotecile tradiţionale o fac cu toate că aceste

comunităţi vor fi dispersate în lungul şi-n latul reţelei.

o Bibliotecile Digitale vor beneficia deopotrivă de serviciile

bibliotecarilor şi ale informaticienilor pentru a deveni viabile.6

Important este şi felul în care este tratată de acelaşi cercetător preconcepţia zilelor

de început ale Bibliotecii Digitale când, greşit se credea că se va putea realiza un sistem

digital complet care să furnizeze accesul instantaneu la toată informaţia pentru toate

sectoarele de activitate de oriunde de pe mapamond. Aceasta este pusă în contrast cu

realitatea zilelor noastre când iniţiativele de constituire a bibliotecilor digitale se lovesc

de impedimente financiare si logistice considerabile ce nu pot fi acoperite decât în mod

cooperativ – concep, de altfel, foarte, foarte important pentru structurile în care se vor

6 Cleveland, Gary. Martie 1998. Digital Libraries: Definitions, Issues and Challenges.<http://www.ifla.org/udt/op/ > [18 Ianuarie 2004].

Page 7: Grid Computing

transforma toate iniţiativele cooperatiste ale zilelor noastre după cum vom discuta mai

jos.

Demnă de amintit este şi modelul de dezvoltare a Bibliotecilor Digitale pe care-l

prezintă Gary Marchionini şi Edward A. Fox7:

Lucrul cu o bibliotecă digitală apare în spaţiul pe care-l descriu vectorii desemnaţi

(vezi figura): comunitate, tehnologie, servicii şi conţinut.

COMUNITATEA: este dimensiunea care include nevoile de informare,

comportamentele de căutare a informaţiei şi atitudinea individului din cadrul comunităţii.

TEHNOLOGIA serveşte ca motor ce conduce la schimbări continue în soluţiile

care concresc în jurul necesităţilor, dorinţelor şi a fezabilităţii. Cercetătorii din domeniul

Bibliotecilor Digitale au balansat progresul tehnic realizat în reţelistică, stocare şi

regăsire, reprezentare multimedia şi design al interfeţei cu utilizatorul pentru a lega

utilizatorii de Bibliotecile Digitale şi de a lega bibliotecile digitale unele de celelalte.

SERVICIILE reflectă funcţionalitatea care o permit sistemele pentru comunitatea

utilizatorilor pe care o deserveşte.

CONŢINUT: este la ceea ce ne gândim când ne gândim la obiectele digitale.

După cum se observă din figură, tendinţa este vădit orientată pe creşterea

tehnologică şi acumularea de conţinut digital.

S-ar părea că primele interesate de bibliotecile digitale ar fi centrele universitare şi

bibliotecile din domeniul cercetării, care într-adevăr sunt şi cele care au cele mai

7 Marchionini, Gary; A. Fox, Edward. Progress toward digital Libraries. <www.ils.unc.edu/~march/IP&M_intro.pdf   > [8 Noiembrie 2003].

Comunitatea Deservită

Tehnologia

Servicii Oferite

Conţinut

Page 8: Grid Computing

consistente colecţii de documente electronice. Pot fi luate ca exemple vii Networked

Digital Library of Theses and Dissertations (NDLTD) şi Networked University Digital

Library (NUDL), care-şi desfăşoară activitatea cu succes în furnizarea documentelor

electronice necesare mediului universitar.

Pe plan american, NSF (National Science Foundation), DARPA (Department of

Defense Advanced Research Projects Agency) şi NASA au pus bazele a şase proiecte

naţionale în ceea ce priveşte construirea unor biblioteci digitale. Patru dintre cele mai

importante fac parte din NPACI (National Partnership for Advanced Computational

Infrastructure):

1. Alexandria

Digital Library

– furnizează acces

la colecţii de hărţi

imagini şi

pictoriale. În acest

moment

Alexandria este în

posesia a peste 2.8

Terra de date de

referinţă în

domeniul studiilor geografice. Din această colecţie nu lipsesc hărţi şi

fotografii ale teritoriului american (U.S. Geological Survey).

2. UC Berkeley Digital Library – dezvoltă instrumentele şi

tehnologiile pentru a oferi acces la mediul informaţional din domeniul

cercetării. UC Berkeley Digital Library Project face parte din Digital

Libraries Initiative sponsorizată de National Science Foundation.

3. University of Michigan's Digital Library – oferă acces la peste

40 de jurnale ştiinţifice

4. Stanford Integrated Digital Library Project – oferă un mediu

partajat, care stabileşte legături începând de la colecţii cu informaţii

personale până la colecţiile convenţionale din biblioteci de e teritoriul

Page 9: Grid Computing

american. Aici NPACI, a dorit implementarea protocolului DLIOP -

Digital Library Interoperability Protocol.

Trecând pe bătrânul continent nu putem vedea micile amănunte ale diverselor

iniţiative în domeniul formării şi dezvoltării de biblioteci digitale fără să nu analizăm

temeinic „fenomenul” OCLC PICA. Am spus fenomen deoarece este singura iniţiativă

sprijinită de Comisia Europeană care a avut succes asigurându-şi astfel un viitor.

OCLC | PICA

OCLC PICA este o nouă organizaţie alcătuită din fostele organizaţii OCLC

Europe, bibliotecile din Orientul Mijlociu şi Africa, şi PICA.

Pentru ca lucrurile să fie puţin mai limpezi trebuie precizate câteva repere istorice

în ceea ce priveşte cooperarea dintre bibliotecile din spaţiul european.8

Reţeaua de biblioteci PICA (Project for Integrated Catalogue Automation) s-a

născut în urma unui proiect de cercetare cu privire la catalogarea automată desfăşurat

între anii 1969-1975 şi susţinut de câteva biblioteci de cercetare din Olanda.

Începând cu 1976, PICA devine o organizaţie cooperativă cu scopul realizării unei

reţele de biblioteci automatizate on-line în Ţările de Jos susţinută de o bază de date

bibliografică centralizată. În 1986, s-a decis schimbarea infrastructurii organizaţionale în

baza căreia PICA opera, aceasta devenind o fundaţie non-profit independentă guvernată

şi finanţată de către participanţii ei. PICA a pornit în 1978 prin furnizarea de servicii

centralizate iar primul sistem operaţional a fost GGC: Gemeenschappelijk

Catalogiseersysteem – Sistemul Catalogului a cărui funcţionalitate era bazată pe

principiul catalogării partajate.

Catalogarea partajată este un prim concept important apărut pe teritoriul

european cu rădăcini mai adânci în iniţiativele celor doi iluştri belgieni Paul Otlet şi

Henri La Fontaine, fondatori ai „Casei Documentare” – Institutul Internaţional

Bibliografic (actualul FID) în miezul căreia stătea Repertoire Bibliographique Universal

(1895).

8 http://oclcpica.org

Page 10: Grid Computing

Sistemul Catalogului este constituit dintr-o bază de date centrală, care

funcţionează pe principiile catalogării partajate: informaţiile de pe cel mai înalt nivel

bibliografic sunt stocate o singură dată iar bibliotecile pot adăuga la aceasta informaţia

localizată (nr. de exemplare, codul de clasificare, etc.). Sistemul Catalogului este un

sistem care funcţionează în timp real; bibliotecile sunt conectate la sistem iar informaţia

adăugată este indexată imediat ce intră în sistem.

În 1983 intră în funcţiune de ILL (Interlending Loan System), care va ajunge la

rezolvarea anuală a 350.000 de cereri din partea a 300 de biblioteci.

Următorii paşi care au fost făcuţi au fost cei ai integrării ILL cu celelalte sisteme

europene de schimb interbibliotecar precum LASER din Marea Britanie şi SDB/SUNIST

din Franţa. Pentru activitatea şi calitatea serviciilor PICA obţine un contract de la

Comisia Europeană pentru punerea la punct a unui proiect pilot demonstrativ OSI9 de

interconectare a reţelelor de biblioteci din Europa în scopul schimbului interbibliotecar.

Din 1985 intră în funcţiune şi serviciul On-line Retrieval System (ORS) prin

intermediul căruia utilizatorii puteau consulta baze de date specializate ce conţineau

informaţii documentare:

- Catalogul de titluri prescurtat al Ţărilor de Jos, Bibliografia Naţională a

Olandei de la 1540 la 1800,

- Bibliografia Lingvisticii Olandeze şi Ştiinţele Literaturii,

- o bază de date cu literatura gri (GLIN),

- o bază de date privitoare la articolele din perioadicele ştiinţifice Olandeze

(TACO)

Diferit de sistemul central de baze de date PICA mai face disponibil un serviciu:

Sistemul Local de Biblioteci, care furnizează funcţiile accesul pentru bibliotecile membre:

OUS – controlul circulaţiei

OPAC – Online Public Access Catalogue

ACQ – Informaţii comunitare şi achiziţii incluzând şi serviciul de control

al serialelor

9 Open System Interconnection – standard ISO dezvoltat în anii 80 pentru telecomunicarea în reţea. Stă la baza altei norme: Z39.50<http://www.wcsu.edu/library/abt_odlis.html>

Page 11: Grid Computing

În 1989 sunt restructurate GGC-ul (Catalogul Sistemului), ILL-ul şi ORS-ul

inclusiv Local Library System. Până în acest an sistemele PICA erau interconectate

printr-o reţea de tip stea folosind terminalele ca staţii de lucru, dar o data cu trecerea la

reţeaua de cercetare a Olandei – SURFnet, staţiile vor folosi IBW –Inteligent

Bibliographic Workstation. Noul concept al reţelei Sistemului Local de Biblioteci (Local

Library System era bazat pe modelul client-server şi avea la bază protocolul proprietar

PICA3. Acest protocol, deşi reprezintă munca de cercetare a reţelei PICA, de fapt era o

implementare a modelului de protocol OSI (Open System Interconection), dar care se

bucura de atributele rapidităţii şi al satisfacerii pe depline a necesităţii lucrului cu date

bibliografice.

De asemenea, SURFnet şi PICA au mai dezvoltat un proiect pentru realizarea

Reţelei Deschise de Biblioteci – Open Library Network, al cărei scop era facilitarea

accesului publicului la cataloagele tuturor bibliotecilor dintr-o singură locaţie.10 Trebuie

menţionat faptul că integrat sistemului ILL era şi consorţiul bibliotecilor universitare din

Olanda – UBK. Bibliotecile care făceau parte din UBK întreţineau infrastructura a ceea

ce se numea Infrastructura Naţională a

Sistemului de Informare bazată pe sistemul

catalogului partajat şi a catalogului unic

conectate la sistemul ILL. În anul 2001, s-a

convenit cedarea controlului complet asupra

sistemului de catalogare partajată şi ILL către

OCLC PICA, care a dezvoltat şi partea de

software necesară susţinerii infrastructurii.

Am amintit o nouă structură de

colaborare între OCLC şi PICA, care a luat

naştere în luna Ianuarie a anului 2002, o colaborare începută în 1978, când Koninklijke

Bibliotheek – Biblioteca Regală, a obţinut (prin semnarea primului tratat internaţional

pentru partea a americană de această dată), 750.000 de înregistrări din WorldCat pentru

nouă biblioteci Olandeze.

10 Smit, Anja. Cartographics Materials in the PICA Library Network: System Description.< http://www.konbib.nl/kb/skd/liber/articles/pica.htm > [14 Martie 2004]

Jay Jordan, CEO al OCLC (stânga) şi Wim van Drimmelen, Director General, Biblioteca Regală a Olandei (dreapta)

Page 12: Grid Computing

OCLC PICA s-a format prin integrarea Pica B.V.şi OCLC EMEA (Europe. The

Middle East and Africa). Actualmente OCLC PICA este o cooperaţie între bibliotecile

europene cu sediul central în Leiden – Olanda.

În 1999, OCLC şi Fundaţia PICA anunţă semnarea unei scrisori de intenţie care

va conduce la stabilirea unei organizaţii condusă în coparticipaţie care să ofere cele mai

bune servicii comunităţii bibliotecilor din Europa. Astfel, PICA pune la dispoziţie

structura informaţională şi infrastructurile deja create şi serviciile sale precum:

catalogare, împrumut interbibliotecar şi serviciile locale şi cele orientate pe utilizator din

spaţiul Ţărilor de Jos, Franţa şi Germania.

Un lucru foarte important de adăugat este faptul că OCLC a primit certificarea

ISO9001 – Standardul Internaţional pentru calitate. Astfel OCLC devine un model în

proiectarea , dezvoltarea, producerea, instalarea şi întreţinerea sistemelor

infodocumentare.11

OCLC PICA interconectează în aceeaşi reţea peste 45.000 de biblioteci din 84 de

ţări şi este activ angajată în reţeaua globală a informaţiilor. În Europa, Orientul Mojlociu

şi Africa sunt aproximativ 4.300 de instituţii care participă activ la programele PICA.

Anul trecut OCLC a serbat 25 de ani de serviciu activ în schimbul interbibliotecar

după cum şi serviciul de cercetare (ANEXA I) a privit peste activitatea desfăşurată

privind cifra jubiliară.

11 Bova Spies, Phyllis. 1999. OCLC Serves Libraries around the Globe. <http://www.arl.org/newsltr/index.html> [28 Martie 2004]

Page 13: Grid Computing

În acest moment, principalele preocupări sunt optimizarea sistemului central

(CBS – Central Bibliographic System) şi local (LBS – Local Bibliographic System) de

biblioteci precum şi dezvoltarea serviciilor orientate către utilizator (PiCarta, iPort,

WorldSearch. OCLC furnizează şi servicii de referinţe precum QuestionPoint, Dewey

Decimal Classification (DDC), servicii pentru catalogare retrospectivă, servicii pentru

controlul de autoritate şi prezervare digitală (Marea Britanie – digitizarea colecţiei Penny

Illustrated folosindu-se programul Olive).

OCLC derulează actualmente peste douăzeci de proiecte dintre care merită a fi

amintite:

Open Archives Initiative (OAI) – sunt dezvoltate şi promovate standarde

de interoperabilitate care să faciliteze diseminarea eficientă a conţinutului.

Suplimentar este dezvoltat un proiect concentrat pe Teze Electronice &

Dizertaţii care foloseşte protocolul Open Archives Initiative pentru

Metadata Harvesting (Culegerea de Metadate) – OAI-PMH pentru a crea

o bază de date cu metadate privitoare la teze electronice şi dizertaţii. De

altfel, OCLC este membru activ al Networked Digital Library of Theses

and Dissertation al cărei scop este îmbunătăţirea educaţiei prin dezvoltarea

accesului la biblioteci digitale cu un astfel de conţinut. Tot OCLC a creat

software-ul necesar proiectului DSpace al MIT şi Hewlett Packard pentru

a suporta depozitarea open-source. De fapt, OCLC a dezvoltat două

programe software open-source pentru implementarea protocoalelor OAI

pentru stocarea datelor şi culegerea acestora special pentru a veni în

întâmpinarea sistemelor de depozitarea instituţiilor.

Registrul DCMI – Dublin Core Metadata Initiative – promovează

descoperirea, refolosirea şi extinderea semanticii existente şi facilitarea

creării de noi vocabulare în ajutorul utilizatorilor Dublin Core.

Trebuie spus că Dublin Core Metadata Initiative este un forum deschis

aplecat spre a dezvolta standarde de interoperabilitate on-line pentru

metadate. Un reper în timp este binevenit şi acesta este anul 1995 în

cadrul unui workshop la Dublin, când s-a pus problema elaborării unor

standarde pentru resursele informaţionale.

Page 14: Grid Computing

Din 1995 şi până în zilele noastre linia evolutivă a cercetărilor în domeniul

metadatelor a condus la statuarea DCMI-ului ca standard ISO: ISO TC

46/SC 4 şi ANSI/NISO: Z39.85-2001.

Ca forma de organizare DCMI este o organizaţie distribuită iar OCLC

Research este doar gazda administrativă a acestei organizaţii. Activităţile

DCMI includ grupuri de lucru, ateliere de lucru pe plan global, conferinţe,

standarde de legătură şi eforturi în domeniul educării pentru a promova

standardele de metadate spre acceptare şi liberă practică.

Un lucru important care merită amintit este faptul că cercetătorul OCLC

Stuart Weiber a fost primul director executiv al DCMI şi tot el a fost cel

care a făcut demersurile pentru împuternicirea DC-ului ca standard ISO.

Sub conducerea lui, DCMI a devenit un program internaţional cu

participanţi în 50 de ţări şi traduceri în 20 de limbi.

Functional Requirements for Bibliographic Records (FRBR) – testează

fezabilitatea implementării structurii FRBR a IFLA în cataloagele bazelor

de date de mari dimensiuni şi examinează de asemenea şi problemele care

apar privind convertirea înregistrărilor pentru a fi compatibile FRBR. În

luna august 2003, OCLC a făcut public primul algoritm FRBR ca software

open-source . Cu ajutorul acestui algoritm este posibilă scrierea de

programe care să proceseze înregistrări MARC şi să genereze seturi de

înregistrări care ăot fi grupate pentru afişare ca aceeaşi lucrare.

Virtual International Autority File (VIAF) – explorează posibilitatea de

combinare a fişierelor nume de autoritate aparţinând Library of Congress

şi a Detsche Bibliothek într-un singur serviciu nume de autoritate. Această

direcţie de cercetare a fost realizată în urma semnării unui memorandum

de înţelegere dintre Die Deutsche Bibliothek, Library of Congress şi

OCLC pentru dezvoltarea unui Catalogul de Autoritate Virtual

Internaţional (Virtual International Authorities File – VIAF). Astfel,

OCLC va folosi software-ul cu algoritmi de identificare şi potrivire asupra

cataloagelor retrospective ale celor două biblioteci pentru a genera VIAF-

ul original. Acest catalog nou generat va fi actualizat regulat cu metadate

Page 15: Grid Computing

culese automat din cataloagele de autoritate naţionale folosindu-se

protocoalele OAI. Acest demers este o piatra de hotar în ceea ce priveşte

colaborarea internaţională între biblioteci.12

Servicii şi Baze de Date

Managementul Colecţiilor, Catalogare şi Metadate

OCLC oferă o suita de programe online şi servicii de organizare şi compactare a

datelor pentru a facilita construirea şi menţinerea unei biblioteci electronice bazate pe

nevoile, bugetul şi scopurile fiecărei instituţii care doreşte construirea unei astfel de

biblioteci. Utilizând serviciile OCLC pot fi reduse costurile de achiziţie şi catalogare a

materialelor şi astfel creşterea productivităţii prin automatizare, generare de date

specializate pentru un anume beneficiar în funţie de nevoile sale şi furnizarea de

materiale fară a mai fi nevoie a fi prelucrate local. Folosind serviciile OCLC de

management al colecţiilor, catalogare şi generare de metadate, fondurile unei biblioteci

pot fi procesate mai economic ca efect direct fiind accesul mai rapid al utilizatorilor la

document, plus un acces mai rapid la conţinutul colecţiei.

Serviciile OCLC de management al colecţiilor, catalogare şi generare de metadate

ajută o bibliotecă prin creşterea productivităţii muncii personalului şi organizarea fluxului

documentelor dintr-o bibliotecă pornind de la editor pana la utilizator. La baza tuturor

acestor servicii se află WordCat, cea mai mare bază de date bibliografice.

1.1) Servicii de catalogare şi metadate

12 Jordan, Jay. 5 Februarie 2004.Global Networking of Information – OCLC’s strategy for the future [Prezentare conferinţă]. 7thInternational Bielefeld Conference. [PDF]: <http://conference.ub.uni-bielefeld.de/proceedings/jordan.pdf> [4 Mai 2004]

Page 16: Grid Computing

Serviciul Connexion a fost lansat în primă fază pe 1 iulie 2002. Conexion este

noua faţă a catalogării OCLC, care oferă acces instantaneu la instrumentele integrate de

catalogare şi la WordCat. Versiunea iniţială foloseşte o interfaţă tip browser pentru multe

din funcţiile care se găsesc acum îndiferitele servicii de catalogare. Funcţii precum cele

ale OCLC CORC, CatExpress şi alte opţiuni cum ar fi serviciile de catalogare Dewey,

sunt incluse acum în serviciul Connexion. 13

Serviciul de Referinţe

OCLC Reference Services oferă acces elecronic la preţuri accesibile la o gamă

variată de informaţii – abstracte, full text, indexuri şi bibliografii – fie că utilizatorul se

află într-o bibliotecă, la birou sau acasă. OCLC ajută biblioteca să furnizeze aceste

informaţii utilizatorului prin cele mai bune mijloace de comunicaţie online, împrumut

interbibliotecar, furnizori de documente sau prin intermediul arhivelor de bibliotecă.

Partajarea resurselor

Serviciul OCLC Interlibrary Loan (ILL), ajută bibliotecile din sistemul OCLC să

creeze, trimită şi să depisteze cereri ILL cu acces la WorldCat ( OCLC Online Union

Catalog ), punând la dispoziţie peste 48 de milioane de înregistrări în 400de limbi şi

resursele a peste 6.700 de biblioteci, centre de documentare şi furnizori de documente. În

plus, o legătură unică între OCLC ILL şi serviciul OCLC FirstSearch permite

utilizatorilor unei biblioteci să iniţieze cereri online.

Digitizare şi Prezervare

Serviciile OCLC Digital&Preservation Resouces furnizează tehnologia,

infrastructura, resursele şi serviciile necesare gestionării unui complet ciclu de viaţă a

unei colecţii digitale. Aceste noi servicii permit crearea, accesarea şi prezervarea

13 OCLC Connexion. http://connexion.oclc.org/

Page 17: Grid Computing

colecţiilor; construirea cooperativă a unor noi colecţii şi centre de informare asupra noilor

proiecte, diverselor finanţări şi cele mai bune modalităţi de lucru; şi actualizarea

informaţiilor cu privire la problemele de digitizare şi prezervare.

Bazele de date

OCLC dispune de WorldCat ( OCLC Online Union Catalog ). De-a lungul a trei

decenii, bibliotecile membre OCLC au partajat cataloagele lor electronice pentru a forma

cea mai mare bază de date bibliogarfică a lumii. WorldCat oferă peste 48 de milioane de

înregistrări bibliografice conţinând, de asemenea informaţii vitale asupra dezvoltării

colecţiilor, catalogare, control de autoritate şi servicii de conversie retospectivă.

Prin intermediul serviciului OCLC FirstSearch, utilizatorii unei biblioteci pot

accesa 70de baze de date incluzând nume comune pornind de la furnizorii de informaţie

cât şi resursele puse la dispoziţie exclusiv de OCLC.

Bazele de date OCLC includ: WorldCat, ArticleFirst, Electronic Collections

Online, PAIS International, PapersFirst, ProceedingsFirst, and the OCLC Union Lists of

Periodicals.

WorldCat este inima serviciului cooperativ al OCLC. Reprezintă întruparea

idealului de colaborare dintre biblioteci furnizând acces la o colecţie virtuală de care nici

o bibliotecă de sine stătătoare nu ar putea beneficia.14

WorldCat include peste 48 de milioane de înregistrări. O înregistrare tipică a

Worlcat conţine o descriere fizică a documentului şi informaţie despre conţinutul

14 WorldCat. http://www.oclc.org/worldcat/

Page 18: Grid Computing

intelectual al acestuia. Datorită partenerilor strategici ai OCLC sunt adăugate

înregistrărilor bibliografice informaţii cu caracter evaluativ cum ar fi: tabele de conţinut,

coperţi, capitulaţia cărţilor şi note privind autorul. Ataşat fiecărei înregistrări bibliografice

stau liste cu bibliotecile membre care deţin documentul la care înregistrarea bibliografică

face trimitere.

Prin parteneri strategici, OCLC înţelege asocierea în sistem de parteneriat cu

diverşi vânzători de carte online şi terţe companii de furnizare şi distribuţie a

documentelor sau diverselor materiale.

Statistici privind activitatea OCLC:

La fiecare 15 secunde o biblioteca membră OCLC adaugă o înregistrare.

La fiecare 5 secunde o bibliotecă membră a OCLC lansează o cerere de împrumut

interbibliotecar prin intermediul serviciului ILL.

La fiecare 2 secunde un utilizator al unei biblioteci membră OCLC accesează

WorldCat prin intermediul serviciului FirstSearch.

OCLC asigură calitatea înregistrărilor bibliografice prin adoptarea standardelor

internaţionale şi prin propriile-i programe de verificare a calităţii. Programul Enhance al

departamentului de control al calităţii înregistrărilor OCLC şi programele de detecţie a

înregistrărilor duplicat, asigură o calitate ridicată şi implicit o reală valoare pentru

utilizatori. Din 1998, specialiştii OCLC au corectat peste 9 milioane de înregistrări fie

manual, fie cu ajutorul macro-urilor (mici secvenţe de cod cu rol de automatizare a unor

operaţiuni care se repetă ), au fuzionat peste 42.700 seturi de înregistrări duplicat şi au

scimbat peste 7 milioane de înregistrări prin intermediul scanărilor automate.

Conectarea la baza de date WoldCat se face prin intermediul serviciului Connexion.

Pentru a căuta o înregistrare bibliografică in WorldCat tastezi informaţia despre

înregistrarea bibliografică dorită într-un formular de interogare a bazei de date.

Page 19: Grid Computing

Informaţia bibliografică provine din mai multe surse cum ar fi un fragment, un titlu sau

chiar pur si simplu o înregistrare de catalog. Fiecare informaţie face parte din procesul de

căutare.

O înregistrare din baza de date WorldCat conţine informaţii ale catalogului de tip

metadate ce descriu o singură entitate (o carte, o înregistrare video, un fişier, un CD,

etc. ). Fiecare înregistrare este divizată în câmpuri (autor, titlu, subiect, etc.). Câmpurile,

la rândul lor sunt subdivizate în subcâmpuri cum ar fi locul de publicare, editor, data

publicării, etc. Catalogatorii codează informaţia folosind “etichete” – taguri, indicatori şi

coduripentru subcâmpuri.

Câmpurile şi subcâmpurile unei înregistrări bibliografice apar într-un format

standard. Formatul standard este formatul MARC (Machine – Readable – Cataloging).

Baza de date WorldCat este formată din înregistrări MARC.

Navigarea prin înregistrările bibliografice ale WorldCat se face prin intermediul a

mai multor variante de interfaţă Connexion, CatME şi Passport. Indiferent de interfaţa

folosită pentru navigare datele afişate sunt aceleaşi.

2.1.2 Calea diamantului

De ce grid ?

„considerăm resursele partajate o caracteristică definitorie a bibliotecilor”15

15 Marchionini, Gary. Progress toward digital libraries: Augmentation through integration. <http://www.ils.unc.edu/~march/IP&M_intro.pdf>

Page 20: Grid Computing

deoarece Bibliotecile Digitale „au arhitecturi deschise şi pentru că suportă o clasă de servicii distribuite de informaţii digitale care suportă extensibilitatea”16

„Aceste elemente [ n.n. – obiect digital, fişiere, baze de date, identificatori, depozite digitale, etc., în narea lor majoritate, descrise la Bibliotecile Digitale ] sunt menite să constituie un set minim de cerinţe şi servicii care trebuie să fie pentru a rezulta infrastructura unui sistem de informaţie digitală universal, deschis şi de largă cuprindere <<Sistemul>>”17

„În viitor, interoperabilitatea dintre platformele tehnice ale bibliotecilor digitale, metadate

şi formatele obiectelor digitale vor fi posibile doar în cadrul graniţelor relative ale

sistemelor create pentru scopuri şi comunităţi bine definite”18

Aminteam anterior de National Partnership for Advanced Computational

Infrastructure – o organizaţie americană, care îşi declară misiunea prin nevoia parcurgerii

etapelor ştiinţifice în scopul creării de infrastructuri computaţionale naţionale, ubique,

continue şi universale prin aria de acoperire: GRIDUL.

În viziunea NPACI, cercetători colectează datele din mediul experimental şi din

bibliotecile digitale; analizează aceste date pe baza modelelor de prelucrare puse la

dispoziţie de gridurile computaţionale, vizualizează şi partajează aceste date în şi prin

Internet şi publică rezultatele pentru comunitatea ştiinţifică prin intermediul bibliotecilor

digitale.

Intenţia mea este să aduc în prim plan una dintre cele 10 tehnologii19 care vor

schimba lumea chiar în mijlocul cercetărilor cu privire la constituirea şi dezvoltarea

proiectelor bibliotecilor digitale, dar mai întâi trebuie desluşite conceptele şi termenii care

alcătuiesc tehnologia grid. Astfel:

Grid computing:

A. Accent pus pe partajarea resurselor

16 Kahn, Robert; Wilensky, Robert. 13 Mai 1995. A framework for distributed digital object services. <www.dlib.org> [cnri.dlib/tn95-01]

17 op. cit. 1.Introduction. par 1.18 Cleveland, Gary. Martie 1998. Digital Libraries: Definitions, Issues and Challenges.<http://www.ifla.org/udt/op/ > [18 Ianuarie 2004].19 Technology Review. Februarie 2003. 10 tehnologii care vor schimba lumea. < http://www.technologyreview.com/articles/emerging0203.asp>

Page 21: Grid Computing

B. Aplicaţii inovative

C. Orientare de înaltă performanţă

Ian Foster20, Carl Kesselman21 şi Steve Tuecke22 în faimoasa lucrare „The Anatomy

of the Grid 23 definesc „problema Grid-ului” ca fiind partajarea coordonată a resurselor

între colectivităţi, instituţii şi resurse – ceea ce se înţelege prin organizaţii virtuale.

În cadrul acestor baze conceptuale descoperim o autentificare unică, autorizare, acces

la resurse, diseminare informaţională, etc.

De fapt termenul de grid însemna la mijlocul anilor 90 un model de infrastructură

pentru mediul computaţional distribuit propriu mediului ştiinţific şi ingineresc. Chiar

începând din acea perioadă termenul de grid şi-a format o aura incertă care denomina

activităţi şi realităţi din lumea cercetării începând de la reţelistică avansată şi până la

inteligenţă artificială. De fapt, conceptul de grid se referă la partajarea coordonată a

resurselor şi rezolvarea problemelor. Partajarea implicată nu se referă doar la schimbul

de fişiere ci dincolo de acesta, adică la accesul direct la resursele computaţionale, date,

software şi alte resurse după cum sunt cerute de o serie întreagă de soluţii cerute de

mediul distribuit, strategii de gestionare a resurselor derivate din mediul in industrial de

dezvoltare, dar şi de mediul ştiinţific. Acest proces de protejare este necesar a se

desfăşura într-un mediu cu un înalt grad de control unde sunt definiţi foarte clar furnizorii

şi consumatorii şi ce anume este conţinutul partajat, cui îi este permis să partajeze resurse

dar şi condiţiile în care partajarea este făcută.

Analizând mediile de comunicare şi furnizorii de servicii din domeniul informaţional

ajungem la necesitatea de a enumera si accentua câteva din tehnologiile complementate

de grid:

INTERNETUL se adresează în general nevoii de comunicare şi schimb

informaţional dintre computere, dar nu furnizează instrumente integrate de

20 Departamentul de Ştiinţă a Matematicii şi Computerelor din cadrul Laboratorului Naţional Aragonne, Illinois.21 Departamentul de Ştiinţe în Computere al Universităţii Chicago22 Institutul de Ştiinţe ale Informării al Universităţii de Sud California. 23 Foster, Ian. Kesselman, Carl. Tuecke Steve. The Anatomy of the Grid.

<http://www.globus.org/research/papers/anatomy.pdf > [12 Februarie 2004]

Page 22: Grid Computing

coordonare partajată a resurselor pe mai multe situri gata de a intra intr-un

mediu integrat

Schimburile B2B (bussiness-to-bussiness) se canalizează pe schimbul de

informaţii, de obicei via servere centrale

Tehnologiile bazate pe computare distribuită (Enterprise distributed computing

technologies precum:

CORBA şi

Enterprise JAVA permit partajarea în cadrul unei aceleiaşi organizaţii.

DCE (The Open Group’s Distributed Computing Evironment)suportă partajare

securizată între situri, dar cele mai multe organizaţii consideră că este greoaie şi

lipsit de flexibilitate

SSP-ule (Storage Service Providers) şi

ASP-urile (Application Service Providers) permit outsourcing-ul24 către terţi, dar

acest tip de comunicaţii sunt de obicei legate de client prin intermediul unui VPN

(Virtual Private Network).

Astfel, este observabil faptul că serviciile existente pe piaţa distribuţiei şi gestionării

de informaţie acoperă doar parţial dezideratele scalabilităţii într-un mediu dinamic.

Deoarece tehnologiile de tip grid sunt orientare către partajarea inter-organizaţională

dinamică ele pot fi considerate complementare celor existente deja.

Arhitectura unui Grid identifică componentele fundamentale ale sistemului,

specifică scopul şi funcţiile acestor componente şi indică felul cum interacţionează aceste

componente între ele. Problema principală pe a cărei rezolvare se bazează soluţiile oferite

de tehnologia grid, este cea a interoperabilităţii, ceea ce în mediul reţelelor înseamnă de

fapt protocoale comune (vezi ANEXA II).

Arhitectura grid este de fapt o arhitectură de protocol pe baza căreia organizaţiile

virtuale negociază, stabilesc, gestionează şi exploatează RELAŢII DE PARTAJARE.

24 Gestionarea unor procese de către terţe părţi

Page 23: Grid Computing

Iată, că aspectul principal pe care se bazează funcţionarea şi scalabilitatea unui sistem

de tip grid este asigurată de folosirea unui mediu standardizat din punct de vedere al

protocoalelor de comunicare. Acelaşi lucru trebuie făcut şi în ceea ce priveşte dezvoltarea

unui limbaj comun în ceea ce priveşte generarea şi comunicarea datelor bibliografice sau

de altă natură cuprinse în sfera activităţilor unei instituţii infodocumentare. Deci o nevoie

clară de standard la nivel de comunicare în primul rând iar în cel de-al doilea nevoia de

standard în ceea ce priveşte datele generate de către aceste instituţii dar şi serviciile pe

care acestea le generează sau le administrează în partidă comună pe linia tehnică a unui

grid.

O mare parte din problema standardizării se poate spune că a fost rezolvată în parte

prin adoptarea standardelor existente în ceea ce priveşte descrierile bibliografice vezi

normele ISO 2709, familia MARC (UNIMARC, USMARC, UKMARC, MARC21),

normele familiei Z39.xx cu precădere folosirea normei de comunicare Z39.50 , ISBD-

Page 24: Grid Computing

urile, etc. Aceste standarde au fost acceptate şi sunt folosite neuniform ceea ce conduce la

disfuncţionalităţi şi confuzie atunci când se doreşte panificarea unui sistem integrat de

prelucrare şi furnizare de informaţii. Prin prisma viitoarelor tehnologii şi nevoi de

interconectare pentru a răspunde unitar nevoilor utilizatorilor şi a marilor beneficiari

(întreprinderi, institute de cercetare, etc), aceste standarde vor trebui să facă faţă

dimensiunii extinderii şi cererii globale cu aspectele sale local particulare şi unitare în

cererile de informare care interoghează un astfel de sistem.

Ca arhitectură, modelul tehnologiei grid are marele avantaj al trecerii dincolo de

protocoalele Internet şi de arhitectură. Se poate vorbi cu siguranţă despre o

„democratizare a ştiinţei”25. Implicit de va realiza şi o democratizare în ceea ce priveşte

accesul utilizatorului la resursele informaţionale dorite.

Bineînţeles nu trebuie gândit faptul că tehnologia grid nu se bazează pe un set de

protocoale. Acestea există iar marele avantaj în cazul tehnologiei este că numărul lor este

foarte mic şi acoperă vastul domeniu al schimbului de resurse.

Protocoalele pe care tehnologia GRID îşi fondează dezvoltarea sunt dispuse după

modelul clepsidrei al cărei zonă mijlocie îngustă este constituită din protocoalele

resurselor şi ale conectivităţii, care facilitează partajarea resurselor individuale. Pe baza

acestora stau: nivelul structural , în jurul căruia se construiesc servicii globale şi aplicaţii

specifice, iar la nivelul situat imediat sub cel al protocoalelor: nivelul colectiv – denumit

astfel deoarece implică coordonarea colectivă a multiplelor resurse26.

Aici trebuie menţionat faptul că marele avantaj al implementării tehnologiei grid intre

structurile infodocumentare din moment ce acestea devin parteneri şi astfel organizaţii

virtuale coparticipante unui astfel de proiect, este acela al unificării standardelor de

comun acord în acord cu atingerea scopul primar al intercomunicării pe baza unui limbaj

comun.

Se atinge în acest moment punctul sensibil al interoperabilităţii. Este momentul să

considerăm faptul că relaţiile de partajare se pot iniţia între instituţii arbitrare, ele fiind

25 Foster Ian. 20 Aprilie 2002. Bucureşti.[Plenary Session]. The Potential of GRID and Distributed Computing Activities in Romania. PowerPoint Presentation. <http://www.grid.ro/workshop/documente/ppt/Ian_Foster_RoGrid_April_02.ppt>

26 Foster, Ian. Kesselman, Carl. Tuecke Steve. The Anatomy of the Grid. <http://www.globus.org/research/papers/anatomy.pdf > [12 Februarie 2004]. pg 7

Page 25: Grid Computing

Sistemul de Stocare

Sistemul de Operare

Aplicaţia

OBIECTUL DIGITAL

Interfaţa Sistemului

capabile să integreze dinamic noi participanţi în ciuda platformelor diferite (sisteme de

operare şi configuraţii hardware diferite), a limbilor şi mediilor de programare27.

Pentru nevoile de argumentare a integrării serviciilor prezente în structurile

infodocumentare în complexul funcţional al tehnologiei grid merită analizată cu atenţei

schema care prezintă cea mai mare credibilitate în ceeea ce priveşte şansa de reuşită a

unei astfel de intreprinderi.

Documentul pe care-l supun atenţiei şi analizei, se numeşte Digital Libraries, Data

Grids, and Persistent Archives28, document emis de colectivul de la SDSC (San Diego

Supercomputer Center), condus de cunoscutul cercetător Reagan W. Moore.

De ţinut în minte sunt următoarele aspecte: SDSC este furnizorul principal de servicii

de mirroring (servicii de asigurare a redundanţei) pentru majoritatea bibliotecilor digitale

din SUA (CDL – AMICO, DARPA/USPTO - patent digital library, NLM Visible

Embryo digital library – GMU, NSF Digital Library Initiative, Phase II - UCSB,

Stanford, NSF NPACI Digital Sky - Caltech 2MASS sky survey, NSF NSDL - UCAR /

Columbia / Cornell / UCSB), dar este şi unul din partenerii de bază al NPACI.29

Să ne oprim la prezentarea obiectelor digitale deja dezbătute la secţiunea privitoare la

bibliotecile digitale aşa cum este receptată în contextul integrării în sistemul de tip grid:

27 op. cit. pg. 528 Moore W. Reagan <[email protected]>. Digital Libraries, Data Grids, and Persistent Archives. [Power

Point Presentation] < http://www.npaci.edu/DICE/ > [ 31 Februarie 2004 ]29 National Partnership for Advanced Computational Infrastructure

Page 26: Grid Computing

Mai sus este prezentată schema simplificată a nivelelor din grila de management

tehnologic al unei structuri de arhivă permanentă. Trebuie menţionat faptul că

managementul tehnologic poate suporta o uşurarea a nivelelor sale de desfăşurare din

moment ce nivelurile Obiectului Digital şi al Spaţiului de Stocare pot fi abstractizate şi

astfel fiind operate mult mai eficient decât dacă s-ar lua în consideraţie de fiecare dată

soluţiile sau implementările de ordin tehnic strict.

Astfel, lucrurile s+ar putea schimba la nivelul percepţiei conceptuale astfel:

Abstractizarea Obiectelor Digitale poate să-şi exprime teoretic existenţa prin

tipologiile sub care pot apărea: reprezentarea logică (intervin intrebările puse cu privire la

ce reprezintă obiectele electronice şi care este înţelesul asociat acestora) şi reprezentarea

fizică ( intervin aspectele care intervin în delimitarea structurii fizice a obiectului

digital ).

În continuare Moore porneşte la a ilustra de la simplu la complex structurile sub care

stă conceptul de obiect digial şi cristalizările pe care acesta le poate prezenta într-o

structură integrată, complexă:

Sistemul de Stocare

Sistemul de Operare

Aplicaţia

OBIECTUL DIGITAL

Interfaţa Sistemului

Abstractizarea Sistemul de Stocare Abstractizarea Interfeţei Sistemului

Abstractizarea Obiectului Digital

Page 27: Grid Computing

ANEXA I

1989

OSROn-line Retrieval

SystemLocal Library System

OUSControlul Circulaţiei

şi Împrumut

OPAC ACQAchiziţii şi Informaţie

ComunitarăInclude şi Controlul SerialelorServicii integrate, care furnizează

utilizatorilor informaţii cu privire la disponibilitatea unui documentPoartă de introducere a cererilor

în sistem

PICADezvoltare 1969 - 1975

Cataloguing SystemSistemul Catalogului

Proiect al Comisiei Europene

ILLInterlending Loan SystemLASE

RAnglia

SDB/SUNIST

Franţa

OPACOn-line Public Access Catalogue

1976

1983

1984

1985

GGCGemeenschappelijk Catalogiseersysteem

Sunt restructurate:

Local Library System

ORSILL

Page 28: Grid Computing

Activitatea Departamentului de Cercetare al OCLC1978 – 2003

1978 – Organizarea Departamentului de Cercetare al OCLC sub conducerea fondatorului OCLC Fred Kilgour

1979 – Analiza şi căutarea eficacităţii activităţilor de furnizare a serviciilor de bibliotecă via telefon şi televiziune

1980 – Investigaţii asupra accesului pe subiecte şi conceperea unui catalog on-line.

1981 – Studiul interacţiunii dintre om şi computer şi îmbunătăţirea accesului la informaţie, în general sisteme on-line.

1982 – Studiu asupra sistemelor de cataloage OPAC pentru a ajuta bibliotecile să treacă de la sistemul cataloagelor pe fişe la cataloagele on-line.

1983 – Studierea de sisteme prototip pentru furnizarea documentelor electronice şi accesul pe subiecte la OCLC Online Union Catalog.

1984 – Explorarea portalurilor şi a sistemelor inteligente de reţea; automatizarea rutinei din tandemul om-computer.

1985 – Studierea folosirii de compact discuri pentru furnizarea de documente, catalogare şi servicii de referinţă.

1986 – Dezvoltarea unui sistem de furnizare a documentelor Graph-Text; elaborarea prototipului unui siste pentru regăsirea articolelor în regim electronic automatizat.

1987 –Dezvoltarea unei tehnici de catalogare descriptivă automată pentru a construi înregistrări bibliografice originale.

1988 – Investigarea stocării full-text, regăsirea şi afişarea; colaborare cu Universitatea Carnegie Mellon pe proiectul Mercury.

1989 – Graph-Text este patentat; Sun Microsystems şi OCLC au convenit să facă schimb de tehnologii.

1990 – Este deschis Laboratorul de Test al OCLC; proiectul CORE începe să dezvolte un sistem on-line pentru a furniza acces la text şi grafică în jurnalele de chimie.

1991 – Colaborare cu bibliotecile Universităţii de Stat Ohio pentru a determina dimensiunea procesului de deteriorare a cărţilor.

Page 29: Grid Computing

1992 – Publicarea lui Online Journal of Current Clinical Trials, primul jurnal de ştiinţă adnotat (în parteneriat cu AAAS)

1993 – Dezvoltarea unei tehnologii care să aibă la bază interfaţa jurnalelor electronice ale OCLC, Dewey în regim electronic şi algoritmi pentru a îmbunătăţi calitatea bazelor de date OCLC

1994 – Cooperare cu figuri importante din lumea World Wide Web pentru a furniza acces la jurnalele electronice OCLC şi serviciul de referinţe prin Mosaic (primul browser web din lume)

1995 – Evaluarea limbajului de programare JAVA pentru furnizarea serviciilor OCLC în Internet; primul atelier de lucru al DCMI (Dublin Core Metadata Initiative) ţinut în Dublin, Ohio.

1996 – Introducerea pachetului software PURL; dezvoltarea modelelor şi standardelor pentru descrierea resurselor informaţionale (metadate).

1997 – Colaborarea cu Library of Congress pentru a eficientiza controlul de autoritate mult mai eficient.

1998 – Studiul infomaţiei accesibile web şi împerecherea sistemului de catalogare LCSH (Library of Congress Subject Headings) cu numerele DDC (Dewey Decimal Cataloguing).

1999 – Lansarea site-ului proiectului de Caracterizare Web şi Cooperative Online Resources Catalog – proiectul CORC.

2000 – Continuarea studiului asupra World Wide Web; analiza CORC pentru clasificarea materialelor de bibliotecă şi a mediului privitor la prezervarea digitală.

2001 – Continuarea studiului asupra prezervării digitale; noile proiecte includ FAST – Faceted Application of Subjects Terminology şi noilor modalităţi de utilizare a DDC-ului.

2002 – Publicarea cadrului OCLC/RLG al metadatelor folosite pentru prezervarea digitală a obiectelor; testarea modelului FRBR – Functional Requirements for Biliographic Records al IFLA folosind înregistrările WorlCat

2003 – Dezvoltarea de aplicaţii software care să suporte Open Archives Initiative; introducerea Registrului DCMI – Dublin Core Metadata Initiative.

ANEXA II

Page 30: Grid Computing

ARHITECTURA UNUI GRID

Aplicaţia

Structură„Servicii globale şi aplicaţii

specifice”

Conectivitate

Resurse„Partajarea de resurse individuale” însemnând negocierea accesului şi

controlul acestora

Colectiv„Coordonarea resurselor multiple” Aplicaţia

Transport

Internet

Link

Arhitectura Protocoalelor GRID

Arhitectura protocoalelor Internet

FIG 1. ARHITECTURA UNUI GRID

Page 31: Grid Computing

Abstractizarea Entităţii Digitale

Entitatea Digitală

Logic: I-Nod-uri

(pe HDD)

Fizic: al HDD(Track/Sector)

Flux de biţi

Abstractizarea Depozitului

Logic: Nume Fişier

(pe HDD)

Fizic: Sitemul de Fişiere

(NTFS / NFS / AFS)

(pe HDD)

Depozitul

Hard Discul

Nivelele de Abstractizare pentru Biţi

FIG 2

Page 32: Grid Computing

Abstractizarea Entităţii Digitale

Entitatea Digitală

Logic: Modelul datelor

(unităţi, semantică)

Fizic: Formatul de Codare

(sintaxă şi structură)

Fişiere

Abstractizarea Depozitului

Logic: Identificatorul (Name Space)

(pe HDD)

Fizic: Sistemul de Management

al Datelor(SRB / MCAT)Depozitul

Sistemul de Fişiere, Arhiva

Nivelele de Abstractizare a Datelor

FIG 3

FIG 4

Page 33: Grid Computing

Abstractizarea Entităţii Digitale

Entitatea Digitală

Logic: Schema Colecţiei

Fizic: SintaxăXML

Atributele Metadatelor

Abstractizarea Depozitului Logic: Schema

Bazei de Date

(pe HDD)

Fizic: MCAT / CWM

Depozitul

Baza de Date

Nivelele de Abstractizare a Informaţiei