t.4.3

13
Investeşte în oameni! Fondul Social European Proiect cofinanţat din Fondul Social European prin Programul Operaţional Sectorial Dezvoltarea Resurselor Umane 2007 – 2013 Axa prioritară 1 „Educaţia şi formarea profesională în sprijinul creşterii economice şi dezvoltării societăţii bazate pe cunoaştere” Domeniul major de intervenţie 1.3 „Dezvoltarea resurselor umane din educaţie şi formare profesională” Titlul proiectului: „OSCINT XXI - Inovare pentru calitate în învăţământul preuniversitar din regiunile Sud Vest Oltenia, Bucureşti-Ilfov, Sud-Est, Sud Muntenia” Cod Contract: POSDRU/157/1.3/S/140010 Beneficiar: Academia Naţională de Informaţii „Mihai Viteazul” Tema T.4.3. Căutare specializată pe tipuri noi de conţinut multimedia Strategii şi metode de formare Pentru activităţile face-to-face: prelegere, dezbatere şi problematizare. Pentru activităţile online: învăţarea colaborativă, aplicaţii practice şi workshop-uri. Conţinut De cele mai multe ori se vorbeşte despre new media (emerging media sau web 2.0) în antiteză cu media clasice (presă în format print, televiziune, radio etc.), deşi, în realitate, new media presupune juxtapunerea formelor clasice de mass-media cu tehnologiile de interacţiune şi comunicare specifice world wide web. Conţinutul media astfel rezultat capătă forme noi, paradigma comunicării dintre emiţător şi receptor reconceptualizându-se sub forma unui proces continuu de feedback şi feedforward. ACADEMIA NAȚIONALĂ DE INFORMAȚII „MIHAI VITEAZUL” Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA POSDRU/157/1.3/S/140010 Pagina 1 din 13

Upload: mihai-traian

Post on 25-Jan-2016

220 views

Category:

Documents


3 download

DESCRIPTION

platforme online

TRANSCRIPT

Page 1: T.4.3

Investeşte în oameni!Fondul Social EuropeanProiect cofinanţat din Fondul Social European prin Programul Operaţional SectorialDezvoltarea Resurselor Umane 2007 – 2013Axa prioritară 1 „Educaţia şi formarea profesională în sprijinul creşterii economice şi dezvoltării societăţii bazate pe cunoaştere”Domeniul major de intervenţie 1.3 „Dezvoltarea resurselor umane din educaţie şi formare profesională”Titlul proiectului: „OSCINT XXI - Inovare pentru calitate în învăţământul preuniversitar din regiunile Sud Vest Oltenia, București-Ilfov, Sud-Est, Sud Muntenia”Cod Contract: POSDRU/157/1.3/S/140010Beneficiar: Academia Națională de Informații „Mihai Viteazul”

Tema T.4.3. Căutare specializată pe tipuri noi de conţinut multimedia

Strategii şi metode de formare Pentru activităţile face-to-face: prelegere, dezbatere şi problematizare. Pentru activităţile online: învăţarea colaborativă, aplicaţii practice şi workshop-uri.

ConţinutDe cele mai multe ori se vorbeşte despre new media (emerging media sau web 2.0) în

antiteză cu media clasice (presă în format print, televiziune, radio etc.), deşi, în realitate, new media presupune juxtapunerea formelor clasice de mass-media cu tehnologiile de interacţiune şi comunicare specifice world wide web. Conţinutul media astfel rezultat capătă forme noi, paradigma comunicării dintre emiţător şi receptor reconceptualizându-se sub forma unui proces continuu de feedback şi feedforward.

Dennis Murphy, în "Fighting Back: New Media and Military Operations", consideră new media ca fiind "orice mijloc care permite unui spectru larg de utilizatori (de la indivizi la entităţi statale) să creeze şi să disemineze informaţii în timp real sau aproape în timp real, care au capacitatea să influenţeze o audienţă largă (regională sau mondială) folosind tehnologii de comunicaţii standardizate şi având ca platformă unificatoare Internetul".În categoria new media sunt incluse bloguri, extensii on-line ale presei clasice, posturi TV, radio sau presă cu activitate doar pe Internet, podcasturi (fişiere audio disponibile pe Internet), lumi virtuale ("Second Life"), enciclopedii de tip "wiki", reţele de socializare ("Facebook"), site-uri sau clienţi de e-mail. Dintre acestea, reţelele de socializare, în special "Facebook" au cunoscut o accelerare a creşterii importanţei pentru utilizatorii Internet, uneori chiar în detrimentul altor forme web 2.0, precum blogurile (Lenhart et al., 2010).

Potrivit lui Lev Manovich, new media este un termen redundant din punct de vedere istoric, folosit pentru descrie cele mai recente media disponibile. Din această perspectivă, termenul este corect folosit doar la un anumit moment, când este potrivit pentru a transfera correct informaţia de la autor la cititor. Dintr-o perspectivă cronologică, acest termen va afecta comunicarea, riscând să transmită o informaţie falsă, acestea fiind motivele pentru

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 1 din 9

Page 2: T.4.3

care vom evita să folosim cât mai puţin acest termen, concentrându-ne, în schimb, pe termenul mult mai explicit de online media.

Încă din 1999 Darcy DiNucci anunţa apariţia web 2.0, semnalând modificarea felului în care utilizatorii folosesc PC-urile personale şi interacţionează în spaţiul virtual. Totuşi, abia în 2004, odată cu organizarea "O'Reilly Media Web 2.0 Conference", şi-a câştigat notorietatea şi a cunoscut o cristalizare conceputală.

Web 2.0 nu înseamnă o modificare de natură tehnologică a Internetului, ci o nouă viziune a locului şi rolului pe care Internetul îl joacă în procesul de relaţionare dintre utilizatorul final şi emiţătorul unui mesaj. Prin interacţiunea celor dintâi cu cei din urmă, web-ul şi-a definit rolul de platformă colaborativă, în care conţinutul media nu este urmărit pasiv de destinatar, ci acesta poate interveni asupra materialului, poate face comentarii, acorda calificative şi forma comunităţi virtuale cu alţi utilizatori cu interese comune.

Social media în accepţiunea de azi apare odată cu crearea, de către Bruce şi Susan Abelson, a "Open Diary", o reţea de socializare care reunea utilizatorii de Internet care deţineau jurnale. De asemenea, a fost utilizat termenul de "weblog", care a fost trunchiat la "blog" un an mai târziu, de către un utilizator care a transformat cuvântul "weblog" într-o propoziţie - "we blog". Creşterea vitezei de navigare pe Internet a contribuit la sporirea popularităţii conceptului.

În anul 2003, respectiv în 2004, au fost create reţelele de socializare "Myspace" şi "Facebook", context în care termenul de "social media" a intrat în legitimate. Social media este urmarea firească a dezvoltării tehnologiilor web 2.0. Social media face posibilă comunicarea prin toate mediile online cunoscute, astfel că aceste comunităţi virtuale includ forumuri, lumi virtuale, social news organizations, comunităţi de împărtăşire a opiniilor, reţele sociale.

Autoarea lucrării „Advertising 2.0 - Social Media Marketing in a Web 2.0 World”, Tracy L.Turen, descrie o legătură foarte puternică între conceptul de social media şi cel de comunitate online. De fapt, ea defineşte termenul de social media referindu-se la cel de comunitate online, subliniind faptul că “social media se referă la comunităţi online care sunt participative, conversaţionale şi fluide. Aceste comunităţi permit membrilor să producă, să publice, să controleze, să critice, să ierarhizeze şi să interacţioneze cu conţinutul online”

Social Media este un termen care face referire la un cumul de activităţi, definite de 3 coordonate: tehnologie, interacţiune socială şi creaţie prin cuvinte, poze, video, audio. Social Media reprezintă un grup de genuri noi de media online care întrunesc următoarele caracteristici:

1. Participare: se încurajează contribuţia proprie de conţinut sau reacţiile (feedback-ul) asupra unui conţinut generat;

2. Comunitate: se permite formarea rapidă a comunităţilor, pe baza unor interese comune şi se facilitează comunicare în interiorul lor sau cu alte comunităţi;

3. Conversaţie: dacă vechile media se bazau pe o transmitere de informaţii într-un mod unidirecţional (informaţiile erau transmise către public fără a se aştepta un feedback din partea lui), în cazul social media comunicarea este bidirecţională (cu sens dublu – de la emiţător către receptor şi invers – rolurile se schimbă);

4. Onestitate: conţinutul publicat trebuie să fie sincer, la fel ca şi reacţiile generate, fără a exista cenzura sau restricţionarea accesului;

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 2 din 9

Page 3: T.4.3

5. Conectivitate: se permite circularea informaţiilor, prin folosirea link-urilor de legătură cu alte site, resurse sau oameni.

Principalele categorii ale social media pot fi identificate prin raportarea la instrumentele folosite pentru crearea/ diseminarea acestora, respectiv:

de comunicare (bloguri, micro bloguri); de colaborare (wikis, site-uri de răspunsuri); de recomandare (social news sites, servicii de bookmarking); site-urile multimedia (audio, partajare imagini şi video, livecasting); lumile virtuale (Second Life, World of Warcraft).Explozia cantităţii de date din Internet, adaptarea în consecinţă a tehnologiilor şi

virtualizarea fluxurilor de lucru au avut ca efect secundar specializarea tuturor domeniilor de activitate până la nivelul la care multe dintre aceastea au devenit dependente de mediul online.

Virtualizarea activităţii, în special în cadrul segmentelor în care este necesară interacţiunea directă a utilizatorilor/ beneficiarilor, permite integrarea şi interpretarea colaborativă a datelor, contribuţia fiecăruia dintre aceştia realizându-se în timp real şi concretizându-se în plus valoarea adăugată rezultatelor muncii.

Avantajul oferit de tehnologia integrată constă, în mare măsură, în relaţionările şi conexiunile extinse şi mult mai relevante realizate cu ajutorul instrumentelor specializate.

Prin intermediul funcţionalităţilor specifice Web 2.0, serviciile şi produsele îmbracă forme complexe, textul fiind însoţit de grafice/ hărţi interactive şi fişiere multimedia, care nu pot fi vizualizate decât online. Conţinutul multimedia creat, modificat şi partajat/ diseminat prin intermediul new media sau al social media poate fi identificat, filtrat şi accesat folosind diverse instrumente online, cele mai populare fiind motoarele de căutare.

Potrivit Merriam-Webster, multimedia reprezintă „o tehnică (precum combinarea de sunet, video şi text) pentru exprimarea ideilor (în comunicaţii, artă sau divertisment) în care mai multe media sunt implicate”1.

Motoarele de căutareMotoarele de căutare sunt instrumente care caută informaţii pe web. Acestea rulează

programe automatizate (“crawlers”, “bots” sau “spiders”) care parcurg web-ul în căutarea paginilor nou-apărute ce ar putea fi adăugate (indexate) în baza de date cu pagini web deja existente. Din fiecare pagină accesată extrag adresele web (url-urile), pe care le indexează ulterior, stocând toate cuvintele şi expresiile într-o bază de date, astfel încât acestea să fie reperabile pentru o căutare ulterioară. Orice cuvânt de pe acea pagină poate fi astfel căutat de un utilizator, odată ce pagina a fost salvată în baza de date, iar aceasta este modalitatea prin care teoretic se poate ajunge la orice document de pe web, folosind cuvinte-cheie şi expresii. Motorul de căutare citeşte codul sursă al paginii, care poate fi împărţit în două părţi: conţinut – vizibil utilizatorului şi constă în titluri, meniuri, text şi legături către alte pagini; sintaxe ale limbajului de programare –partea invizibilă utilizatorului, care constă în sintaxele de formatare a paginii, tag-urile meta, liniile de cod ale scripturilor, etc2.

Atunci când „robotul” identifică un site care încă nu a fost indexat, îl adaugă în baza sa de date care, cel mai frecvent, conţine titlul paginii, adresa web (URL), pagini complementare 1 http://www.merriam-webster.com/dictionary/multimedia 2 http://www.dream-webdesign.ro/blog/optimizare-seo/motoarele-de-cautare.html

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 3 din 9

Page 4: T.4.3

şi o porţiune a textului respectiv. De asemenea, roboţii salvează şi alte informaţii despre pagina respectivă, astfel încât căutarea să se poată face după diferite criterii: data ultimei indexări a paginii, a ultimei actualizări, sumarul paginii, titlul acesteia, limba de editare, caracterul public sau restrictiv pentru anumite categorii de cititori.

Deşi „roboţii” lucrează constant, căutarea unui site nou va lua mult timp deoarece, potrivit estimărilor, în prezent webul conţine aproximativ 20 de miliarde de pagini, dar mai există alte milioane de pagini pe web care trebuie revăzute. Motoarele de căutare re-indexează lent zonele acoperite şi periodic "curăţă" bazele de date: elimină, spre exemplu, erorile de tip “404”, cauzate de dispariţia unor pagini între două indexări. Totuşi, programele folosite de motoarele de căutare evită, de regulă, link-urile care duc către porţiuni "necartografiate" din web.

Dacă luăm în calcul şi specificul volatil al Internetului, respectiv faptul că site-urile dispar, se mută sau sunt modificate neîncetat, devine evident că până şi cele mai puternice motoare de căutare sunt depăşite, deoarece simpla păstrare "la zi" a bazelor de date deja existente se transformă într-o sarcină din ce în ce mai dificilă.

Exemple de motoare de căutare: Google, Yahoo, Excite, Alta Vista, WebCrawler, Alltheweb etc..

Instrumentele de căutare pot fi diferite: motor de căutare (search engine – Google), arborescent sau de tip director (directory - LookSmart), o combinaţie între tipurile arborescent şi instrument de căutare (directory/ search engine - Excite, Yahoo) şi multi-mecanism (multiengine - All-In-One, Metacrawler, Dogpile).

Caracteristicile serviciilor de căutareMotoarele de căutare nu văd bazele "ascunse" de date, paginile cu date dinamice (pe

care "refuză" să le indexeze) şi resursele care resping accesul roboţilor de indexare prin fişierele de tipul “robots.txt”, conţinutul unor fişiere PDF, conţinutul site-urilor care necesită autentificare, rezultatele obţinute în urma procesării la distanţă a unei cereri, resurse comerciale la care accesul este limitat de proprietar, resurse “non-web”.

Motoare de meta-căutare (metasearch engine)Un motor de meta-căutare transmite interogarea utilizatorului către alte motoare de

căutare şi apoi combină rezultatele primite de la acestea. De fapt, utilizatorul nu foloseşte doar un motor de căutare, ci o combinaţie de mai multe motoare de căutare simultan pentru a optimiza căutarea (ex. Dogpile este un motor de meta căutare).

După colectarea rezultatelor căutării de la toate serviciile apelate, motoarele de meta-căutare elimină duplicatele şi, conform unui algoritm propriu combină rezultatele într-o singură listă, acordându-le şi o rată de relevanţă. Deoarece majoritatea motoarelor de meta-căutare iau în considerare numai primele 10-20 de rezultate de la fiecare motor de căutare apelat, rezultatele retunate sunt foarte bune din punct de vedere al relevanţei. Din cauza diferenţelor dintre motoarele de căutare, nu pot fi aplicate sintaxe complexe de căutare în cazul motoarelor de meta-căutare, acestea nefiind recunoscute sau interpretate diferit. Motoarele de meta-căutare nu au propriile baze de date, ci le folosesc pe cele ale serviciilor apelate.

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 4 din 9

Page 5: T.4.3

Unele dintre cele mai cunoscute motoare de meta-căutare sunt: Dogpile – foloseşte Ask, Live, Google, şi Yahoo. IxQuick All-in one search AskJeeves Cyber411 GoshMe Inference Find Jux2 Mamma MetaCrawler

Directoare web Directoarele web (numite uneori şi subject directory - director de subiecte) sunt o

colecţie de pagini Web selecţionate şi organizate ierarhic în categorii de subiecte de către un editor uman. Directoarele nu sunt motoare de căutare, ci în principal liste de link-uri aranjate sistematic3. Deoarece sunt selectate de persoane, relevanţa este mare. Un concept şi mai selectiv este cel de bibliotecă virtuală, care este un director web ce include legături spre pagini cu informaţie de înaltă specializare, pe domenii alese de editor (bibliotecarul virtual).Serviciile de directoare acoperă şi indexează o porţiune mult mai mică din paginile web existente, comparativ cu motoarele de căutare, însă folosirea lor poate duce la regăsirea unor rezultate ale căutării mult mai relevante pentru utilizator. Cele mai extinse servicii de directoare web indexează cel mult câteva milioane de pagini, comparativ cu cele cîteva miliarde indexate de către motoarele de căutare mai importante. Serviciile de directoare nu interoghează direct paginile web, ci caută mai degrabă în interiorul bazei lor de date. Din acest motiv, rezultatul căutării poate duce la returnarea unor rezultate perimate, care uneori nu mai au relevanţă, pagina originală suferind între timp schimbări majore de conţinut sau poate chiar să dispară.

Open Directory ipl2 Digital Librarian: a librarian's choice of the best of the Web EiNET.net Infomine Internet Public Library The WWW virtual Library Yahoo .

Diferenţe între motoarele de căutare şi directoarele webMotoarele de căutare permit utilizatorului să folosească orice termeni de căutare

(combinaţie de termeni) doreşte, motorul căutând aceşti termeni în baza de date şi returnând paginile care conţin aceste combinaţii de termeni. Spre deosebire de motoarele de căutare,

3 http://rr.reuser.biz/#web%20Directories

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 5 din 9

Page 6: T.4.3

serviciile de directoare web au paginile organizate în baza de date pe subiecte. Paginile cu informaţia dorită pot fi selectate navigând prin această structură arborescentă a directoarelor. Navigarea prin structura directoarelor web poate fi un foarte bun start pentru căutarea informaţiei dorite, cu condiţia ca topicul ales sa fie unul inclus între subiectele directorului tematic (de exemplu regăsiţi cu uşurinţă un arbore de directoare dedicat sectorului educaţional în orice serviciu de directoare web, însă nu veţi găsi prea uşor un arbore de directoare dedicat consumului de alcool).

Două concepte sunt deosebit de importante în evaluarea listei de rezultate returnate după efectuarea căutărilor: rata de relevanţă (relevancy ranking), respectiv sumarul (abstract) ce însoţeşte legătura către pagină.

Rata de relevanţă (Relevancy Ranking)Paginile returnate în urma căutării sunt aproape întotdeauna ordonate pe baza

relevanţei lor, în conformitate cu termenii după care s-a efectuat căutarea. Algoritmii după care este cuantificată rata de relevanţă diferă de la un motor de căutare la altul şi, în general, nu sunt făcuţi publici. Paginile vor fi considerate cu atât mai relevante (şi vor fi afişate mai sus în lista cu rezultate) cu cât cuvintele cheie sunt regăsiţi de mai multe ori în acea pagină. Pe baza ratei de relevanţă sistemul care realiza căutarea va acorda fiecărui document ce conţine termenii doriţi o rată de relevanţă şi, în final, va afişa corespunzător acele pagini considerate a fi cu cea mai mare relevanţă. Cu toate acestea, lista cu rezultatele afişate este influenţată, cel puţin în cazul google.com, şi de comportamentul utilizatorilor care au efectuat anterior aceeaşi căutare sau căutări similare. Astfel, dacă unul dintre rezultatele afişate în urma unei căutări este accesat de utilizatori în detrimentul altor rezultate din listă, acel rezultat va fi considerat de google.com mai relevant decât celelalte şi va urca în lista afişată la căutări ulterioare.

Sumarul paginilor (Abstracts)În cazul celor mai multe servicii de căutare online putem observa că aproape fiecare

legătură spre o pagină considerată relevantă este însoţită de un sumar al conţinutului, multe servicii recurgând chiar la sublinierea termenilor căutaţi şi prezenţi în respectivul sumar. Însă, chiar şi atunci când există şi este afişat, acest rezumat al paginii este mult mai scurt decât conţinutul paginii aflat în baza de date web. De aceea de cele mai multe ori nu vom putea aprecia adevărata relevanţă a informaţiei conţinute în acea pagină decât accesând linkul respectiv.

Deep WebÎn mediul online, informaţiile se regăsesc atât în „Web-ul de suprafaţă – Surface Web”

(totalitatea site-urilor indexate de motoarele de căutare), cât şi în „Web-ul ascuns – Deep Web” (totalitatea surselor care nu sunt indexate de motoarele de căutare). Web-ul ascuns (Deep Web/ Dark Web) - deţine cea mai importantă pondere în web-ul actual (aproximativ 80%, de 4 ori mai mare decât Surface Web). Potrivit rezultatelor prezentate în raportul The Deep Web: Surfacing Hidden Value (Bergman, 2001) – care deşi este realizat în 2001, este considerat cel mai bun până astăzi (Pagliery, 2014) - se estimează că 54% din site-uri sunt baze de date.

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 6 din 9

Page 7: T.4.3

Totodată, regăsim şi intranet-uri private protejate cu parole, pagini private administrate de diverse companii care limitează accesul contra-cost la informaţii, documente în formate care nu pot fi indexate, enciclopedii, dicţionare, jurnale academice4. Cea mai mare parte a Dark Web-ului o reprezintă bazele de date academice, guvernamentale sau ale unor mari biblioteci, organizaţii internaţionale, companii etc. O bună parte din aceste date nu poate fi accesată decât de persoanele autorizate.

Resursele Deep Web-ului pot fi clasificate in cateva categorii generale:- pagini cu continut dinamic: pagini dinamice care apar ca raspuns la un anumit tip

de cautare sau care sunt accesate prin formulare web (câmpuri de text). Explorarea acestor pagini e dificilă daca nu suntem familiarizaţi cu conţinutul domeniului.

- pagini care nu sunt legate de altele prin link-uri, acest lucru împiedică programele de tip spider să le acceseze conţinutul.

- web privat: pagini care necesită un nume de utilizator şi parolă.- web contextual: pagini ale caror conţinut variază în funcţie de contextul accesării

(clasa de I.P.-uri a clientului sau secvenţa de navigare precedentă).- pagini cu conţinut limitat: pagini cu acces limitat tehnic (folosesc programe care

exclud accesul roboţilor şi împiedică motoarele de căutare să le indexeze şi să creeze copii cache).

- script-uri: pagini ce sunt accesibile doar prin link-uri de JavaScript, dar şi alte conţinuturi dinamice descărcate de pe serverele web (generare automată de linkuri sau coduri de acces).

- conţinut non-HTML/ text: conţinut textual codat în fişiere multimedia sau alte formate specifice ce nu sunt suportate de motoarele de cautare.

- pagini accesibile doar prin intermediul anumitor instrumente şi reţele (ex. TOR).

Motoare de căutare în Deep WebComplete Planet: această pagină se auto-intitulează “uşa din faţă a Deep Web-ului”.

Indexează în jur de 70.000 de baze de date şi motoare de căutare specifice, care nu sunt regăsite de motoarele „normale” de căutare.

Infoplease: portal de informatii ce contine enciclopedii, almanahuri, atlase şi biografii.IncyWincy: se comportă asemenea unui meta-motor de căutare deoarece se foloseşte

de alte motoare de căutare şi apoi filtrează rezultatele.Scirus: e axat doar pe stiinta. E un motor de cautare puternic ce indexeaza jurnale,

site-uri personale ale savanţilor, materiale de curs şi reţele instituţionale.TechXtra: motor de cautare ce e axat pe inginerie, matematica si I.T. Indexeaza stirile

din aceste domenii, oferte de munca, rapoarte tehnice, documente electronice, resurse de studiu si cercetare si alte article si informatii relevante.

The WWW Virtual Library: aceasta pagină e considerata a fi cel mai vechi catalog de pe web, fiind creat de către Tim Berners-Lee, creatorul web-ului. Acest motor listează o

4 "Worldcrunch." Welcome To The Deep Web: The Internet's Dark And Scary Underbelly. Disponibil online la http://www.worldcrunch.com/tech-science/welcome-to-the-deep-web-the-internet-039-s-dark-and-scary-underbelly/invisible-internet-tor-onion-network/c4s10150/#.UzPOgKIVdzg. [Accesat la 02.05.2014.]

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 7 din 9

Page 8: T.4.3

multime de resurse relevante despre o multime de subiecte. Se poate folosi bara de cautare sau se pot explora directoarele verticale ale subiectelor afişate în ordine alfabetică.

The Hidden Wiki afişează directoare şi motoare de căutare din domeniul .onion, accesibil prin intermediul TOR.

The Tor Library – diverse resurse din domeniul .onion, accesibil prin intermediul TOR.

Alte tipuri de motoare de căutare Motoare de căutare federativă (Federated Search Engines) reprezintă programe care

lansează căutări pe mai multe resurse simultan şi în timp real, deosebit de metamotorul de căutare care caută prin indexuri statice.

MetaCrawler - www.zoo.com/Zoo-Site/ foloseşte Yahoo şi Google. Biznar beta - http://biznar.com/biznar/ , este specializat pe zona de afaceri, având

opţiunea efectuării de căutări pe companii, industrii şi pieţe, în ştiri şi media sociale; ZACK Gateway - opus.tu-bs.de/zack/index.en.html este un motor federativ de căutare

specializat în baze de date bibliografice.

Motoare de căutare serială (Serial Search Engines) – trimite cererea utilizatorului către mai multe motoare de căutare simple în serie, fără rescrierea interogării (ex. TwinGine - twingine.com).

Motoare de clusterizare (Cluster Search Engines) - rezultatele căutărilor sunt prezentate sub formă de clustere, grupate tematic.

Carrot2 - search.carrot2.org/stable/search, rezultatele pot fi afişate, la alegere, sub forma de foldere sau sub forma de clustere;

WebClust.com - www.webclust.com.

Motoare de căutare în timp real (Real-Time Search Engines)/ în anumite social media (SNS Engines) sunt acele aplicaţii care lansează căutări în timp real, la nivelul reţelelor de socializare.

Topsy - topsy.com, este axat pe Twitter. Faţă de alte motoare de căutare (google.com, yahoo.com) afişează în lista de rezultate postări recente (o oră), care încă nu au fost indexate de motoarele de căutare „normale”.

48ers - www.48ers.com, foloseşte ca surse diverse social media (Twitter, Facebook, Dig, Delicious).

Bibliografie

1. BERGMAN, Michael K. "WHITE PAPER: The Deep Web: Surfacing Hidden Value." Journal of Electronic Publishing 7, no. 1 (12, 2001). doi:10.3998/3336451.0007.104.

2. GUŢU, Dorina, New Media, Bucureşti, Editura Tritonic, 2007.3. KAPOUN, Jim, "Teaching undergrads WEB evaluation. A guide for library instruction",

http://www.ala.org/cfapps/archive.cfm?path=acrl/undwebev.html.4. NORMAN, Dax R. “How to Identify Credible Sources on The Web”,

https://sites.google.com/site/daxrnorman2/.

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 8 din 9

Page 9: T.4.3

5. Pagliery, Jose. "The Deep Web You Don't Know about." CNNMoney. March 10, 2014, http://money.cnn.com/2014/03/10/technology/deep-web/index.html?iid=HP.

6. Lev Manovich - “The Language of New Media”, 2001, www.manovich.net/LNM/Manovich.pdf.

7. Sebe, Marius, Intelligence din surse deschise OSIT, Bucureşti, 20148. "Worldcrunch." Welcome To The Deep Web: The Internet's Dark And Scary Underbelly.

http://www.worldcrunch.com/tech-science/welcome-to-the-deep-web-the-internet-039-s-dark-and-scary-underbelly/invisible-internet-tor-onion-network/c4s10150/#.UzPOgKIVdzg.

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 9 din 9