t.4.2

21
Investeşte în oameni! Fondul Social European Proiect cofinanţat din Fondul Social European prin Programul Operaţional Sectorial Dezvoltarea Resurselor Umane 2007 – 2013 Axa prioritară 1 „Educaţia şi formarea profesională în sprijinul creşterii economice şi dezvoltării societăţii bazate pe cunoaştere” Domeniul major de intervenţie 1.3 „Dezvoltarea resurselor umane din educaţie şi formare profesională” Titlul proiectului: „OSCINT XXI - Inovare pentru calitate în învăţământul preuniversitar din regiunile Sud Vest Oltenia, Bucureşti-Ilfov, Sud-Est, Sud Muntenia” Cod Contract: POSDRU/157/1.3/S/140010 Beneficiar: Academia Naţională de Informaţii „Mihai Viteazul” Tema T.4.2. Sistemul de surse în cadrul procesului de colectare. Resurse, metode şi tehnici specifice procesului de colectare a informaţiilor din surse deschise Strategii şi metode de formare Pentru activităţile face-to-face: prelegere, dezbatere şi problematizare. Pentru activităţile online: învăţarea colaborativă, aplicaţii practice şi workshop-uri. Conţinut I. Sistemul de surse în cadrul procesului de colectare Anterior apariţiei Internetului, activitatea OSINT se concentra pe exploatarea surselor deschise de informare clasice, având ca avantaje fluxul constant de informaţii, provenit dintr-un număr relativ mic de surse, formate consacrate de livrare a produselor şi notorietatea autorilor. Progresul tehnologic a generat trecerea de la „traditional media” la „new media”, prin dezvoltarea Internetului, şi ulterior la ACADEMIA NAȚIONALĂ DE INFORMAȚII „MIHAI VITEAZUL” Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA POSDRU/157/1.3/S/140010 Pagina 1 din 21

Upload: mihai-traian

Post on 14-Dec-2015

223 views

Category:

Documents


2 download

DESCRIPTION

platforma online

TRANSCRIPT

Page 1: T.4.2

Investeşte în oameni!Fondul Social EuropeanProiect cofinanţat din Fondul Social European prin Programul Operaţional SectorialDezvoltarea Resurselor Umane 2007 – 2013Axa prioritară 1 „Educaţia şi formarea profesională în sprijinul creşterii economice şi dezvoltării societăţii bazate pe cunoaştere”Domeniul major de intervenţie 1.3 „Dezvoltarea resurselor umane din educaţie şi formare profesională”Titlul proiectului: „OSCINT XXI - Inovare pentru calitate în învăţământul preuniversitar din regiunile Sud Vest Oltenia, București-Ilfov, Sud-Est, Sud Muntenia”Cod Contract: POSDRU/157/1.3/S/140010Beneficiar: Academia Naţională de Informaţii „Mihai Viteazul”

Tema T.4.2. Sistemul de surse în cadrul procesului de colectare. Resurse, metode şi tehnici specifice procesului de colectare a informaţiilor din surse deschise

Strategii şi metode de formare Pentru activităţile face-to-face: prelegere, dezbatere şi problematizare. Pentru activităţile online: învăţarea colaborativă, aplicaţii practice şi workshop-uri.

Conţinut

I. Sistemul de surse în cadrul procesului de colectare Anterior apariţiei Internetului, activitatea OSINT se concentra pe exploatarea surselor

deschise de informare clasice, având ca avantaje fluxul constant de informaţii, provenit dintr-un număr relativ mic de surse, formate consacrate de livrare a produselor şi notorietatea autorilor.

Progresul tehnologic a generat trecerea de la „traditional media” la „new media”, prin dezvoltarea Internetului, şi ulterior la „social media”, rezultând o explozie a volumului, valorii şi accesibilităţii informaţiilor obţinute din surse deschise. Începând cu anii `90, când Internetul a devenit comercial, sursele deschise de informare s-au înmulţit, conţinutul şi modul de livrare a acestuia s-au diversificat, iar identificarea autorilor a devenit o problemă pe fondul anonimatului relativ oferit de mediul virtual.

Odată cu dezvoltarea tehnologiei şi implementarea, din anul 2004, a Web 2.0 (interactivitatea site-urilor), activitatea OSINT s-a confruntat cu provocările reprezentate de numărul imens de surse de informare, creşterea exponenţială a volumului de informaţii şi diversificarea formatelor şi a metodelor de livrare a acestora, anonimatul utilizatorilor (deveniţi autori), precum şi de răspândirea virală a informaţiilor (ceea ce implică dificultăţi în regăsirea sursei primare).

1. În prezent, există două mari categorii de surse de informare deschise, diferenţiate prin suportul de difuzare, caracteristicile conţinutului şi modul de diseminare: sursele tradiţionale şi cele online.

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 1 din 14

Page 2: T.4.2

1.1 Sursele deschise de informare tradiţionale publicaţii periodice - ziare, reviste, cărţi (de specialitate, anuare), materiale

documentare, broşuri, studii, hărţi, fotografii; posturi de radio şi tv cu transmisie în eter; date oficiale - rapoarte guvernamentale, bugete, statistici demografice, audieri,

dezbateri legislative, conferinţe de presã, discursuri; date şi informaţii din mediile profesionale şi academice - conferinţe, simpozioane,

documente elaborate de asociaţii profesionale, lucrãri academice şi ale experţilor din diverse domenii;

date geospaţiale - imagini din satelit, hãrţi, atlase, date geodezice, topografice, informaţii despre mediu;

literatura gri - “Informaţia produsă la toate nivelurile mediului guvernamental, academic, de business şi industrial, în format electronic şi tipărit, a cărei distribuţie nu este controlată de edituri comerciale”1.

Sursele deschise de Informare online denumite generic new media, reprezintă orice produs media digital care este

interactiv şi distribuit prin reţele informatice sau totalitatea textelor, sunetelor, imaginilor şi elementelor grafice prelucrate pe computer şi reunite în baze de date (enciclopedii, biblioteci, bloguri, forumuri, lumi virtuale, reţele sociale, ediţii online ale mass-media clasică, portaluri informaţionale, portaluri de partajare fişiere, etc.)2.

unul dintre cele mai importante segmente ale new media este constituit de social media.

Sursele tipărite Cu toate că Internet-ul a devenit sursa principală a OSINT datorită volumului şi

diversităţii de informaţii şi a multiplelor formate de livrare a acestora, sursele tipărite continuă să fie o resursă informaţională importantă. Cărţile, bibliografiile, periodicele, jurnalele ştinţifice, articolele de cercetare şi recenziile au un aport deosebit atât din punctul de vedere al conţinutului, cât şi al identificării de noi surse, termeni şi concepte cheie, problematici şi experţi din domenii diverse.

Surse tipărite

Resurse Utilitate

Cărţi - furnizează analize, sinteze;- prezintă contextul şi înţelegerea istorică;- prin intermediul referinţelor oferă informaţii despre alte

lucrări şi autori;

Bibliografii - prin informaţiile prezentate facilitează activitatea de

1 Guţu, Dorina - New Media, Editura Tritonic, Bucureşti 20072 Idem 1

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 2 din 14

Page 3: T.4.2

cercetare/ documentare;- oferă titluri de lucrări grupate tematic;- orientează cercetarea/ documentarea prin furnizarea de

termeni cheie şi identificarea de materiale.

Jurnale ştiinţifice şi recenzii ale acestora– jurnale interne ale corporaţiilor

- Scrise de experţi acreditaţi, de obicei folosind un vocabular specializat;

- Articolele tind să fie mai lungi, mai detaliate şi oferă întotdeauna citate;

- Destinate studenţilor, academicienilor, şi experţilor.- Exemplu: Security Journal, International Journal of

Intelligence and Counterintelligence

Publicaţii periodice (populare)– cotidiane, ziare, reviste de ştiri– reviste de călătorii– reviste economice– reviste dedicate comerţului şi industriei– reviste de tehnologie.

- Scrise de jurnalişti sau experţi folosind un vocabular simplu;

- Articolele sunt mai scurte şi abordează o tematică extinsă;- Sursele folosite sunt mult mai rar incluse;- Conţinutul se adresează publicului larg.Exemple: Adevărul, The Guardian, Newsweek,

Articole de cercetare - Prezintă rezultatele unui singur studiu sau experiment;- Detaliază datele colectate, metodele folosite şi rezultatele;- Sunt întotdeauna însoţite de rezumat.

Recenzii de articole - Sumarizează rezultatele mai multor studii şi experimente;- Identifică sau critică trendurile emergente sau modelele

din domeniu;- Autorul nu este semnatarul articolelor recenzate.

Sursele tipărite (adaptare după Pallaris,C., 2010)

Literatura gri - “nu reprezintă un fenomen nou, caracteristic sfârşitului de secol XX, reprezentând, de fapt, un gen de literatură încă din anii 1920, în special în cercurile ştiinţifice din Europa”3.

Literatura gri a fost, mult timp, sinonimă cu “literatura rapoartelor”. Descoperirile ştiinţifice şi dezvoltarea armamentului sofisticat în timpul celui de-Al Doilea Război Mondial, de la tancuri la arma atomică, au făcut ca acurateţea şi viteza comunicaţiilor să devină o necesitate. Astfel, rapoartele tehnice prin intermediul cărora erau diseminate informaţiile respective au început să fie folosite pe scară largă. În deceniile care au urmat, avântul luat de cercetarea ştiinţifică şi tehnologică a fost folosit, în special, în domeniul militar. Nivelul de clasificare a documentelor, impus de nevoile de securitate, au făcut ca literatura gri să dobândească o importanţă aparte, dezvoltându-se ca mediu separat de comunicare, în care materialele erau publicate în afara canalelor convenţionale.

3 Augur, Charles P., 1989, “Informaţion Sources in Grey Literature”, Londra, Bowker-Saur

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 3 din 14

Page 4: T.4.2

Încă din anii ’70, literatura gri era deja recunoscută ca mijloc de diseminare pentru multe organizaţii şi considerată o lectură importantă pe tot globul4.

LITERATURA GRICeea ce este “gri” pentru un expert, nu este pentru altul5. Resurse Utilitate -Comunicate de presă– Rapoarte tehnice– Lucrări şi proceduri în cadrul Conferinţelor– Buletine de ştiri, broşuri şi fişe informative ale companiilor– Teze academice– Cataloage, broşuri– Manuale de instrucţiuni şi de proiectare– Coduri de practici– Ghiduri– Drafturi/ lucrări nepublicate– Rapoarte de activitate.

Literatura gri poate acoperi golurile din cunoaştere şi ajută la identificarea unor noi surse de informaţii valoroase (umane, digitale, sau altele).– deseori gratuită;– informaţii foarte relevante şi specializate, ce acoperă, de obicei, subiecte de nişă;– furnizează expertiză pe subiecte;– poate ajuta la identificarea cuvintelor-cheie;– poate oferi avantajul competitiv.

Dezavantaje– volumul informaţiilor depăşeşte capacitatea noastră de a le procesa cu eficienţă;– exploatarea necesită cunoaşterea subiectului şi a surselor;– de cele mai multe ori nu este disponibilă prin canalele normale de distribuţie;– conţinutul intern elaborat de organizaţii este rar distribuit publicului;– foarte rar există control bibliografic (număr ISBN) ;– formatele şi citatele pot fi inconsistente;– nu sunt întotdeauna disponibile online;– rar indexate de biblioteci sau baze comerciale;– fără recenzii realizate de omonimi ai autorilor;– au natură tranzitorie, efemeră;- calitatea materialelor variază considerabil.

1.2. Sursele deschise de informare onlineDenumite generic new media, reprezintă orice produs media digital care este

interactiv şi distribuit prin reţele informatice sau totalitatea textelor, sunetelor, imaginilor şi elementelor grafice prelucrate pe computer şi reunite în baze de date (enciclopedii, biblioteci, bloguri, forumuri, lumi virtuale, reţele sociale, ediţii online ale mass-media clasică, portaluri informaţionale, portaluri de partajare fişiere, etc.)6 . Unul dintre cele mai importante segmente ale new media este constituit de social media.

Folosind ca principal vector de dezvoltare Internetul şi beneficiind de avantajele acestui mediu - costuri scăzute, arie largă de adresabilitate, accesul instantaneu la informaţii, posibilităţile multimedia de prezentare a materialelor, interactivitatea ce a permis transformarea audienţei în autori - new media au un aport deosebit la schimbarea modelului

4 http://www.moyak.com/papers/grey-technical-literature.html5 Pallaris, Chris – „OSINT Course 2010”, Cea de a 8-a Reuniune a Clubului de la Budapesta, Bruxelles, septembrie 20096 Guţu, Dorina - New Media, Editura Tritonic, Bucureşti 2007

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 4 din 14

Page 5: T.4.2

clasic al comunicării de masă, oferind posibilitatea creării de comunităţi virtuale şi reţele sociale online, în cadrul cărora indivizi cu preocupări distincte, din zone geografice variate, se întâlnesc, se informează şi discută.

În mediul online, informaţiile se regăsesc atât în „Web-ul de suprafaţă – Surface Web” (totalitatea site-urilor indexate de motoarele de căutare), cât şi în „Web-ul ascuns – Deep Web” (totalitatea surselor care nu sunt indexate de motoarele de căutare).

Sursele din Web-ul de suprafaţă se clasifică în funcţie de felul în care sunt structurate: baze de date electronice - din punct de vedere al importanţei pentru problematicile de securitate naţională, bazele de date cu materiale analitice ca Jane’s, Stratfor, Lexis Nexis, Oxford Analytica, etc. reprezintă un interes deosebit; enciclopedii electronice - prezintă informaţia structurată pe domenii, beneficiind de avantajul modulului de căutare pe cuvinte cheie; portaluri - site-uri ce grupează resursele web pe categorii, oferind un punct de pornire în navigare); site-uri de conţinut - reprezintă cele mai răspândite tipuri de site-uri; aici, informaţia este structurată pe categorii şi subcategorii, respectându-se, în principal, principiul grupării tematice a articolelor; site-uri de ştiri - specie de site-uri de conţinut în care informaţia este reprezentată de „ştiri”, iar frecvenţa de actualizare este cel puţin zilnică; ediţii electronice ale presei tradiţionale - varianta online a ziarelor, revistelor, staţiilor de radio şi televiziune, informaţia beneficiind de interactivitatea conferită de spaţiul virtual; site-uri Foto/Video sharing - pagini web pe care informaţiile publicate de către utilizatori sunt exclusiv în format foto/video; agenţii de ştiri - transmiterea în format electronic a fluxurilor de ştiri; bloguri – site-uri web care conţin reflecţii personale, comentarii şi hyperlink-uri frecvent oferite de autor7. Acest tip de surse este vectorul de forţă al curentului „Web 2.0”, caracterizat prin interactivitate crescută şi prin implicarea utilizatorilor în crearea de conţinut; forumuri - aplicaţii web, unde utilizatorii înregistraţi pot iniţia şi întreţine discuţii online pe anumite teme; comunităţi virtuale - reţele de socializare în cadrul cărora utilizatorii sunt încurajaţi să realizeze conţinut text, foto sau video.

Web-ul ascuns (Deep Web/ Dark Web) - deţine cea mai importantă pondere în web-ul actual (aproximativ 80%, de 4 ori mai mare decât Surface Web). Potrivit rezultatelor prezentate în raportul The Deep Web: Surfacing Hidden Value (Bergman, 2001) – care deşi este realizat în 2001, este considerat cel mai bun până astăzi (Pagliery, 2014) - se estimează că 54% din site-uri sunt baze de date. Totodată, regăsim și intranet-uri private protejate cu parole, pagini private administrate de diverse companii care limitează accesul contra-cost la informaţii, documente în formate care nu pot fi indexate, enciclopedii, dicţionare, jurnale academice8.

Cea mai mare parte a Dark Web-ului o reprezintă bazele de date academice, guvernamentale sau ale unor mari biblioteci, organizaţii internaţionale, companii etc. O bună parte din aceste date nu poate fi accesată decât de persoanele autorizate.

Resursele Deep Web-ului pot fi clasificate în câteva categorii generale: pagini cu conţinut dinamic: pagini dinamice care apar ca răspuns la un anumit tip de căutare sau care

7 "Blog." Merriam-Webster., online la http://www.merriam-webster.com/dictionary/blog [accesat la 19.04. 2014.]8 "Worldcrunch." Welcome To The Deep Web: The Internet's Dark And Scary Underbelly. Disponibil online la http://www.worldcrunch.com/tech-science/welcome-to-the-deep-web-the-internet-039-s-dark-and-scary-underbelly/invisible-internet-tor-onion-network/c4s10150/#.UzPOgKIVdzg. [Accesat la 02.05.2014.]

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 5 din 14

Page 6: T.4.2

sunt accesate prin formulare web (câmpuri de text). Explorarea acestor pagini este dificilă, dacă nu suntem familiarizaţi cu conţinutul domeniului; pagini care nu sunt legate de altele prin link-uri, ceea ce impiedică programele de tip “spider” să le acceseze conţinutul; web privat: pagini care necesită abonarea sau creare unui cont de utilizator, pentru a putea fi accesate sau vizualizate în întregime; web contextual: pagini al căror conţinut variază în funcţie de contextul în care sunt accesate (clasele de IP ale clientului sau secvenţa de navigare precedentă); pagini cu conţinut limitat: pagini cu acces limitat tehnic (folosesc programe care exclud accesul roboţilor şi împiedică motoarele de căutare să le indexeze şi să creeze copii “cache”); conţinut scriptat: pagini ce sunt accesibile doar prin link-uri de JavaScript, dar şi alte conţinuturi dinamice descărcate de pe serverele web via Flash sau AJAX; conţinut non-HTML/text: conţinut textual codat in fişiere multimedia sau alte formate specifice, ce nu sunt suportate de motoarele de căutare.

Social MediaPe măsură ce social media continuă să evolueze iar utilizarea lor se modifică şi

extinde, la fel se întâmplă şi cu definiţia social media. Acest fenomen este determinat în special de legătura dintre social media şi tehnologia şi platformele care fac posibilă crearea de conţinut, colaborarea şi schimburile dintre participanţi şi public.

Termenul se referă atât la conţinutul generat de utilizatori, cât şi la instrumentele folosite pentru crearea şi publicarea acestuia. Principalele categorii ale social media sunt instrumentele: de comunicare (bloguri, microbloguri); de colaborare (wikis, site-uri de răspunsuri); de recomandare (social news sites, servicii de bookmarking); site-urile multimedia (audio, partajare imagini şi video, livecasting, etc.) şi lumile virtuale (Second Life, World of Warcraft).

● Blogurile – au constituit motorul dezvoltării Web-ului interactiv. În prezent, există peste 200 de milioane de bloguri, iar 54% dintre blogeri postează zilnic9. Datorită implementării aplicaţiilor software Web 2.0, blogurile au devenit interactive, cititorii având posibilitatea să posteze materiale proprii şi comentarii, formând astfel comunităţi online centrate în jurul unui blog. Concomitent, s-a înregistrat atât diversificarea subiectelor abordate, cât şi specializarea blogurilor pe anumite domenii (business, branding, cultură, călătorii, design, divertisment, IT, jurnalism, media, medicină, politică, PR, tehnologie, social, sport, etc.). Unele bloguri au deja audienţe mai mari decât mass-media tradiţională.

● Wikis - site-urile de acest tip folosesc platforma digitală gratuită ”MediaWiki”, implementată şi pe pagina enciclopediei ”Wikipedia”. În urma dezvoltării ”MediaWiki”, enciclopediile electronice au cunoscut un adevărat ”boom”. ”Wikis” sunt caracterizate de instrumentele dedicate lucrului colaborativ, cu ajutorul cărora utilizatorii pot elabora în comun conţinutul. Aceştia pot adăuga, şterge sau modifica informaţia afişată fără a cunoaşte limbaje de programare. ”Wikis” combină un mediu de discuţii cu o bibliotecă electronică, un sistem de mail, un chat room şi un instrument de colaborare transparent. Paginile păstrează ultimele modificări, astfel încât vizitatorii care nu sunt de acord să poată reveni la versiunile anterioare şi să corecteze greşelile.

9 http://www.digitalbuzzblog.com/the-social-media-revolution-visualised/

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 6 din 14

Page 7: T.4.2

● Site-urile multimedia (audio, partajare imagini şi video, livecasting, etc.) au ca exponenţi principali ”YouTube”, ”LiveLeaks”, ”MetaCafe”, ”Dailymotion” (fişiere video postate de utilizatori – persoane sau instituţii/ organizaţii) şi ”Flickr”, ”Picassa”, ”Photobucket” (fişiere foto).

Reţele socialeSite-urile de reţele sociale, de multe ori cunoscute doar ca "social media", se referă la

un număr de site-uri de internet care au fost înfiinţate pentru a permite şi a încuraja utilizatorii să creeze reţele de cunoştinţe şi, de asemenea, să partajeze mesaje şi materiale audiovizuale, de multe ori la dispoziţia unui public mai larg (McQuail, 2010).

În prezent, acestea completează potenţialul Internetului: conectează oamenii la nivel global. Reţelele sociale reprezintă un fenomen de masă, principalele site-uri de acest tip având, cumulat, peste un miliard de utilizatori. Dintre aceştia, în 2014, peste 1.184 de miliarde au conturi pe ”Facebook”, cea mai mare reţea socială online.Potrivit cercetătorului specializat în media socială, Danah Boyd, din cadrul centrului de cercetare „Microsoft Research New England”, reţelele sociale reprezintă ultima generaţie de spaţiu public mediat, spaţiul de întâlnire şi interacţiune publică mediată de tehnologie.

Caracteristici Oferă utilizatorilor metode noi şi variate de comunicare, inclusiv prin aplicaţiile

dedicate lansate pentru platformele mobile (iOS, Android, Symbian); Permit crearea unor profiluri personale şi structurarea prietenilor în grupuri

personalizate, cu diferite grade de acces la informaţiile postate; Comunicarea poate fi şi de tip “1 la 1” sau generalizată, toţi prietenii utilizatorului

având acces la informaţiile postate pe pagina acestuia; Asemeni celorlalte instrumente de comunicare, reţelele de socializare au seturi de

reguli, convenţii şi practici; Datorită potenţialului deţinut, reţelele de socializare au devenit un puternic

instrument de marketing, fiind folosite de companii, organizaţii şi persoane publice pentru diverse campanii de promovare.

REŢELE SOCIALE

Avantaje Dezavantaje

- diversitatea subiectelor

- identificarea experţilor, actorilor și instituţiilor-cheie, precum și a știrilor sau a altor materiale relevante;

- accesul la conversaţii sau asociaţii profesionale (prin intermediul accesării grupurilor);

- anonimatul relativ al utilizatorilor

- cantitate mare de informaţii

- un număr mare de grupuri sunt de o calitate îndoielnică

- setările de securitate și restricţionarea/ limitarea accesului la informaţiile postate

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 7 din 14

Page 8: T.4.2

- urmărirea activităţii persoanelor relevante;

- identificarea relaţiilor dintre persoane, etc..

doar la prieteni sau membrii unui grup.

Reţele sociale. Avantaje vs Dezavantaje

2. Constituirea unui sistem de surseSistemul de surse este format din totalitatea surselor deschise de informare

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 8 din 14

STATISTICI - Internetul în anul 2013-2014

Reducerea costurilor de conectare la Internet, acoperirea largă a reţelelor de comunicaţii și dinamismul

înregistrat de segmentul IT reprezentat de dispozitivele mobile au generat o amplificare a expansiunii

mediului virtual, constând în apariţii de noi site-uri, înmulţirea numărului de conturi pe reţelele de

socializare, creșterea fluxului informaţional și cantităţi imense de conţinut multimedia:

● Numărul total al site-urilor în 2013 a fost de 759 de milioane;

● Numărul conturilor de e-mail – 3,9 miliarde în 2013;

● Numărul utilizatorilor de Internet la nivel global – 2,7 miliarde în martie 2014;

● Numărul căutărilor pe Google, în anul 2013 – 2.161 miliarde în ianuarie 2014;

● Numărul blogurilor (postate pe Internet, fără cele de pe reţelele interne) - 152 de milioane în

2013;

● Numărul lunar de useri activi pe ”Twitter” - 232 de milioane în ianuarie 2014;

● Media zilnică a tweets trimise în anul 2012 – 175 de milioane în ianuarie 2014;

● Numărul utilizatorilor ”Facebook” – 1,184 miliarde în ianuarie 2014;

● Numărul de membri ”LinkedIn”, în ianuarie 2014 – 259 de milioane;

● Numărul global de utilizatori de telefon mobil – 6,57 miliarde în ianuarie 2014;● Numărul de utilizatori Vimeo – peste 100 de milioane în 2013.

Surse: "Social, Digital & Mobile in 2014." We Are Social Singapore RSS. 2014. http://wearesocial.sg/blog/2014/01/social-digital-mobile-2014/; "World Internet Users Statistics Usage and World

Population Stats." World Internet Users Statistics Usage and World Population Stats. Accesat Mai 12, 2014. http://www.internetworldstats.com/stats.htm.; "ITU: Committed to Connecting the World." ITU. , 2014. http://www.itu.int/en/Pages/default.aspx.

Page 9: T.4.2

exploatate de o organizaţie în scopul îndeplinirii obiectivelor şi atribuţiilor specifice. În cadrul unui SSD, sursele sunt grupate pe diverse criterii şi taxonomii, în funcţie de:

● format (tipărite, audio-video, online – blog, portal informaţional sau partajare multimedia, forum, IPTV, reţea de socializare)

● ţara de apariţie● limba de difuzare● domeniul abordat● tip (sursă specializată, generalistă)● acces (gratuit, restricţionat)● periodicitate.Taxonomia este reprezentată, în acest caz, de metadatele atribuite surselor pentru a

descrie criteriile stabilite pentru descrierea acetora.

Structurarea surselor din cadrul unui SSD are nu numai rolul de a organiza conţinutul, ci serveşte şi la facilitarea regăsirii informaţiilor. Astfel, prin selectarea a două sau mai multe criterii folosite pentru gruparea surselor (ex.: ţara de apariţie, domeniu şi format) putem consulta doar sursele dintr-o singură ţară, specializate pe domeniul ales, şi doar cele în formatul dorit (ex.:surse din Franţa, domeniul educaţie, format blog).

II. Resurse, metode si tehnici specifice procesului de colectare a informatiilor

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 9 din 14

Page 10: T.4.2

din surse deschiseActivitatea de colectare a informaţiilor din surse deschise a fost influenţată, în mod

direct, de evoluţia tehnologiei informaţiei şi a comunicaţiilor, atât din perspectiva provocărilor reprezentate de creşterea numărului de surse şi a diversificării mijloacelor de diseminare a informaţiilor, cât şi din cea a instrumentelor dezvoltate şi implementate în procesul OSINT.

Scriitorul şi futurologul american, Alvin Toffler sintetizează într-o manieră reuşită transformarea societăţii umane sub influenţa tehnologiei informaţiei în teza celor trei valuri ale civilizaţiei, de la societatea agricolă la era informaţiei. Toffler împarte istoria în trei perioade principale, definite în funcţie de schimbarea mijloacelor de menţinere a puterii, de creare a bogăţiei şi de manevrare a războiului. Tehnologia este cauza acestor tranziţii, pentru că odată cu introducerea noilor tehnologii se schimbă întreaga bază a bogăţiei (producţia) şi a puterii (potenţialul pentru putere economică şi distrugere). De asemenea, aceste schimbări între valuri susţin potenţialul schimbării rapide a ordinii globale. Fiecare nou val împarte statele naţiune în categorii diferite, aflate în diverse stadii de dezvoltare, societăţile aflate în era informaţiei fiind al treilea val. Potrivit lui Toffler, ultimele decenii ale secolului trecut reprezintă tranziţia către era informaţiei. Aici, informaţia reprezintă resursa centrală pentru producerea bogaţiei şi deţinerea puterii militare, bogaţia este bazată pe deţinerea informaţiei, inclusiv pe livrarea de produse bazate pe cunoaştere, iar conflictele sunt bazate pe competiţii informaţionale, în loc de ideologii şi economii.   

Cu toate că automatizarea unor activităţi sau procese şi facilitarea altora reprezintă beneficii însemnate pentru etapa de colectare/ procesare, volumul mare al fluxului informaţional reprezintă un factor care generează constant presiuni asupra organizaţiilor/ departamentelor OSINT - reflectate prin nevoia de specializare în domenii variate a personalului şi de achiziţionare de produse software şi hardware costisitoare. Alte provocări sunt reprezentate de multiplicarea platformelor de publicare şi diseminare a conţinutului, inclusiv prin intermediul social media - reţele de socializare, forumuri, bloguri şi camere de chat; livrarea conţinutului în formate diferite şi în diverse limbi, precum şi modificarea constantă a acestuia şi volatilitatea surselor.  

O altă provocare majoră este reprezentată de Deep Web (Dark Web), acea parte a Internetului care nu este indexată de motoarele de căutare şi pentru accesarea căreia sunt necesare acţiuni efectuate de către utilizator (logare, interogare manuală).

Pe lângă dificultatea reprezentată de colectarea şi procesarea datelor, un alt aspect esenţial al cercetării mediului Internet vizează anonimizarea utilizatorilor şi a termenilor de căutare folosiţi, pentru evitarea expunerii identităţii colectorilor şi a domeniului investigat.  Creşterea fenomenală a numărului de date şi opinii publicate în mediul online necesită instrumente software care să permită analiştilor să gestioneze supraîncărcarea cu informaţii (Best, 2008, p. 331), deoarece devine extrem de dificilă organizarea şi procesarea acestora în vederea identificării celor relevante.

Specializarea personalului implicat în procesul de colectare/ procesare vizează dobândirea unor abilităţi şi competenţe care să corespundă etapelor de cercetare a mediului informaţional pentru identificarea surselor de interes, de monitorizare, procesare şi implementare a informaţiilor, respectiv:

pentru diferite tehnici de colectare (adaptarea la diversitatea new media - bloguri, site-uri de microblogging, reţele de socializare, portaluri informaţionale, lumi virtuale, etc.);

lingvistice (caracterul global al Internetului a favorizat înmulţirea limbilor în care

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 10 din 14

Page 11: T.4.2

sunt postate materialele); cunoştinţe speciale în domenii precum exploatarea documentelor şi transcrierea

acestora; tehnice (datorită apariţiei softurilor dedicate achiziţiei şi prelucrării multitudinii de

formate în care este livrată informaţia, şi pentru a accesa/ salva fişiere de pe site-uri); analitice (identificarea şi selectarea surselor relevante).

În lucrarea ”The New Digital Age: Reshaping the Future of People, Nations and Business”, dedicată predicției impactului tehnologiei asupra societății, Eric Schmidt și Jared Cohen afirmă că până în anul 2025, majoritatea populației lumii, în decursul unei singure generații, va trece de la lipsa accesului la informație la accesarea informației la nivel global prin intermediul unor dispozitive de dimensiuni din ce în ce mai mici. Dacă ritmul actual al inovării tehnologice se va menține, cea mai mare parte a populației estimată la opt miliarde de persoane se va axa pe mediul online.

Prin prisma a ceea ce au denumit “Revoluția Datelor”, Schmidt și Cohen descriu un viitor în care oamenii vor avea informații fără precedent despre cum gândesc indivizii, despre cum aderă sau deviază de la norme, în cadrul oricărei societăți din lume. Această nouă abilitate de a obține facil informații corecte și validate în limba natală și în cantități enorme, va introduce într-o eră a gândirii critice societăți care anterior erau izolate cultural.Ideea schimbărilor profunde determinate de tehnologie este susţinută şi prin evidenţierea rolului deţinut de platformele tehnologice moderne (precum Google, Facebook, Amazon şi Apple), autorii afirmând că “viitorul lumii va fi profund schimbat de adoptarea şi succesul lor în societăţile de pretutindeni”. Mai mult, sunt descrise ca reprezentând “o adevărată schimbare de paradigmă, similară inventării televiziunii” (Schmidt şi Cohen, 2013).

Pentru a fi depăşite erorile inerente pe care le presupun selectarea, filtrarea, sintetizarea, integrarea şi analiza din surse deschise, structurile specializate în activitatea OSINT apelează la instrumente destinate colectării, traducerii, clasificării pe categorii/ domenii de interes şi prelucării informaţiilor obţinute din surse deschise.

Primul instrument de acest gen este chiar Internetul. Progresele tehnologiei au condus la apariţia unor softuri specializate, anual updatate şi upgradate, instrumentele folosite pe Internet evoluând astfel într-un ritm rapid. Capacitatea de a agrega şi ierarhiza conţinutul, de a permite referinţe (link-uri) mult mai uşor de urmărit decât pagina tipărită, viteza de reacţie specifică site-urilor, care pot difuza o informaţie mai repede decât televiziunea şi în timp aproximativ egal cu posturile de radio, site-urile de metasearch care caută, în funcţie de cerinţele date, prin mai multe motoare de căutare în acelaşi timp, afişând o listă cu rezultate combinate sunt numai câteva dintre elementele ce facilitează colectarea de informaţii.

Este adevărat însă că această dezvoltare tehnică a adus cu sine şi creşterea numărului, tipurilor de surse şi a varietăţii conţinutului ce trebuie analizat şi validat, astfel încât a apărut o preocupare deosebită pentru identificarea unor metode de a „controla” volumul de informaţii, prin crearea unor baze de date care să monitorizeze şi stocheze informaţiile comunicate (pe Internet, prin telefon sau reţele sociale). Crearea şi întreţinerea datelor de acest gen reprezintă o bună practică de intelligence competitiv, venind în sprijinul procesului de analiză de intelligence.

Problema cea mai importantă de soluţionat în momentul în care există baze de date

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 11 din 14

Page 12: T.4.2

enorme din surse deschise este descoperirea unui mod de a le „converti” în intelligence. Au apărut, astfel, companii care pun la dispoziţie instrumentele necesare monitorizării surselor şi facilitării colectării şi procesării informaţiilor. ”Sail Labs” (cu sediul în Viena), de exemplu, este una dintre cele mai importante companii ce activează în domeniul ”speech technology” şi oferă servicii destinate eficientizării procesului de colectare a informaţiei (sisteme de media, text/ podcast mining), cu ajutorul cărora date nestructurate din surse multiple (televiziune, radio, podcast-uri, streaming media) sunt procesate în informaţie structurată, uşor de căutat şi accesibilă.

În cadrul acestui proces, conţinutul unui fişier video sau audio este transcris, tradus şi indexat în mod automat, în timp real, în funcţie de limbă, vorbitor, subiect, nume sau cuvinte-cheie.

În ceea ce priveşte traducerea automată aproximativ în timp real, aplicaţiile pentru dispozitivele ”smart” sunt pe punctul de a deveni general valabile în cel mult trei ani, dat fiind că cercetătorii sunt aproape de a definitiva tehnologia necesară şi de a o aplica sub forma smart phones, în cadrul procesului fiind utilizate un soft optic pentru recunoaşterea caracterelor şi tehnologia ”Google Translate”.

Progresul impune şi necesitatea găsirii unor noi modalităţi de validare, dat fiind că, de exemplu, şi conţinutul generat de utilizator se numără, în prezent, printre „sursele” de interes. Ceea ce era până acum suficient pentru evaluarea acurateţii şi credibilităţii informaţiei-text nu se mai aplică şi altor tipuri de conţinut, mai ales că sursele „scrise” constituie, în prezent, un procentaj minor din masa enormă de informaţii utilizate de analiştii OSINT. Din această perspectivă, a devenit evident că, pentru a depăşi obstacolele, trebuie conştientizat că OSINT nu se limitează la ”Internet mining” sau monitorizarea presei, ci solicită de la cei implicaţi abilităţi sociale şi culturale considerabile.

Dacă între anii 2000 - 2005, rolul tehnologiei OSINT a fost axat în special pe facilitarea accesului la date şi colectarea acestora, în prezent asistăm deja la mutarea centrului de interes către tehnologiile dedicate interpretării datelor şi managementului cunoaşterii. Acest proces reprezintă o evoluţie firească, determinată de accesul larg la informaţii şi creşterea exponenţială a volumului de date regăsite în domeniul Internet. În acest context, adoptarea noilor tehnologii reprezintă un imperativ care face diferenţa între date/ informaţii şi intelligence/ cunoaştere.

Au fost dezvoltate tehnologii specifice pentru acoperirea fiecărei etape din ciclul OSINT (planificare, colectare, procesare, analiză şi diseminare), iniţial acestea fiind de sine stătătoare și răspunzând punctual anumitor cerinţe şi bazate în special pe expertiza şi solicitările domeniului business. Concomitent, în mai mică măsură, au fost dezvoltate aplicaţii şi sisteme tehnologice specifice, care să răspundă caracteristicilor şi nevoilor activităţii de intelligence guvernamental. Următorul pas a constat în integrarea acestora în soluţii complete, hardware şi software, care acoperă întreg ciclul OSINT şi conţin funcţionalităţi necesare întregului proces (Best, 2008, p. 333), respectiv: colectare, procesare, analiză, vizualizare date şi colaborare.

Aceste soluţii integrate, denumite generic ”platforme OSINT”, reprezintă acele sisteme care integrează instrumente şi fluxuri de lucru specifice procesului de exploatare a informaţiilor din surse deschise. Deşi arhitectura unei platforme OSINT poate varia pentru a corespunde anumitor indicatori funcţionali, aceasta include în mod obligatoriu toate modulele necesare pentru acoperirea etapelor ciclului OSINT. Din perspectiva provenienţei

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 12 din 14

Page 13: T.4.2

informaţiilor utilizate şi a rolului lor, platformele OSINT sunt complementare platformelor de Intelligence, iar în unele cazuri, în funcţie de soluţiile implementate, pot reprezenta o componentă a acestora.

Platforma colaborativă este acea noţiune-nucleu ce caracterizează tehnologia Web 2.0, în cadrul căreia toate componentele sunt conectate, avantajul acestui model fiind dat în principal de faptul că atât instrumentele, cât şi metodologia de lucru şi angajaţii se perfecţionează în urma lucrului în comun, grefat pe aşa-numita „arhitectură a participării” sub formă de reţea. Aceste sisteme colaborative furnizează un spaţiu virtual unde toţi participanţii pot procesa informaţia şi cunoaşterea în timp real. Unele platforme OSINT exploatează toate tipurile de surse deschise, în timp ce altele sunt dedicate anumitor tipuri de surse - de exemplu social media. Această specializare este determinată de specificul colectării şi al analizei acestor surse, respectiv de limitările impuse de tehnologia folosită de diversele reţele de socializare şi platforme de blogging, precum şi de metodologia analizei reţelelor sociale.În ceea ce priveşte realizarea unui sistem de surse, deşi capacitatea produselor software a crescut semnificativ, iar procesul este automatizat, atribuirea automată de metadate este limitată de configurările sistemului - pot fi alocate metadate primare (autor, sursă, ora de difuzare/ publicare, limbă, spaţiu de provenienţă şi chiar domeniul în care este încadrat materialul - economic, politic, educaţie, etc.).

Pentru o mai bună caracterizare/ încadrare a materialului colectat, este nevoie ca metadatele conforme cu taxonomia specifică fiecărei organizaţii să fie alocate de una sau mai multe persoane, pe baza competenţelor şi în funcţie de atribuţiile acestora. Momentan, factorul uman nu poate fi înlocuit din acest proces de alocare de metadate, însă, odată cu apariţia a ceea ce numim Web-ul Semantic, caracterizat de capacitatea de analiză semantică a textului şi tehnologii care permit coroborarea şi interpretarea diferitelor modele de comportament al utilizatorilor, este posibil ca întreg procesul de colectare/ procesare să fie complet automatizat.

BIBLIOGRAFIE

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 13 din 14

Page 14: T.4.2

1. AUGER, Charles P. Information Sources in Grey Literature. London: Bowker-Saur, 1989.2. BERGMAN, Michael K. "WHITE PAPER: The Deep Web: Surfacing Hidden Value." Journal of

Electronic Publishing 7, no. 1 (12, 2001). doi:10.3998/3336451.0007.104.3. FOLGER, Peter F. Geospatial Information and Geographic Information Systems (GIS): Current

Issues and Future Challenges. Charleston, SC: BiblioGov, DIANE Publishing, 2010.4. Best, Clive. Open Source Intelligence în Fogelman-Soulie, F. 2008. Mining massive data sets for

security: Advances in data mining, search, social networks and text mining, and their applications to security. Amsterdam, Olanda: IOS Press, pp. 331-344.

5. Burke, Cody. 2007. Freeing knowledge, telling secrets: Open source intelligence and development,   CEWCES Research Paper 11, disponibil la http://epublications.bond.edu.au/cewces_papers/11

6. GUŢU, Dorina, New Media, Bucureşti, Editura Tritonic, 2007.7. NORMAN, Dax R. “How to Identify Credible Sources on The Web”, Accesat Decembrie 14, 2013.

https://sites.google.com/site/daxrnorman2/.8. Pagliery, Jose. "The Deep Web You Don't Know about." CNNMoney. March 10, 2014. Accesat

aprilie 18, 2014. http://money.cnn.com/2014/03/10/technology/deep-web/index.html?iid=HP.9. PALLARIS, Chris. Skills in inteligence Collection and Analysis. Prezentare susţinută în cadrul

Celei de a 8-a Conferinţe a Clubului de la Budapesta, Bruxeles,13-15.09.2010.10. Schmidt, Eric şi Cohen, Jared.  2013. The New Digital Age: Reshaping the Future of People,

Nations and Business.11. Schreier, Fred. 2010. Transforming Intelligence Services: Making Them Smarter, More Agile,

More Effective and More Efficient. Vienna: National Defence Academy.    12. TEKIR, Selma. Open Source Intelligence Analysis: A Methodological Approach. Saarbru cken,

Germany: VDM, 2009.13. Toffler, Alvin. 1980. The Third Wave. New York: Morrow. 14. "Grey Literature: History, Definition, Acquisition, and Cataloguing." - CISTI, Scientific, Technical,

Special Libraries. http://www.moyak.com/papers/grey-technical-literature.html.15. "Leetspeak - NetLingo The Internet Dictionary: Online Dictionary of Computer and Internet Terms,

Acronyms, Text Messaging, Smileys ;-)." Leetspeak - NetLingo The Internet Dictionary: Online Dictionary of Computer and Internet Terms, Acronyms, Text Messaging, Smileys ;-). Accesat Aprilie 3, 2014. http://www.netlingo.com/word/leetspeak.php.

16. "Url Decoder." Url Decoder. http://old.library.jhu.edu/researchhelp/general/evaluating/url.html.

ACADEMIA NAȚIONALĂ DE INFORMAȚII„MIHAI VITEAZUL”

Casa Corpului Didactic DOLJ Casa Corpului Didactic BRĂILA

POSDRU/157/1.3/S/140010 Pagina 14 din 14