de câte stele sunt datele d-voastră?

Post on 22-Jun-2015

1.779 Views

Category:

Technology

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

A presentation – available in Romanian language – regarding the open data and 5-star access & publishing approaches. Also, several details about the linked data initiative are provided.

TRANSCRIPT

Procesare de la algoritmi optimi la software comercial

1945—1970

adaptare după Daconta et al. (2003)

Procesare de la algoritmi optimi la software comercial

1945—1970

“datele sunt mai puțin importante decât codul”

adaptare după Daconta et al. (2003)

Date proprietare baze de date & suite de birou proprietare

1970—1994

adaptare după Daconta et al. (2003)

Date proprietare baze de date & suite de birou proprietare

1970—1994

“datele sunt la fel de importante ca și programele”

adaptare după Daconta et al. (2003)

Publicarea datelor pe Web Web-ul clasic – standarde: HTML & CSS

1994—2004

adaptare după Daconta et al. (2003)

Publicarea datelor pe Web Web-ul clasic – standarde: HTML & CSS

1994—2004

“datele sunt la fel de importante ca și programele”

adaptare după Daconta et al. (2003)

Partajarea & reutilizarea documentelor Web-ul social – modele de date: XML, JSON,…

2004—prezent

adaptare după Daconta et al. (2003)

Partajarea & reutilizarea documentelor Web-ul social – modele de date: XML, JSON,…

2004—prezent

“datele sunt mai importante decât codul”

adaptare după Daconta et al. (2003)

Accesarea resurselor disponibile pe Web

Unicode DNS TCP/IP

URI HTTP

bine-cunoscute standarde Internet & Web

Accesarea resurselor disponibile pe Web

“dacă nu ai asociat un URL, nu exiști”

Accesarea resurselor disponibile pe Web

“dacă nu ai asociat un URL, nu exiști”

Uniform Resource Locator

Accesarea resurselor disponibile pe Web

identificarea oricărei (reprezentări de) resurse

via localizatori uniformi de resurse – URL-uri

Tom Heath & Christian Bizer (2011)

Accesarea resurselor disponibile pe Web

autoritatea care stabilește URL-ul (domeniul) deține

reprezentarea resursei desemnate de acel URL

Accesarea resurselor disponibile pe Web

procesarea marcajelor HTML – Web scrapping

versus interfețe de programare

(API – Application Programming Interface)

Reutilizarea datelor disponibile pe Web

preluarea datelor via servicii Web

eventual, pe baza API-urilor

lista API-urilor publice (aici, privind domeniul educațional)

www.programmableweb.com

Reutilizarea datelor disponibile pe Web

preluarea datelor via servicii Web

aplicații Web hibride (mash-up-uri)

instrumentul Web Zemanta – sistem de recomandare

mash-up “inteligent” folosind resurse disponibile liber pe Web

(exemplu: îmbogățirea conținutului unui articol de blog WordPress)

Reutilizarea datelor disponibile pe Web

necesitatea adoptării unei licențe de (re)utilizare

Reutilizarea datelor disponibile pe Web

utilizare onestă (fair use)

folosire limitată, dar gratuită, a unei lucrări

protejate de drepturi de autor – e.g., pentru uz educațional

Reutilizarea datelor disponibile pe Web

domeniul public (public domain)

a expirat copyright-ul, proprietarul deliberat plasează

resursa în domeniul public sau legile nu pot proteja

resursa respectivă

Reutilizarea datelor disponibile pe Web

copyleft

autorul oferă resursa să fie utilizată

cu anumite restricții

uzual: some rights reserved

Reutilizarea datelor disponibile pe Web

Creative Commons

oferă licențe de tip copyleft pentru creații disponibile pe Web

reasonable, flexible copyright

valori de bază: deschidere, transparență, respect

https://creativecommons.org/

Reutilizarea datelor disponibile pe Web

Creative Commons

vizează maniera de atribuire, caracterul non-comercial,

politica derivării conținutului și modul de partajare

creativecommons.org/about/licenses/

stabilirea unei licențe de (re)utilizare

a însemnărilor publicate pe Twitter – www.tweetcc.com

căutarea de resurse respectând licențele Creative Commons

http://search.creativecommons.org/

acces la resurse multimedia prin inițiativa Wikimedia Commons

https://commons.wikimedia.org/

Disponibilitatea datelor disponibile pe Web

a fi stocat pe Web

(“on the Web”)

ca document “opac”

– disponibil într-un format proprietar sau nu –

fără a referi, pe baza standardelor Web,

alte resurse de interes

Tom Health (2007)

Disponibilitatea datelor disponibile pe Web

a fi descoperibil pe baza standardelor Web

(“in the Web”)

folosind modele/formate de date deschise

(e.g., HTML, XML, JSON, RDF etc.)

aliniate principiilor hipertextului/hipermedia,

procesabile independent de platformă

Tom Health (2007)

“A piece of content or data is open if anyone is free to use, reuse, and redistribute it.”

http://opendefinition.org/

Caracterul deschis al datelor e dat de…

disponibilitate & acces

reutilizare & redistribuire

participare universală

opendatahandbook.org

Caracterul deschis al datelor e dat de…

disponibilitate & acces

reutilizare & redistribuire

participare universală

opendatahandbook.org

inter-operabilitate

deși pretind a avea (uneori) un caracter deschis,

“castelele” aplicațiilor Web actuale țin “ostatice” datele

deși pretind a avea (uneori) un caracter deschis,

“castelele” aplicațiilor Web actuale țin “ostatice” datele

acces (limitat, eventual pe baza

unei subscripții – e.g., taxe) via API

Cum putem evalua caracterul deschis

al resurselor Web?

Date de 5 stele (5 ★ Open Data)

Tim Berners-Lee (2009)

date de 1 stea

date de 1 stea

conținutul e disponibil pe Web – indiferent de

format – conform unei licențe deschise

utilizatorii pot vizualiza, lista,

stoca local și, eventual, modifica documentul

documentul în sine poate fi partajat via Internet

documentul poate fi publicat rapid & facil pe Web

pentru a refolosi datele incluse în document

sunt necesare uneori procesări suplimentare

★ ★

date de 2 stele

date de 2 stele

suplimentar, conținutul este disponibil pe Web

într-un format structurat

utilizatorii pot procesa documentul

– folosind, uzual, software proprietar

documentul poate fi exportat în alt format

(structurat sau nu)

documentul poate fi încă publicat facil pe Web

datele sunt în continuare “încuiate” în document,

procesarea depinzând de un anumit program

★ ★ ★

date deschise de 3 stele

date deschise de 3 stele

recurgerea la un format deschis

pentru a pune la dispoziție pe Web date

datele pot fi gestionate (vizualizate, filtrate, procesate,

convertite, refolosite etc.) în orice manieră

asigurarea independenței de platforma software

în continuare, documentul poate fi publicat facil pe Web

exportarea datelor într-un format proprietar

ar putea fi problematică

★ ★ ★ ★

date deschise de 4 stele

date deschise de 4 stele

adoptarea identificatorilor de resurse (URI-uri)

pentru a desemna “lucruri” de interes

datele, informațiile și cunoștințele se identifică via URI-uri

pentru a putea fi ulterior referite și (re)utilizate

uzual, se recurge la modelul RDF

(Resource Description Framework)

publicarea poate fi relativ mai dificilă,

necesitând de obicei adoptarea de instrumente și

metodologii specifice tehnologiilor Web-ului semantic

“data in the Web”implicații pe termen lung

★ ★ ★ ★ ★

date deschise de 5 stele

date deschise de 5 stele

în plus, datele sunt inter-relaționate

conform principiilor inițiativei linked data

posibilitatea descoperirii altor date de interes (înrudite)

direct la momentul procesării

se oferă premisele efectuării de raționamente automate

direct la nivel de Web pe baza modelelor conceptuale

exprimate standardizat via SKOS, OWL,…

dificultăți:

consistența & reconcilierea datelor și cunoștințelor

probleme legate de adopția lentă de către industrie

5stardata.info

Michael Hausenblas (2012)

interogări vizuale asupra datelor deschise (conform modelului RDF)

oferite de DBpedia – varianta procesabilă a Wikipedia

“Norul” datelor interconectate

reducerea redundanței

facilitarea reutilizării

permiterea descoperirii

maximizarea inter-conectivității dintre “lucruri” înrudite

adoptarea unei viziuni pragmatice

Tom Heath & Christian Bizer (2011)

martie 2009

http://lod-cloud.net/

sept. 2011

http://lod-cloud.net/

http://thedatahub.org/

http://ckan.org/

http://opengovernmentdata.org/

S. Buraga, Prezentările aferente cursului

“Dezvoltarea aplicațiilor Web”, UAIC, 2012

http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html

D. Dietrich et al., The Open Data Handbook, Open Knowledge Foundation, 2012

http://opendatahandbook.org/

T. Heath & C. Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011

http://linkeddatabook.com/book

D. Allemang & J. Hendler, Semantic Web for the Working Ontologist (2nd Ed.), Morgan Kaufmann, 2011

de studiat

fotografii realizate de 3brian, bjaglin, ecatoncheires, Hervé Boulben, Ralph Hockens, jjjj56cp,

micmol, mynameisharsha, Daniel Petzold, scot2342, striatic, ToSaveOnPostage

Dr. Sabin Buraga www.purl.org/net/busaco

Facultatea de Informatică, Universitatea “A. I. Cuza” Iași

top related