wade 2014—2015 (supliment): modelarea datelor în html: aserţiuni rdfa

48
Dr. Sabin Buragawww.purl.org/net/busaco Dezvoltarea aplicațiilor Web <⊷> date structurate în cadrul documentelor HTML RDFa – declarații de triple RDF în paginile Web

Upload: sabin-buraga

Post on 15-Jul-2015

88 views

Category:

Technology


1 download

TRANSCRIPT

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Dezvoltarea aplicațiilor Web

<⊷>date structurate în cadrul documentelor HTML

RDFa – declarații de triple RDF în paginile Web

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

“Imaginația este mai importantă ca erudiția.”

Albert Einstein

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Folosind modelul RDF (subiect, predicat, obiect),n-am putea include triplele RDF în paginile Web?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Specificarea construcțiilor RDF direct în (X)HTMLRDFa

reprezintă un alt format de serializare a modelului RDF

RDF + HTML = RDFa

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

recomandări ale Consorțiului Web

RDFa 1.0 (2008)RDFa 1.1 (2012 – prima ediție; 2013 – a doua ediție)

www.w3.org/TR/rdfa-core

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

„punte” între Web-ul social și Web-ul datelor

www.w3.org/TR/rdfa-primer/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

utilizarea unor atribute HTML specifice menite a modeladatele disponibile într-o pagină Web

în vederea procesării acestora de către un program

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

minimal, se pot utiliza atributeleprecizate de recomandarea RDFa Lite (W3C, 2012)

www.w3.org/TR/rdfa-lite/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

vocab – desemnează URL-ul vocabularului de date (modelului conceptual) adoptat

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

vocab – desemnează URL-ul vocabularului de date (modelului conceptual) adoptat

exemplificări:scheme de date HTML5 – http://schema.org/

specificațiile DCMI, FOAF, SIOC,…diverse vocabulare deschise – http://vocab.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

studiu de caz: BIO – vocabular privind biografia unei persoane

http://vocab.org/bio/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

typeof – precizează un tip de date (clasă de „lucruri”)

exemple:Event

Person

Product

etc.

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

property – specifică o proprietate asociată tipului de date

e.g., pentru tipul Event sunt definite proprietățileduration, location, startDate, endDate, performers,…

(conform http://schema.org/Event)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

resource – indică un identificator de resursă (subiectul)despre care se „vorbește” în termeni de meta-date

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa

prefix – desemnează prefixul unui vocabular specific,facilitând referirea acestuia

e.g., rdf pentru RDF, rdfa – RDFa, xsd – XML Schema

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

lista prefixelor predefinite:www.w3.org/2011/rdfa-context/rdfa-1.1

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Exemplu recurgând la vocabularul schema.org

adaptare după (Manu Sporny, 2012)

<p vocab="http://schema.org/" typeof="Person"

resource="#tux">

Salut, eu sunt

<span property="name">Tuxy Pinguinescu</span>

și vă invit să vizitați

<a property="url" href="http://tux.info/"

title="Situl lui Tuxy">situl meu</a>.

</p>

adnotare explicită direct în HTML: resursa identificată cu tux este o persoană având atașate

un nume și o adresă Web a sitului personal

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Exemplu recurgând la vocabularul schema.org

adaptare după (Manu Sporny, 2012)

<p vocab="http://schema.org/" typeof="Person"

resource="#tux">

Salut, eu sunt

<span property="name">Tuxy Pinguinescu</span>

și vă invit să vizitați

<a property="url" href="http://tux.info/"

title="Situl lui Tuxy">situl meu</a>.

</p>

@prefix s: <http://schema.org/Person> .

:tux rdf:type s:Person ;

s:name "Tuxy Pinguinescu" ;

s:url <http://tux.info/> .

aserțiunile RDF echivalente

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Exemplu: modelarea grafului social al unui utilizatorpe baza vocabularului FOAF (Friend Of A Friend)

<div vocab="http://xmlns.com/foaf/0.1"><div resource="#busaco" typeof="Person"><a property="url" href="http://purl.org/net/busaco">

<span property="name">Sabin Buraga</span></a> îi are drept cunoscuți pe

<a property="knows" href="#alecsandru">Alecsandru</a> și <a property="knows" href="#blankdots">Ștefan</a>.

</div><p resource="#alecsandru" typeof="Person">

<span property="name">Alecsandru Grigoriu</span></a> </p>…

</div>

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

date adnotatesemantic via RDFa

triplele RDF extrase

redareaconținutului

marcat

http://rdfa.info/play/un instrument Web de editare și vizualizare a construcțiilor RDFa

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

graful RDF corespunzător

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Exemplu: specificarea „punctajului” dat unei resurse(adnotare semantică via review vocabulary de la Google)

<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Review"><span rel="v:itemreviewed">

<span about="urn:ISBN:978-973-46-0249-0" typeof="bib:book">Titlu: <span property="v:name" xml:lang="ro">Tehnologii XML</span></span>

</span>Evaluare: <span property="v:rating" content="5">*****</span><span property="v:summary">…</span>

</div>

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

rdf: utilizari

corelarea și accesarea cunoștințelor despre e-commercevia RDF – @kidehen & @mfhepp (2010)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

<div typeof="gr:Offering" about="#fabulous-offer"><div rev="gr:offers" resource="http://www.undeva.biz#business">

<span property="gr:validFrom" datatype="xsd:dateTime" content="2012-11-20T00:00:00Z"></span>

<span property="gr:validThrough" datatype="xsd:dateTime" content="2013-11-20T00:00:00Z"></span>

</div><div rel="gr:hasPriceSpecification">

<span typeof="gr:UnitPriceSpecification" about="#UnitPriceSpec">Pret:<span property="gr:hasCurrencyValue" datatype="xsd:float">

33.33</span> <span property="gr:hasCurrency" datatype="xsd:string">Euro</span>

</span></div><a rel="product:specification" href="http://undeva.biz/product#spec">Specificațiile produsului</a>

</div>

modelarea în RDFa a unei oferte de e-business pe bazamodelului Good Relations – după Martin Hepp (2009)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

O listă a siturilor/aplicațiilor care recurg la adnotărisemantice RDFa referitoare la produse via Good Relations

poate fi consultată lahttp://notes.3kbo.com/goodrelations-sites

exemplificări:BestBuy, CheapToTravel, Magento Shop, O’Reilly Media,

Overstock, ProductDB, Yahoo! Real Estate

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa transformă o pagină Web într-un API

acces la date structurate – „purtând” un înțeles –, nu doar la conținut textual

http://rdfa.info/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

RDFa transformă o pagină Web într-un API

diverse biblioteci/module de prelucrare:clj-rdfa (Closure), EasyRDF (PHP), librdfa (C),Green Turtle (JavaScript), PyRDFa (Python),

semargl (Java), vie (Node.js)

http://rdfa.info/dev/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Există o serie de studii de cazprivitoare la RDFa?

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

rNews

model conceptual vizând includerea de meta-date din domeniul publicațiilor

(e.g., știri, articole, periodice) în documentele HTML

standard IPTC (International PressTelecommunications Council) – octombrie 2011

rnews.org

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

rNews

pe bazează pe microdate HTML5 și/sau RDFa

detalii în prezentarea E. Sandhaus, S. Myles & A. Gebhard,“The State of rNews”, Semantic Technology & Business

Conference, San Francisco (2012)

https://speakerdeck.com/u/agebhard/p/the-state-of-rnews

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Generarea de construcții RDFape baza editorului on-line RDFaCE

abordare WYSISYG (What You See Is What You Get)

generează reprezentări RDFa – inclusiv rNews

recurge la API-uri de adnotare a conținutului textual(e.g., Alchemy, Open Calais, Ontos, DBpedia)

disponibil și ca extensie pentru WordPress

http://aksw.org/Projects/RDFaCE.html

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Generarea de constructii RDFape baza editorului on-line RDFaCE

A. Khalili, S. Auer & D. Hladky (2012)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

rdf: utilizari – rdfa

extragerea triplelor RDF dintr-un document HTML ce include RDFa via RDFa 1.1 Distiller and Parser

http://www.w3.org/2012/pyRdfa/Overview.html

URL-ul resursei conținând triple RDFa

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

rdf: utilizari – rdfa

date pentru consumul uman oferite de www.thegazette.co.uk

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

@prefix this: <https://www.thegazette.co.uk/id/notice/2225959#> . @prefix dc: <http://purl.org/dc/elements/1.1/> . @prefix og: <http://ogp.me/ns#> . @prefix gaz: <https://www.thegazette.co.uk/def/publication#> .@prefix court: <https://www.thegazette.co.uk/def/court#> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

<https://www.thegazette.co.uk/id/edition/London> a gaz:Edition .

<https://www.thegazette.co.uk/notice/2225959>og:image "https://www.thegazette.co.uk/largetile.png"@en; dc:publisher <https://www.thegazette.co.uk/id/notice/2225959>; gaz:isAbout <https://www.thegazette.co.uk/id/notice/2225959> .

this:court a court:Court; court:courtName "Southen County Court"^^xsd:string .

this:courtCase a court:CourtCase; court:caseNumber "201"^^xsd:string; court:caseYear "2011"^^xsd:gYear; court:hasCourt this:court .

triple RDF privind cunoștințe din domeniul legislativ (modelate de vocabulare specifice) obținute prin procesarea construcțiilor RDFa

date RDF în format Turtle

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

extragerea de triple RDF din construcții RDFavia instrumentul RADiFy – http://code.google.com/p/radify/

(în acest caz, se folosesc vocabulare ca FOAF și Good Relations)

<#offering> gr:name "Ty Pennington Style Mayfield 4 Pc. Deep Seating Set"

<#offering> gr:hasCurrency "USD"

<#offering> gr:hasCurrencyValue "849.99"

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

vizualizarea triplelor RDF incluse într-un document HTMLcu extensia Green Turtle RDFa pentru Chrome

aici se recurge la Open Graph Protocol – http://opengraphprotocol.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

recomandări de resurse pe baza marcajelor RDFa Lite extensia RuleTheWeb pentru Firefox: http://ruletheweb.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

conform principiilor datelor de 5 stele, instrumentulRuleTheWeb descoperă fapte de interes privind

resursa vizată – oferite de Freebase la URL-ulhttp://www.freebase.com/m/012kyx

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

Aserțiunile RDFa sunt indexate de motoarele de căutare

Bing – http://tinyurl.com/b9mx2f2

Google rich snippets – http://tinyurl.com/3c6naq7

Yahoo! BOSS (Build your Own Search Service)http://developer.yahoo.com/search/boss/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

microformate↔microdate↔RDFa

Microformatele pot fi exprimatevia microdate HTML care, la rândul lor,

pot avea asociate construcții RDF(a)

a se parcurge și articolul lui Manu Sporny, „Mythical Differences: RDFa Lite vs. Microdata” (2012):

http://manu.sporny.org/2012/mythical-differences/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

microformate↔microdate↔RDFa

Cel mai expresiv – general – model este RDF(a)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

<!-- microformate (utilizarea microformatului hCard) --><div class="vcard">

<p>Nume: <span class="fn">Sabin Buraga</span></p><p>Titlu academic: <span class="title">Dr.</span></p>

</div>

<!-- microdate HTML5 --><div itemscope itemtype="http://schema.org/Person">

<p>Nume: <span itemprop="name">Sabin Buraga</span></p><p>Titlu academic: <span itemprop="title">Dr.</span></p>

</div>

<!-- aceleași construcții exprimate via RDFa --><div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person">

<p>Nume: <span property="v:name">Sabin Buraga</span></p><p>Titlu academic: <span property="v:title">Dr.</span></p>

</div>

adaptare după Marco Lisci & Luisa Scarlata (2011)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

<li class="conference" itemscope itemid="/2011/oscon/"

itemtype="http://schema.org/Event"

itemclass="SocialEvent BusinessEvent EducationEvent">

<h2><a itemprop="url" href="/2011/oscon/">

<span itemprop="name">OSCON 2011</span></a></h2>

<p itemprop="location" itemscope itemid="/places/portland/"

itemtype="http://schema.org/Place">

<span itemprop="name"><a href="/places/usa/">USA</a> /

<a itemprop="url" href="/places/portland/">Portland</a></span></p>

<p class="date">

<time itemprop="startDate" datetime="2011-07-25">25</time> –

<time itemprop="endDate" datetime="2011-07-29">29 iulie</time>

</p>

...

</li>

modelarea unui eveniment via microdate HTML5,pe baza schemelor de date oferite de schema.org

(Jeni Tennison, 2011)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

@prefix s: <http://schema.org/>

</2011/oscon/> a s:Event ,

s:SocialEvent , s:BusinessEvent ,

s:EducationEvent ;

s:url <http://lanyrd.com/2011/oscon/> ;

s:name "OSCON 2011" ;

s:location </places/portland/> ;

s:startDate "2011-07-25"^^xsd:date ;

s:endDate "2011-07-29"^^xsd:date .

</places/portland/> a s:Place ;

s:url <http://lanyrd.com/places/portland/> ;

s:name "United States / Portland" .

construcțiile RDF echivalente pe baza asocierilor (mappings) realizate – Jeni Tennison, 2011

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

{ "type" : "http://schema.org/Event",

"id" : "http://lanyrd.com/2011/oscon/",

"properties" : {

"url" : [ "http://lanyrd.com/2011/oscon/" ],

"name" : [ "OSCON 2011" ],

"location" : [

{ "type" : "http://schema.org/Place",

"id" : "http://lanyrd.com/places/portland/",

"properties" : {

"name" : [ "United States / Portland" ],

"url" : [ "http://lanyrd.com/places/portland/" ] }

} ],

"startDate" : [ "2011-07-25" ],

"endDate" : [ "2011-07-29" ]

}

}

modelul de date exprimat în JSON(accesat via un serviciu Web respectând paradigma REST)

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

microformate↔microdate↔RDFa

Alte resurse de interes privind modelarea și procesarea datelor structurate disponibile pe Web

sunt oferite de situlhttp://structured-data.org/

Dr.

Sab

in B

ura

ga

www.purl.org/net/busa

co

rezumat

<⊷>RDFa: specificarea triplelor RDF direct în HTML