cautaera multilingva

16
UNIVERSITATEA “ALEXANDRU IOAN CUZA”, IAŞI FACULTATEA DE INFORMATICĂ CĂUTARE DOCUMENTARĂ ÎNTR- UN CONTEXT MULTILINGV Sesiunea: IULIE, 2010 propusă de Alina- Elena Mihăilă Coordonator ştiinţific Asistent, Dr. Adrian Iftene

Upload: bringiton

Post on 22-Jun-2015

312 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Cautaera multilingva

UNIVERSITATEA “ALEXANDRU IOAN CUZA”, IAŞI

FACULTATEA DE INFORMATICĂ

CĂUTARE DOCUMENTARĂ ÎNTR-

UN CONTEXT MULTILINGV

Sesiunea: IULIE, 2010

propusă de

Alina- Elena Mihăilă

Coordonator ştiinţific

Asistent, Dr. Adrian Iftene

Page 2: Cautaera multilingva

CUPRINS

2

Cuvinte Cheie

Prezentarea Problemei şi Formularea Soluţiei

Tehnologii

• Prezentare

• Configurare

Internet Surveillance

Aplicaţie- Structură

Studiu de caz

Concluzii

Direcţii Viitoare

2

Page 3: Cautaera multilingva

CUVINTE CHEIE

Multilingual

Căutare

Lucene

Index

Nutch

Google Translated API

Google Search API

Internet Surveillance

J2EE

JSF, JSP, MVC

Internaţionalizare

3

3

Page 4: Cautaera multilingva

PREZENTAREA PROBLEMEI ŞI

FORMULAREA SOLUŢIEI

Problemă

Utilizatori ocupaţi

Informaţii multe şi dispersate

Nu există un motor de căutare multilingv

Identificarea greoaie a opiniilor

Soluţie

Punerea în comun a informaţiilor în mai multe limbi

Identificarea uşoară a opiniilor

Păstrarea locală a informaţiilor

Internaţionalizarea aplicaţiei

4

4

Page 5: Cautaera multilingva

TEHNOLOGII- PREZENTARE

Apache LUCENE

bibliotecă de funcţii gratuită folosită în căutarea documentară

documentul, câmpul şi termenul

index

Apache NUTCH

framework pentru punerea în aplicare a motoarelor

de căutare

crawling

conceput pentru a procesa seturi de documente Web

5

5

Page 6: Cautaera multilingva

TEHNOLOGII- PREZENTARE

Google Translate API

proiect open source

translator automat

Google Search API

integrarea motorului de căutare Google în cadrul unei pagini

Web

J2EE

platformă Java proiectată pentru a prelucra date

pentru organizaţii mari

model distribuit multitier de realizare a aplicaţiilor

JAVASERVER FACES

standard pentru construirea interfeţelor cu

utilizatorul pe partea de server 6

6

Page 7: Cautaera multilingva

TEHNOLOGII- CONFIGURARE

NUTCH

Crearea directoarelor

Configurarea fişierelor

Indexare

Cygwin

Parsare fişier

Compunerea comenzii

Directoare de crawl

7

bin/nutch crawl urls -dir crawl -depth 3 -

topN 5

Page 8: Cautaera multilingva

TEHNOLOGII- CONFIGURARE

J2EE/JSF

web.xml

faces-config.xml

8

<servlet>

<servlet-name>

Faces Servlet</servletname>

<servlet-class>

javax.faces.webapp.FacesServlet

</servlet-class>

<load-on-startup>1</load-on-

startup>

</servlet>

<servlet-mapping>

<servlet-name>Faces Servlet

</servlet-name>

<url-pattern>/faces/*</url-pattern>

</servlet-mapping>

<navigation-rule>

<from-view-id>/index.jsp</from-view-id>

<navigation-case>

<fromoutcome>

searchConfiguration

</from-outcome>

<to-view-id>/search.jsp</to-viewid>

</navigation-case>

</navigation-rule>

Page 9: Cautaera multilingva

TEHNOLOGII- CONFIGURARE

JSF-MVC (Model- View- Controller)

9

Page 10: Cautaera multilingva

INTERNET SURVEILLANCE

„ Societatea noastră nu este una de spectacol, ci de

supraveghere (...) individul este atent fabricat în ea, în

conformitate cu o întreagă tehnică de forţe şi corpuri”

(Foucault 1977:217)

un concept care ne permite interogarea absolută a

colecţiilor de informaţii

„ Acumularea de informaţii definite simbolic materiale

care pot fi stocate de o agenţie sau o colectivitate,

precum şi supravegherea activităţilor subordonaţilor

de către superiorii lor ” (Giddens 1981:169)

10

Page 11: Cautaera multilingva

APLICAŢIE- STRUCTURĂ

Componente JavaBeans

Aplicaţia este structurată în trei pachete:

Bean- conţine clasa QueryResults

Internationalization- conţine clasa Language

Search- este format din clasele EnteredQuery,

GoogleQuery, Search şi TranslatedQuery

11

EnteredQuery.receivedQuery() TranslatedQuery.translateQuery()

GoogleQuery.makeQuery() Search.getConfiguration()

Search.createHit() QueryResults.QueryResults()

Page 12: Cautaera multilingva

APLICAŢIE- STRUCTURĂ

Pagini JSP

prezentarea rezultatelor către utilizator

Biblioteci de tag-uri

includerea elementelor de interfaţă în cadrul paginilor jsp şi

obiectele ataşate acestora pe partea de server

Fişiere de configurare

web.xml

faces-config.xml

12

Page 13: Cautaera multilingva

STUDIU DE CAZ

Pentru a ilustra funcţionalitatea şi utilitatea

aplicaţiei MLS (Multilingual Searcher) descriem

în cele ce urmează un studiu de caz referitor la

căutarea produsului iPhone.

Cu ajutorul acestui sistem utilizatorii vor avea

toate informaţiile necesare centralizate şi în

plus ele vor fi clasificate în comentarii pozitive şi

negative

13

Page 14: Cautaera multilingva

CONCLUZII

Utilizatori mulţumiţi- obţin rezultatele dorite

multilingv

Alternativă la căutarea clasică pe Internet

Combinarea rezultatelor obţinute

Afişarea opiniilor pozitive şi negative

Eficienţă - păstrarea locală a indecşilor

Componente principale

Separarea logicii de partea de prezentare

14

Page 15: Cautaera multilingva

DIRECŢII VIITOARE

Combinarea rezultatelor obţinute cu

rezultatele de pe reţelele de socializare

Extinderea numărului de limbi utilizate

Creşterea eficientei

Sortarea rezultatelor obţinute

Detecţia opiniilor

15

Page 16: Cautaera multilingva

UNIVERSITATEA “ALEXANDRU IOAN CUZA”, IAŞI

FACULTATEA DE INFORMATICĂ

Vă Mulţumesc !

16