sistem online de verificare a autenticit ăţii documentelor

Post on 23-Feb-2016

65 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

Sistem online de verificare a autenticit ăţii documentelor. Proiect realizat de Radu -Constantin Ciob ănică Coordonat de S.L. Dr. Ing. Iulian Niţă. Structura lucrării. Forme de plagiat Scenarii vizate Metode de evitare Algoritmul Smith -Waterman Algoritmul Boyer-Moore - PowerPoint PPT Presentation

TRANSCRIPT

Sistem online de verificare a autenticităţii documentelor

Proiect realizat de Radu-Constantin Ciobănică

Coordonat de S.L. Dr. Ing. Iulian Niţă

Structura lucrării•Forme de plagiat•Scenarii vizate•Metode de evitare•Algoritmul Smith-Waterman•Algoritmul Boyer-Moore•Criterii de performanţă•Comparaţie între algoritmi•Concluzii• Implementare

Forme de plagiat•Copy & paste•Schimbarea cuvintelor •Plagiatul de stil•Plagiatul metaforei•Plagiatul de idei

Scenarii vizate• Boyer-Moore:

▫copy&paste▫schimbare ordine de apariţie

• Smith-Waterman:▫cuvinte derivate▫plagiat de stil▫plagiat metafore

Tehnici de evitare•Înţelegerea plagiatului•Folosirea surselor multiple•Semnele citării – ghilimelele•Referinţe la parafraze•Referinţe la reformulare sau rezumare•Precizarea surselor

Smith-Waterman•Compară segmente de toate lungimile•Găseşte similarităţi structurale

1. Preprocesare: ▫Iniţializare matrici▫Maparea caracterelor

Smith-Waterman2. Calcularea matricii de scoruri

Smith-Waterman

3. Calcularea părinţilor (traceback)

Smith-Waterman

4. Identificare potriviri semnificative▫Decizie dependentă de valoarea scorului

5. Populare matrice M.

Boyer-Moore•Analiza se face de la

dreapta la stânga•Căutare la nivel de

pattern•Dispune de shift-ări

inteligente

Boyer-Moore1. Preprocesare: • Indexare • Generare tabele shift-areîn funcţie de ocurenţă

Boyer-Moore2. Aliniere pattern3. Compararea cu ultimul caracter:• Shift-are caracter greşit(distinct)

Boyer-Moore• Shift-are cu sufix bun- shift-are 2 poziţii

Boyer-Moore• Shift-are cu sufix bun- shift-are 5 poziţii

Criterii de performanţăSmith-Waterman:• Complexitate temporală:O(M+N) + O(MN) + O(MN) =

O(MN)Iniţializare umplere matr traceback

Boyer-Moore:• faza de preprocesare O(M + N) de timp şi spaţiu;• faza de căutare în O(MN);• performanţă maximă O(N/M)

Comparaţie algoritmi•Dimensiune eşantion / şir:•Eficienţa în timp•Spaţiu de stocare necesar•Ţinta analizei

Concluzii•“Ligi” diferite•Funcţionalităţi complementare•Performanţe complementare

Implementare

top related