2.4. teoria structurii retorice (rst)ipistol/tlu0708/res/discurs.pdf · descrierea modului de...

23
2.4. Teoria Structurii Retorice (RST) 2.4.1 Originea şi descrierea teoriei Plecând de la ideile axiomatice prezentate anterior, Mann şi Thompson elaborează şi descriu în 1988 [Mann şi Thompson, 1988] Teoria Structurilor Retorice (Rhetorical Structure Theory – RST). Această teorie a devenit una dintre cele mai populare printre lingvişti, fiind fie acceptată ca atare, fie folosită ca punct de plecare pentru teorii ulterioare. Ideea centrală a RST este noŃiunea de relaŃie retorică ce leagă două fragmente continue şi adiacente de text. Unitatea elementară de discurs, ce se găseşte la nivelul cel mai de jos al reprezentării structurii RST este identificată ca fiind o clauză ce cuprinde o predicaŃie. RelaŃiile leagă aceste unităŃi într-o structură arborescentă, ce are ca frunze unităŃi elementare de discurs şi ca noduri interioare grupuri de mai multe unităŃi elementare adiacente în discurs. RST identifică două tipuri mari de relaŃii retorice: paratactice şi hipotactice. O relaŃie este paratactică, sau echinucleară, dacă leagă doi sau mai mulŃi constituienŃi egali ca importanŃă şi hipotactică dacă leagă constituienŃi ce nu sunt egali ca importanŃă. Între constituienŃii uniŃi de relaŃiile hipotactice există întotdeauna unul singur mai important, numit nucleu, ceilalŃi fiind numiŃi sateliŃi. La relaŃiile paratactice, prin convenŃie se consideră că toŃi constituienŃii sunt nuclei. Aceste relaŃii sunt detaliate în 27 de tipuri ce diferă prin legătura semantică dintre fragmentele legate şi de semnificaŃia individuală a constituenŃilor. Un exemplu de astfel de relaŃie [după Mann şi Thompson, 1988] : Numele relaŃiei: EVIDENCE Constrângeri asupra N: Este posibil ca cititorul R să nu aibă un grad de încredere satisfăcător

Upload: others

Post on 08-Jan-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

2.4. Teoria Structurii Retorice (RST)

2.4.1 Originea şi descrierea teoriei

Plecând de la ideile axiomatice prezentate anterior, Mann şi Thompson

elaborează şi descriu în 1988 [Mann şi Thompson, 1988] Teoria Structurilor

Retorice (Rhetorical Structure Theory – RST). Această teorie a devenit una

dintre cele mai populare printre lingvişti, fiind fie acceptată ca atare, fie

folosită ca punct de plecare pentru teorii ulterioare.

Ideea centrală a RST este noŃiunea de rela Ńie retoric ă ce leagă două

fragmente continue şi adiacente de text. Unitatea elementar ă de discurs , ce

se găseşte la nivelul cel mai de jos al reprezentării structurii RST este

identificată ca fiind o clauză ce cuprinde o predicaŃie. RelaŃiile leagă aceste

unităŃi într-o structură arborescentă, ce are ca frunze unităŃi elementare de

discurs şi ca noduri interioare grupuri de mai multe unităŃi elementare

adiacente în discurs.

RST identifică două tipuri mari de relaŃii retorice: paratactice şi

hipotactice. O relaŃie este paratactică, sau echinucleară, dacă leagă doi sau

mai mulŃi constituienŃi egali ca importanŃă şi hipotactică dacă leagă

constituienŃi ce nu sunt egali ca importanŃă. Între constituienŃii uniŃi de relaŃiile

hipotactice există întotdeauna unul singur mai important, numit nucleu, ceilalŃi

fiind numiŃi sateli Ńi. La relaŃiile paratactice, prin convenŃie se consideră că toŃi

constituienŃii sunt nuclei.

Aceste relaŃii sunt detaliate în 27 de tipuri ce diferă prin legătura

semantică dintre fragmentele legate şi de semnificaŃia individuală a

constituenŃilor. Un exemplu de astfel de relaŃie [după Mann şi Thompson,

1988] :

Numele relaŃiei: EVIDENCE

Constrângeri asupra N: Este posibil ca cititorul R să nu aibă

un grad de încredere satisfăcător

Page 2: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

(pentru scriitor) asupra informaŃiei

conŃinute de nucleul N

Constrângeri asupra S: R este convins de adevărul

informaŃiei conŃinute de satelitul S

sau o crede credibilă

Constrângeri asupra N+S: ÎnŃelegerea de către R a informaŃiei

din S face ca încrederea R în

informaŃiei din N sa crească

Efectul: Încrederea R în N creşte

Locul efectului: N

Exemplu: [Adevărul este că presiunea

psihologică de a fuma este mai mare

în timpul liceului decât va fi în oricare

altă perioadă a vieŃii.]N[Ştim că 3000

noi adolescenŃi încep să fumeze în

fiecare zi.]S

Aceste relaŃii sunt legate pentru a forma arborele de discurs ce

acoperă întreaga lungime a discursului după cinci scheme [Mann şi

Thompson, 1988]:

CIRCUMSTANCE

S N

N N

CONTRAST

Page 3: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Mann şi Thompson descriu astfel analiza unui text în concepŃia RST ca

fiind o serie de aplicaŃii ale schemelor precedente asupra unor unităŃi

elementare de discurs sau asupra unor fragmente continue şi adiacente de

discurs, această analiză având proprietăŃile [Mann şi Thompson, 1988]:

Completivitate : Există o aplicare a unei scheme a cărei

rădăcină

acoperă întregul text

Conectivitate : Cu excepŃia rădăcinii, fiecare component al unei

aplicaŃii este fie o unitate elementară, fie rădăcina unei alte

aplicaŃii de schemă

N N

JOIN

MOTIVATION ENABLEMENT

S S N

SEQUENCE SEQUENCE

N NN

Page 4: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Unicitate : Fiecare rădăcină a unei aplicări de schemă acoperă o

altă zonă din discurs

Adiacen Ńă: Zonele de discurs implicate în aplicarea unei

scheme sunt adiacente

[Mann şi Thompson, 1988], ca şi [Moser şi Moore, 1996], dau

următoarele criterii de identificare a nucleului faŃă de satelit, valabile atât la

nivelul unităŃilor elementare de discurs cât şi la nivelul fragmentelor mai mari:

Testul ştergerii : cînd un satelit este şters, segmentul încă mai poate

îndeplini funcŃia iniŃială în text, deşi probabil acum ea este slăbită. Cînd un

nucleu este şters, textul este mult mai puŃin inteligibil.

Testul înlocuirii : un satelit poate fi înlocuit cu o altă informaŃie fără a

altera funcŃia segmentului, ceea ce nu e valabil în cazul nucleului. Există, ca

şi în cazul ştergerii, o puternică asimetrie între a înlocui un satelit şi a înlocui

un nucleu.

Un exemplu de structură RST [Cristea, 2001], pentru textul:

1. Când a ajuns Apolo în muntele Parnas,

2. dihania uriaşă s-a avântat spre dânsul,

3. dornică să-l ucidă.

4. Dar zeul şi-a întins arcul.

5. A tras prima săgeată.

6. Erau doar patru zile de când văzuse lumea,

7. şi întâia lui săgeată a şi nimerit monstrul.

din “Legendele Olimpului” de Alexandru Mitru

2-3 PURPOSE

CIRCUMSTANCE 1-3

1 CONCESSION 6-7 4 5

CONTRAST

SEQUENCE 4-7 SEQUENCE

1-7

Comment [D1]: Mai multe exemple. Vezi în [Moser, Moore, Gled., 1995]

Page 5: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

2.4.2 Probleme şi soluŃii în RST

Principalul lucru ce i se reproşează teoriei lui Mann şi Thompson este,

aşa cum îl formulează Marcu [Marcu, 1997], lipsa unor criterii suficiente de

compoziŃionalitate care să elimine ambiguităŃile şi să garanteze posibilitatea

obŃinerii automate a structurii RST a oricărui discurs.

Descrierea modului de construcŃie a arborelui RST şi a modului de

identificare a relaŃiilor retorice este insuficient detaliată, lăsând loc pentru

interpretări personale şi variante multiple corecte pentru acelaşi discurs.

Un exemplu [după Moore şi Pollack , 1993]:

1. Întoarce-te la ora 5:00.

2. Atunci putem merge la magazin înainte de a se închide.

3. Astfel o sa putem termina rafturile în seara asta.

Există două reprezentări RST la fel de corecte:

Porblema îşi poate avea originea fie în descrierea insuficentă a

relaŃiilor retorice posibile, fie lipsa unei modalităŃi de a lua o decizie în cazuri

ambigue. Marcu [Marcu, 1997] propune soluŃii pentru ambele cauze: identifică

3

1

condition

2

condition

1

2

motivation

3

motivation

Page 6: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

78 de tipuri noi de relaŃii mai puŃin ambigue decât cele 27 originale şi propune

un criteriu de compoziŃionalitate [Marcu, 1997]: ” Daca o relaŃie retorică R

există între două fragmente de text în reprezentarea sa ca arbore, atunci acea

relaŃie există şi între cele mai importante unităŃi ale acelor fragmente.”

ObiecŃii asupra RST au mai fost ridicate privind lipsa unei ontologii a

relaŃiilor retorice [Hovy, 1990, Maier, 1993] şi ignorarea fragmentelor

întrerupte de text [Cawsey, 1991].

Deşi insuficient de deterministă din puntul de vedere al generării

automate, RST are un potenŃial deosebit atât în crearea unor algoritmi de

interpretare şi generare automată a discursului cât şi ca punct de plecare

pentru alte teorii, aşa cum voi arăta în (2.2.1) şi (4.5).

2.5 Teoria Centrelor (CT)

2.5.1 Origine

ExistenŃa a cel puŃin două teorii acceptate asupra structurii globale a

discursului (RST 2.3, AST 2.6.1) a lăsat loc pentru definirea unei teorii asupra

coerenŃei locale a discursului. Deşi RST permite fomalizarea relaŃiilor dintre

unităŃile discursului şi modul în care contribuie ele la semnificaŃia şi forma

discursului, nu precizează nimic referitor la coerenŃa şi structura locală, din

interiorul acestor unităŃi elementare, şi nici nu explică de ce unele texte sunt

mai uşor de interpretat decât altele, fie de un analizor uman, fie de unul

automat.

IniŃial apărută ca idee încă din 1981 [Joshi şi Weinstein, 1981], Teoria

Centrelor a fost definită ca atare în 1995 [Grosz, Joshi şi Weinstein, 1995] şi

a dat prima descriere funcŃională a coerenŃei la nivel de unităŃi elementare de

discurs.

Principalul scop al CT, definit de autori [Grosz, Joshi şi Weinstein,

1995] este să explice de ce unele texte sunt mai greu de interpretat decât

altele. Fie exemplul :

a. George a jucat şah cu Victor.

Page 7: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

b. El a câştigat repede, apoi Victor a plecat să joace fotbal.

c. El era un şahist talentat.

Acest text poate fi înŃeles cu uşurinŃă, nefiind probleme în a identifica

pronumele “el” din ultima propoziŃie ca refindu-se la George.

a. George a jucat şah cu Victor.

b. El a câştigat repede, apoi Victor a plecat să joace fotbal.

c. El a dat un gol.

.

În acest exemplu avem o dificultate în a identifica persoana referită de

pronumele din a treia propoziŃie. Putem recunoaşte pe “el” ca fiind Victor doar

pentru că acŃiunea realizată se leagă de acŃiunea sa din a doua propoziŃie.

CT presupune discursul împărŃit în unităŃi. Ce înseamnã unitate de

discurs nu este definit riguros în teorie. Autorii utilizeazã termenul utterance

(exprimare), în toate exemplele acestea fiind fraze, dar putem considera

aceeaşi unitate ca şi în cazul RST, respectiv o propoziŃie, uneori o clauză.

Expresiile referenŃiale cuprinse într-o unitate realizează centre . Un

centru este o entitate semantică, spre deosebire de o expresie referenŃială

care este o entitate lexicală.

CT explică această dificultate prin schimbarea centrului principal de

la propoziŃia a doua la a treia. Centrul unei propoziŃii este identificat ca find

entitatea principală a unei unităŃi de discurs, în general cea care are şi rol de

subiect şi apare la începutul propoziŃiei. Schimbarea centrului principal implică

o dificultate sporită la înŃelegerea textului.

În modelul formal propus de CT, pentru fiecare unitate de discurs Un se

construieşte o listă de centre anticipatoare (forward-looking centers) notată

Cf(Un) ce conŃine toate centrele din Un. Ordinea centrelor din Cf(Un) trebuie să

reflecte importanŃa lor în Un. Criteriul de ordonare folosit iniŃial de Joshi şi

Weinstein este:

subiect > obiect direct > obiect indirect > complemente > adjuncŃii

Page 8: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Elementele listei Cf(Un) sunt acele elemente despre care se vorbeşte în

Un, deci este cel mai probabil că se va continua a se vorbi şi în unitatea

următoare Un+1. Primul element din lista Cf(Un), deci şi cel mai important, se

notează cu Cp(Un) (principal center). Fiecărei unităŃi îi este de asemenea

asociat un centru retroactiv Cb(Un) (backward-looking center). Pentru prima

unitate (segment) a discursului Cb(Un) este considerat implicit ca fiind acelaşi

cu Cp(Un), pentru toate celelalte unităŃi el este primul element din Cf(Un) ce

apare în Cf(Un+1).

Definind aceste centre pentru oricare două unităŃi elementare

consecutive dintr-un discurs putem face o listă a variantelor de tranziŃii

posibile [Brennan, Friedmann şi Pollard, 1987, Grosz, Joshi şi Weinstein,

1995]:

Continuare (continuing): Cb(Un+1) = Cb(Un) şi Cb(Un+1) = Cp(Un+1), cu

alte cuvinte, între două unităŃi consecutive se păstrează acelaşi centru

retroactiv iar acesta este focusul unităŃii curente. Într-o altă exprimare, o

tranziŃie de tip continuare corespunde situaŃiei în care atît în Un cît şi în Un+1

se vorbeşte despre aceeaşi entitate şi este de aşteptat ca şi în unitatea

următoare să se vorbească despre ea. Exemplu [Cristea, 2001]:

Un: Ion i-a dat Mariei o floare.

Cf = ([Ion], [Maria], [o floare]) Cb = [Ion] Cp = [Ion]

Un+1: El a cerut-o apoi în căsătorie.

Cf = (el=[Ion], o=[Maria]) Cb = [Ion] Cp = [Ion]

Cb(Un+1) = Cb(Un) Cb(Un+1) = Cp(Un+1)

ReŃinere (retaining): Cb(Un+1) = Cb(Un) dar Cb(Un+1) ≠ Cp(Un+1), a cărui

interpretare este că deşi atît în Un cît şi în Un+1 se vorbeşte despre aceeaşi

entitate, este de aşteptat ca în unitatea următoare să se vorbească despre o

alta. Exemplu [Cristea, 2001]:

Un: Ion i-a dat Mariei o floare.

Cf = ([Ion], [Maria]) Cb = [Ion] Cp = [Ion]

Page 9: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Un+1: Ea i-a zîmbit.

Cf = (ea=[Maria], i=[Ion]) Cb = [Ion] Cp = [Maria]

Cb(Un+1) = Cb(Un) Cb(Un+1) ≠ Cp(Un+1)

Schimbare lin ă (smooth-shifting): Cb(Un+1) ≠ Cb(Un) dar Cb(Un+1) =

Cp(Un+1), cu semnificaŃia că deşi în Un şi în Un+1 nu se vorbeşte despre

aceeaşi entitate totuşi este de aşteptat ca în unitatea următoare să se

vorbească despre entitatea ce a fost în focus ultima oară. Exemplu [Cristea,

2001]:

Un: Ion i-a dat Mariei o floare.

Cf = ([Ion], [Maria], [o floare]) Cb = [Ion] Cp = [Ion]

Un+1: Ea i-a zîmbit lui Mihai.

Cf = (ea=[Maria], [Mihai]) Cb = [Maria] Cp = [Maria]

Cb(Un+1) ≠ Cb(Un) Cb(Un+1) = Cp(Un+1)

Schimbare abrupt ă (abrupt-shifting): Cb(Un+1) ≠ Cb(Un) şi Cb(Un+1) ≠

Cp(Un+1), cu semnificaŃia că în Un şi în Un+1 nu se vorbeşte despre aceeaşi

entitate şi este de aşteptat ca în unitatea următoare să se vorbească despre o

altă entitate decît ultima menŃionată. Exemplu [Cristea, 2001]:

Un: Ion i-a dat Mariei o floare.

Cf = ([Ion], [Maria], [o floare]) Cb = [Ion] Cp = [Ion]

Un+1: Mihai i-a zîmbit fetei.

Cf = ([Mihai], fata=[Maria],) Cb = [Maria] Cp = [Maria]

Cb(Un+1) ≠ Cb(Un) Cb(Un+1) ≠ Cp(Un+1)

Pe lângă noŃiunile şi formalizările prezentate anterior, Teoria Centrelor

mai defineşte două contsrângeri asupra centrelor şi tranziŃiilor dintre ele:

Regula 1 : Dacă există un element al listei Cf(Un) care să fie realizat ca

un pronume în Un+1 atunci Cb(Un+1) trebuie de asemenea să fie exprimat ca un

pronume.

Page 10: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Cu alte cuvinte această regulă interzice folosirea în Un+1 a pronumelor

ce referă centre realizate în Un dacă Cb(Un+1) nu este el însuşi realizat ca un

pronume. Abia după ce utilizez pronume pentru expresia lui Cb(Un+1) pot

eventual să mai folosesc alte pronume pentru expresia şi a altor centre

comune cu Un. Fie exemplul:

a. George este fratele Mariei.

b. El I-a dat o veste bună astăzi.

c. El I-a spus că ea va primi o vizită plăcută .

a’. George este fratele Mariei.

b’. El I-a dat o veste bună astăzi.

c’. George I-a spus că ea va primi o vizită plăcută .

CT stabileşte că cea de-a doua variantă e mai puŃin acceptabilă, adică

mai greu de procesat, decît prima. Folosirea referinŃei nominale George este

derutantă în condiŃiile în care pentru referirea personajului feminin se

foloseşte un pronume.

Regula 2 : SecvenŃele de continuări sînt preferabile secvenŃelor de

reŃineri, care sînt preferabile secvenŃelor de schimbări line, acestea fiind

preferabile secvenŃelor de schimbări bruşte: continuare < reŃinere < schimbare

lină < schimbare abruptă

Regula a doua se bazează pe presupunerea că anumite secvenŃe

produc o încărcare inferenŃială în ascultător mai mare decît altele. Exemplul

următor arată cum putem folosi această regulă pentru a interpreta un text

[după Grosz, Joshi şi Weinstein, 1983]:

1. Nu l-am văzut pe George de câteva zile.

2. Victor crede că el se pregăteşte pentru examenele sale.

3. Eu cred că el a plecat la mare cu Laura.

Page 11: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Problema constă în a afla cine este referentul pronumelui “el” din a

treia propoziŃie. Pentru primele două propoziŃii din secvenŃă avem situaŃia:

1. Nu l-am văzut pe George de câteva zile.

Cf = ([eu], “l” = [George], “George” = [George]) Cb = [Eu] Cp = [Eu]

2. Victor crede că el se pregăteşte pentru examenele sale.

Cf = (“Victor” = [Victor], “el” = [George], “examenele” = [examenele],

“sale” = [George]) Cb = [George] Cp = [Victor]

Pentru propoziŃia a treia următoarele două situaŃii sunt posibile: “el” =

[George] sau “el” = [Victor]. În primul caz situaŃia este următoarea:

3. Eu cred că el a plecat la mare cu Laura.

Cf = (“eu” = [eu], ”el”= [George], “mare” = [mare], “Laura” = [Laura]) Cb

= [George] Cp=[“eu”]

ceea ce determină a tranziŃie de tipul “reŃinere”, iar în cel de al doilea

caz:

3. Eu cred că el a plecat la mare cu Laura.

Cf = (“eu” = [eu], ”el”= [Victor], “mare” = [mare], “Laura” = [Laura]) Cb =

[Victor] Cp=[“eu”]

ceea ce determină a tranziŃie de tip “schimbare abruptă”. Cum regula a

doua a CT stabileşte că sunt de preferat tranziŃiile de tip “reŃinere” faŃă de cele

de tip “schimbare abruptă”, interpretarea preferată este aceea în care “el”

referă pe George nu pe Victor, ceea ce corespunde celei mai fireşti

interpretări.

Valoarea CT este evidentă în rezolvarea unei probleme importante ale

Lingvisticii ComputaŃionale, cum ar fi rezoluŃia anaforelor şi în special a

anaforelor pronomiale. CT oferă una dintre cele mai viabile metode de a

identifica referenŃii din propoziŃiile 2 şi 3 din exemplul anterior.

Page 12: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

2.5.2 Probleme şi soluŃii în CT

Principalul punct slab al Teoriei Centrelor este aplicabilitatea sa doar la

nivel local, în interiorul unui fragment de discurs. Deşi oferă o metodă viabilă

de a analiza coerenŃa la nivel local, în aplicaŃiile practice de tipul

interpretoarelor şi generatoarelor automate de discurs sunt rare situaŃiile în

care se lucrează doar la nivelul la care CT se poate aplica.

O altă problemă, întâlnită şi la RST, este cea a identificării unităŃilor

elementare de discurs. Deşi sunt elemente centrale ale ambelor teorii, este

greu de dat o definiŃie precisă a lor, identificarea putând fi particularizată la

diferiŃi cercetători.

Există situaŃii în care CT eşează în a identifica corect referenŃii din text.

Un examplu (dupa Carberry S., 1996):

1. Ioana şi Ion au avut parte de o revedere deosebită weekendul

trecut.

2. Ioana s-a întâlnit cu bunica ei sâmbătă.

3. Ion s-a întâlnit cu ea duminică.

1. Ioana şi Ion au avut parte de o revedere deosebită weekendul

trecut.

Cf = ([Ioana], [Ion], …) Cb = [Ioana] Cp=[Ioana]

2. Ioana s-a întâlnit cu bunica ei sâmbătă.

Cf = ([Ioana], [bunica], …) Cb = [Ioana] Cp=[Ioana]

3. Ion s-a întâlnit cu ea duminică.

Prima interpretare:

Cf = ([Ion], [Ioana], …) Cb = [Ioana] Cp=[Ion]

TranziŃie “reŃinere”

A doua interpretare:

Cf = ([Ion], [bunica], …) Cb = [bunica] Cp=[Ion]

TranziŃie “schimbare abruptă”

Page 13: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

CT interpretează deci propoziŃia 3 ca “Ion s-a întâlnit cu Ioana

duminică” în ciuda faptului că noi am fi găsit dimpotrivă că “Ion s-a întâlnit cu

bunica duminică” . SoluŃia pe care o propune Dan Cristea [Cristea, 2001] este

că aici intervine un alt criteriu ce are prioritate înainte de CT, un criteriu pe

care îl denumeşte constan Ńa pattern-ului compozi Ńional semantic . El este

enunŃat în felul următor: dacă două unităŃi succesive prezintă un pattern

compoziŃional similar atunci este probabil ca un număr cît mai mare de roluri

corespunzătoare să fie satisfăcute de referenŃi identici. În exemplu avem:

2. întălnit(Ioana, bunica, sâmbătă)

c. întălnit(Ion, X, duminică) conform criteriului X = bunica

CT nu este capabilă aici a infera referenŃii anaforici pronominali dar ea

prevede corect că 3 este dificil de procesat, pentru că tranziŃia dintre 2 şi 3

este o schimbare abruptă.

O importanŃa deosebită în prezicerile asupra încărcărilor inferenŃiale pe

care le avansează CT o are ordonarea elementelor listei centrelor

anticipatoare, pentru că în funcŃie de ordinea acestor elemente se calculează

Cb-ul, Cp-ul şi, de aici, tipul de tranziŃie. Mai multe studii s-au preocupat de

găsirea celui mai corect criteriu de ordonare a elementelor listei Cf.

O abordare foarte interesantă este datorată lui Michael Strube şi Udo

Hahn [Strube şi Hahn, 1996] care avansează teoria func Ńional ă a centrelor

(functional centering). Era clar că rolul sintactic nu putea satisface o limbă ca

germana cu o ordine variabilă a elementelor în frază şi în care informaŃia dată

de rolul sintactic e mult mai puŃin predictivă asupra importanŃei centrelor într-o

exprimare. Strube şi Hahn propun ca ordonarea să se facă conform structurii

informaŃionale funcŃionale a uniturilor în termenii legării ori a nelegării în

context a elementelor de discurs. Ei propun trei niveluri de relaŃii de ordine

care să funcŃioneze pentru ordonarea elementelor listei Cf într-o limbă ca

germana [Strube şi Hahn, 1996]:

Page 14: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Element legat >ISbase element nelegat

Anafora >ISbound (pronume posesiv xor antecedent eliptic) >Isbound

(expresie eliptică xor head de expresie anaforică)

Head nominal >prec head nominal >prec …>prec head nominal

RelaŃia globală este apoi definită astfel:

>IS := {(x, y) | x şi y sînt head-uri lexicale şi

dacă x şi y reprezintă ambele acelaşi tip de pattern al structurii

informaŃionale

atunci relaŃia >prec se aplică între x şi y,

altfel dacă x şi y sunt amândouă diferite forme de elemente legate

atunci relaŃia >ISbound se aplică între x şi y

altfel relaŃia >ISbase se aplică între x şi y}

Alte criterii se ordonare a elementelor listei Cf sînt propuse în literatură

pentru limbi precum japoneza, italiana şi româna unde apare fenomenul

pronumelor vide (cu precădere pe post de subiect). Toate acestea impun

necesitatea unui studiu riguros asupra criteriilor specifice de ordonare a listei

Cf pentru aplicarea CT la fiecare limbă în parte. În lipsa unui astfel de studiu,

observaŃii empirice lasă ca opŃiune implicită o ordonare ce urmăreşte

îndeaproape ordinea de suprafaŃă.

Deşi nu este perfectă, CT este unul din elementele principale în

evaluarea arborilor parŃiali (4.11.2) dezvoltaŃi de aplicaŃia prezentată, ordinea

elementelor din Cf fiind luată cea implicită.

2.6 Teoria Venelor (VT)

Dan Cristea, Nancz Ide şi Laurent Romary Propun în 1998 [Cristea, Ide

şi Romary, 1998] propun o generalizare a Teoriei Centrelor de la nivel local la

nivelul global al discursului. Astfel, în vreme ce CT se ocupă de problema

referenŃialităŃii între unităŃi de discurs adiacente şi situate în acelaşi fragment

Page 15: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

al discursului (referinŃe locale), VT ia în consideraŃie relaŃiile dintre structurile

globale ale discursului şi rezoluŃia anaforei, identificând domenii de

accesibilitate ale referinŃelor pentru fiecare unitate de discurs peste structura

arborescentă a discursului.

VT are la bază următoarele principii, similar RST:

• Structura unui discurs poate fi reprezentată printr-un arbore, care în cazul

VT este binar

• Un nod terminal (frunză) din acel arbore reprezintă o unitate elementară a

discursului, considerată a fi o propoziŃie sau clauză

• Un nod intermediar din arbore reprezintă o mulŃime de unităŃi elementare

adiacente ce formează un fragment continuu de discurs care are o

structură proprie

• Nodurile arborelui sunt polarizate: ele pot fin nuclee sau sateliŃi funcŃie de

importanŃa lor relativ la semnificaŃia discursului

• VT nu identifică tipuri de relaŃii între nodurile arborelui, spre deosebire de

cele 27 identificate de RST

VT introduce o serie de noŃiuni importante:

Expresia “head” a unui nod este lista ordonată (în ordinea apariŃiei în

discurs) a celor mai importante unităŃi din fragmentul de discurs

corespounzător nodului. Aceasta se calculează “bottom-up” în felul următor:

• “head”-ul unui nod terminal este eticheta sa (a unităŃii elementare

respective)

• “head”-ul unui nod neterminal este concatenarea “head”-urilor nodurilor fii

nucleare

Expresia “head” proiectează unitaŃile importante în arbore până la nivelul

cla care ele ajung să facă parte dintr-un satelit sau până la rădăcina arborelui.

Expresia “ven ă” (vena) unui nod reprezintă lista ordonată (în ordinea

apariŃiei în discurs) a unităŃilor elementare ce sunt necesare pentru a înŃelege

semnificaŃia fragmentului de discurs acoperit de nod în contextul întregului

discurs. “Venele” se calculează “top-down” în felul următor:

• expresia “venă” a rădăcinii este aceeaşi cu expresia “head” a rădăcinii

Page 16: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

• expresia “venă” a unui nod nuclear fără frate satelit la stânga este

aceeaşi cu expresia “venă” a nodului părinte

• expresia “venă” a unui nod nuclear cu frate satelit la stânga este

concatenarea expresiei “venă” a nodului părinte cu unităŃile marcate

din “head”-ul fratelui

• expresia “venă” a unui fiu stâng satelit este concatenarea “venei”

părintelui cu expresia “head” a nodului respectiv

• expresia “venă” a unui fiu satelit drept este concatenarea “venei”

părintelui, din care sunt eliminate unităŃile marcate, cu expresia “head”

a nodului respectiv

Un exemplu de calcul al acestor expresii şi de reprezentare a arborelui cu

“vene” marcate:

1. Când l-a auzit pe George în camera alăturată

2. Victor l-a chemat

3. ca să-I ceară ajutorul.

4. Însă Victor îl deranjase pe George

5. şi acesta se întoarse în camera sa.

6. Deşi George îl refuzase categoric,

7. Victor încă mai spera să îl ajute.

H=2 4 5 7 V=2 4 5 7

H=5 7 V=2 4 5 7

H=4 5 7 V=2 4 5 7

1

2 3

4 H=7

V=2 4 5 7 H=4

H=1 V=1 2 4 5 7

H=2 V=2 4 5 7

Page 17: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Cu “H” este notată expresia “head” iar cu “V” expresia “venă” a unui

nod. Cu linii îngroşate sunt marcate pe arbore liniile principale de

argumentaŃie în text, aşa cum sunt ele deduse din expresiile “venă” calculate.

O altă noŃine introdusă de VT este aceea de domeniu de

accesibilitate evocativ ă (DEA domain of evocative accesibility) al unui nod

terminal şi reprezintă o listă de unităŃi elementare de discurs, ordonate în

ordinea apariŃiei lor, în care este cel mai probabil să fie găsiŃi antecedenŃii

anaforici ai entităŃilor semantice din unitatea elementară desemnată de nod.

DEA se calculează, pentru unitatea “u” ca fiind prefixul venei unităŃii u luat

până la apariŃia unităŃii “u” (toate unităŃile apar în expresia “venă” a lor).

VT introduce pe baza noŃiunii de domeniu de accesibilitate evocativă,

trei tipuri de referinŃe posibile în discurs:

• Dacă A şi B sunt unităŃi în care apare aceeaşi entitate semantică,

referinŃa dintre cele două reprezentări lexicale ale entităŃii este

direct ă dacă A apare în DEA(B) şi antecedentul din A este cel mai

apropiat antecedent din discurs faŃă de anaforul din B

• Dacă A şi B sunt unităŃi în care apare aceeaşi entitate semantică,

referinŃa dintre cele două reprezentări lexicale ale entităŃii este

indirect ă dacă A apare în DEA(B) şi antecedentul din A nu este cel

Page 18: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

mai apropiat antecedent din discurs faŃă de anaforul din B, ci există

un alt antecedent mai apropiat care face parte dintr-o unitate ce nu

apare în DEA(B)

• ReferinŃa dintre cele două reprezentări lexicale ale unei entităŃii

semantice din unitatea A este inferen Ńială dacă antecedenŃii ei nu

apar în nici o unitate din DEA(A)

Referitor la coeziunea discursului , Teoria Venelor defineşte

următoarea regulă: AntecedenŃii unui anafor se găsesc cel mai probabil în

domeniul de accesibilitate evocativă dat de expresia “venă” a unităŃii

elementare căreia îi aparŃine anaforul.

Dacă se asociază celor patru tipuri de tranziŃii definite de Teoria

Centrelor un scor conform regulii a doua a CT privind coerenŃa, de exemplu:

(CNT) continuare = 4

(RET) reŃinere = 3

(SSH) schimbare lină = 2

(ASH) schimbare abruptă = 1

putem calcula un scor de coeren Ńă global ă a unui discurs însumând

scorurile tranziŃiilor existente şi împărŃind această valoare la numărul total de

tranziŃii. Acest scor poate fi calculat folosind tranziŃiile dintre unităŃile

adiacente din discurs, sau folosind unitatea anterioară din expresia “venă” a

fiecăreia, obŃinând două scoruri pentru acelaşi număr de tranziŃii.

Privind coeren Ńa discursului , VT afirmă: Scorul de coerenŃă globală

calculat folosind unităŃile antecedente de pe vene este cel puŃin la fel de mare

ca cel folosind unităŃile antecedente din discurs.

Un exemplu de calcul al acestor două scoruri (pentru exemplul

anterior):

G = [George], ca = [camera], V = [Victor], a = [ajutorul]

Scorul folosind unităŃile precedente liniar:

1 2 3 4 5 6 7

Page 19: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Cf G,ca V,G G,a V,G G,c,G G,V V,V

Cb G G G G G G V

Tranz

RET CON RET CON CON ASH

Scor

3 4 3 4 4 1

Global 19/6 =

3.16

Scorul folosind unităŃile precedente pe “vene”

1

2

(pre 1)

3

(pre 2)

4

(pre 2)

5

(pre 4)

6

(pre 5)

7

(pre 6)

Cf G,ca V,G G,a V,G G,c,G G,V V,V

Cb G G G G G G V

Tranz

RET CON RET CON CON ASH

Scor

3 4 3 4 4 1

Global 19/6 =

3.16

Fiind încă o teorie nouă, VT are potenŃialul de a deveni un mijloc

funcŃional util de a pune în comun părtile importante din RST şi CT, adăugând

şi o modalitate validă de a eficientiza rezoluŃia anaforei.

Page 20: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

Teoria Venelor este elementul central în două părŃi esenŃiale ale

aplicaŃiei dezvoltate în acest proiect, şi anume motorul de rezoluŃie a anaforei

(4.6.4) şi evaluarea arborilor (4.8.2).

2.7 Alte teorii importante asupra discursului

2.7.1 Grosz şi Sidner (AST)

Teoria Stărilor AtenŃionale [Grosz şi Sidner, 1986] reprezintă prima

tentativă semnificativă în desluşirea structurii discursului. Teoria postulează

legătura dintre intenŃiile vorbitorului, dinamica atenŃiei în recepŃionarea textului

(focusul) şi structura discursului. Un model al manierei în care discursul este

procesat este simultan elaborat.

Conform teoriei lui Grosz şi Sidner intenŃiile joacă rolul principal în

explicarea structurii discursului în timp ce dinamica atenŃiei joacă rolul

principal în explicarea procesării discursului. Structura discursului are trei

componente distincte dar strîns corelate:

• o structur ă lingvistic ă care face ca una sau mai multe propoziŃii, unităŃi

elementare să fie agregate într-un segment de discurs iar limitele dintre

segmente să fie indicate de expresii lingvistice, intonaŃie, schimbări ale

timpului şi aspectelor verbelor. Deşi două exprimări adiacente pot face

parte din acelaşi segment, este de asemenea posibil ca doua exprimări

consecutive să aparŃină la segmente diferite, după cum este posibil ca

două exprimări neconsecutive să aparŃină aceluiaşi segment.

• o structur ă inten Ńional ă care face să vedem discursul ca avînd un scop

global (SD – scopul discursului) care este scopul fundamental al

vorbitorului/scriitorului la emiterea discursului şi fiecare segment al său –

un scop al segmentului (SSD – scopul segmentului de discurs) care este

un subscop al scopului segmentului din care face el parte. Dintr-un punct

de vedere intuitiv SSD specifică cum contribuie respectivul subsegment la

realizarea scopului segmentului din care face el parte. Teoria recunoaşte

infinitatea intenŃiilor posibil a fi transmise de un discurs: nu există o listă

Page 21: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

finită de scopuri ale discursului, care să facă posibilă o comparaŃie cu lista

categoriilor gramaticale, de exemplu. Însă deşi există un număr infinit de

intenŃii, numai un număr finit de relaŃii dintre ele pot fi puse în evidenŃă.

Conform teoriei două relaŃii structurale joacă un rol important în

compunerea structurii discursului: rela Ńia de dominan Ńă (dacă SSD1

domină SSD2 atunci SSD2 contribuie la SSD1, sau SSD2 este intenŃionată

a satisface parŃial SSD1 şi rela Ńia de satisfacere-preceden Ńă (SSD1

satisface-precede SSD2 dacă SSD1 trebuie satisfăcut înainte de SSD2);

• starea aten Ńional ă prin care se asociază un spaŃiu al entităŃilor aflate în

centrul atenŃiei fiecărui segment al discursului. Starea atenŃională este o

proprietate a discursului iar nu a participanŃilor la discurs. Ea reprezintă o

trăsătură dinamică a discursului, păstrînd obiecte, propriet ăŃi şi rela Ńii ce

sînt importante la fiecare moment al parcurgerii discursului. Starea

atenŃională e modelată printr-un set de spa Ńii ale centrelor aten Ńiei , în

timp ce schimbările ce pot avea loc în starea atenŃională sînt restricŃionate

de un set de reguli de tranziŃie care arată condiŃiile de adăugare şi

ştergere a spaŃiilor. ColecŃia tuturor spaŃiilor centrelor de atenŃie ce sînt

disponibile în fiecare moment al interpretării unui discurs formează o

structură a atenŃiei ce are dinamica unei stive .

AST s-a dovedit a avea multe elemente mai puŃin compatibile cu structura

discursurilor reale [Cristea, 2001], dar ea merită remarcată ca având o

contribuŃie importantă la dezvoltarea teoriilor ulterioare asupra discursului.

2.7.2 Hobbs Teoria propusă de Jerry Hobbs [Hobbs, 1996] este parte a unei teorii

complexe ce îşi propune să explice relaŃiile existente între interpretarea unui

discurs, evenimente reale şi bagajul de cunoştinŃe şi credinŃe ale vorbitorului

şi ascultătorului.

Principala diferenŃă dintre teoria lui Hobbs şi celelalte teorii este natura

relaŃiilor ce trebuie să fie prezente în discurs pentru a-l face coerent. Astfel, el

afirmă că un discurs este coerent atunci când în el se vorbeşte despre

evenimente reale coerente, când reflectă o structură raŃională de cunoştinŃe,

Page 22: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

când ajută la legarea segmentelor discursului de cunoştinŃe anterioare ale

cititorului sau când ajută cititorul la recunoaşterea unor relaŃii inferenŃiale între

segmente ale discursului.

Similar RST, unităŃile elementare sunt clauze, relaŃiile retorice sunt fie

hipotactice, fie paratactice, iar structura discursului este reprezentată ca un

arbore. Metoda de analiză este însă diferită. Hobbs propune un algoritm “top-

down” : în primul pas, analizorul identifica intuitiv fragmentele mari ale

discursului, apoi procedeaza similar pentru fiecare până obŃine o structură

arborescentă ce acoperă întregul discurs. În continuare se procedează în

manieră “bottom-up” la etichetarea nodurilor neterminale cu relaŃii de coerenŃă

împreună cu cunoştinŃele şi presupunerile care au stat la baza etichetării

nodului respectiv cu acel tip de relaŃie de coerenŃă.

2.7.3 Polanyi Teoria propusă de Livia Polanyi [Polanyi, 1996] este deasemenea

compatibilă cu elementele esenŃiale ale RST: structura discursului este

arborescentă, unităŃile elementare sunt clauze distincte.

Polanyi propune o abordare incrementală a analizei discursului şi a

creării arborelui de struictură. Pentru asta, presupune că fiecare unitate

elementară trebuie privită împreună cu contextul ce cunprinde informaŃiile

necesare analizei şi interpretării sale corecte. Analiza acestui context permite

stabilirea exactă a nodului la care se va face ataşarea noii unităŃi la arborele

precedent, precum şi tipul de relaŃie ce o leagă de vecin: de coordonare, de

subordonare, sau egalitate. Odată cu adăugarea unui nod la arbore contextul

tuturor nodurilor superioare sale se va modifica pentru a Ńine cont de noile

informaŃii aduse de unitatea adăugată.

Dificultatea evidentă legată de aplicabilitatea acestei teorii este lipsa

unui mecanism determinist de construcŃie a arborelui de discurs pe baza

premiselor acestei teorii. Deşi poate explica natura şi mecanismul analizei,

practic nu rezolvă problemele importante ale construcŃiei arborelui de discurs.

Page 23: 2.4. Teoria Structurii Retorice (RST)ipistol/tlu0708/res/discurs.pdf · Descrierea modului de construc Ńie a arborelui RST şi a modului de identificare a rela Ńiilor retorice este

2.7.4 Marcu Daniel Marcu a formulat o teorie asupra construcŃiei arborelui de

discurs [Marcu, 1997] având la bază RST. Astfel, unităŃile elementare sunt de

asemenea clauze, relaŃiile retorice sunt de aceeaşi natură, dar mai detaliate şi

structurate (78 faŃă de 27 la RST).

Arborele de discurs în teoria lui Marcu arată însă diferit de cel RST: el

este binar, frunzele sale sunt unităŃi elementare ale discursului, nodurile pot fi

nucleare sau sateliŃi, au ataşat o relaŃie retorică ce le leagă de arbore şi un

listă de promovare (promotion set) ce identifică unităŃile elementare cele mai

importante aflate sub acel nod. ConstrucŃia arborelui se face similar RST,

Marcu însă adaugă un criteriu de compozi Ńionalitate : ” Daca o relaŃie

retorică R există între două fragmente de text în reprezentarea sa ca arbore,

atunci acea relaŃie există şi între cele mai importante unităŃi ale acelor

fragmente.” Această regulă, precum şi detalierea relaŃiilor retorice, ajută la

eliminarea cel puŃin parŃială a nedeterminismului în construcŃia arborelui RST.