abordĂri neuronale

Upload: madlened

Post on 05-Jul-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/16/2019 ABORDĂRI NEURONALE

    1/6

    ABORDĂRI NEURONALEÎN TRADUCEREA AUTOMATĂ A TEXTELOR

    Dr. ing. Emil Olteanu – şef birou B.N.R. Sucursala Alba Conf. dr. Remus Joldeş – Univ. “1 Decembrie 1918” Alba IuliaConf. dr. Ioan Ileana – Univ. “1 Decembrie 1918” Alba Iulia 

    Lect. drd. Manuella Kadar – Univ. “1 Decembrie 1918” Alba Iulia 

    ABSTRACT: Automatic translation of texts represents a challange for the field of Artificial Intelligence. In this

     paper, the main difficulties of this special field have been emphasised and the approach with neural networks has been investigated.

    1.  Obiectul traducerii

    Problema traducerii (alături de cea a recunoaşterii formelor) este printre cele maicomplexe activităţi ale creierului omenesc. Problema nu poate fi abordată deocamdată, în toată amploarea ei. Trebuie avute în vedere, şi abordate diferite aspecte ale traducerii.

    Traducerea a fost multă vreme considerată ca fiind redarea unui text din limba-sursă  înlimba-destinaţie, astfel încât sensul de suprafaţă  al celor două  texte să  fie aproximativasemănător, iar structurile textului-bază să se păstreze în măsura în care nu afectează structurile

    textului-destinaţie. Actul traducerii reprezintă  una dintre cele mai pasionante şi mai dificileîntreprinderi ale spiritului uman. Concepţia conform căreia traducerea este simpla redare a unuitext, dintr-un limbaj sursă, într-un text din limbaj destinaţie, astfel încât sensul de suprafaţă  alcelor două  texte să  fie aproximativ asemănător, este o concepţie îngustă. Traducerea nu este oactivitate secundar ă, mecanică, ci un proces creator. “Traducerea trebuie ridicată  la demnitateaoperei originale.”[2. p. 20] Traducerea presupune multă muncă, pregătire, cunoştinţe, experienţă,simţ al limbii, intuiţie şi talent.

    În primul rând trebuie avut în vedere scopul traducerii. În cazul traducerii corespondenţeicomerciale internaţionale sau a unui contract, unde este vorba de obligaţii, termene scadente, nuse poate risca utilizarea unui program de traducere automată  a textului. Trebuie executată traducerea de către un expert, care să  fie un bun cunoscător al limbii, al domeniului în care se

    face traducerea, şi al uzanţelor internaţionale. Există anumite formule consacrate de exprimare,care trebuie bine cunoscute de către cel care face traducerea. De asemenea, acesta trebuie să fieun bun cunoscător al limbii şi să  cunoască  diferitele nuanţe ale cuvintelor, deoarece încomunicarea scrisă, unde nu trebuie să te întinzi la explicaţii interminabile, trebuie să utilizezi unstil sobru şi concis. Un cuvânt utilizat cu prea multă uşurinţă poate crea confuzii, care sunt greude înlăturat (autorul nefiind de faţă la citirea corespondenţei) şi care poate avea mari implicaţii înrelaţiile viitoare cu partenerul de afaceri. În această situaţie se poate folosi un program de asistarea traducerii, dotat cu dicţionare puternice şi de tipuri diferite (dicţionare de sinonime, dicţionare

    “CONSTANTIN BRÂNCUSI” UNIVERSITY – ENGINEERING FACULTY

    U N I V E R S I T Y ’ S D A YU N I V E R S I T Y ’ S D A YU N I V E R S I T Y ’ S D A YU N I V E R S I T Y ’ S D A Y

    8 th INTERNATIONAL CONFERENCETârgu Jiu, May 24-26, 2002 

    Târgu Jiu, Geneva Street, nr.3, 1400, Gorj, România,Tel.+4053215848, Fax+4053214462, www.utgjiu.ro 

  • 8/16/2019 ABORDĂRI NEURONALE

    2/6

    de expresii de corespondenţă  comercială  internaţională, de specialitate în domeniul economic, juridic şi altele).

    O altă situaţie deosebită de traducere este în cazul unei opere literare. O traducere simplă,mecanică, nu va fi citită cu plăcere de nimeni. În această situaţie traducerea trebuie f ăcută de un bun cunoscător al limbii, al obiceiurilor, al figurilor de stil, cu reale aptitudini de creaţie, în aşa

    fel încât traducerea să se ridice la valoarea originalului. Traducerea trebuie să fie şi ea o oper ă deartă.Una din problemele mari în domeniul traducerii este cea a sinonimelor. Pentru a sesiza

    complexitatea problemei prezentăm în continuare cazul cuvântului “casă” (în cazul unui programde traducere în 4 limbi – româna, engleză, franceză şi germană):

    De exemplu, cuvântul casă  poate fi tradus astfel (fiecare cuvânt din limbile engleză,franceză şi germană având ataşate şi sensurile lor în limba româna):a. - {în limba engleză} - house, (locuinţă, gospodărie, de casă, f ăcut în casă, a adă posti, a găzdui,

    a depozita, a înmagazina) dwelling  (locuinţă, casă, sălaş), home (locuinţă, reşedinţă, casă  părintească, ţar ă  sau loc de baştină, patrie, cămin, vatr ă, azil, ţintă  - în anumite jocuri,casnic, domestic, natal, intern, interior, spre casă, spre patrie, spre ţar ă);

     b. - {în limba francez } - maison  (casă, personal de serviciu, slugi, neam, familie, casă  decomer ţ), caisse  (ladă, cutie, casă  de bani, casă, birou, ghiveci), ménage  (căsnicie,gospodărie, pereche, familie), famille (familie, neam);

    c. - {în limba german } -  Haus  (casă, loc), Gebäude  (clădire), Wohnung (locuinţă), Haushalt(gospodărie), Heim (cămin).Lucrurile se complică  şi mai mult, deoarece pornind de la aceleaşi cuvinte putem avea

    expresii, care să aibă înţelesuri complet diferite în celelalte limbi. Exemple de expresii în limbaromână care conţin cuvântul “casă” şi traducerile lor în limba:

    {engleză}; ( ~ pentru plată) pay desk; ( ~ de ajutor reciproc) Mutual Aid Fund; (~ deamanet) pawn shop; ( ~ de bani) strongbox; ( ~ de bilete) booking office; ( ~ de economii)savings bank; ( ~ de naşteri) maternity house; ( ~ de odihnă) rest home; ( ~ de toleranţă) bawdyhouse; (în ~ ) indoors.

    {franceză}; ( ~ de bani) coffre-fort; ( ~ de bilete) guichet; ( ~ de odihnă) maison derepos; ( ~ de cultur ă) foyer culturel; (fată în ~ ) bonne.

    {germană}; ( ~ de nebuni) Narrenhaus; ( ~ părintească) Elternhaus; ( ~ de odihnă)Erholungsheim; (cu ~ şi masă) mit Kost und Logis; ( ~ de bani) Kasse; ( ~ de economii)Sparkasse; ( ~ de comenzi) Versandhaus; (casa scării) Treppenhaus; ( ~ de toleranţă)Freudenhaus, Bordell.

    Cuvintele respective pot forma expresii şi în celelalte limbi.De exemplu cuvântul “house” din limba engleză (traducerea cuvântului casă), poate intra

    în compunerea următoarelor expresii sau cuvinte compuse: darkhouse, mormânt; house andhome, confort casnic; from house to house, din poartă în poartă; house of cards, castel din căr ţi de joc; like a house on fire, repede şi uşor; town house, reşedinţă la oraş, primărie; country house,castel, vilă la ţar ă; house fly, muscă; house arrest , domiciliu for ţat; House of Commons, CameraComunelor;  House of Lords, Camera Lorzilor;  House of Representatives, CameraReprezentanţilor (în S.U.A.); lower house, camera inferioar ă, camera deputaţilor; upper house,camera superioar ă, senat; to make a house, a-şi asigura majoritatea; a bill before the House, olege în curs de votare; housekeeping , menaj; public house, restaurant, birt, cârciumă; the House,Bursa din Londra; housebreaker , spărgător; household , casă, familie, menaj, servitorii casei,gospodărie, casnic; household word , zicătoare, cuvânt obişnuit, expresie curentă; householder ,cap de familie, gospodar, proprietar de casă; housekeeper , administrator, intendent, menajer ,guvernată; houseless, f ăr ă  domiciliu; house linen, rufe, albituri; housemaid , fată  în casă,

  • 8/16/2019 ABORDĂRI NEURONALE

    3/6

    servitoare, slujnică; house top, acoperi ; housemaster , director de internat, cămin; housemother ,directoare de cămin, gospodină, matroană; housewarming , petrecere pentru inaugurarea casei;housewife, trusă de cusut, gospodină, stă pâna casei; housewifely, gospodar, menajer; house work ,treburi casnice.

    Cuvântul “Haus” din limba germană  (traducerea cuvântului casă), poate intra în

    compunerea următoarelor expresii sau cuvinte compuse: zu Hause sein, a fi versat; von Haus aus,originar, din naştere; Haus’armer , sărac, ruşinos; Haus’arrest , arest disciplinar; haus’backen, decasă, simplu, prozaic; Haus’bewohner , locatar, chiriaş; Haus’freund , amic al casei; Haus’genoss,colocatar;  Haus’gesinde, slugi;  Haus’halt , gospodărie, menaj;  Haus’hälter , gospodar, econom; Haus’haltung, Haus’stand , menaj;  Haus’herr , stă pânul casei;  Haus’hofmeister , intendent; Haus’hund , câine domestic;  Haus’jungfer, Haus’mädschen, fată  în casă;  Haus’katze, pisică domestică; Haus’lehrer , profesor particular; Haus’leute, chiriaşi; Haus’marder , dihor; Haus’zins,chirie.

    Cazurile prezentate sunt extreme. Sunt multe situaţii unde o traducere automată ar fi demare utilitate. Astfel de cazuri sunt foarte multe, printre care, “frunzărirea” corespondenţei,citirea revistelor de specialitate etc. În astfel de cazuri un program de traducere este extrem deutil.

    2. Alte metode de abordare a traducerii

    Problema traducerii automate a fost abordată în mai multe moduri, în funcţie de putereacalculatoarelor utilizate şi de preţul lor de cost. Înainte de apariţia calculatoarelor personale, când programatorul nu avea acces direct la calculator, se prefera o traducere complet automată.Posibilităţile extrem de reduse ale calculatoarelor au dus la limitări extrem de severe: vocabularredus (în jur de 1.000 de cuvinte), gramatică  redusă, traduceri simple. În paralel, specialiştiinterdisciplinari, au creat teorii foarte laborioase in domeniul matematicii formale şi al limbajelornaturale, care sunt foarte greu de simulat pe calculator.

    O dată cu apariţia calculatoarelor personale, a apărut posibilitatea traducerii interactive, încare utilizatorul poate sta în faţa calculatorului şi interveni în procesul de traducere. Dezvoltareadeosebită în continuare a acestora, a creat posibilitatea utilizării de resurse foarte mari (dicţionareuriaşe, gramatici foarte laborioase), şi utilizării de tehnici de programare moderne (programareorientată  pe obiecte, programare condusă  de evenimente), tehnici foarte adecvate pentru programele de traducere.

    3. Abordarea neuronală 

    Calculatorul tradiţional nu mai reuşeşte întotdeauna să  facă  faţă problemelor ce necesită calcul intensiv cum ar fi recunoaşterea formelor, controlul mişcării roboţilor, traducere automată,

    luarea deciziilor pe baza unor cantităţi mari de date cu zgomot etc., astfel încât s-au abordat şialte metode de prelucrare a informaţiilor, printre care prelucrarea distribuită [7].

    Una dintre aceste direcţii neconvenţionale de prelucrare a informaţiilor o constituiereţelele neuronale (calcul neuronal, conexionism). În contrast cu maşina Von Neumann careexecută  un program scris pe baza unui algoritm, reţelele neuronale învaţă  prin exemple.Rezultatul învăţării nu este un cod ci o reprezentare distribuită  a informaţiei. Reprezentareadistribuită şi calculul local caracteristic reţelelor neuronale micşorează complexitatea elementelorde calcul dar măreşte volumul conexiunilor dintre ele.

  • 8/16/2019 ABORDĂRI NEURONALE

    4/6

      Reţelele neuronale artificiale îşi au izvorul de inspiraţie în rezultatele obţinute deneuroştiinţe (biologie, neurobiofizică, neurofiziologie) care studiază sistemul nervos şi creieruluman. Creierul uman prezintă  o serie de caracteristici care ar fi deosebit de utile unor sistemeartificiale de calcul :

    •  este robust şi tolerant la defecte

    •  este flexibil (se poate adapta unui nou context prin învăţare)•   poate prelucra informaţii vagi, probabilistice, zgomotoase sau inconsistente•  este caracterizat de un înalt paralelism•  este mic, compact şi disipă foarte puţină energie.

    Este evident că un sistem artificial care ar avea astfel de tr ăsături ar fi o soluţie pentru problemele care în momentul de faţă nu pot fi rezonabil rezolvate de calculatoarele tradiţionale.Este şi motivul pentru care rezultatele obţinute de neuroştiinţe au fost folosite pentru a creamodele, foarte simplificate de altfel, ale funcţionării creierului. Pe de altă parte aceste modele potfi de folos pentru înţelegerea funcţionării creierului, în măsura în care modelele artificiale aureuşit să surprindă tr ăsăturile esenţiale ale acestuia.

    Unitatea de organizare a creierului (şi a sistemului nervos) este celula numită neuron.

    Creierul este format din circa 1011

     neuroni, de diferite tipuri. În figura 1 este reprezentatschematic un neuron natural. Un axon al unui neuron asigur ă conectarea cu circa 104 alţi neuroni.

    Fig. 1. Reprezentare schematică a unui neuron natural. Sursa: [11], pag. 2

    Pornind de la acest model al neuronului natural, McCullogh şi Pitts au propus în 1943 unmodel simplu de neuron artificial. Figura 2 ilustrează  un model uşor modificat de neuronartificial, foarte utilizat în aplicaţiile recente. În esenţă un astfel de neuron realizează o sumare ponderată a intr ărilor, rezultatul, net, fiind apoi folosit ca argument pentru o funcţie f neliniar ă.

    x1

    x2

    xn

    3333

    w2

    wn

    .

    .

    .

    w1

    netf  y

     

    Fig. 2. Reprezentare schematică a unui neuron artificial

    Sinapsă Axon

    Corpulcelulei

    Dendrite

     Nucleu

  • 8/16/2019 ABORDĂRI NEURONALE

    5/6

    3.1. Reţele neuronale feed-forward

    O primă abordare a traducerii automate cu ajutorul reţelelor neuronale ar putea folosi oreţea multistrat de tip feed-forward (fig. 3.), care ar realiza transformarea cuvintelor dintr-unspaţiu de intrare I (exemplu limba română) într-un spaţiu de ieşire E (exemplu limba engleză).

    Straturi ascunse

    X1X2

    X3

    Xn

    FxPrimul strat

    ascuns

    FyAl doilea strat

    ascunsStratul de

    iesire

    x 0 R n y 0 R m

    y1

    y2

    y3

    ym

     Fig. 3. Exemplu de reţea neuronală multistrat

    care poate realiza o transformare de la R n la R m 

    Principalele probleme ridicate de o astfel de abordare sunt următoarele:•  Traducerea trebuie f ăcută cuvânt cu cuvânt, astfel putându-se pierde nuanţa sau informaţia de

    context;•  Cuvintele trebuie transformate în vectori numerici de lungime constantă  (eventual se pot

    înlocui caracterele prin coduri şi se pot completa cu spaţii până la o lungime standard);•  Revenirea la forma uzuală a cuvântului implică o post procesare.

    3.2. Utilizarea memoriilor asociative

    O memorie asociativă este un sistem ce realizează asocierea a p perechi de forme >>>>i

    0R 

    n

    , .i

    0    R 

    m

    ,(i=1, 2,..., p) astfel încât atunci când sistemului i se prezintă un vector nou x   0R  n , cu proprietateacă:

    ) j,xmin(),x(d j

    iξ=ξ   (1)

    sistemul r ăspunde cu >>>>i Perechile (>>>>i, .i ), (i= 1,2,... p) se numesc prototipi iar asocierea realizată de memoria

    asociativă poate fi definită ca o transformare  : R n × R m  astfel încât: .i = (>>>>i). 

  • 8/16/2019 ABORDĂRI NEURONALE

    6/6

    Spaţiul Σδ R n al vectorilor de intrare x poartă numele de spaţiul configuraţiilor iar vectorii>>>>i, (i=1,2,...,p) se numesc atractori sau puncte fixe. În jurul fiecărui atractor există un bazin Bi deatracţie cu proprietatea că  x 0 Bi , dinamica reţelei va conduce la stabilizarea pe perechea (>>>>

    i,....i).

    Principalele probleme legate de astfel de memorii asociative, în afara celor semnalate în

    secţiunea precedentă, sunt capacitatea de memorare (numărul maxim p de perechi asociate),stabilitatea reţelei (evoluţia spre un atractor şi apoi stabilizarea în acesta), existenţa unor atractori paraziţi (diferiţi de prototipii memoraţi). 

    4. Concluzii

    Traducerea automată  sau asistarea utilizatorului în traducere reprezintă  o ţintă ambiţioasă, dificilă  şi încă  nesoluţionată  complet. Abordarea neuronală  poate aduce, datorită avantajelor evidenţiate în secţiunea 3, elemente interesante şi intenţionăm să  continuămexperimentele în această direcţie.

    BIBLIOGRAFIE:

    1. I. Andone - Inteligenţă  artificială  şi sisteme expert în contabilitate, Editura Moldova, Iaşi,1993.

    2. Andrei Bantaş, Elena Croitoru – Didactica traducerii, Editura Teora, Bucureşti, 1998.3. Michael Brookes şi David Homer - Business English - Engleza pentru afaceri - Editura Teora,

    Bucureşti, 1997.4. Adriana Chiriacescu, Laura Mureşan, Virginia Barghiei şi Alexander Hollinger -

    Corespondenţă de Afaceri în limbile Română şi Engleză - Editura Teora, Bucureşti, 1997.5. A.M. Florea, A.G. Boiangiu - Bazele logice ale inteligenţei artificiale, Universitatea Tehnică,

    Bucureşti, 1994.

    6. M. Frenţiu, B. Pârv - Elaborarea programelor. Metode şi tehnici moderne, Editura Promedia,Cluj-Napoca, 1994.7. Paul Hartley şi Gertrud Robins - Germana pentru oamenii de afaceri - Editura Teora,

    Bucureşti, 1998.8. A. Hollinger şi alţii - Ghid practic de corespondenţă  economică  în limba engleză, Bucureşti,

    A.S.E.,1990.9. J. Lyons - Introducere în lingvistica teoretică, Editura ştiinţifică, 1995.10. E. Olteanu, R. Joldeş  - Studiu privind posibilităţi de traducere cu ajutorul calculatorului

    compatibil IBM-PC. Primul Simpozion Internaţional de Informatică  Economică,Bucureşti, 18-22 mai 1993.

    12. E. Olteanu - Probleme legate de întocmirea unui dicţionar multilingv pentru programe de

    asistare a traducerii corespondenţei comerciale internaţionale - Sesiune ştiinţifică jubiliar ă cu participare internaţională "Procesul tranziţiei la economia de piaţă - abordare teoretică şi practică" 24-25 mai 1996.

    13. Luiza Seche, Mircea Seche, Irina Preda - Dicţionar de sinonime - Editura ştiinţifică  şiEnciclopedică, Bucureşti, 1989.

    14. Claudia Spircu şi Ionuţ  Lopătan - POO. Analiza, proiectarea şi programarea orientate spreobiecte - Editura Teora, Bucure ti, 1995.

    15. D. Zaharie, P. Năstase - Sisteme expert în economie, Editura Romcart, Bucureşti, 1993.