textgrid89.38.230.23/wp-content/uploads/2016/04/manual-trans... · 2016. 4. 25. · 3 4.pentru...

6
1 Transcrierea ortografică a înregistrărilor audio [email protected] Transcrierea ortografică a înregistrărilor audio presupune: utilizarea ortografiei limbii române; transcrierea literală a ezitărilor, vocalelor prelungite, repetiţiilor, cuvintelor trunchiate etc.; reprezentarea numerelor/datele calendaristice atât literal cât şi prin forma lor uzuală; transcrierea, cu distincţie, a abrevierilor şi acronimelor; numele proprii scrise cu majuscule; unităţile de măsură scrise cu minuscule; anonimizarea participanţilor la dialog; utilizarea cu măsura a semnelor de punctuaţie permise (? ! .,...). Pentru transcrierea ortografică a înregistrărilor audio se va folosi aplicaţia gratuită Praat. Aplicaţia este disponibilă pentru mai multe sisteme de operare (Macintosh, Windows, Linux) şi poate fi descărcată de la adresa http://www.fon.hum.uva.nl/praat/. Crearea unui fişier de transcriere presupune următorii paşi: 1. încărcarea fişierului de sunet: Open/Read from file... sau Open/Open long sound file... 2. Selectarea fişierului de sunet, selectarea din meniul Annotate, din dreapta, a opţiunii To TextGrid...

Upload: others

Post on 27-Feb-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TextGrid89.38.230.23/wp-content/uploads/2016/04/Manual-Trans... · 2016. 4. 25. · 3 4.pentru completare/modificare a fişierului de transcriere se va selecta din lista de obiecte,

1

Transcrierea ortografică a înregistrărilor [email protected]

Transcrierea ortografică a înregistrărilor audio presupune:­ utilizarea ortografiei limbii române;­ transcrierea literală a ezitărilor, vocalelor prelungite, repetiţiilor, cuvintelor trunchiate etc.;­ reprezentarea numerelor/datele calendaristice atât literal cât şi prin forma lor uzuală;­ transcrierea, cu distincţie, a abrevierilor şi acronimelor;­ numele proprii scrise cu majuscule;­ unităţile de măsură scrise cu minuscule;­ anonimizarea participanţilor la dialog;­ utilizarea cu măsura a semnelor de punctuaţie permise (? ! .,...).

Pentru transcrierea ortografică a înregistrărilor audio se va folosi aplicaţia gratuită Praat. Aplicaţia este disponibilă pentru mai multe sisteme de operare (Macintosh, Windows, Linux) şi poate fi descărcată de la adresa http://www.fon.hum.uva.nl/praat/.

Crearea unui fişier de transcriere presupune următorii paşi:1. încărcarea fişierului de sunet: Open/Read from file... sau Open/Open long sound file...

2. Selectarea fişierului de sunet, selectarea din meniul Annotate, din dreapta, a opţiunii To TextGrid...

Page 2: TextGrid89.38.230.23/wp-content/uploads/2016/04/Manual-Trans... · 2016. 4. 25. · 3 4.pentru completare/modificare a fişierului de transcriere se va selecta din lista de obiecte,

2

3. Completarea numelor nivelurilor de adnotare, Tier names, cu transcription speaker, validarea datelor introduse cu OK

Page 3: TextGrid89.38.230.23/wp-content/uploads/2016/04/Manual-Trans... · 2016. 4. 25. · 3 4.pentru completare/modificare a fişierului de transcriere se va selecta din lista de obiecte,

3

4. pentru completare/modificare a fişierului de transcriere se va selecta din lista de obiecte, stânga, fişierul de suntet cât şi (CTRL + ) fişierul de adnotare, selectarea, din meniul din dreapta nou apărut, a opţiunii View&Edit

5. nivelul de transcriere speaker va conţine graniţe pentru fiecare rostire a unui participant la dialog sau a unui grup de participanţi la dialog ce vorbesc sincronizat; segmentul creat va conţine iniţialele numelui vorbitorului (de ex. NP sau MF) sau iniţialele vorbitorilor demarcate cu + în cazul vorbirii sincrone (de ex. NP+MF dacă ar vorbi în acelaşi timp)

6. nivelul de transcriere transcription va conţine transcrierea ortografică propriu­zisă

Page 4: TextGrid89.38.230.23/wp-content/uploads/2016/04/Manual-Trans... · 2016. 4. 25. · 3 4.pentru completare/modificare a fişierului de transcriere se va selecta din lista de obiecte,

4

Set de convenţii pentru transcriera ortografică a înregistrărilor audio (nivelul transcription)

overlap rostirea curentă începe înainte de a se termina precedenta (cu 0.2 s; suprapunerea cu ultimul/o porţiune a ultimului cuvânt al rostirii anterioare)Exemplu: overlap Bună ziua şi mulţumesc pentru invitaţie…

demarcarea – fără transcriere ­ cu graniţă la stânga şi la dreapta, a pauzei în vorbire în/între rostiri. Pauza – tăcere în vorbire, inclusiv non­vorbire, mai mare de 0.2 s

transcrierea cu graniţe, la stânga şi la dreapta, a evenimentelor non­lexicale sonore realizate de vorbitorul curent:inbreath inspiraţieoutbreath expiraţiecough tuselaugh râssneeze strănutthroat voce răguşităcrackstammer bolborosi, bâlbâi cry_babygulp înghiţimouthetc.

Exemplu:pun în practică u:n mare proiect de inginerie socială care vrea să transforme throat complet societatea

transcrierea fără marcarea graniţelor, stânga şi dreapta, împreună cu ID­ul vorbitorului ce realizează evenimentul non­lexical sonor inbreath_ID inspiraţieoutbreath_ID expiraţiecough_ID tuselaugh_ID râssneeze_ID strănutthroat_ID voce răguşităetc.

Exemplu:laugh_SF Toate se mişcă un pic mai greu la noi. Doamna gap Potoceanu gap ce înseamnă pensia pentru dumneavoastră?

trunc transcrierea cuvintelor trunchiateExemplu: Am trunc du trunc trimes­o în Germania în cârjă la tată­su.

Evenimentele de tip zgomot ce afectează înţelegerea discursului vor fi notate cu noise

unclearTranscriptorul nu este sigur pe cuvintele transcrise ca urmare a vorbirii sincrone sau zgomotului ambiental:unclear ipa sibisi unclear

unkSecţiune din înregistrare neinteligibilă.

Page 5: TextGrid89.38.230.23/wp-content/uploads/2016/04/Manual-Trans... · 2016. 4. 25. · 3 4.pentru completare/modificare a fişierului de transcriere se va selecta din lista de obiecte,

5

gap Păstrarea anonimatului participanţilor la interviu.Exemplu: Invitata mea de astăzi este doamna profesor universitar gap Nadia Potoceanu gap.

[]Notaţie utilizată pentru marcarea porţiunilor de discurs sincrone. Exemple:[[SF Şi de care să aveţi grijă.][NP unk]]

SF Şi de care să aveţi grijă.NP unktranscriere [[SF Şi de care să aveţi grijă.][NP unk]]

[SF O viaţă de][[SF om ][NP o]][NP viaţă de om.]SF O viaţă de om.NP O viaţă de om.transcriere [SF O viaţă de] [[SF om ][NP o]] [NP viaţă de om.]

[[OC mix verbal=‘două mii paişpe’ 2014 mix][SN mix verbal=‘o mie nouă sute paisprezece’ 1914 mix]][SN mix verbal=‘două mii paisprezece’ 2014 mix]OC 2014SN 1914 2014transcriere [[OC mix verbal=‘două mii paişpe’

2014 mix][SN mix verbal=‘o mie nouă sute paisprezece’ 1914 mix]]

[SN mix verbal=‘două mii paisprezece’ 2014 mix]

: (două puncte)Vocală/consoană alungită, fără a specifica lungimea în milisecunde/secunde a acesteia.Exemplu:mergeam cu studenţii în practică sau la laboratoare, şi mă şo:chea:ză ceea ce este acum, adică spaţii goale sau de depozite

‘ (apostrof)Gruparea cuvintelor ce au o semnificaţie împreună.Exemple:Se cheamă 'Banca europeană de amintiri'. Şi este o bancă. Am făcut un mix verbal=‘sidiu’ CD mix

întrebarea ’oare eu aş fi dispus să mor pentru credinţă?’, ‘oare eu aş fi dispus să spun ă: 'poţi să mă ă: ucizi acum dar eu nu mă lepăd de Hristos’’?

Interjecţiile, transcrise ortografic. Exemplu: O:ho!

mixRedarea ortografică a rostirii de adrese web, acronime, numere, date calendaristice, cuvinte străineverbal transcrierea textuală

Exemple:mix verbal=‘ve ve ve punct radio iaşi punct ro’ www.radioiasi.ro mixmix verbal=‘u re se se’ URSS mix

Page 6: TextGrid89.38.230.23/wp-content/uploads/2016/04/Manual-Trans... · 2016. 4. 25. · 3 4.pentru completare/modificare a fişierului de transcriere se va selecta din lista de obiecte,

6

mix verbal=‘sidiu’ CD mixPentru cazul în care transcrierea ortografică nu diferă de pronunţia verbală a cuvântului, nu se va mai marca cu acest element, de exemplu: cod CAEN

mix verbal=‘hobiuri’ hobby­uri mixmix verbal=‘velico gradişte’ Veliko Gradište mixcând am avut un proiect care s­a creat mix verbal=‘uămăn iu chen’ 'Woman you can!' mix şi, adică 'Femeie ­ tu poţi!', şi în care am spus că în grupul ţintă dorim neapărat să fie femei

mix verbal=‘cinci’ 5 mix mix verbal=‘paişpe mii cinci sute’ 14500 mix de euro

mix verbal=‘cinşpe treizeci’ 15:30 mixmix verbal=‘nouăşpe’ 19 mix

mix verbal=‘douăzeci şi nouă mai două mii cincisprezece’ 29 mai 2015 mix

mix verbal=‘unsprezece la sută’ 11% mix

mix verbal='în ă: tr­o' într­o mix

Observaţii. Transcrierea ortografică este influenţată de mai mulţi factori:­ unităţi lingvistice ce nu se potrivesc cu ortografia standard a limbii române, de ex. cuvintele străine;

­ zgomotul ambiental;­ debitul vocal, vorbirea sincronă dintre doi sau mai mulţi vorbitori etc.;­ transcriptorul însuşi prin reconstruirea mesajului ce nu poate fi uşor de înţeles (ex. pronunţii dialectale) sau prin interschimbarea/înlocuirea unor cuvinte; conţinutul mesajului fiind foarte puţin modificat.

Exemplu: ‘să spunem aşa o vorbă din popor’ varianta corectă fiind ‘să spunem o vorbă aşa din popor’

Folosirea virguleiHD Da, a fost, a fost mare scandal.

ReferinţeBoersma, P. & Weenink, D. PRAAT: doing Phonetics by computer. Online: http://www.fon.hum.uva.nl/praat/

Tei, Guidelines for Electronic Text Encoding and Interchange, Transcription of Speech: http://www.tei­c.org/release/doc/tei­p5­doc/en/html/TS.html