textgrid89.38.230.23/wp-content/uploads/2016/04/manual-trans... · 2016. 4. 25. · 3 4.pentru...
TRANSCRIPT
1
Transcrierea ortografică a înregistrărilor [email protected]
Transcrierea ortografică a înregistrărilor audio presupune: utilizarea ortografiei limbii române; transcrierea literală a ezitărilor, vocalelor prelungite, repetiţiilor, cuvintelor trunchiate etc.; reprezentarea numerelor/datele calendaristice atât literal cât şi prin forma lor uzuală; transcrierea, cu distincţie, a abrevierilor şi acronimelor; numele proprii scrise cu majuscule; unităţile de măsură scrise cu minuscule; anonimizarea participanţilor la dialog; utilizarea cu măsura a semnelor de punctuaţie permise (? ! .,...).
Pentru transcrierea ortografică a înregistrărilor audio se va folosi aplicaţia gratuită Praat. Aplicaţia este disponibilă pentru mai multe sisteme de operare (Macintosh, Windows, Linux) şi poate fi descărcată de la adresa http://www.fon.hum.uva.nl/praat/.
Crearea unui fişier de transcriere presupune următorii paşi:1. încărcarea fişierului de sunet: Open/Read from file... sau Open/Open long sound file...
2. Selectarea fişierului de sunet, selectarea din meniul Annotate, din dreapta, a opţiunii To TextGrid...
2
3. Completarea numelor nivelurilor de adnotare, Tier names, cu transcription speaker, validarea datelor introduse cu OK
3
4. pentru completare/modificare a fişierului de transcriere se va selecta din lista de obiecte, stânga, fişierul de suntet cât şi (CTRL + ) fişierul de adnotare, selectarea, din meniul din dreapta nou apărut, a opţiunii View&Edit
5. nivelul de transcriere speaker va conţine graniţe pentru fiecare rostire a unui participant la dialog sau a unui grup de participanţi la dialog ce vorbesc sincronizat; segmentul creat va conţine iniţialele numelui vorbitorului (de ex. NP sau MF) sau iniţialele vorbitorilor demarcate cu + în cazul vorbirii sincrone (de ex. NP+MF dacă ar vorbi în acelaşi timp)
6. nivelul de transcriere transcription va conţine transcrierea ortografică propriuzisă
4
Set de convenţii pentru transcriera ortografică a înregistrărilor audio (nivelul transcription)
overlap rostirea curentă începe înainte de a se termina precedenta (cu 0.2 s; suprapunerea cu ultimul/o porţiune a ultimului cuvânt al rostirii anterioare)Exemplu: overlap Bună ziua şi mulţumesc pentru invitaţie…
demarcarea – fără transcriere cu graniţă la stânga şi la dreapta, a pauzei în vorbire în/între rostiri. Pauza – tăcere în vorbire, inclusiv nonvorbire, mai mare de 0.2 s
transcrierea cu graniţe, la stânga şi la dreapta, a evenimentelor nonlexicale sonore realizate de vorbitorul curent:inbreath inspiraţieoutbreath expiraţiecough tuselaugh râssneeze strănutthroat voce răguşităcrackstammer bolborosi, bâlbâi cry_babygulp înghiţimouthetc.
Exemplu:pun în practică u:n mare proiect de inginerie socială care vrea să transforme throat complet societatea
transcrierea fără marcarea graniţelor, stânga şi dreapta, împreună cu IDul vorbitorului ce realizează evenimentul nonlexical sonor inbreath_ID inspiraţieoutbreath_ID expiraţiecough_ID tuselaugh_ID râssneeze_ID strănutthroat_ID voce răguşităetc.
Exemplu:laugh_SF Toate se mişcă un pic mai greu la noi. Doamna gap Potoceanu gap ce înseamnă pensia pentru dumneavoastră?
trunc transcrierea cuvintelor trunchiateExemplu: Am trunc du trunc trimeso în Germania în cârjă la tatăsu.
Evenimentele de tip zgomot ce afectează înţelegerea discursului vor fi notate cu noise
unclearTranscriptorul nu este sigur pe cuvintele transcrise ca urmare a vorbirii sincrone sau zgomotului ambiental:unclear ipa sibisi unclear
unkSecţiune din înregistrare neinteligibilă.
5
gap Păstrarea anonimatului participanţilor la interviu.Exemplu: Invitata mea de astăzi este doamna profesor universitar gap Nadia Potoceanu gap.
[]Notaţie utilizată pentru marcarea porţiunilor de discurs sincrone. Exemple:[[SF Şi de care să aveţi grijă.][NP unk]]
SF Şi de care să aveţi grijă.NP unktranscriere [[SF Şi de care să aveţi grijă.][NP unk]]
[SF O viaţă de][[SF om ][NP o]][NP viaţă de om.]SF O viaţă de om.NP O viaţă de om.transcriere [SF O viaţă de] [[SF om ][NP o]] [NP viaţă de om.]
[[OC mix verbal=‘două mii paişpe’ 2014 mix][SN mix verbal=‘o mie nouă sute paisprezece’ 1914 mix]][SN mix verbal=‘două mii paisprezece’ 2014 mix]OC 2014SN 1914 2014transcriere [[OC mix verbal=‘două mii paişpe’
2014 mix][SN mix verbal=‘o mie nouă sute paisprezece’ 1914 mix]]
[SN mix verbal=‘două mii paisprezece’ 2014 mix]
: (două puncte)Vocală/consoană alungită, fără a specifica lungimea în milisecunde/secunde a acesteia.Exemplu:mergeam cu studenţii în practică sau la laboratoare, şi mă şo:chea:ză ceea ce este acum, adică spaţii goale sau de depozite
‘ (apostrof)Gruparea cuvintelor ce au o semnificaţie împreună.Exemple:Se cheamă 'Banca europeană de amintiri'. Şi este o bancă. Am făcut un mix verbal=‘sidiu’ CD mix
întrebarea ’oare eu aş fi dispus să mor pentru credinţă?’, ‘oare eu aş fi dispus să spun ă: 'poţi să mă ă: ucizi acum dar eu nu mă lepăd de Hristos’’?
Interjecţiile, transcrise ortografic. Exemplu: O:ho!
mixRedarea ortografică a rostirii de adrese web, acronime, numere, date calendaristice, cuvinte străineverbal transcrierea textuală
Exemple:mix verbal=‘ve ve ve punct radio iaşi punct ro’ www.radioiasi.ro mixmix verbal=‘u re se se’ URSS mix
6
mix verbal=‘sidiu’ CD mixPentru cazul în care transcrierea ortografică nu diferă de pronunţia verbală a cuvântului, nu se va mai marca cu acest element, de exemplu: cod CAEN
mix verbal=‘hobiuri’ hobbyuri mixmix verbal=‘velico gradişte’ Veliko Gradište mixcând am avut un proiect care sa creat mix verbal=‘uămăn iu chen’ 'Woman you can!' mix şi, adică 'Femeie tu poţi!', şi în care am spus că în grupul ţintă dorim neapărat să fie femei
mix verbal=‘cinci’ 5 mix mix verbal=‘paişpe mii cinci sute’ 14500 mix de euro
mix verbal=‘cinşpe treizeci’ 15:30 mixmix verbal=‘nouăşpe’ 19 mix
mix verbal=‘douăzeci şi nouă mai două mii cincisprezece’ 29 mai 2015 mix
mix verbal=‘unsprezece la sută’ 11% mix
mix verbal='în ă: tro' întro mix
Observaţii. Transcrierea ortografică este influenţată de mai mulţi factori: unităţi lingvistice ce nu se potrivesc cu ortografia standard a limbii române, de ex. cuvintele străine;
zgomotul ambiental; debitul vocal, vorbirea sincronă dintre doi sau mai mulţi vorbitori etc.; transcriptorul însuşi prin reconstruirea mesajului ce nu poate fi uşor de înţeles (ex. pronunţii dialectale) sau prin interschimbarea/înlocuirea unor cuvinte; conţinutul mesajului fiind foarte puţin modificat.
Exemplu: ‘să spunem aşa o vorbă din popor’ varianta corectă fiind ‘să spunem o vorbă aşa din popor’
Folosirea virguleiHD Da, a fost, a fost mare scandal.
ReferinţeBoersma, P. & Weenink, D. PRAAT: doing Phonetics by computer. Online: http://www.fon.hum.uva.nl/praat/
Tei, Guidelines for Electronic Text Encoding and Interchange, Transcription of Speech: http://www.teic.org/release/doc/teip5doc/en/html/TS.html