ARXIU DE CORPUS DE LA UNIVERSITAT DE BARCELONA

CORPUS D'INFORMATIUS ORALS

PAUTES I NORMES DE TRANSCRIPCIÓ

Aquest manual ha estat elaborat per Eugènia Ustrell Peñafiel, amb l'assessorament de Lluís de Yzaguirre i Maura i la col.laboració de Natàlia Centelles i M. del Mar Massanell.

SounEdit(TM), MacRecorder(R) i Apple són marques comercials registrades de llurs propietaris.

  1. INTRODUCCIÓ
  2. CAPÍTOL 1- El programa SoundEdit
    1. Com obrir i desar un document.
    2. Com sortir del programa.
    3. La finestra de SoundEdit.
    4. Funcions de les diferents icones, controls i indicadors.
    5. Icones que s'utilitzen en el procés d'etiquetatge.
  3. CAPÍTOL 2 - Procés d'etiquetatge
    1. Selecció de settings.
    2. Com etiquetar.
    3. Com modificar una etiqueta.
    4. Caixes d'informes.
  4. CAPÍTOL 3 - Procediment de transcripció. Normes de codificació
    1. Subdivisió de la cadena fònica (barra de subratllat).
    2. Codificació d'incidències (parèntesis, claudàtors, asterisc).
    3. Altres normes de transcripció.
    4. Identificació de transcriptors, supervisors i locutors.
    5. Redistribució de fitxers.
    6. Fragments que no s'etiqueten.
  5. CAPÍTOL 4 - Possibles problemes
  6. ANNEX 1. Versió de treball de la PEOSFIEC

INTRODUCCIÓ

Es pressuposa que l'usuari d'aquest manual té els següents coneixements bàsics de Mac:

  1. Com engegar i apagar l'ordinador.
  2. L'escriptori del Macintosh.
  3. L'ús del ratolí (selecció de comandaments, obrir una icona, activar una finestra, ampliar o reduir una finestra, tancar-la, moure-la).
  4. L'ús del teclat.
  5. Instal.lació de programes (inserir i treure un disc flexible, copiar el contingut d'un disc, guardar el contingut d'un disc, utilitzar la paperera).
  6. Com fer una còpia de seguretat.
Si ets nou en l'entorn Macintosh, segueix la visita guiada Tècniques Bàsiques.

CAPÍTOL 1: El programa SoundEdit

Com obrir i desar un document

Per obrir un document feu dos clics sobre la icona. El document s'obre i apareix la pantalla del SoundEdit. Un cop heu fet l'etiquetatge, podeu tancar la finestra fent clic al quadre de tancament que hi ha a l'esquerra de la barra de títol. Apareixerà un quadre de diàleg que preguntarà si voleu desar els canvis realitzats (Save changes to "X" begore closing?); feu clic a "Yes" si voleu tancar el document i conservar les modificacions realitzades.

2.- Com sortir del programa.

Quan sortiu del document el programa no es tanca, sinó que queda obert i actiu. Per sortir del programa heu de seleccionar l'opció "Quit" del menú "File". També ho podeu fer prement la tecla i la tecla Q al mateix temps. Si us apareix un quadre de diàleg i us pregunta si voleu desar els canvis realitzats, feu clic a "Yes" si voleu conservar-los.

3.- La finestra del SoundEdit.

El programa SoundEdit permet visualitzar el so gràficament com un senyal. Quan obriu un dels fitxers, a la finestra hi veieu un oscil.lograma i, a la part de baix, tota una sèrie d'icones, controls i indicadors que s'utilitzen per enregistrar, reproduir i editar sons.

botó de tancament, nom del fitxer, oscil.lograma, etiquetes, barra de desplaçaments, enregistrar, escoltar, zoom, control de volum, control d'espectre, mode, velocitat de mostreig, posició de la busca, longitud del fitxer, fragment seleccionat, rull

4.- Funcions de les diferents icones, controls i indicadors. Breu descripció.

1- Barra d'etiquetes. Sobre aquesta barra és on s'escriuen les etiquetes de text. El punt de reproducció es mou seguint aquesta barra.

2.- Barra de posició relativa. És una barra de desplaçament horitzontal que indica quina és la part del contingut de l'oscil.lograma que es visualitza (excepte si tot és visible).

3.- Etiqueta. És el text que identifica un sector de l'oscil.lograma.

4.- Punt d'inserció. És una línia vertical llarga que indica la situació a l'oscil.lograma. Un punt d'inserció es crea marcant amb el punter qualsevol lloc de l'oscil.lograma.

5.- Punt de reproducció. És una línia vertical curta que es mou al llarg de la barra d'etiquetes quan es reprodueix un so. Indica quin sector del so s'està reproduint en cada moment.

6.- Icona d'enregistrament del so.

Serveix exclusivament per a l'enregistrament del so provinent del micròfon.

7.- Icona de reproducció del so.

Permet de reproduir una selecció, un so sencer o bé el sector del so a la dreta del punt d'inserció.

8.- Icona de control d'entrada.

Es fa servir per canviar el detall amb què es visualitza el so, ja sigui ampliant-lo o bé reduint-lo.

9.- Icona de nivell d'entrada.

Ajuda a determinar el nivell òptim d'entrada del so.

10.- Icona d'anàlisi espectral.

Permet de veure un gràfic en temps real de les freqüències del so d'entrada provinent del micròfon.

11.- Mode.

El programa SoundEdit pot reproduir el so en mono o en estèreo. El mode en què està reproduint apareix a la part de baix de la finestra.

12.- Velocitat de mostreig/relació de compressió.

Mostra el nombre d'intervals per segon que es fan servir per capturar un so digitalitzat. SoundEdit suporta velocitats de 22, 11, 7 i 5 KHz. Afecta la qualitat del so. Hi ha quatre relacions de compressió. Un so comprimit és aquell que s'ha alterat de tal manera que requereix menys memòria; comprimint el so, però, se'n redueix la qualitat.

13.- Caixa d'informe de situació del punter.

Indica la situació del punter a l'oscil.lograma.

14.- Caixa d'informe de longitud de l'oscil.lograma.

Indica la longitud de l'ona sencera. El valor que apareix a la caixa es pot visualitzar en mostres, segons o fraccions de segon.

15.- Caixes d'informe de selecció.

Visualitzen la situació del punt d'inserció o bé del començament i final d'una selecció.

16.- Caixes d'informe del bucle sense fi.

Mostren on comença o on acaba un bucle fònic de repetició. Si no n'hi ha, les dues caixes tenen zero. Els valors que apareixen a les caixes es poden visualitzar en mostres, segons o fraccions de segon. El bucle sense fi és un sector del so que es torna a repetir quan es reprodueix el so.

Icones que s'utilitzen en el procés d'etiquetatge.

Icona de reproducció del so.

1.- Fent clic a la icona sentireu el so per l'altaveu de l'ordinador. Si no sentiu res, pot ser que accidentalment hàgiu seleccionat una petita part del senyal provocant que SoundEdit només reprodueixi aquest tros en lloc de l'enregistrament sencer. Intenteu marcar amb el punter qualsevol lloc de l'oscil.lograma per crear un punt d'inserció i, llavors, torneu-ho a intentar prement de nou la icona de reproducció. A sota de l'oscil.lograma hi ha una línia vertical dita punt de reproducció. El punt de reproducció es mou al llarg de l'oscil.lograma per mostrar la part que s'està reproduint a cada moment.

2.- Feu clic sobre la icona. Torneu a fer clic per veure el punt de reproducció si l'havíeu perdut el primer cop.

3.- També es pot reproduir una part determinada de l'oscil.lograma. Ara seleccionareu i reproduireu la paraula "X".

4.- Col.loqueu el punter a l'esquerra de l'últim globus de l'oscil.lograma. Arrossegueu-lo fins al final del senyal per tal de seleccionar la paraula "X". El sector seleccionat apareix ressaltat.

5.- Feu clic sobre la icona de reproducció de so per reproduir la paraula "X".

També podeu reproduir un so amb les tecles de funcions ràpides-P. Prement de nou la icona atureu la reproducció. Quan heu fet una selecció i premeu la icona de reproducció, el programa SoundEdit reprodueix només una selecció. Quan teniu un punt d'inserció i premeu la icona, SoundEdit reprodueix el so sencer o el sector del so a la dreta del punt d'inserció. Podeu seleccionar l'oscil.lograma sencer fent-hi doble clic o bé amb l'ordre "Select All" al menú "Edit".

Per determinar quin sector del so es reproduirà seleccioneu "Play From Insert P" a la caixa de diàleg "User Options". Quan seleccioneu aquesta opció, SoundEdit reprodueix el sector del so a la dreta del punt d'inserció. Quan aquesta opció no està seleccionada, SoundEdit reprodueix el so sencer.

* Icona de control d'entrada- Zoom.

Es fa servir per canviar el detall amb què es visualitza l'oscil.lograma. Podeu veure l'ona ampliada més detalladament (zoom in) arrossegant l'indicador amb el punter cap a l'esquerra i podeu veure-la més reduïda (zoom out) arrossegant-lo cap a la dreta.

* Caixa d'informe de situació del punter.

Indica la situació del punter dintre de l'oscil.lograma. La situació del punter ve donada en les unitats de visualització seleccionades que poden ser mostres, segons o fraccions de segon.

* Caixes d'informe de selecció.

Visualitzen la situació del punt d'inserció o bé del començament i final d'una selecció. Els valors que apareixen a les caixes també es poden visualitzar en mostres, segons o fraccions de segon. Si no teniu cap fragment seleccionat, la caixa de l'esquerra indica la situació del punt d'inserció. El valor que es mostra a la caixa de la dreta ve determinat per l'ajust del "Display Range" a la caixa de diàleg "Display Options": si se selecciona "Left and Right" (dreta i esquerra), la caixa de la dreta també mostra la situació del punt d'inserció; per contra, si se selecciona "Left and Length" (esquerra i longitud), aleshores a la caixa de la dreta hi ha un zero. Si heu fet una selecció, la caixa de l'esquerra indica on comença. El valor que es mostra a la caixa de la dreta també ve determinat per l'ajust del "Display Range" a la caixa de diàleg "Display Options": si seleccioneu "Left and Right" (dreta i esquerra), la caixa de la dreta mostra el final de la selecció, mentre que si seleccioneu "Left and Length" (esquerra i longitud) la caixa de la dreta mostra la llargada de la selecció.

La resta d'icones, controls i indicadors només s'usen en cas d'enregistrament, activitat totalment exclosa durant el procés de transcripció.

CAPÍTOL 2

Procés d'etiquetatge

La transcripció ortogràfica d'un programa de Ràdio o TV per al Corpus es fa per fitxers que guarden fragments entre pauses i consisteix a delimitar les paraules que corresponen a cada part de l'enregistrament de veu digitalitzada.

La unitat d'emmagatzemament és el fitxer en format SoundEdit™. El conjunt de fitxers d'un programa té un nom seriat, és a dir, amb una part comuna i unes xifres consecutives que permeten recuperar-los en l'ordre cronològic original.

La unitat de segmentació és l'etiqueta, que normalment correspondrà a un mot, però sovint contindrà algun element extra, com pronoms o l'article apostrofats.

Abans de començar la transcripció, és necessari fer una selecció al menú "Settings" segons les indicacions que tot seguit s'assenyalen.

1.- Selecció de "Settings".

Si desplegueu el menú "Settings", us apareixerà el següent quadre:

Primer.- Ordre d'opcions de visualització ("Display Options"). L'ordre d'opcions de visualització afecta la manera com es visualitza un senyal en una finestra del programa SoundEdit. Quan es tria "Display Options" des del menú "Settings", apareix la caixa de diàleg (també es pot visualitzar aquesta caixa de diàleg fent doble clic just a fora de les caixes d'informes). Heu de seleccionar "Samples" i fer clic a "OK".

Segon.- Ordre de recordar ("Remember Options"). Heu de seleccionar "Remember Options" al menú "Settings". Un cop heu seleccionat "Samples", cal donar l'ordre de "Remember Options", ja que, un cop salvada, aquesta configuració és la que s'usa automàticament la següent vegada que obriu el programa SoundEdit.

2.- Etiquetatge. Com etiquetar.

Es posa en una etiqueta tot el que en un text normal va entre espais en blanc (als exemples següents, el contingut de cada etiqueta va entre cometes):

"ha" "d'escriure'l" "avui"

Tenim l'objectiu de generar un text normal a partir de les etiquetes. Doncs, l'ortografia s'ha d'assemblar al màxim a la normal, inclosos la puntuació i l'ús de les majúscules:

"L'entrenador" "del" "Barça," "Johan" "Cruyff," "critica" "la" "premsa."

Per etiquetar, el primer pas és fer una selecció d'un sector de l'oscil.lograma i escoltar-la. Heu de col.locar el punter a l'inici del sector que preteneu etiquetar i l'heu d'arrossegar fins allà on s'acabi; la paraula "X" ha quedat seleccionada. Feu clic sobre la icona de reproducció de so i si la selecció és correcta, escriviu l'etiqueta; l'etiqueta apareix centrada sota la selecció a la barra d'etiquetes. Per reproduir el sector de l'oscil.lograma que heu seleccionat, només cal que torneu a fer clic sobre la icona de reproducció de so. Per reseleccionar un sector etiquetat d'un senyal feu clic sobre l'etiqueta.

3.- Com modificar una etiqueta.

Per modificar etiquetes heu d'anar a l'ordre d'Edició d'etiquetes ("Edit Label") que us apareix quan desplegueu el menú "Edit":

Abans, però, heu de seleccionar el sector etiquetat fent clic sobre l'etiqueta que volgueu modificar. Us apareix un quadre de diàleg que ofereix la possibilitat de canviar el nom de l'etiqueta ("Label") o els valors de longitud de l'etiqueta ("Start" i "Length"). Un cop heu fet les modificacions necessàries, feu clic a "OK".

4.- Caixes d'informes de selecció.

Els valors de les caixes vénen determinats per l'ajust del "Display Range" a la caixa de diàleg "Display Options" al menú "Settings": heu de seleccionar "Left and Right" (dreta i esquerra) i donar l'ordre de "Remember Options". Si se selecciona un sector etiquetat (fent clic sobre l'etiqueta), les caixes d'informes de selecció d'un bloc visualitzen el començament i el final d'aquesta selecció, és a dir, de l'etiqueta. El valor de la caixa de l'esquerra indica on comença una etiqueta i el de la caixa de la dreta, on acaba. La xifra que mostra on acaba una etiqueta i la que mostra on comença l'etiqueta següent ha de ser la mateixa. El mètode més eficaç per evitar imprecisions a l'hora de marcar el valor de les etiquetes és fer servir les tecles de funcions ràpides de la manera següent:

1.- Escriviu la primera etiqueta. 2.- Amb l'etiqueta seleccionada, feu dos clics a la caixa d'informe de selecció de la dreta. 3.- Premeu i C al mateix temps. 4.- Feu dos clics a la caixa d'informe de selecció de l'esquerra i premeu i V al mateix temps. El valor inicial de la nova etiqueta serà el mateix que el valor final de l'etiqueta anterior. 5.- Feu clic i majúscules alhora i arrossegueu el punter fins allà on vulgueu fer acabar l'etiqueta següent. 6.- Escriviu l'etiqueta.

Heu de repetir aquest procediment fins a tenir tot el text etiquetat. CAPÍTOL 3

Procediment de transcripció. Normes de codificació.

1.- Problemes de subdivisió de la cadena fònica (barra de subratllat).

Sempre que una paraula monosil.làbica es realitzi tautosil.làbicament amb el mot immediat (sinalefa), de manera que resulti impossible de delimitar en la cadena fònica{1}1, les escriurem en la mateixa etiqueta unides per una barra de subratllat (caràcter que hi ha a les majúscules del guió, al costat del zero):

"que_estiguis" "quiet" "o" "no_acabarem"
"ha_aconseguit" "l'objectiu"

Aquesta norma s'aplicarà sempre que la sinalefa es pugui considerar normal.

Sempre que una paraula polisil.làbica es realitzi tautosil.làbicament amb el mot immediat (sinalefa), de manera que resulti impossible de delimitar en la cadena fònica, les escriurem per separat i afegirem una barra de subratllat (caràcter que hi ha a les majúscules del guió, al costat del zero) entre la vocal elidida i el límit de mot:]

"encara" "_està" "_animat"

Aquesta norma s'aplicarà sempre que la sinalefa es pugui considerar normal.

El mateix es farà sempre que dues paraules immediates tinguin una realització única i llarga per coincidència del fonema final i l'inicial, de manera que resultin impossibles de delimitar en la cadena fònica (entre una consonant implosiva i una explosiva, marcarem la primera):

"les_" "sabates"; "per_" "raons"

Si hi ha una lletra muda, marcarem, si és possible, l'altre mot:

millor "ensorrar" "_altres" que "ensorrar_" "altres"

2.- Codificació d'incidències (parèntesis, claudàtors, asterisc).

Quan el locutor deixi de pronunciar un so que normalment s'ha de pronunciar segons la PEOSFIEC{2}2 , l'escriurem entre parèntesis:

"p(r)ograma"; "lleng(u)a"; "qu(a)ranta"; "han" "(a)conseguit"; "am(b)" "escales"

Quan el locutor pronunciï un so que normalment no s'ha de pronunciar segons la PEOSFIEC, l'escriurem entre claudàtors:

"ide[i]a"; "du[gu]es"; "no[u]ranta"

El signe [ s'obté per la combinació de les tecles Alt+< i ] mitjançant Alt+' .

Quan el locutor pronunciï un mot d'una manera que no s'ajusta a l'ortografia, representarem la discrepància dins d'un parèntesi que contindrà dues parts separades per barra (primer la correcta, després l'observada); si el locutor ha dit [mi +¥ons] per "milions", escriurem "mil(i/l)ons".

Altres exemples:

"m(u/o)nicipal"; "t(è/e)xtil"; "atm(o/ó)sfera"; "(o/au)lor"

Altres exemples d'ús de la barra (extrets de fitxers no supervisats, ergo amb possibles errors):

"Aques(s/t)a", "compromi(s/ss)os", "redu(ï/i)a", "nota(b/p)lement", "(d/s)e", "qu(a)rantado(s/ss)(è/é)", "fa(c/ix)i", "(q/g)ue_el", "Clint(o/u)n", "pre(s/ss)ència", "qu(è/e)", "mati(s/ss)ades.", "{(s/x)(e)ixanta-u}", "pre(s/ss)idència", "12{dot(z/s)e}_anys", "po(s/ss)ar_el", "(g/c)overnador", "pre(s/ss)idencials_", "la_ideolo(g/x)ia", "60{(s/x)(e)ixanta}", "repre(s/ss)entant", "pre(s/ss)ident", "la_i(l.l/l)u(s/ss)ió_o", "po(b/p)le_", "se(g/c)le.", "proba(b/p)lement,", "(l/n)a", "prome(s/ss)es", "san(i/e)tari", "fa(c/ix)i", "reta(ll/i)ades*58", "co(l.l/l)aboradors", "vice- pre(s/ss)ident", "que_exerce(ix/r)*40", "e(x/s)plica_el", "ca(s/ss)a", "pre(s/ss)idirà", "Convergèn(ci/x)a", "h(a/e)uran", "per(ò/ó)", "verita(b/p)le", "13{tret(z/s)e}", "prev(è/é)ien", "el(e/a)ccions", "vi(st/ss)a", "(sei/xi)xanta*41?", "$45{(qua/coranta)}*22?", "in(c/ts)idents", "judic(i-a/ia)[a]l,", "$aquesta_impressi(ó/ò)", "És_c(è/é)rt*?", "se(m/t)mana", "d('/e)intervenir(,)", "d('/e)", "(l/ll)ògic", "d('/e)absoluta", "vu(ll/i)", "imp(e/i)deix", "22.000{vint-i-d(ue/o)s}", "$per(q/g)uè", "co(l.l/l)ectiu", "pota(b/p)le.$", "combusti(b/p)le", "anti-a(nn/n)exionista_*53", "c(o/u)ntra", "perqu(è/e)", "l(a/') instalaci(ó/ò)", "pú(b/p)lics", "c(ò/ó)sta.", "ren(di/ta)bilitzar", "f(o/ó)ra", "l(a/')imaginació", "l('/a)ocupació", "u(n/m)", "(o/u)n", " Es(p/f)orts.", "presid(è/é)ncia", "d'aqu(è/é)sta", "(Z/S)elanda", "supre(s/z)ió", "qu(è/e)_els", "gue(rr/r)a", "p(r)o(ss/s)es", "ciu(t/d)ats", "a(ss/s)etjades", "(de/a)*?", "mi(ss/s)ió", "t(ra/ar)slladat", "(I/J)ugoslàvia", "(j/y)a", "refu(gi/j/)ats", "d('/e)anar", "l'e(x/s)plosió", "l'e(x/s)plosió", "recomana(b/p)le,", "recomana(b/p)l(e),", "(t/d)ot", "po(t/d)ències", "a(q/g)uesta_", "co(l.l/l)ocació", "assole(ll/i)at", "mi(ss/s)ioneres", "fu(s/ss)ió", "s'ha_insta(l.l/l)at", "(eu/o)ropea.", "ha_ anu(l.l/l)at", "s(o/u)bretot", "reprova(b/p)le", "S.{ess(a/e)}", "so(l.l/l)icitar", "deci(s/ss)ió", "Aques(t/s)a*", "e(x/s)terior(s)", "exce(l.l/l)ents", "hau(r/d)à*", "nota(b/p)le", "d('/e)imposar-se", "qu(è/e)", "co(l.l/l)egi", "i(l.l/l)usions", "se(g/c)le", "p(r/l)àcticament", "constata(b/p)les.$", "nor(t/d)-americà", "d'a(q/g)uest", "pota(b/p)le", "possi(b/p)le", "(q/g)ue", "varia(b/p)le", "esta(b/p)les."

Als casos anteriors, tots reals, es detecta un ús impropi del parèntesi amb barra, que ha de servir per plantejar dues alternatives, no una supressió o addició d'un element.

-Els casos de caiguda d'un grafema s'ha de representar amb parèntesi senzill com "supres(s)ió" o "anul(.l)at" o "anti-an(n)exionista" i no "supre(ss/s)ió" ni "supre(s/z)ió" ni "anu(l.l/l)at" ni "anti- a(nn/n)exionista".

-Els casos d'addició d'un grafema s'ha de representar amb claudàtor com a "pres[s]ident" o "[l]lògic" i no "pre(s/ss)ident" ni "(l/ll)ògic".

Cal recordar que tenim l'objectiu d'obtenir llistats amb el text normal i també llistats pseudofonètics amb els errors, de manera que és molt correcta la codificació "refu(gi/j)ats" que es desdoblarà en "refugiats ≠ refujats" mentre que "refug(i)ats" es desdoblaria erròniament en "refugiats ≠ refugats". En aquesta línia, cal considerar errors clamorosos les etiquetes "(j/y)a" o "se(m/t)mana" que caldria formular com "(j/i)a" i "se(t/d)mana".

Codificació amb asterisc.

Davant de qualsevol dubte sobre com escriure un mot o qualsevol incidència, es posarà un asterisc seguit d'interrogant al final de l'etiqueta:

"Ièltsim*?"

Per indicar dificultats en la segmentació de dos mots usarem el codi *s darrere de la primera paraula.

Sovint l'ortografia no permet reflectir d'una manera unívoca un error de pronúncia. Altres vegades es tracta d'un fenomen complex difícil de sintetizar. Per a aquests casos, usarem els números de paràgraf (entre claudàtors a la versió inclosa en aquest fascicle). Per exemple, si un locutor oriental pronuncia "classe" i no , volem deixar- ne constància tenint en compte el paràgraf 18 de la PEOSFIEC{3}3 , però no ens serveix "classa", que equivaldria a . Doncs, escriurem "classe*18". Per raons de processament informàtic i de redundància d'informació, els nou primers paràgrafs es codificaran amb un zero entre l'asterisc i el número del paràgraf ("*08").

Algunes vegades ens trobarem una pronúncia que no correspon exactament al que descriu el paràgraf de la PEOSFIEC que parla del tema. En aquest cas, marcarem amb asterisc, seguit del número i del signe d'interrogació. Per exemple, el locutor pronuncia "atmosfera" [´d +mosfer´]. El problema de la trasllació de l'accent quedarà recollit en un parèntesi: "atm(o/ó)sfera" o "atm(o/ò)sfera". Però la no neutralització de la penúltima vocal s'ha de reflectir amb codi i el paràgraf 18 (vegeu nota recent) no parla exactament d'aquest cas. Doncs, etiquetarem:

"atm(o/ó)sfera*18?"

En casos dubtosos no previstos entre els anteriors, acabarem l'etiqueta amb un asterisc:

"sabaita*"

3.- Altres normes de transcripció.

Cal textualitzar tots els elements no textuals: dates, xifres, abreviatures, etc., car, en cas contrari, no s'hi poden aplicar les normes de transcripció anteriors. Escriurem primer les xifres, sigles o abreviatures habituals en l'escriptura i, a continuació, en posarem el desenvolupament entre claus.

"1994{mil}" "{nou-cents}" "{no[u]ranta-quatre}"

"J.{jota_}" "S.{ess(a/e)}"

Nota Bene: La clau d'obrir { s'obté amb la combinació de tecles Alt+§. La de tancar } s'obté mitjançant Alt+Maj+§.

No editarem mai etiquetes sense contingut sonor. Així, per exemple, "per" "a" són dues etiquetes però, en cas d'elisió de la "a", "per (a)" serà una sola etiqueta (en cas que considerem que calia pronunciar aquesta "a"). Si la seqüència "Aniria" "a" "escoltar-lo" és pronunciada, normalment, [´ni +ri´skul +tArlu], evitarem fer una etiqueta buida per a la "a" i, en canvi, posarem:

"aniria" "_a_escoltar-lo" o bé "aniria_a" "_escoltar-lo" o bé "aniria_a_" "escoltar-lo"

Posarem dins de parèntesi () la manifestació gràfica de les pauses esperables no realitzades.

"s'ha" reunit" "am(b)" "el" "secretari" "general" "d'Esquerra" "Republicana(,)_" "Àngel" "Colom."

Marcarem entre claudàtors [] els sons paralingüístics inserits en el text.

"Convergència" "i_Unió," "per" "la" "se(v)a" "banda," "[eau]" "proposa" "augmentar" "l'edat" "penal."

Nota Bene: per a la codificació d'aquests sons utilitzarem la Proposta de convencions de transcripció del discurs oral, de Lluís Payrató.

Els allargaments indeguts de vocals els marcarem entre claudàtors [].

"Els" "que[e]" "són" "titulars" "de" "menys" "de" "deu" "accions" "podran" "assistir" "a" "l'acte" "p(e)rò" "no" "pas" "votar."

Escriurem igualment entre claudàtors [] les paraules truncades i indicarem el truncament amb un guió - a continuació del segment pronunciat.

"Setién" "ha" "dit" "que," "[l'indep-]" "independentment" "de" "qui" "hi_hagi[n]" "darrere" "de" l'assassinat", "aquest" "és" "reprova(b/p)le."

4.- Identificació de transcriptors, supervisors i locutors.

Cada transcriptor(a) té un codi d'identificació de tres xifres precedides per "T" (majúscula). Cada vegada que comenci a transcriure una sèrie de fitxers consecutius, marcarà el primer fitxer amb el seu codi. Això es farà incorporant aquest codi, seguit de dos punts (":"), a la primera etiqueta:

"T001:La"

Cada supervisor(a) té un codi d'identificació de dues xifres precedides per "S" (majúscula). Cada vegada que comenci a revisar una sèrie de fitxers consecutius, marcarà el primer fitxer amb el seu codi. Això es farà incorporant aquest codi, seguit de dos punts (":"), a la primera etiqueta:

"S07:Mentre"; "S01:T001:La"

Quan es produeix un canvi de locutor dins d'un fitxer o entre dos fitxers consecutius, cal incorporar un codi de locutor de tres xifres precedides per "L" (majúscula). Les xifres corresponen a un registre de locutors i pot ser el cas que el locutor en qüestió no hi hagi estat incorporat encara o que no se sàpiga qui és. Davant de qualsevol dubte sobre el número de codi del locutor, el/la qui transcriu es limitarà a codificar (com en els casos anteriors, a la primera etiqueta) el canvi de locutor sense especificar-ne el codi:

"L007:Certament"; "T001:L:Demà";

5.- Redistribució de fitxers.

Sempre que un fitxer contingui el final d'una frase i el començament de la següent, caldrà redistribuir-les. Per indicar el punt en què tallarem el fitxer, inclourem un dòlar ("$") com a darrer caràcter de la darrera etiqueta d'una frase:

"a" "la" "ciutat" "de" "Barcelona.$" "L'objectiu" "d'aquest" "pla"

Amb el mateix objectiu de redistribuir els fitxers de veu, indicarem amb un dòlar com a primer caràcter de la primera etiqueta d'un fitxer, que ha d'anar unit a l'anterior:

"$revisat" "anualment," "és" "garantir"

Observació: el dòlar inicial precedirà, si n'hi ha, les indicacions de transcriptor i de supervisor:

"$T099:S08:revisat" "anualment," "és" "garantir"

6.- Fragments que no s'etiqueten.

Sempre que hi hagi una seqüència sonora que no es transcrigui (música, sintonia, idiomes altres que català, soroll, etc.) es farà una única etiqueta per a tot el fragment que tindrà la forma {c:XXXXX}, en què XXXXX és una breu identificació com

{c:música} {c:sintonia} {c:castellà} {c:soroll}

CAPÍTOL 4: Problemes possibles

1.- No s'obre un document i apareix un missatge que us indica que l'intenteu obrir des de l'aplicació. Heu d'anar a la icona del Finder (angle superior dret de la pantalla de l'ordinador), seleccionar l'aplicació amb el punter i obrir-la. Un cop fet això, intenteu obrir el document a través de l'ordre "Open" del menú "File".

2.- Es perden canvis quan només corregim etiquetes. Aneu a l'arxiu i seleccioneu "Save As". Apareix un missatge que us demana posar el nom del document que voleu desar: heu de donar el mateix nom que té i "Save". Quan us pregunti si el voleu reemplaçar pel que ja existeix ("Replace existing"), heu de contestar "Yes".

3.- No se sent res. Aneu a la poma i dins dels taulers de control seleccioneu el so. Eleveu el volum del so de l'altaveu.

4.- Com neutralitzar una etiqueta que sobra. Per neutralitzar etiquetes heu de seguir el punt "Com modificar una etiqueta" del capítol 2, Procés d'Etiquetatge, a la pàgina 13. Heu d'eliminar el contingut textual i donar zeros als valors de longitud de l'etiqueta ("Start" i "Length"). Un cop heu fet les modificacions necessàries, feu clic a "OK" i l'etiqueta queda neutralitzada. NOTAS A PIE******************************** {1}1 Ergo, el criteri determinant és la cadena fònica: si observem dos sons diferents, tallarem pel mig i farem dues etiquetes; si resulta impossible subdividir el so fronterer sense alterar l'audició d'una de les dues paraules, farem una sola etiqueta amb el monosíl.lab i l'altre mot units pel subratllat o per l'apòstrof. {2}2 Proposta d'Estàndard Oral de la Secció Filològica de l'Institut d'Estudis Catalans. {3}3 No són recomanables: (...) [18] La pronunciació, en els parlars orientals, d'una e tancada en comptes d'una vocal neutra en la síl.laba final de mots cultes com frase, examen, càncer, classe, etc.