L'estructura sil·làbica del català central


- El diccionari fonètic.

- Propòsit.

Una de les possibles continuïtats del material que hem produït és la creació de la base de dades necessària per a l'elaboració d'un diccionari fonètic plurigeolectal o, millor encara, el diccionari fonètic de l'estàndard oral. Aquesta base de dades no contindrà totes les paraules que tenim ara: excepte un model de cada verb, haurem d'eliminar la majoria de les formes verbals, deixant, de cada verb, només les formes nominals i la primera persona del present d'indicatiu en el cas dels verbs amb infinitiu arizotònic que tenen una "e" o una "o" tònica en les formes rizotòniques (com "menjar", "trencar", "tocar" i "mocar"). Els verbs irregulars hi seran amb totes les formes (són menys de vint mil). En total tindrem unes dues-centes mil formes ortogràfiques.

L'estructura de la base de dades per al diccionari fonètic haurà de tenir in extenso moltes de les informacions que ara tenim compactades:

- Avantatges d'aquest plantejament.

És evident que un diccionari fonètic que inclogui tots els mots de la llengua (encara que n'excloguem els termes que no formen part de la llengua comuna) amb la seva flexió (o una part, en el cas dels verbs) i ofereixi per a cada mot diverses variants (no necessàriament només geolectals) només pot ser gestionat informàticament si aspirem a veure'l publicat abans que la pronúncia hagi evolucionat.

Però el plantejament que hem esbossat a l'apartat anterior pot semblar innecessàriament barroc si no hi afegim una justificació: si aconseguim que un conjunt de bases de dades i els programes que les manipulen ens permetin obtenir automàticament la pronúncia en una variant determinada voldrà dir que, a més del diccionari, posseïm una descripció vàlida dels processos regulars a partir dels quals s'obté la pronúncia d'un mot segons la seva ortografia i una llista exhaustiva de totes les irregularitats que es donen en aquests processos regulars.

Per exemple, imaginem que intentem implementar com a regla que els mots amb ela geminada han de pronunciar-se amb dues "eles", encara que s'admet la reducció a una "ela" en tots els mots excepte "cel·la" i "til·la". És una de les regles més complexes que ens poden sortir perquè 1) prescriu una opcionalitat, de manera que la regla ha de produir dos resultats, el segon dels quals quedarà etiquetat com a "admissible", i 2) preveu excepcions.

En primer lloc, haurem de formalitzar regles amb més d'una sortida, més complexes que les que hem resumit al capítol tercer, però gens difícils. En segon lloc, haurem d'establir una marca idiosincràtica per a la "ela geminada que es manté sempre". En tercer lloc, haurem d'incorporar aquesta marca a "cel·la" i "til·la".

Quan processarem aquesta informació, obtindrem dues transcripcions en el cas de "til·ler" i una en el cas de "til·la". Si quedem descontents d'aquest resultat, ens haurem de replantejar si el que no volem és que tots els mots tinguin una alternativa admissible o si alguns mots en particular no han de tenir-la, és a dir, si modifiquem la regla o la llista d'excepcions.

Probablement aquest procediment resultarà laboriós; però l'acumulació manual en una base de dades de totes les transcripcions resultaria molt més laboriosa i molt menys profitosa: no solament perdríem l'ocasió de compendiar les regles i excepcions a què suara ens referíem sinó que la probabilitat que s'introduïssin errors fóra molt més elevada, amb la penalització que els errors no serien sistemàtics i, doncs, no es podrien corregir automàticament.

- Exemples.

Hem fet una prova amb els mots que tenim amb unes regles que no han tingut en compte res més que la cadena de caràcters i no informacions que també es podrien considerar, com la categoria morfològica del mot o la posició respecte a l'accent.

Hem tipificat quatre geolectes (central, lleidatà, valencià i balear) i hem previst una versió més formal i una altra de més col·loquial.

Les regles que hem aplicat han estat:

Trobareu els exemples a continuació; en negreta hi ha el mot escrit ortogràficament, seguit de les diverses transcripcions sense cap indicatiu; la primera transcripció de cada element de la flexió del mot va precedida d'un guió.

a: - a A

a: - 'A - 'As

ab: - 'Ap - 'Aps

ababol: - aBa'BOl ABA'BOl - aBa'BOls ABA'BOls

ababolera: - aBaBu'lera ABABo'lerA aBaBo'lera - aBaBu'leras ABABo'leres aBaBo'leras

àbac: - 'ABak 'ABAk - 'ABaks 'ABAks abacà: - aBa'kA ABA'kA - aBa'kAs ABA'kAs

abacallanar: - aBakaLa'nA ABAkALA'nA ABAkALA'nAr aBakaja'nA - aBakaLa'nAn ABAkALA'nAn ABAkALA'nAnt aBakaja'nAn - aBakaLa'nAt ABAkALA'nAt aBakaja'nAt - aBakaLa'nADa ABAkALA'nADA aBakaja'nADa - aBakaLa'nAts ABAkALA'nAts aBakaja'nAts - aBakaLa'nADas ABAkALA'nADes aBakaja'nADas - aBaka'LAnu ABAkA'LAno ABAkA'LAne aBaka'jAn

abacial: - aBasi'Al ABAsi'Al aBa'sjAl ABA'sjAl - aBasi'Als ABAsi'Als aBa'sjAls ABA'sjAls

abaciologi: - aBasiu'lOZi ABAsio'lOZi aBasio'lOZi aBasju'lOZi ABAsjo'lOZi aBasjo'lOZi - aBasiu'lOZis ABAsio'lOZis aBasio'lOZis aBasju'lOZis ABAsjo'lOZis aBasjo'lOZis

abacista: - aBa'sista ABA'sistA - aBa'sistas ABA'sistes

abacomtat: - aBakum'tAt ABAkom'tAt aBakom'tAt - aBakum'tAts ABAkom'tAts aBakom'tAts

abacomte: - aBa'komta ABA'komte - aBa'komtas ABA'komtes

abadal: - aBa'DAl ABA'DAl - aBa'DAls ABA'DAls

abadanar: - aBaDa'nA ABADA'nA ABADA'nAr - aBaDa'nAn ABADA'nAn ABADA'nAnt - aBaDa'nAt ABADA'nAt - aBaDa'nADa ABADA'nADA - aBaDa'nAts ABADA'nAts - aBaDa'nADas ABADA'nADes - aBa'DAnu ABA'DAno ABA'DAne aBa'DAn abadeig: - aBa'DEtS ABA'DEtS - aBa'DEZus ABA'DEZos aBa'DEZos

abadernar: - aBaDaR'nA ABADeR'nA ABADeR'nAR - aBaDaR'nAn ABADeR'nAn ABADeR'nAnt - aBaDaR'nAt ABADeR'nAt - aBaDaR'nADa ABADeR'nADA - aBaDaR'nAts ABADeR'nAts - aBaDaR'nADas ABADeR'nADes - aBa'DERnu ABA'DERno ABA'DERne aBa'DERn- Conclusions.

Com a resultat del que hem presentat fins aquí, tenim el següent:

En tots els passos anteriors se'ns han presentat obstacles i també hem comès errors; sempre que ens n'hem adonat, hem deixat constància de limitacions i equivocacions que puguin influir en la validesa dels resultats.