Diccionari Ortològic Català

Teresa Cabré i Castellví, Lluís de Yzaguirre i Maura, Esteve Clua i Julve


Disponible en paper a Cabré, MT.; De Yzaguirre, Ll. i E. Clua (1999) "Diccionari ortològic català", conferència al Congrés Llengua i Mitjans de Comunicació. LXXV anys de ràdio. 1924-1999, Universitat de Lleida, desembre 1999. Publicada a Creus, I.; Julià, J i S. Romero (eds.) Llengua i mitjans de comunicació, Pagès editors.
 

1. Objectiu

La formulació actual de l'estàndard flexible com a síntesi entre la necessària unitat de la llengua i la pluralitat de models, siguin geogràfics, socials o estilístics, deixa un marge de decisió als professionals de la llengua oral, tant locutors com correctors, en què sovint se senten desassistits per la manca d'una eina de consulta adequada.

No tenim model de pronúncia al diccionari normatiu segurament per la mateixa raó per la qual no tenim un diccionari fonètic de l'estàndard flexible: la dificultat de cobrir les principals variants geogràfiques, modalitats formals o informals, pròpies, adequades o no recomanables; una publicació que cobrís totes aquestes variants seria complicada de produir, inviable econòmicament i amb molta informació supèrflua.

Aquesta comunicació presentarà un projecte per elaborar un diccionari ortològic que respongui a les necessitats professionals cobrint l'estàndard flexible. Evidentment, es tracta d'un projecte amb múltiples tapes i molts participants. Ha de tenir l'objectiu de fornir solucions als locutors, ortòlegs, actors de doblatge, productors multimèdia, ensenyants, oradors i enginyers lingüístics.

 

2.- Característiques

Les variables que configuren un diccionari com aquest són:

a) prescriptiu vs. descriptiu: amb els recursos que la nostra comunitat lingüística pot dedicar a una feina d'aquestes característiques, un diccionari descriptiu hauria caducat abans d'arribar al 50%; a més, per vocació, es tracta d'oferir una eina que orienti els professionals de la llengua oral davant de possibles dubtes en qüestions de fonètica normativa; doncs, el projecte ha de tenir un enfocament clarament prescriptiu, que no exclou la possibilitat de compendiar, seguint el model d'estàndard flexible, les pronúncies habituals desaconsellades.

b) fonemàtic vs. fonètic: partint de l'axioma que ha de ser possible, en la majoria dels casos, obtenir regularment les variants fonètiques tant geogràfiques com estilístiques a partir d'una única representació fonemàtica, el DOC tindrà per a cada forma compendiada una única representació fonemàtica; les formes en principi seran el lema i totes aquelles que se'n derivin i que necessitin tractament específic, com, per exemple, les formes rizotòniques amb "e" o "o" dels verbs. La possibilitat que hi hagi paraules en què no totes les variants fonètiques siguin predictibles a partir d'una única transcripció fonemàtica no solament no és un obstacle per al projecte sinó que representa un al·licient especial.

c) regular vs. irregular: un diccionari verbal que no inclogués els paradigmes dels models no seria de gran ajuda; de la mateixa manera, no seria gaire útil un diccionari fonemàtic que no proposés, per a cada variant, el conjunt de regles que permeten obtenir la realització fonètica d'una representació fonemàtica. El fet que les variants fonètiques s'obtinguin amb regles farà, també, més fàcil el manteniment diacrònic del diccionari, car una part important de les modificacions diacròniques afectaran les regles i no les representacions fonemàtiques.

d) lèxic vs. enciclopèdic: els dubtes ortològics quotidians dels professionals de la llengua oral no es limiten al vocabulari compendiat a les eines lexicogràfiques; un dels camps que sol presentar sovint dubtes és el de l'onomàstica, pròpia o forastera, com també passa amb abreviacions, sigles, i ...

e) lèxic vs. terminològic: ... amb el vocabulari especialitzat; Bruguera va excloure del seu Diccionari de pronúncia quasi vint mil entrades, que va qualificar de "cabal de terminologia científica i tècnica de caràcter enciclopèdic, més propi de diccionaris especialitzats"; aquestes entrades concentren la majoria de casos de difícil solució ortològica que, tot i que infreqüents aïlladament, poden aparèixer massivament en un documental especialitzat.

f) tancat vs. obert: una de les característiques de la neologia és la inestabilitat inicial de la seva pronúncia (vegeu v.g. la picabaralla ingènua amb l'euro); doncs, la capacitat de desenrotllar el treball de compilació del DOC en sintonia amb l'Observatori de Neologia serà un dels factors que en poden condicionar el grau d'interès.

 

3.- Format

El DOC ha estat concebut substancialment com un producte electrònic, encara que res no impedirà que se'n derivin versions impreses o aportacions a productes lexicogràfics "clàssic" (ergo, en paper). Fonamentalment, serà una base de dades on cada registre contindrà:

Tant la seva elaboració com la difusió es farà a través d'Internet mitjançant una base de dades en línia. A més, se'n podrà fer difusió via cedé, cosa que permetrà incorporar al programa de consulta les regles fonètiques: l'usuari podrà veure la transcripció fonemàtica i sol·licitar la variant fonètica que li convingui i visualitzar-la i fins escoltar-la sintèticament.

Finalment, tant la representació fonemàtica com qualsevol de les variants fonètiques que se n'obtindran podran ser incorporades a productes lexicogràfics o enciclopèdics.

 

4.- Materials de partida

Els materials de partida del projecte es divideixen en dos blocs: les dades i el software. Les dades són un conjunt de materials localitzats a l'IULA: el lemari i la recol·lecció onomàstica que han servit per al processament del seu Corpus tècnic, la base de dades de l'Observatori de Neologia. El nucli principal del lemari procedeix de la tesi sobre l'estructura sil·làbica de Lluís de Yzaguirre i està estructurat en quatre nivells de basicitat que tindran influència en l'estratègia de creació de la base de dades. L'extensió del treball a altres compendis de dades dependrà de possibles convenis amb empreses o institucions o d'altres iniciatives amb aspectes comuns, com l'eventual posada en marxa d'un Observatori d'onomàstica.

Pel que fa als procediments informàtics, la transcripció fonemàtica va ser resolta per a la base de dades de l'estructura sil·làbica; la gestió de la base de dades de transcripcions es farà amb un gestor que permet la interacció via Internet amb formularis HTML.

 

5.- Estratègia de creació de la base de dades

La creació de la base de dades seguirà un conjunt de fases estructurades en tres etapes: interna, restringida i oberta.

L'etapa interna té per objectiu crear un primer nucli de transcripcions, que podria oscil·lar entre cinc mil i vint mil, segons els progressos que es facin, en què només els col·laboradors principals accediran a les dades i hi faran correccions. Les dades seran generades automàticament per a les cinc grans variants geogràfiques en dos registres: formal i informal. Els col·laboradors ajustaran la proposta automàtica i hi afegiran, si cal, altres variants. Les diferents fases d'aquesta etapa i de les successives estaran delimitades per paquets de 1000 registres cadascun. Com a resultat de la primera etapa tindrem transcrites les paraules més bàsiques del català revisades exhaustivament. A més, s'hauran sintonitzat les regles de transcripció per a les qüestions més fonamentals.

L'etapa restringida té per objectiu a) transcriure automàticament la totalitat del vocabulari, inclosa la neologia i la terminologia, a més de l'onomàstica pròpia i la forana de què es disposi, b) revisar-ne manualment un percentatge aleatori al voltant del 5% [o superior, segons el pressupost de què es disposi] i c) obrir la consulta a un nucli d'aproximadament dos-cents col·laboradors externs que podran aportar les seves pròpies observacions sobre l'adequació dels materials.

L'etapa pública representa la continuació de la revisió manual aleatòria combinada amb el seguiment de les consultes i els dubtes formulats pel públic en general. La decisió del pas de l'etapa restringida a la pública i la que l'etapa pública ha aconseguit un nivell de qualitat satisfactori haurien de basar-se en una ràtio entre el nombre de consultes i el d'objeccions que a priori situaríem en un 1%, sempre que el nombre de consultes superi un mínim raonable.

 

6.- Estratègia de consulta i manteniment

L'etapa interna només demana una jerarquia en els drets d'accés a la base de dades que garanteixi que tots els col·laboradors interns (tot i que remots) accedeixen a les decisions dels altres però només poden modificar les dades que tenen atribuïdes.

L'etapa restringida pretén beneficiar-se de les aportacions d'aquells que dia a dia es troben amb dubres ortològics significatius; per a aconseguir-ho, cal que els resulti atractiu no només el fet de poder consultar una base de dades ortològica sinó que se'ls faciliti un procediment àgil per resoldre els seus dubtes sobre les solucions ofertes per la base de dades i també sobre qüestions encara no contemplades. Aquesta agilitat, es mirarà d'obtenir amb una llista de corr-el (LISTSERV) en què els col·laboradors externs (correctors, locutors, docents, productors multimèdia...) podran esmenar o ampliar les solucions proposades a la base de dades o preguntar o/i respondre sobre problemes no contemplats. Els col·laboradors interns monitoritzaran la llista per incorporar-ne les aportacions a la base de dades (doncs, no serà automàtic).

A més dels col·laboradors consumidors del producte, caldrà, en aquesta segona etapa, disposar dels següents especialistes: diacronicista, onomàstic, documentalista i experts en llengües forasteres.

L'etapa pública ha de permetre interaccionar amb un ventall molt ampli d'usuaris (pensem, per exemple, en els qui aprenen català...) mitjançant una FAQ, oberta a tothom, fins als que no tenen corr-el; no està clar que l'equip pugui contestar totes qüestions plantejades, però el sistema permetrà el diàleg entre els usuaris.

Un projecte com aquest no tindria fi si el pressupost ho permetés, però... en un moment determinat caldrà tancar els materials i divulgar-los de totes les maneres que resultin viables. Certament, cada dia de sempre més, mentre el català segueixi essent una llengua de comunicació social, un nou polític, un volcà, un terratrèmol, faran circular noms nous que caldrà dir en català d'alguna forma, de la mateixa manera que nou vocabulari ampliarà el cabal lèxic de la llengua, com gentilicis o derivats post-onomàstics ("com haig de dir «kremlinòlegs»?"). Somniar amb la possibilitat de donar continuïtat al projecte (una mena d'Observatori ortològic, a imatge i semblança de l'Observatori de neologia), el fa més atractiu, però ja n'és tant, que tampoc no ve d'això.

 

7.- Ús i reús dels materials

Per a un projecte com el que presentem, serà prou si els ajuts públics o privats cobreixen els costos (fungibles, viatges, mà d'obra informàtica, manteniment operatiu...). Doncs, els col·laboradors que pretenem trobar han de ser desinteressats (en l'aspecte crematístic, no en el curricular o d'altres). A més, hauran de renunciar a tota explotació individual de les dades que no tingui el consentiment de la majoria dels col·laboradors.

 

8.- Referències

IEC (1992) Proposta per a un estàndard oral de la llengua catalana II, Morfologia, Barcelona.

De Yzaguirre, Ll . (1990) Estructura sil·làbica del català central, tesi de doctorat, DFCUB, Barcelona.