L'estructura silálàbica del català central



Apèndix sobre formes verbals no incloses.

Entre els verbs, ens hem trobat amb dues menes de dualitats, les que afecten una forma o totes les formes de només un temps i les que afecten tot un paradigma. Aquestes darreres s'han resolt introduint els/l'infinitiu/s dos cops, amb els codis de flexió corresponents, com lluir que pot ser incoatiu o no, o com néixer/nàixer; això ha passat amb els verbs de la llista següent i llurs compostos, amb els quals no solament no hem renunciat a cap forma, sinó que a més en tenim de repetides (com "nascut" de néixer i "nascut" de nàixer):

cabre/caber, caldre/caler, doldre/doler, donar/dar, ésser/ser/esser, jeure/jaure, mentir(inc./no inc.), néixer/nàixer, treure/traure, valer/valdre.

Els casos en què realment hem entrat només una d'entre dues formes són els de la relació següent i llurs compostos (en total, poc més d'un centenar de mots):

El verb haver ha estat entrat dues vegades: com a auxiliar sota haver sense imperatiu i com a no auxiliar sota heure. Com a auxiliar, s'han deixat d'entrar les variants següents: haig, hem, heu, haguera (i la resta del condicional alternatiu), haguem, hagueu.

El verb oir només ha estat entrat com a incoatiu; si haguéssim provat d'introduir- lo com a no incoatiu hauríem tingut un problema de manca d'informació, ja que ni Xuriguera ni Alsina, en els seus respectius manuals de flexió verbal, no en contemplen tot el paradigma.

Cal dir, finalment, que alguns participis arcaics substituïts actualment per formes analògiques ( com "nat" o "tort") han estat entrats com a adjectius.

Apèndix sobre prefixos no automatitzats.

Els prefixos de la llista següent no han estat incorporats al programa de partició sil·làbica; no caldria gaire, però, per fer-ho: destriar tots els pseudo-prefixats, és a dir, mots que comencen amb les mateixes lletres sense correspondre a ocurrències del prefix. Un cop marcats aquests casos com a excepcions a la rutina de fronteres, detectaríem els prefixos cercant-los d'acord amb l'ordre en què els presentem:

-ordenats per la primera lletra; -subordenats pel nombre de caràcters; -subordenats segons el valor ASCII de les lletres que els representen.

Apèndix sobre formes repetides.

Algunes de les preguntes que es poden formular sobre el corpus fan referència al pes que hi tenen les formes repetides, la justificació d'aquestes repeticions i la influència que poden tenir en els resultats.

Podem subdividir les repeticions en els següents tipus:

-són dues variants del mateix mot, com "menjava", que pot ser primera o tercera persona de l'imperfet d'indicatiu.

-són dues versions del mateix mot, que tenen categories gramaticals diferents;

-són dues versions del mateix mot, que tenen paradigmes diferents;

El grup més nombrós de repeticions és constituït per les formes coincidents dins del paradigma d'un verb, però corresponents a persones gramaticals o a temps diferents:

primera i tercera persones de l'imperfet;

primera i tercera persones del condicional;

primera i tercera persones del present de subjuntiu i tercera de l'imperatiu;

primera i tercera persones de l'imperfet de subjuntiu;

tercera persona del present d'indicatiu i segona de l'imperatiu;

quarta persona dels presents d'indicatiu i de subjuntiu i de l'imperatiu;

cinquena persona dels presents d'indicatiu i de subjuntiu i de l'imperatiu;

sisena persona del present de subjuntiu i de l'imperatiu.

Totes aquestes repeticions (que es produeixien en tots els verbs, excepte algun irregular), superen els, aproximadament, vuitanta-vuit mil mots sobre sis-cents mil. Són, però, repeticions necessàries si volem estar en disposició d'obtenir dades específiques d'un temps verbal o d'una persona en particular.

Els casos que resten són repeticions parcials. Per exemples, menjar substantiu vs. verb coincideixen en una de les cinquanta-cinc formes que acumulen. D'entre aquestes repeticions, les més qüestionables són aquelles en què el mot repetit és exactament el mateix, com acompanyant, que pot tenir (amb sentits diferents) els femenins "acompanyant" i "acompanyanta", o motor, que indubtablement significa el mateix tant si el seu femení és "motora" com si és "motriu". Hi ha tres motius pels quals hem inclòs aquestes formes duplicades:

-la frontera entre els casos en què la forma repetida significa exactament el mateix i els altres casos és molt difusa i difícil de concretar;

-el conjunt d'aquests casos (els clars i els foscos) té molt poc pes, com es veu a la llista que hi ha a continuació (menys de sis-cents, comparats amb els casos verbals);

-el disseny de base de dades que havíem adoptat prèviament no ens permet obtenir dues flexions a partir d'un sol primitiu.

Vegeu la llista que segueix, en què presentem tots els mots de la nostra base de dades que tenen més d'un model de flexió; només hi surten primitius (hi manquen casos com "esquerra" relacionat amb "esquerre" i amb "esquer": són escassíssims). Si un mot hi apareix més d'un cop, significa que segueix més de dos models derivatius. Les lletres que precedeixen el mot signifiquen la categoria gramatical de les dues variants que tenim; una "V" correspon a verb; una "F", a substantiu femení; una "M", a substantiu masculí; una "N", a adjectiu o substantiu masculí i femení; i una "I", a mot invariable.