L'estructura sil·làbica del català central

index


Resultats.

El diccionari sil·làbic.

El resultat principal de tota la feina que hem descrit fins ara és la base de dades sil·làbica, SY.R08.

De fet, aquest fitxer és un diccionari sil·làbic i SYPA.R08 és el seu índex. Transportar aquesta informació a paper tindria l'avantatge de poder entrar en els canals de distribució més generals però tindria els següents inconvenients:

A més, una gran part del contingut del diccionari té poc sentit que sigui llistat: per exemple, les quasi noranta-nou mil ocasions en què la síl·laba [A] apareix sense consonants explosives ni implosives, com al condicional de tots els verbs; sí que interessa saber el pes que aquesta síl·laba pot tenir en el total, però no un buidatge exhaustiu sobre paper de tots els primitius que la contenen.

Per contra, hi ha un conjunt de casos més que discutibles, en els quals es centraran les observacions que farem més endavant sobre l'estructura sil·làbica del català; malgrat els inconvenients que hem presentat abans, sí que ens interessa abocar a paper una part del diccionari, aquella sobre la qual s'ha de centrar la feina posterior.

Es dóna la circumstància, que no és casual, que molt poques síl·labes acumulen una gran majoria de les ocurrències, mentre que la major part de les síl·labes tenen un índex de presència molt baix. Això ens ha facilitat el camí de cara a la publicació de resultats: presentarem in extenso el nombre màxim de síl·labes que ocupin el nombre mínim de pàgines; de les altres, en facilitarem només els estadístics.

El segon volum, titulat Diccionari sil·làbic, conté, doncs, tota la informació numèrica de totes les síl·labes i el llistat de primitius en què es localitza aquesta síl·laba quan n'hi ha menys de trenta-un. En algun cas d'interès especial, també hem desenvolupat l'entrada amb la llista de primitius, encara que fossin més de trenta.

Com a resultat d'aquesta selecció, el diccionari té menys de quatre-centes pàgines, en comptes de les catorze mil que tindria tot en aquest format.

De les aproximadament 4800 síl·labes, 3800 tenen menys de 31 lemes; el total de lemes presentats és inferior a seixanta-dos mil: se n'han quedat fora dos milions tres-cents cinquanta- set mil i escaig. Dit amb percentatges, desenvolupant el 79% de les síl·labes necessitem el 2,56% de l'espai.

Aquesta solució de compromís té el valor afegit que totes les síl·labes que necessitarem comentar hi són.

Organització del diccionari.

Cada entrada del diccionari conté la síl·laba seguida de sis xifres a la mateixa línia. Cada xifra du postfixada una lletra que significa: Si el nombre de lemes és inferior a trenta-un, en segueix la llista amb unes xifres per a cada mot entre claudàtors:

Si la segona o la tercera xifra són zero, no hi consten; i si tant la segona com la tercera són zero, només hi consta la primera.

Cal remarcar que, en la primera línia de l'entrada, el valor de la tònica és complementari del de l'àtona, com passa amb final i no final. En el cas de la primera línia, és una repetició que no pren més espai; en canvi en les entrades desenvolupades ha representat un estalvi important el fet de compactar-ho com acabem de dir.

L'ordenació que hem fet de les síl·labes ha seguit els següents criteris:

Els símbols fonètics han estat ordenats amb criteris articulatoris, que queden reflectits en la posició que ocupen en la seqüència següent:

b p d t g k v f z s Z S m n Y r R l L j w i e E A O o u

Som conscients que no resulta fàcil, i menys al principi, de navegar amb aquests criteris. Per això ens hem esforçat per complementar el diccionari amb uns índexs.

Ens ha semblat que el conjunt del treball seria més manipulable si publicàvem el diccionari en un segon volum. Això vol dir que a continuació trobareu tots els resultats de caire més global i que haureu d'anar a cercar els detalls al segon volum.

Anàlisi de les dades.

A continuació d'aquest capítol trobareu un conjunt de llistats extrets de la base de dades sil·làbica. Són només una petita part de les informacions que és possible obtenir-ne, aquella part que hem considerat de més gran interès comú.

En primer lloc, trobareu els resultats de cada tipus sil·làbic, en quadres de doble entrada (a les abscisses, les diferents explosions; a les ordenades, les diferents implosions). Hem deixat a part les 3964 síl·labes amb només consonant (del tipus [kon+s.truk.si.o:]).

Seguidament, trobareu un llistat de freqüències de les síl·labes, agrupades segons la seva importància; dins de cada grup, estan en l'ordre en què apareixen al diccionari.

En tercer lloc, trobareu el rendiment dels diversos segments i grups de segments en les diferents parts de les síl·labes, tant per fases com per posicions; pot despistar-vos la primera línia que duu una xifra sense cap segment: correspondrà a l'explosió o implosió buida.

Freqüència absoluta de les síl·labes

VCVCCVtotal
V15773011591601167481433638
VC22310165402735032912160
VCC1086148013466463538
VCCC32549741895488
Total39201718661741566332414824

La taula anterior i les que seguiran tenen a cada columna les dades de cada mena d'explosió que són, d'esquerra a dreta, vocal precedida de zero, una i dues consonants; a cada fila trobem les implosions, de zero a tres consonants implosives. A continuació trobem les mateixes dades expressades en percentatge (les dades estan truncades a les centèsimes, per la qual cosa un valor inferior a l'u per deu mil hi apareix com a zero):

Percentatge absolut observat

VCVCCVtotal
V6.5348.004.8359.36
VC9.2327.081.4537.77
VCC0.441.980.192.63
VCCC0.010.200.00.22
Total16.2377.276.48100.0

El percentatge absolut ens permet detectar més fàcilment on es concentra la majoria de les síl·labes: entre CV i CVC acumulen tres quartes parts de la mostra; si hi afegim V i VC, superem el 90%. Si comparem el percentatge observat amb l'esperat (obtingut per la combinació del percentatge total de les implosions amb el total de les explosions) ens surt la desviació de la freqüència observada respecte a l'esperada i hi podem notar que tornen a ser els tipus V, CV, VC, CVC els que presenten més variació: més endavant veurem que aquesta diferència ve causada fonamentalment per les síl·labes finals, entre els quals la implosió amb una consonant té més pes que en el conjunt de la mostra.

Percentatge absolut esperat

V CV CCV
V 9.63 45.86 3.84
VC 6.13 29.18 2.44
VCC 0.42 2.03 0.17
VCCC 0.03 0.16 0.01

Desviació de la freqüència observada

V CV CCV
V 3.1 2.14 0.99
VC 3.1 2.1 0.99
VCC 0.02 0.05 0.02
VCCC 0.02 0.04 0.01

En primer lloc, sembla lògic que les síl·labes que tenen més alta freqüència presentin més desviació; en segon lloc, podem intentar delimitar aquesta desviació creuant la tipologia sil·làbica amb l'accent (síl·laba àtona vs. tònica) i la casuística del final de mot (síl·laba no final vs. final):

Freqüència absoluta de les síl·labes àtones

VCVCCVtotal
V136475831844968121065131
VC21176947964826134717551
VCC46336813242213868
VCCC033033
Total35287713183381253681796583

Freqüència absoluta de les síl·labes tòniques

VCVCCVtotal
V2125532731619936368507
VC113321743798898194609
VCC622841200224249670
VCCC32549411895455
Total3914054783631265618241

Freqüència absoluta de les síl·labes no finals

VCVCCVtotal
V12621810185191036901248427
VC16901130963024361503002
VCC46859201865791
VCCC222024
Total29991613290911282371757244

Freqüència absoluta de les síl·labes finals

VCVCCVtotal
V3151214064113058185211
VC5409034439710671409158
VCC617647093447857747
VCCC32349521895464
Total9210153708328396657580

De totes les taules anteriors, la que es diferencia més de les altres en proporcions és aquesta darrera, en què la síl·laba CVC acapara més del 50% dels casos; aquesta circumstància queda més clarament remarcada en les gràfiques següents, on cada columna correspon a una implosió i les seves subdivisions corresponen a les explosions:

Aquesta darrera gràfica presenta la proporció de síl·labes finals dels diversos tipus contraposant les dels verbs a la resta. S'hi observa, en primer lloc, que les dels verbs són més abundants (435022 contra 162765); en segon lloc, si comparem aquesta gràfica amb la immediata anterior (que és la mateixa sense diferenciar els verbs), podem veure que els verbs són els responsables màxims del predomini absolut del tipus xVC, encara que entre la resta també es dóna un lleuger predomini d'aquest tipus sobre els altres (motivat pels plurals). Les dades corresponents a la darrera gràfica són les de la taula següent:

Freqüència absoluta (síl·labes finals): verbs vs. la resta.

verbs resta
xV 120880 47925
xVC 297271 71790
xVCC 16825 37643
xVCCC 46 5407
total 435022 162765

Resultats segons categories morfològiques.

La constatació anterior que discriminar els verbs de la resta pot ajudar a interpretar certes peculiaritats dels resultats ens incita a desglossar-los tots en funció de la categoria morfològica del mot a què pertany la síl·laba final. Centrarem l'atenció en els següents subgrups: 1) verbs; 2) substantius femenins; 3) substantius masculins i 4) nominals, que inclourà els adjectius de totes menes i els substantius amb flexió de gènere. En el cas dels verbs, si no és necessari, no farem altres distincions. Entre els substantius i adjectius, diferenciarem resultats segons el gènere i el nombre. A cada taula, subratllem el valor més alt.

Freqüència absoluta (síl·labes finals): subs. fem. sing.

FSVCVCCVtotal
V72231027916817670
VC1081989632160
VCC849562
VCCC1102
Total73401231823619894

Freqüència absoluta (síl·labes finals): subs. fem. plur.

FPVCVCCVtotal
V0000
VC45411062816915338
VCC27851637614483
VCCC434240
Total73301229923219861

Freqüència absoluta (síl·labes finals): subs. masc sing.

MSVCVCCVtotal
V21359718737057
VC48279717179170
VCC8831421813411
VCCC034135
Total78317118177219673

Freqüència absoluta (síl·labes finals): subs. masc plur.

MPVCVCCVtotal
V0527
VC7960567366871
VCC599880379510197
VCCC552454582567
Total73317318159119642

Freqüència absoluta (síl·labes finals): nom. masc sing.

NMSVCVCCVtotal
V442379714665705
VC8201126270712789
VCC15416901071951
VCCC0707
Total141616756228020452

Freqüència absoluta (síl·labes finals): nom. fem. sing.

NFSVCVCCVtotal
V101315052142117486
VC3901292941776
VCC115936431094
VCCC0000
Total151817280155820356

Freqüència absoluta (síl·labes finals): nom. masc. plur.

NMPVCVCCVtotal
V0000
VC16472714276170
VCC10551079766112513
VCCC1481449741671
Total121916973216220354

Freqüència absoluta (síl·labes finals): nom. fem. plur.

NFPVCVCCVtotal
V0000
VC101315084141917516
VCC3901272911753
VCCC115927431085
Total151817283155320354

Freqüència absoluta (síl·labes finals): verbs.

VerbsVCVCCVtotal
V21637967012542120880
VC437422483735156297271
VCC9391518470216825
VCCC0351146
Total663183602938411435022

A més de les grans xifres, que en cada cas ens diuen quins dels diversos tipus més han influït en aquell subgrup en particular, criden l'atenció algunes xifres extremament baixes; anem a comentar-les.

Entre els substantius femenins singulars, destaquen els casos amb implosió amb tres consonants ("urbs" i "larinx") hi hauria d'haver "esfinx", però aquest mot ha estat entrat com a substantiu masculí i femení. .

Dels substantius femenins plurals, ens fixem en els casos xVCCC (40):

Fixem-nos, ara, en els trenta-cinc substantius masculins singulars del grup xVCCC: Els casos de substantius masculins plurals sense implosió són set errors de codi que hem comès (provocant que el plural sigui idèntic al singular) amb les set perles següents: hardware, eixorba-rates negre, firmware, guppy, noli me tàngere, piral de la vinya, statu quo.

Els nominals (substantius o adjectius) masculins singulars presenten dos compostos invariables ("ploramorts" i "cerca-revolts") i cinc mots que comentarem al capítol cinquè: exhaust, faust, inexhaust, infaust, mixt.

Com a darrera qüestió a comentar dins d'aquest apartat hi ha els casos xVCCC dels substantius o adjectius femenins plurals; es tracta d'una xifra baixa (1085 casos) però important dins del seu grup (5423 casos en total). Vegem-ne la casuística:

Un cop delimitats els casos anteriors, ens en resten mil setanta que comparteixen dues característiques: tots acaben en -nt(s) i tots són invariables en gènere, com, per exemple:

Sobre aquests mots l'evolució exerceix una forta pressió analògica en favor del desdoblament de gènere (seguint, v.g., "calent, -a") com ho proven mots com "acompanyant", "comerciant" i "dependent", que tenen reconegudes les dues possibilitats de femení (invariable o amb -a) o els de la llista següent, que, tot i tenir un origen comparable, es troben al diccionari amb femení diferenciat:

-adjunt, aprenent, assistent, comediant, congregant, estadant, estudiant, laborant, president, pretendent.

La importància del fet que 1070 sobre 1085 femenins plurals amb xVCCC final corresponguin a casos de coincidència amb masculí rau en la possibilitat de considerar que entre la segona i la tercera consonants finals hi ha un morfema zero de gènere, amb les implicacions que veurem més endavant.

Però no podem avançar per aquest camí sense acceptar una definició de morfema zero: seguim els passos de Mascaró 86, segons el qual "les distincions inflectives es fan de vegades a partir de morfs fonològicament plens i morfs zero o buits. (...) Així, a 'unas podem destriar una arrel 'un, present també a 'una, 'un, 'uns, i dos sufixos a, s, un de femení i un altre de plural. (...) Diem per tant que el morf de masculí és zero (Ø) ..." (Mascaró- 86:85-86)

Al capítol sisè presentarem la idea que aquest morfema zero de gènere, tot i ser buit, té caràcter vocàlic. Això implica que la seqüència de tres consonants finals existeix només a nivell fonètic, però no en una representació fonemàtica, sempre que el mot sigui masculí ; d'aquí se'n desprèn la importància de determinar si "adolescents" a "les adolescents" és femení, és masculí, és femení idèntic al masculí, és femení amb una diferència subjacent sense manifestació superficial... Mascaró tracta aquests casos amb els dels mots idèntics però de gènere diferent. És a dir, masculins i femenins amb el mateix radical i amb morf de gènere Ø en ambdós casos, ... (Mascaró-86:102)

Aplicant-ho al nostre cas, tenim que la seqüència -nts pot ser interpretada com a -ntØs i que la majoria de les seqüències xVCCC final són xVCCØC; per ser exactes, de 5423, totes menys les següents:

cohorts, hosts, urbs, assarbs (reg.), carns, contraparts, corts, dents, destalents, dissorts, esfinxs, estirps, fonts, forests, gents, larinxs, lents, ments, morts, parts, posts, radiofonts, sangs, sements, serps, sobredents, sorts, consorts, mandings, multistàndards, udmurts i víkings.

I encara els mots que coincideixen amb un masculí (com "parts", "lents", "morts") podrien rebre el mateix tractament que "adolescents" i fan plantejable l'extensió del tractament a tots els altres.

Les implosions en els verbs.

Tenim interès a presentar els verbs amb més detall que fins ara per deixar constància dels casos amb menys freqüència. En primer lloc, cal dir que una part important de les desinències tenen la mateix mena d'implosió en tots els verbs. Són:

totes amb zero consonants: participi femení singular; primera i tercera persones de l'imperfet d'indicatiu, del futur, del condicional i del present de subjuntiu; tercera persona de l'imperatiu.

totes amb una consonant: participi femení plural; primera i tercera persones de l'imperfet de subjuntiu; segona persona de l'imperfet d'indicatiu, del perfet, del futur, del condicional, del present de subjuntiu i de l'imperfet de subjuntiu; quarta, cinquena i sisena persones de tots els temps.

totes amb dues consonants: gerundi.

En segon lloc, vegem les que no tenen el mateix tipus d'implosió final a totes les conjugacions:

A les dades anteriors podem observar que trenta-cinc dels quaranta-sis casos amb tres consonants corresponen a participis masculins plurals, amb morfema zero. També observem que entre els participis masculins plurals i els gerundis apleguen 16367 dels 16825 casos amb dues consonants, amb la conseqüència que podem afirmar que entre les formes personals és una excepció que hi haig més d'una consonant implosiva final. A continuació presentem els casos amb tres consonants:

segona persona del present d'indicatiu:

adorms, condorms, consents, dorms, perds, pressents, ressents, ressurts, sents, sobresurts, surts.

participi masculí plural:

absolts, acomplerts, coberts, colts, complerts, cuits, descoberts, dissolts, eixoberts, encoberts, entreoberts, establerts, incomplerts, mòlts, morts, oberts, oferts, omplerts, pelloberts, preestablerts, premorts, reabsolts, reblerts, recoberts, recomplerts, recuits, redescoberts, remòlts, reoberts, reomplerts, resolts, restablerts, soferts, suplerts, tolts.

Coeficient de consonants implosives.

Per sintetitzar el pes de cada implosió en síl·laba final, hem elaborat un coeficient que, de fet, és la mitjana de consonants implosives (entre zero i tres), amb els resultats següents:

Dades generals:

Total 0.43717
Síl·labes àtones 0.41489
Síl·labes tòniques 0.50193
Síl·labes no finals 0.29288
Síl·labes finals 0.82278
Dades de la síl·laba finals segons categories:

Substantius femenins en singular 0.11511 en plural 1.22975 Substantius masculins en singular 0.81823 en plural 1.78016 Nominals en masculí singular 0.81713 en femení singular 0.19473 en masculí plural 1.77896 en femení plural 1.19274 Verbs 0.76102

Noteu que la diferència entre àtones i tòniques no és important comparada amb la diferència entre finals i no finals. Noteu, també, que la complexitat implosiva va associada al plural i, en especial, als masculins.


- Rendiment per grups de freqüència.

La taula següent acumula i completa els valors de les llistes de grups de freqüència; a la primera columna (A) hi ha el nombre de síl·labes que pertanyen al grup de freqüència, a la segona (B), la suma d'ocurrències de les síl·labes del grup; a la tercera columna (C) hi ha el percentatge:

A B C + de 10000 52 1306911 54,03 + de 5000 49 371560 15,36 + de 2000 96 300214 12,41 + de 500 276 277159 11,45 + de 200 237 77506 3,2 + de 50 539 57580 2,38 - de 51 3543 27858 1,15 Total 4792 2418788

A continuació, els mateixos resultats acumulant a cada línia el valor de les anteriors:

+ de 10000 52 1306911 54,03 + de 5000 101 1678471 69,39 + de 2000 197 1978685 81,8 + de 500 473 2255844 93,26 + de 200 710 2333350 96,46 + de 50 1249 2390930 98,84 - de 51 4792 2418788 100

- Llista d'explosions en relació a l'accent.

Totes les llistes que queden en aquest capítol comparteixen la mateixa presentació: les dues primeres columnes contenen subtotals (aquí, àtones vs. tòniques); la tercera columna presenta el percentatge de la segona (aquí, tòniques) sobre el total i la darrera columna acumula les dues primeres. En totes la primera línia de resultats correspon a "zero", o sigui "sense explosió", "sense vocal" o "sense implosió".