De fet, aquest fitxer és un diccionari sil·làbic i SYPA.R08 és el seu índex. Transportar aquesta informació a paper tindria l'avantatge de poder entrar en els canals de distribució més generals però tindria els següents inconvenients:
Per contra, hi ha un conjunt de casos més que discutibles, en els quals es centraran les observacions que farem més endavant sobre l'estructura sil·làbica del català; malgrat els inconvenients que hem presentat abans, sí que ens interessa abocar a paper una part del diccionari, aquella sobre la qual s'ha de centrar la feina posterior.
Es dóna la circumstància, que no és casual, que molt poques síl·labes acumulen una gran majoria de les ocurrències, mentre que la major part de les síl·labes tenen un índex de presència molt baix. Això ens ha facilitat el camí de cara a la publicació de resultats: presentarem in extenso el nombre màxim de síl·labes que ocupin el nombre mínim de pàgines; de les altres, en facilitarem només els estadístics.
El segon volum, titulat Diccionari sil·làbic, conté, doncs, tota la informació numèrica de totes les síl·labes i el llistat de primitius en què es localitza aquesta síl·laba quan n'hi ha menys de trenta-un. En algun cas d'interès especial, també hem desenvolupat l'entrada amb la llista de primitius, encara que fossin més de trenta.
Com a resultat d'aquesta selecció, el diccionari té menys de quatre-centes pàgines, en comptes de les catorze mil que tindria tot en aquest format.
De les aproximadament 4800 síl·labes, 3800 tenen menys de 31 lemes; el total de lemes presentats és inferior a seixanta-dos mil: se n'han quedat fora dos milions tres-cents cinquanta- set mil i escaig. Dit amb percentatges, desenvolupant el 79% de les síl·labes necessitem el 2,56% de l'espai.
Aquesta solució de compromís té el valor afegit que totes les síl·labes que necessitarem comentar hi són.
Si la segona o la tercera xifra són zero, no hi consten; i si tant la segona com la tercera són zero, només hi consta la primera.
Cal remarcar que, en la primera línia de l'entrada, el valor de la tònica és complementari del de l'àtona, com passa amb final i no final. En el cas de la primera línia, és una repetició que no pren més espai; en canvi en les entrades desenvolupades ha representat un estalvi important el fet de compactar-ho com acabem de dir.
L'ordenació que hem fet de les síl·labes ha seguit els següents criteris:
Els símbols fonètics han estat ordenats amb criteris articulatoris, que queden reflectits en la posició que ocupen en la seqüència següent:
b p d t g k v f z s Z S m n Y r R l L j w i e E A O o u
Som conscients que no resulta fàcil, i menys al principi, de navegar amb aquests criteris. Per això ens hem esforçat per complementar el diccionari amb uns índexs.
Ens ha semblat que el conjunt del treball seria més manipulable si publicàvem el diccionari en un segon volum. Això vol dir que a continuació trobareu tots els resultats de caire més global i que haureu d'anar a cercar els detalls al segon volum.
En primer lloc, trobareu els resultats de cada tipus sil·làbic, en quadres de doble entrada (a les abscisses, les diferents explosions; a les ordenades, les diferents implosions). Hem deixat a part les 3964 síl·labes amb només consonant (del tipus [kon+s.truk.si.o:]).
Seguidament, trobareu un llistat de freqüències de les síl·labes, agrupades segons la seva importància; dins de cada grup, estan en l'ordre en què apareixen al diccionari.
En tercer lloc, trobareu el rendiment dels diversos segments i grups de segments en les diferents parts de les síl·labes, tant per fases com per posicions; pot despistar-vos la primera línia que duu una xifra sense cap segment: correspondrà a l'explosió o implosió buida.
V | CV | CCV | total | |
V | 157730 | 1159160 | 116748 | 1433638 |
VC | 223101 | 654027 | 35032 | 912160 |
VCC | 10861 | 48013 | 4664 | 63538 |
VCCC | 325 | 4974 | 189 | 5488 |
Total | 392017 | 1866174 | 156633 | 2414824 |
La taula anterior i les que seguiran tenen a cada columna les dades de cada mena d'explosió que són, d'esquerra a dreta, vocal precedida de zero, una i dues consonants; a cada fila trobem les implosions, de zero a tres consonants implosives. A continuació trobem les mateixes dades expressades en percentatge (les dades estan truncades a les centèsimes, per la qual cosa un valor inferior a l'u per deu mil hi apareix com a zero):
V | CV | CCV | total | |
V | 6.53 | 48.00 | 4.83 | 59.36 |
VC | 9.23 | 27.08 | 1.45 | 37.77 |
VCC | 0.44 | 1.98 | 0.19 | 2.63 |
VCCC | 0.01 | 0.20 | 0.0 | 0.22 |
Total | 16.23 | 77.27 | 6.48 | 100.0 |
El percentatge absolut ens permet detectar més fàcilment on es concentra la majoria de les síl·labes: entre CV i CVC acumulen tres quartes parts de la mostra; si hi afegim V i VC, superem el 90%. Si comparem el percentatge observat amb l'esperat (obtingut per la combinació del percentatge total de les implosions amb el total de les explosions) ens surt la desviació de la freqüència observada respecte a l'esperada i hi podem notar que tornen a ser els tipus V, CV, VC, CVC els que presenten més variació: més endavant veurem que aquesta diferència ve causada fonamentalment per les síl·labes finals, entre els quals la implosió amb una consonant té més pes que en el conjunt de la mostra.
V | CV | CCV | |
V | 9.63 | 45.86 | 3.84 |
VC | 6.13 | 29.18 | 2.44 |
VCC | 0.42 | 2.03 | 0.17 |
VCCC | 0.03 | 0.16 | 0.01 |
V | CV | CCV | |
V | 3.1 | 2.14 | 0.99 |
VC | 3.1 | 2.1 | 0.99 |
VCC | 0.02 | 0.05 | 0.02 |
VCCC | 0.02 | 0.04 | 0.01 |
En primer lloc, sembla lògic que les síl·labes que tenen més alta freqüència presentin més desviació; en segon lloc, podem intentar delimitar aquesta desviació creuant la tipologia sil·làbica amb l'accent (síl·laba àtona vs. tònica) i la casuística del final de mot (síl·laba no final vs. final):
V | CV | CCV | total | |
V | 136475 | 831844 | 96812 | 1065131 |
VC | 211769 | 479648 | 26134 | 717551 |
VCC | 4633 | 6813 | 2422 | 13868 |
VCCC | 0 | 33 | 0 | 33 |
Total | 352877 | 1318338 | 125368 | 1796583 |
V | CV | CCV | total | |
V | 21255 | 327316 | 19936 | 368507 |
VC | 11332 | 174379 | 8898 | 194609 |
VCC | 6228 | 41200 | 2242 | 49670 |
VCCC | 325 | 4941 | 189 | 5455 |
Total | 39140 | 547836 | 31265 | 618241 |
V | CV | CCV | total | |
V | 126218 | 1018519 | 103690 | 1248427 |
VC | 169011 | 309630 | 24361 | 503002 |
VCC | 4685 | 920 | 186 | 5791 |
VCCC | 2 | 22 | 0 | 24 |
Total | 299916 | 1329091 | 128237 | 1757244 |
V | CV | CCV | total | |
V | 31512 | 140641 | 13058 | 185211 |
VC | 54090 | 344397 | 10671 | 409158 |
VCC | 6176 | 47093 | 4478 | 57747 |
VCCC | 323 | 4952 | 189 | 5464 |
Total | 92101 | 537083 | 28396 | 657580 |
De totes les taules anteriors, la que es diferencia més de les altres en proporcions és aquesta darrera, en què la síl·laba CVC acapara més del 50% dels casos; aquesta circumstància queda més clarament remarcada en les gràfiques següents, on cada columna correspon a una implosió i les seves subdivisions corresponen a les explosions:
verbs | resta | |
xV | 120880 | 47925 |
xVC | 297271 | 71790 |
xVCC | 16825 | 37643 |
xVCCC | 46 | 5407 |
total | 435022 | 162765 |
FS | V | CV | CCV | total |
V | 7223 | 10279 | 168 | 17670 |
VC | 108 | 1989 | 63 | 2160 |
VCC | 8 | 49 | 5 | 62 |
VCCC | 1 | 1 | 0 | 2 |
Total | 7340 | 12318 | 236 | 19894 |
FP | V | CV | CCV | total |
V | 0 | 0 | 0 | 0 |
VC | 4541 | 10628 | 169 | 15338 |
VCC | 2785 | 1637 | 61 | 4483 |
VCCC | 4 | 34 | 2 | 40 |
Total | 7330 | 12299 | 232 | 19861 |
MS | V | CV | CCV | total |
V | 213 | 5971 | 873 | 7057 |
VC | 482 | 7971 | 717 | 9170 |
VCC | 88 | 3142 | 181 | 3411 |
VCCC | 0 | 34 | 1 | 35 |
Total | 783 | 17118 | 1772 | 19673 |
MP | V | CV | CCV | total |
V | 0 | 5 | 2 | 7 |
VC | 79 | 6056 | 736 | 6871 |
VCC | 599 | 8803 | 795 | 10197 |
VCCC | 55 | 2454 | 58 | 2567 |
Total | 733 | 17318 | 1591 | 19642 |
NMS | V | CV | CCV | total |
V | 442 | 3797 | 1466 | 5705 |
VC | 820 | 11262 | 707 | 12789 |
VCC | 154 | 1690 | 107 | 1951 |
VCCC | 0 | 7 | 0 | 7 |
Total | 1416 | 16756 | 2280 | 20452 |
NFS | V | CV | CCV | total |
V | 1013 | 15052 | 1421 | 17486 |
VC | 390 | 1292 | 94 | 1776 |
VCC | 115 | 936 | 43 | 1094 |
VCCC | 0 | 0 | 0 | 0 |
Total | 1518 | 17280 | 1558 | 20356 |
NMP | V | CV | CCV | total |
V | 0 | 0 | 0 | 0 |
VC | 16 | 4727 | 1427 | 6170 |
VCC | 1055 | 10797 | 661 | 12513 |
VCCC | 148 | 1449 | 74 | 1671 |
Total | 1219 | 16973 | 2162 | 20354 |
NFP | V | CV | CCV | total |
V | 0 | 0 | 0 | 0 |
VC | 1013 | 15084 | 1419 | 17516 |
VCC | 390 | 1272 | 91 | 1753 |
VCCC | 115 | 927 | 43 | 1085 |
Total | 1518 | 17283 | 1553 | 20354 |
Verbs | V | CV | CCV | total |
V | 21637 | 96701 | 2542 | 120880 |
VC | 43742 | 248373 | 5156 | 297271 |
VCC | 939 | 15184 | 702 | 16825 |
VCCC | 0 | 35 | 11 | 46 |
Total | 66318 | 360293 | 8411 | 435022 |
A més de les grans xifres, que en cada cas ens diuen quins dels diversos tipus més han influït en aquell subgrup en particular, criden l'atenció algunes xifres extremament baixes; anem a comentar-les.
Entre els substantius femenins singulars, destaquen els casos amb implosió amb tres consonants ("urbs" i "larinx") hi hauria d'haver "esfinx", però aquest mot ha estat entrat com a substantiu masculí i femení. .
Dels substantius femenins plurals, ens fixem en els casos xVCCC (40):
Els nominals (substantius o adjectius) masculins singulars presenten dos compostos invariables ("ploramorts" i "cerca-revolts") i cinc mots que comentarem al capítol cinquè: exhaust, faust, inexhaust, infaust, mixt.
Com a darrera qüestió a comentar dins d'aquest apartat hi ha els casos xVCCC dels substantius o adjectius femenins plurals; es tracta d'una xifra baixa (1085 casos) però important dins del seu grup (5423 casos en total). Vegem-ne la casuística:
Sobre aquests mots l'evolució exerceix una forta pressió analògica en favor del desdoblament de gènere (seguint, v.g., "calent, -a") com ho proven mots com "acompanyant", "comerciant" i "dependent", que tenen reconegudes les dues possibilitats de femení (invariable o amb -a) o els de la llista següent, que, tot i tenir un origen comparable, es troben al diccionari amb femení diferenciat:
-adjunt, aprenent, assistent, comediant, congregant, estadant, estudiant, laborant, president, pretendent.
La importància del fet que 1070 sobre 1085 femenins plurals amb xVCCC final corresponguin a casos de coincidència amb masculí rau en la possibilitat de considerar que entre la segona i la tercera consonants finals hi ha un morfema zero de gènere, amb les implicacions que veurem més endavant.
Però no podem avançar per aquest camí sense acceptar una definició de morfema zero: seguim els passos de Mascaró 86, segons el qual "les distincions inflectives es fan de vegades a partir de morfs fonològicament plens i morfs zero o buits. (...) Així, a 'unas podem destriar una arrel 'un, present també a 'una, 'un, 'uns, i dos sufixos a, s, un de femení i un altre de plural. (...) Diem per tant que el morf de masculí és zero (Ø) ..." (Mascaró- 86:85-86)
Al capítol sisè presentarem la idea que aquest morfema zero de gènere, tot i ser buit, té caràcter vocàlic. Això implica que la seqüència de tres consonants finals existeix només a nivell fonètic, però no en una representació fonemàtica, sempre que el mot sigui masculí ; d'aquí se'n desprèn la importància de determinar si "adolescents" a "les adolescents" és femení, és masculí, és femení idèntic al masculí, és femení amb una diferència subjacent sense manifestació superficial... Mascaró tracta aquests casos amb els dels mots idèntics però de gènere diferent. És a dir, masculins i femenins amb el mateix radical i amb morf de gènere Ø en ambdós casos, ... (Mascaró-86:102)
Aplicant-ho al nostre cas, tenim que la seqüència -nts pot ser interpretada com a -ntØs i que la majoria de les seqüències xVCCC final són xVCCØC; per ser exactes, de 5423, totes menys les següents:
cohorts, hosts, urbs, assarbs (reg.), carns, contraparts, corts, dents, destalents, dissorts, esfinxs, estirps, fonts, forests, gents, larinxs, lents, ments, morts, parts, posts, radiofonts, sangs, sements, serps, sobredents, sorts, consorts, mandings, multistàndards, udmurts i víkings.
I encara els mots que coincideixen amb un masculí (com "parts", "lents", "morts") podrien rebre el mateix tractament que "adolescents" i fan plantejable l'extensió del tractament a tots els altres.
totes amb zero consonants: participi femení singular; primera i tercera persones de l'imperfet d'indicatiu, del futur, del condicional i del present de subjuntiu; tercera persona de l'imperatiu.
totes amb una consonant: participi femení plural; primera i tercera persones de l'imperfet de subjuntiu; segona persona de l'imperfet d'indicatiu, del perfet, del futur, del condicional, del present de subjuntiu i de l'imperfet de subjuntiu; quarta, cinquena i sisena persones de tots els temps.
totes amb dues consonants: gerundi.
En segon lloc, vegem les que no tenen el mateix tipus d'implosió final a totes les conjugacions:
segona persona del present d'indicatiu:
adorms, condorms, consents, dorms, perds, pressents, ressents, ressurts, sents, sobresurts, surts.
participi masculí plural:
absolts, acomplerts, coberts, colts, complerts, cuits, descoberts, dissolts, eixoberts, encoberts, entreoberts, establerts, incomplerts, mòlts, morts, oberts, oferts, omplerts, pelloberts, preestablerts, premorts, reabsolts, reblerts, recoberts, recomplerts, recuits, redescoberts, remòlts, reoberts, reomplerts, resolts, restablerts, soferts, suplerts, tolts.
Coeficient de consonants implosives. Per sintetitzar el pes de cada implosió en síl·laba final, hem elaborat un coeficient que, de fet, és la mitjana de consonants implosives (entre zero i tres), amb els resultats següents:
Dades generals:
Total | 0.43717 |
Síl·labes àtones | 0.41489 |
Síl·labes tòniques | 0.50193 |
Síl·labes no finals | 0.29288 |
Síl·labes finals | 0.82278 |
Substantius femenins en singular 0.11511 en plural 1.22975 Substantius masculins en singular 0.81823 en plural 1.78016 Nominals en masculí singular 0.81713 en femení singular 0.19473 en masculí plural 1.77896 en femení plural 1.19274 Verbs 0.76102
Noteu que la diferència entre àtones i tòniques no és important comparada amb la diferència entre finals i no finals. Noteu, també, que la complexitat implosiva va associada al plural i, en especial, als masculins.
La taula següent acumula i completa els valors de les llistes de grups de freqüència; a la primera columna (A) hi ha el nombre de síl·labes que pertanyen al grup de freqüència, a la segona (B), la suma d'ocurrències de les síl·labes del grup; a la tercera columna (C) hi ha el percentatge:
A B C + de 10000 52 1306911 54,03 + de 5000 49 371560 15,36 + de 2000 96 300214 12,41 + de 500 276 277159 11,45 + de 200 237 77506 3,2 + de 50 539 57580 2,38 - de 51 3543 27858 1,15 Total 4792 2418788
A continuació, els mateixos resultats acumulant a cada línia el valor de les anteriors:
+ de 10000 52 1306911 54,03 + de 5000 101 1678471 69,39 + de 2000 197 1978685 81,8 + de 500 473 2255844 93,26 + de 200 710 2333350 96,46 + de 50 1249 2390930 98,84 - de 51 4792 2418788 100
- Llista d'explosions en relació a l'accent.
Totes les llistes que queden en aquest capítol comparteixen la mateixa presentació: les dues primeres columnes contenen subtotals (aquí, àtones vs. tòniques); la tercera columna presenta el percentatge de la segona (aquí, tòniques) sobre el total i la darrera columna acumula les dues primeres. En totes la primera línia de resultats correspon a "zero", o sigui "sense explosió", "sense vocal" o "sense implosió".