La Rambla 30-32. 08071 Barcelona . 
           Telèfon 542 23 22 . FAX 542 23 21. e-mail: iula@grup.upf.es

2.4.2.2.3. El model de prefixos

a) descripció del model de prefixos: es tracta de la llista dels prefixos estrictes del català, aquells que tenen caràcter gramatical (adverbial i preposicional), quantificadors, etc. Hi ha seqüències complexes inicials detectades a les mostres de tractament manual. No s'ha fet, com per als sufixos, una escisió en dos models entre prefixos inicials absoluts i segons i tercers prefixos. L'ordenació de les formes és distinta a la dels sufixos i infixos: s'ordenen per longitud però dins de cada lletra inicial de l'abecedari. Es tracta de fer prevaler el criteri de captació prèvia dels elements més idiosincràtics, més llargs, però atès que la confusió entre prefixos de lletres distintes és impossible sembla procedimentalment més coherent respectar l'ordre alfabètic del diccionari.

Origen: els formants provenen de la llista formal elaborada a partir de les diverses fonts i dels criteris d'inclusió i d'exclusió ja comentats allí. Hi he afegit seqüències complexes detectades en les mostres manuals en què els integrants són prefixos estrictes. També formes simples detectades i que compleixen amb els criteris de gramaticalitat. Igualment d'altres integrats en seqüències complexes a la lletra A en segona o tercera posició, però que tenen rendibilitat com a prefixos independents en d'altres lletres del diccionari. Aquests dos darrers grups, evidentment, no sempre apareixen a les llistes de les fonts. També inclou formes que apareixien a la llista de prefixos de Farriols (1993), que no són a les llistes formals, però que compleixen els requisits per a ser prefixos i no radicals de composició (co- radicals).

Tipologia dels formants: només s'entren en aquest model prefixos estrictes, de caràcter preposicional i/o adverbial, o tanmateix partícules inicials de caràcter formal. Com s'ha dit, el model d'infixos conté només afixos post-radicals; els "infixos" pre-radicals són tractats sistemàticament aquí com a prefixos i només es poden detectar aquells que es combinin constantment amb un altre prefix inicial absolut, dins d'aquest model de prefixos. Malgrat l'analogia que es pot establir amb casos del fitxer de co- radicals finals, no separo cap vocal final, ja que m'atinc, convencionalment, a la naturalesa adverbial i preposicional dels formants, és a dir, invariables.

Criteris de restricció d'entrada: inclou fins i tot els molt confusionaris, que són els d'una i dues lletres, i fins algun de tres també prou confusionari. Es compta, per tant, que l'ordre d'anàlisi del partidor i les verificacions d'arrels i patrons evitaran la major part de les possibles confusions. Les variants ortogràficament condicionades d'un prefix ja s'inclouen amb la condició (bàsicament en relació a la primera lletra del radical). S'escindeixen del model els co-radicals inicials que en els models de Farriols (1993) hi anaven inclosos. S'exclouen alguns segments inicials que l'anàlisi manual ha presentat en algun mot o família de mots com a prefixos per eliminació de la resta de formants (radical, d'altres prefixos, etc.), ja que esdevenen massa rars i gens documentats per a incloure'ls en un inventari que pretén ser de prefixos estrictes, a banda de ser poc rendibles; malgrat això, l'acceptació de formes no documentades teòricament (variants formals específiques d'altres prefixos, preposicions i adverbis documentats en posició inicial de mot pre-radical, etc.), no ha estat gens restrictiva a fi d'afavorir la potència del sistema en la detecció dels formants.

Nivell d'optimització: destaca en complexitat la part corresponent a la lletra A que inclou una llista important de seqüències constants detectades a l'estudi manual, tot i que per a la resta de lletres del diccionari, en aquells mots integrats en mostres de tractament manual, l'extracció de seqüències ha estat també força rendible. A diferència del model de sufixos, en què la probabilitat de noves ocurrències complexes no depèn de la part del diccionari triada (quina lletra) sinó de la quantitat seleccionada (per al treball les més 33000 paraules validades manualment), en el cas dels prefixos és fonamental seleccionar formes de tot el diccionari, de totes les lletres, si es vol una mostra representativa dels possibles inicis complexos prefixats. Com que el corpus explotat per als prefixos és el mateix que per als sufixos, cal admetre que per a una part important dels inicis potencials de mot, la llista se circumscriu força a les formes que provenen de la llista formal. En qualsevol cas es pot parlar d'una llista força completa quant a prefixos simples, tot i que no s'assumeix com a un producte tan evolucionat com la llista de sufixos quant a seqüències complexes de prefixos. Altra vegada es topa amb la necessitat de completar l'anàlisi manual de tot el diccionari.

b) operacions de recerca i anàlisi del model de prefixos: ultra la correspondència directa de la llista formal i algunes anàlisis menors, les operacions dutes a terme són bàsicament quatre.

1a Estudi sobre els formants més confusionaris: (...)

2a Discriminació entre prefixos i co-radicals inicials: (...)

3a Extracció de seqüències complexes documentades: (...)

4a Darreres modificacions de l'anàlisi final de rebutjos: (...)

(...)


Per comentaris i observacions, poseu-vos en contacte amb Antoni Jaume Farriols (o amb Lluís de Yzaguirre)
Institut Universitari de Lingüística Aplicada (IULA)