La Rambla 30-32. 08071 Barcelona . Telèfon 542 23 22 . FAX 542 23 21. e-mail: iula@grup.upf.es
Com ja he avançat en apartats precedents quasi la meitat del diccionari s'ha validat manualment. D'aquí ha nascut un inventari de radicals documentats. Alhora, de cada lexema validat manualment se n'ha extret un patró. Sobre cadascuna de les propostes de segmentació d'un mateix lexema s'hi aplica un sistema de comprovació recorrent de verificacions, basat a identificar-la amb algun dels patrons documentats, alguna de les arrels documentades, o bé totes dues coses, o cap: l'esmentat índex de confiança. És a dir, entre totes les possibles segmentacions del lexema en qüestió que proposa el partidor, si n'hi ha més d'una, la prevalència l'obté, per aquest ordre:
a) Aquella en què el radical demarcat ha estat documentat en algun mot revisat manualment i, alhora, el patró d'aquesta segmentació també. P.ex. la segmentació BRAÇ»AL del mot braçal,m, té el màxim grau d'acceptabilitat perquè el patró [+»AL]m ha estat documentat en mots com aigual o fenal, i l'arrel en mots com abraçar i derivats, embraçadura, etc. Aquesta proposta preval sobre qualsevol altra ja que el volum de material documentat manualment és prou important com per pensar que la coincidència formal és indici suficient de veracitat en la identificació de les formes.
b) Aquella en què només s'hagi documentat l'arrel, però no el patró. P.ex. la segmentació DES«MES»UR»A del mot desmesura, té documentada l'arrel amb mots revisats manualment com mesura i derivats, o amesurat, o contramesures, però el patró [DES«+»UR»A]f és inèdit.
c) Aquella en què només s'hagi documentat el patró, però l'arrel sigui desconeguda. P.ex. la segmentació CRIN»ER»A del mot crinera,f, comparteix el patró [+»ER»A]f amb mots documentats com albera o cacera, però l'arrel no apareix a cap mot de la mostra manual.
d) Aquella en què ni l'arrel ni el patró han estat documentats. En principi es tracta de les propostes de segmentació menys fiables, la qual cosa no vol dir que no siguin adequades: poden ser correctes, en aplicació del sistema de segmentació automàtica descrit (reconeixent afixos) però amb elements (arrel i patrons) que no han estat documentats, encara, en les mostres treballades manualment.{1}
(...)
NOTES
{1} De la mateixa manera que una segmentació amb arrel i patró documentats pot ser errònia a causa de coincidències formals casuals. (retorn)
Per comentaris i observacions, poseu-vos en contacte amb
Antoni Jaume Farriols (o amb
Lluís de Yzaguirre)
Institut
Universitari de Lingüística Aplicada (IULA)