Institut de Lingüística Aplicada
Universitat "Pompeu Fabra"
Fitxer de regles generals.RDL
Convencions:
Les regles de desambiguació lingüístiques usen trets explícits que
trobareu al document "Etiquetari de l'IULA".
En el seu formulisme es contempla l'ús de variables amb les següents
pautes:
- La variable W és un escarràs o comodí per a tots els valors
d'una variable. Això es fa servir quan només ens interessa comprovar
que ocorri la variable; per exemple, per saber si una forma verbal
està flexionada, usem temps o personaW.
- Les variables X, Y i Z s'usen per substituir
un conjunt de valors:
- la primera vegada que apareix la variable, els valors possibles
s'expressen dins de claus; per exemple, nombre=X{SP} fa que una
regla s'apliqui primer al singular i després al plural.
- una variable pot aparèixer només un cop o més d'un; en aquest darrer
cas, la variable apareix sense interpretació, que forçosament ha de ser
la de la primera vegada.
- per simplificar la comprovació de la sintaxi de les RDL, la variable
Z no pot aparèixer si no s'ha usat abans la Y i aquesta
exigeix l'aparició prèvia de X.
- Cal tenir present que el desambicial expandeix les
regles abans d'aplicar-les; doncs, per a ell, una regla amb X{MF},
Y{SP} i Z{123} equival a 2 * 2 * 3 = 12 regles.
* Regla 0032 -> article seguit de nom
si
- el mot analitzat té la variable categoria amb valor "A"
- el mot analitzat no té la variable categoria amb valor "P"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "X{NJ}"
llavors
- del mot analitzat triem categoria = "A"
* Regla 0010 -> "de" seguit de CR+CJ seguit de nom
si
- el lema del mot analitzat és "de"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "R"
- el mot següent al mot analitzat té la variable categoria amb valor "J"
- el nombre de lemes del segon mot després del mot analitzat és "1"
- el segon mot després del mot analitzat té la variable categoria amb valor "N"
llavors
- del mot següent al mot analitzat triem categoria = "J"
* Regla 0031 -> article? seguit de part.?
si
- el mot analitzat té la variable categoria amb valor "A"
- el mot analitzat no té la variable categoria amb valor "P"
- el mot següent al mot analitzat té la variable mode amb valor "C"
- el mot següent al mot analitzat té la variable categoria amb valor "X{NJ}"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem categoria = "X"
* Regla 0040 -> formes flexionades "haver"+participi
si
- el lema del mot analitzat és "haver"
- el mot següent al mot analitzat té la variable mode amb valor "C"
- el mot següent al mot analitzat té la variable gènere amb valor "M"
- el mot següent al mot analitzat té la variable nombre amb valor "S"
llavors
- del mot analitzat triem categoria = "V"
- del mot següent al mot analitzat triem categoria = "C"
* Regla 0050 -> article+"estat"
si
- el mot analitzat té la variable categoria amb valor "A"
- el mot analitzat no té la variable categoria amb valor "P"
- el lema del mot següent al mot analitzat és "estat"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem categoria = "N"
* Regla 0060 -> preposició+"estat"
si
- el mot analitzat té la variable categoria amb valor "P"
- el mot següent al mot analitzat és "estat"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "N"
* Regla 0070 -> "es" precedit de singular i seguit de flexionat
si
- el mot analitzat té la variable gènere amb valor "S"
- el mot següent al mot analitzat és "es"
- el segon mot després del mot analitzat té la variable categoria amb valor "V"
- el segon mot després del mot analitzat té la variable persona amb valor "3"
llavors
- del mot següent al mot analitzat triem categoria = "R"
* Regla 0080 -> pronom seguit de verb flexionat
si
- el mot analitzat té la variable categoria amb valor "R"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
- el mot següent al mot analitzat té la variable persona amb valor "X{123}"
llavors
- del mot analitzat triem categoria = "R"
* Regla 0081 -> pronom seguit de pronom
si
- el mot analitzat té la variable categoria amb valor "R"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "R"
llavors
- del mot analitzat triem categoria = "R"
* Regla 0082 -> pronom#art? seguit de no verb
si
- el nombre de lemes del mot analitzat és "2"
- el mot analitzat té la variable categoria amb valor "R"
- el mot analitzat té la variable categoria amb valor "A"
- el mot següent al mot analitzat no té la variable categoria amb valor "V"
llavors
- del mot analitzat triem categoria = "A"
* Regla 0090 -> art.+ "seu" + nom o adj
si
- el mot analitzat té la variable categoria amb valor "A"
- el mot analitzat té la variable gènere amb valor "X{MF}"
- el mot analitzat té la variable nombre amb valor "Y{SP}"
- el lema del mot següent al mot analitzat és "seu"
- el mot següent al mot analitzat té la variable gènere amb valor "X"
- el mot següent al mot analitzat té la variable nombre amb valor "Y"
- el nombre de lemes del segon mot després del mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "Z{NJ}"
- el segon mot després del mot analitzat té la variable gènere amb valor "X"
- el segon mot després del mot analitzat té la variable nombre amb valor "Y"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem categoria = "J"
* Regla 0100 -> "en" seguit d'article
si
- el mot analitzat és "en"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "A"
llavors
- del mot analitzat triem categoria = "P"
* Regla 0101 -> "en què"
si
- el mot analitzat és "en"
- el mot següent al mot analitzat és "què"
llavors
- del mot analitzat triem categoria = "P"
* Regla 0102 -> "en" determinant
si
- el mot analitzat és "en"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable comú amb valor "4"
llavors
- del mot analitzat triem categoria = "A"
* Regla 0110 -> art+"qual"
si
- el mot analitzat té la variable categoria amb valor "A"
- el lema del mot següent al mot analitzat és "qual"
llavors
- del mot analitzat triem categoria = "A"
* Regla 0120 -> anar+"ser"+part.
si
- el lema del mot analitzat és "anar"
- el lema del mot següent al mot analitzat és "ser"
- el segon mot després del mot analitzat té la variable mode amb valor "C"
llavors
- del mot següent al mot analitzat triem categoria = "V"
- del segon mot després del mot analitzat triem mode = "C"
* Regla 0121 -> "ser"+part.
si
- el lema del mot analitzat és "ser"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable mode amb valor "C"
llavors
- del mot analitzat triem categoria = "V"
* Regla 0130 -> anar+inf.
si
- el lema del mot analitzat és "anar"
- el nombre de lemes del mot següent al mot analitzat no és "1"
- el mot següent al mot analitzat té la variable mode amb valor "I"
llavors
- del mot següent al mot analitzat triem categoria = "V"
* Regla 0131 -> "va/vas" (pret. perifràstic)
si
- el lema del mot analitzat és "anar"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable mode amb valor "I"
llavors
- del mot analitzat triem categoria = "V"
* Regla 1000 -> "per+inf."
si
- el mot analitzat és "per"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable mode amb valor "I"
llavors
- del mot analitzat triem categoria = "P"
* Regla 1010 -> "nom+prep+nom/verb flex."
si
- el nombre de lemes del mot analitzat és "1"
- el mot analitzat té la variable categoria amb valor "N"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "P"
- el nombre de lemes del segon mot després del mot analitzat és "2"
- el segon mot després del mot analitzat té la variable categoria amb valor "N"
- el segon mot després del mot analitzat té la variable categoria amb valor "V"
- el segon mot després del mot analitzat té la variable persona amb valor "W"
llavors
- del segon mot després del mot analitzat triem categoria = "N"
* Regla 1020 -> "en+art."
si
- el mot analitzat és "en"
- el mot següent al mot analitzat té la variable categoria amb valor "A"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "A"
* Regla 1030 -> "art.+nom/verb flex."
si
- el nombre de lemes del mot analitzat és "1"
- el mot analitzat té la variable categoria amb valor "A"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "N"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
- el mot següent al mot analitzat té la variable persona amb valor "W"
llavors
- del mot següent al mot analitzat triem categoria = "N"
* Regla 1050 -> "art.+inf/nom"
si
- el mot analitzat té la variable categoria amb valor "A"
- el mot analitzat no té la variable categoria amb valor "P"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
- el mot següent al mot analitzat té la variable mode amb valor "I"
- el mot següent al mot analitzat té la variable categoria amb valor "N"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem categoria = "N"
* Regla 1070 -> "flex.+prep?+nom/verb flex."
si
- el nombre de lemes del mot analitzat és "1"
- el mot analitzat té la variable mode amb valor "W"
- el mot següent al mot analitzat té la variable categoria amb valor "P"
- el nombre de lemes del segon mot després del mot analitzat és "2"
- el segon mot després del mot analitzat té la variable categoria amb valor "N"
- el segon mot després del mot analitzat té la variable categoria amb valor "V"
- el segon mot després del mot analitzat té la variable persona amb valor "W"
llavors
- del mot següent al mot analitzat triem categoria = "P"
- del segon mot després del mot analitzat triem categoria = "N"
* Regla 1080 -> "prep+art?+nom/verb flex."
si
- el nombre de lemes del mot analitzat és "1"
- el mot analitzat té la variable categoria amb valor "P"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "A"
- el mot següent al mot analitzat té la variable categoria amb valor "R"
llavors
- del mot següent al mot analitzat triem categoria = "A"
* Regla 1081 -> "prep+art?+nom/verb flex."
si
- el nombre de lemes del mot analitzat és "1"
- el mot analitzat té la variable categoria amb valor "P"
- el mot següent al mot analitzat té la variable categoria amb valor "A"
- el nombre de lemes del segon mot després del mot analitzat és "2"
- el segon mot després del mot analitzat té la variable categoria amb valor "N"
- el segon mot després del mot analitzat té la variable categoria amb valor "V"
- el segon mot després del mot analitzat té la variable persona amb valor "W"
llavors
- del mot següent al mot analitzat triem categoria = "A"
- del segon mot després del mot analitzat triem categoria = "N"
* Regla 1090 -> "el que"
si
- el nombre de lemes del mot analitzat és "1"
- el lema del mot analitzat és "el"
- el mot analitzat té la variable categoria amb valor "A"
- el mot següent al mot analitzat és "que"
llavors
- del mot següent al mot analitzat triem categoria = "R"
* Regla 1110 -> "verb flex+ molt+prep."
si
- el nombre de lemes del mot analitzat és "1"
- el mot analitzat té la variable categoria amb valor "V"
- el mot analitzat té la variable persona amb valor "W"
- el lema del mot següent al mot analitzat és "molt"
- el nombre de lemes del segon mot després del mot analitzat és "1"
- el segon mot després del mot analitzat té la variable categoria amb valor "P"
llavors
- del mot següent al mot analitzat triem categoria = "R"
* Regla 1120 -> "flex.+art/pron."
si
- el nombre de lemes del mot analitzat és "1"
- el mot analitzat té la variable mode amb valor "W"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "A"
- el mot següent al mot analitzat té la variable categoria amb valor "R"
llavors
- del mot següent al mot analitzat triem categoria = "A"
* Regla 1140 -> "per tal de"
si
- el mot analitzat és "per"
- el mot següent al mot analitzat és "tal"
- el lema del segon mot després del mot analitzat és "de"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "D"
* Regla 1200 -> "poden+inf."
si
- el nombre de lemes del mot analitzat és "2"
- el lema del mot analitzat és "podar"
- el lema del mot analitzat és "poder"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
- el mot següent al mot analitzat té la variable mode amb valor "I"
llavors
- del mot analitzat triem lema = "poder"
* Regla 1201-> podria+infinitiu
si
- el lema del mot analitzat és "poder"
- el mot analitzat té la variable temps amb valor "C"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
- el mot següent al mot analitzat té la variable mode amb valor "I"
llavors
- del mot analitzat triem temps = "C"
* Regla 1202 -> "pot(s)"+infinitiu
si
- el nombre de lemes del mot analitzat és "2"
- el lema del mot analitzat és "poder"
- el mot analitzat té la variable categoria amb valor "V"
- el mot analitzat té la variable mode amb valor "D"
- el mot analitzat té la variable temps amb valor "R"
- el mot analitzat té la variable gènere amb valor "S"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
- el mot següent al mot analitzat té la variable mode amb valor "I"
llavors
- del mot analitzat triem categoria = "V"
* Regla 1250 -> "poder+ser+part."
si
- el nombre de lemes del mot analitzat és "1"
- el mot analitzat té la variable gènere amb valor "X{SP}"
- el lema del mot analitzat és "poder"
- el mot següent al mot analitzat és "ser"
- el segon mot després del mot analitzat té la variable mode amb valor "C"
- el segon mot després del mot analitzat té la variable gènere amb valor "X"
llavors
- del mot següent al mot analitzat triem mode = "I"
- del segon mot després del mot analitzat triem mode = "C"
* Regla 1260 -> "art+altre+nom"
si
- el lema del mot analitzat és "el"
- el lema del mot següent al mot analitzat és "altre"
- el segon mot després del mot analitzat té la variable categoria amb valor "N"
- el nombre de lemes del segon mot després del mot analitzat és "1"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem categoria = "J"
* Regla 1290 -> "en+infinitiu"
si
- el mot analitzat és "en"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable mode amb valor "I"
llavors
- del mot analitzat triem categoria = "P"
* Regla 1300 -> "dels nom/verb"
si
- el mot analitzat té la variable categoria amb valor "A"
- el nombre de lemes del mot analitzat és "1"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "N"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
llavors
- del mot següent al mot analitzat triem categoria = "N"
* Regla 01310 -> "de nom/verb adj."
si
- el mot analitzat és "de"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "N"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
- el nombre de lemes del segon mot després del mot analitzat és "1"
- el segon mot després del mot analitzat té la variable categoria amb valor "J"
llavors
- del mot següent al mot analitzat triem categoria = "N"
* Regla 1320 -> "caldre" [red.]
si
- el lema del mot analitzat és "caldre"
llavors
- del mot analitzat triem lema = "caldre"
* Regla 1330 -> "sense nom/verb"
si
- el lema del mot analitzat és "sense"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "N"
- el mot següent al mot analitzat té la variable categoria amb valor "V"
- el mot següent al mot analitzat no té la variable mode amb valor "I"
- el mot següent al mot analitzat té la variable persona amb valor "W"
llavors
- del mot següent al mot analitzat triem categoria = "N"
* Regla 1440 -> "ha de ser"
si
- el lema del mot analitzat és "haver"
- el mot següent al mot analitzat és "de"
- el segon mot després del mot analitzat té la variable mode amb valor "I"
llavors
- del mot analitzat triem categoria = "V"
- del mot següent al mot analitzat triem categoria = "P"
- del segon mot després del mot analitzat triem categoria = "V"
* Regla 1450 -> "art+gerundi?adj?"
si
- el lema del mot analitzat és "el"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "X{NJ}"
- el mot següent al mot analitzat té la variable mode amb valor "G"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem categoria = "J"
* Regla xxxx "de reforma"
si
- el mot analitzat té la variable categoria amb valor "P"
- el nombre de lemes del mot analitzat és "1"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "N"
- el mot següent al mot analitzat té la variable temps amb valor "R"
llavors
- del mot següent al mot analitzat triem categoria = "N"
* Regla xxxx "l acceptant"
si
- el mot analitzat té la variable categoria amb valor "A"
- el mot analitzat no té la variable categoria amb valor "P"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "J"
- el mot següent al mot analitzat té la variable mode amb valor "G"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem categoria = "J"
Lluís de Yzaguirre i Maura
Institut de Lingüística Aplicada -
Universitat "Pompeu Fabra"
e-mail: de_yza@upf.es