Institut de Lingüística Aplicada
Universitat "Pompeu Fabra"
Fitxer de regles multimots.RDL
Convencions:
Les regles de desambiguació lingüístiques usen trets explícits que
trobareu al document "Etiquetari de l'IULA".
En el seu formulisme es contempla l'ús de variables amb les següents
pautes:
- La variable W és un escarràs o comodí per a tots els valors
d'una variable. Això es fa servir quan només ens interessa comprovar
que ocorri la variable; per exemple, per saber si una forma verbal
està flexionada, usem temps o personaW.
- Les variables X, Y i Z s'usen per substituir
un conjunt de valors:
- la primera vegada que apareix la variable, els valors possibles
s'expressen dins de claus; per exemple, nombre=X{SP} fa que una
regla s'apliqui primer al singular i després al plural.
- una variable pot aparèixer només un cop o més d'un; en aquest darrer
cas, la variable apareix sense interpretació, que forçosament ha de ser
la de la primera vegada.
- per simplificar la comprovació de la sintaxi de les RDL, la variable
Z no pot aparèixer si no s'ha usat abans la Y i aquesta
exigeix l'aparició prèvia de X.
- Cal tenir present que el desambicial expandeix les
regles abans d'aplicar-les; doncs, per a ell, una regla amb X{MF},
Y{SP} i Z{123} equival a 2 * 2 * 3 = 12 regles.
* Regla 1040 -> "primer ministre"
si
- el mot analitzat és "primer"
- el mot següent al mot analitzat és "ministre"
llavors
- del mot analitzat triem categoria = "J"
* Regla 1060 -> "en honor"
si
- el mot analitzat és "en"
- el mot següent al mot analitzat és "honor"
llavors
- del mot analitzat triem categoria = "P"
* Regla 1100 -> "pla de desenvolupament"
si
- el mot analitzat és "pla"
- el mot següent al mot analitzat és "de"
- el segon mot després del mot analitzat és "desenvolupament"
llavors
- del mot analitzat triem categoria = "N"
- del mot següent al mot analitzat triem categoria = "P"
* Regla 1130 -> "drets humans"
si
- el mot analitzat és "drets"
- el mot següent al mot analitzat és "humans"
llavors
- del mot analitzat triem categoria = "N"
* Regla 1150 -> "els corts"
si
- el nombre de lemes del mot analitzat és "3"
- el mot analitzat té la variable gènere amb valor "X{MF}"
- el mot analitzat té la variable categoria amb valor "A"
- el mot analitzat té la variable categoria amb valor "R"
- el mot analitzat té la variable categoria amb valor "J"
- el nombre de lemes del mot següent al mot analitzat és "2"
- el mot següent al mot analitzat té la variable categoria amb valor "N"
- el mot següent al mot analitzat té la variable gènere amb valor "X"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem gènere = "X"
* Regla 1160 -> "ser" [regla de redundància]
si
- el nombre de lemes del mot analitzat és "3"
- el lema del mot analitzat és "ser"
- el lema del mot analitzat és "esser"
- el lema del mot analitzat és "ésser"
llavors
- del mot analitzat triem lema = "ser"
* Regla 1170 -> "treure" [regla de redundància]
si
- el nombre de lemes del mot analitzat és "2"
- el lema del mot analitzat és "treure"
- el lema del mot analitzat és "traure"
llavors
- del mot analitzat triem lema = "treure"
* Regla 1180 -> "de juny"
si
- el mot analitzat és "de"
- el nombre de lemes del mot analitzat és "1"
- el mot següent al mot analitzat té la variable categoria amb valor "P"
- el mot següent al mot analitzat és "juny"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "N"
* Regla 1190 -> "en cap cas"
si
- el mot analitzat és "en"
- el mot següent al mot analitzat és "cap"
- el segon mot després del mot analitzat és "cas"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "J"
- del mot següent al mot analitzat triem categoria = "N"
* Regla 1210 -> "estat de dret"
si
- el lema del mot analitzat és "estat"
- el mot següent al mot analitzat és "de"
- el segon mot després del mot analitzat és "dret"
llavors
- del mot següent al mot analitzat triem categoria = "P"
- del segon mot després del mot analitzat triem categoria = "N"
* Regla 1220 -> "per tal que"
si
- el mot analitzat és "per"
- el mot següent al mot analitzat és "tal"
- el segon mot després del mot analitzat és "que"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "D"
- del segon mot després del mot analitzat triem categoria = "C"
* Regla 1230 -> "en primer lloc"
si
- el mot analitzat és "en"
- el mot següent al mot analitzat és "primer"
- el segon mot després del mot analitzat és "lloc"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "J"
* Regla 1240 -> "pena de mort"
si
- el mot analitzat és "pena"
- el mot següent al mot analitzat és "de"
- el segon mot després del mot analitzat és "mort"
llavors
- del mot analitzat triem categoria = "N"
- del mot següent al mot analitzat triem categoria = "P"
- del segon mot després del mot analitzat triem categoria = "N"
* Regla 1270 -> "llibertat religiosa"
si
- el mot analitzat és "llibertat"
- el mot següent al mot analitzat és "religiosa"
llavors
- del mot analitzat triem categoria = "N"
* Regla 1280 -> "codi penal"
si
- el mot analitzat és "codi"
- el mot següent al mot analitzat és "penal"
llavors
- del mot següent al mot analitzat triem categoria = "J"
* Regla 1340 -> "estat civil"
si
- el mot analitzat és "estat"
- el mot següent al mot analitzat és "civil"
llavors
- del mot analitzat triem categoria = "N"
* Regla 1350 -> "nacions unides"
si
- el mot analitzat és "nacions"
- el mot següent al mot analitzat és "unides"
llavors
- del mot següent al mot analitzat triem categoria = "J"
* Regla 1360 -> "a través de"
si
- el mot analitzat és "a"
- el mot següent al mot analitzat és "través"
- el segon mot després del mot analitzat és "de"
llavors
- del mot següent al mot analitzat triem lema = "través"
- del segon mot després del mot analitzat triem categoria = "P"
* Regla 1370 -> "el bé de"
si
- el mot analitzat és "el"
- el mot següent al mot analitzat és "bé"
- el segon mot després del mot analitzat és "de"
llavors
- del mot analitzat triem categoria = "A"
- del mot següent al mot analitzat triem categoria = "N"
- del segon mot després del mot analitzat triem categoria = "P"
* Regla 1380 -> "estats units"
si
- el mot analitzat és "estats"
- el mot següent al mot analitzat és "units"
llavors
- del mot analitzat triem categoria = "N"
- del mot següent al mot analitzat triem categoria = "J"
* Regla 1390 -> "dret d'asil"
si
- el mot analitzat és "dret"
- el mot següent al mot analitzat és "d"
- el segon mot després del mot analitzat és "asil"
llavors
- del mot analitzat triem categoria = "N"
* Regla 1400 -> "fins i tot"
si
- el mot analitzat és "fins"
- el mot següent al mot analitzat és "i"
- el segon mot després del mot analitzat és "tot"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "C"
- del segon mot després del mot analitzat triem categoria = "D"
* Regla 1401 -> "fins on"
si
- el mot analitzat és "fins"
- el mot següent al mot analitzat és "on"
llavors
- del mot analitzat triem categoria = "P"
* Regla 1410 -> "llibertat d'expressió"
si
- el mot analitzat és "llibertat"
- el mot següent al mot analitzat és "d"
- el segon mot després del mot analitzat és "expressió"
llavors
- del mot analitzat triem categoria = "N"
* Regla 1420 -> "en aquest sentit"
si
- el mot analitzat és "en"
- el mot següent al mot analitzat és "aquest"
- el segon mot després del mot analitzat és "sentit"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "J"
- del segon mot després del mot analitzat triem categoria = "N"
* Regla 1430 -> "a fi de"
si
- el mot analitzat és "a"
- el mot següent al mot analitzat és "fi"
- el lema del segon mot després del mot analitzat és "de"
llavors
- del mot analitzat triem categoria = "P"
- del mot següent al mot analitzat triem categoria = "N"
- del segon mot després del mot analitzat triem categoria = "P"
* Regla xxxx "dret mercantil"
si
- el mot analitzat és "dret"
- el mot següent al mot analitzat és "mercantil"
llavors
- del mot analitzat triem categoria = "N"
* Regla xxxx "el constitueix"
si
- el nombre de lemes del mot analitzat és "2"
- el mot analitzat té la variable categoria amb valor "A"
- el mot analitzat té la variable categoria amb valor "R"
- el nombre de lemes del mot següent al mot analitzat és "1"
- el mot següent al mot analitzat té la variable temps amb valor "W"
llavors
- del mot analitzat triem categoria = "R"
* Regla xxxx "en canvi"
si
- el mot analitzat és "en"
- el mot següent al mot analitzat és "canvi"
llavors
- del mot analitzat triem categoria = "P"
* Regla xxxx "encara que"
si
- el mot analitzat és "encara"
- el mot següent al mot analitzat és "que"
llavors
- del mot analitzat triem categoria = "D"
- del mot següent al mot analitzat triem categoria = "C"
* Regla xxxx "per"
si
- el mot analitzat és "per"
llavors
- del mot analitzat triem categoria = "P"
Lluís de Yzaguirre i Maura
Institut de Lingüística Aplicada -
Universitat "Pompeu Fabra"
e-mail: de_yza@upf.es