Institut de Lingüística Aplicada
Universitat "Pompeu Fabra"
Fichero de reglasES951013.rdl
Convenciones:
Las reglas de desambiguación lingüísticas usan rasgos explícitos que
encontraréis en el documento "pendent".
En su formulismo se contempla el uso de variables con las siguientes
pautas:
- La variable W es un jóker o comodín para todos los valores
de una variable. Se usa cuando sólo nos interesa comprobar
que ocurra la variable; por ejemplo, para saber si una forma verbal
está flexionada, usamos temps o personaW.
- Las variables X, Y y Z se usan para substituir
un conjunto de valores:
- la primera vez que aparece la variable, los valores posibles se
expresan dentro de llaves; por ejemplo, nombre=X{SP} hace que una
regla se apliqui primero al singular y después al plural.
- una variable puede aparecer sólo una vez o más de una; en este último
caso, la variable aparece sin interpretación, que forzosamente ha de ser
la de la primera vez.
- para simplificar la comprobación de la sintaxis de las RDL, la variable
Z no puede aparecer si no se ha usado antes la Y y ésta
exige la aparición previa de X.
- Hay que tener presente que el desambigüicial expande las
reglas antes de aplicarlas; luego, para él, una regla con X{MF},
Y{SP} y Z{123} equivale a 2 * 2 * 3 = 12 reglas.
- El desambigüicial procesa indistintamente textos en catalán y en
castellano. Por esta razón, las etiquetas que usa están en catalán y tienen
los siguientes equivalentes:
- categoria -------> categoría
- gènere ----------> género
- nombre ----------> número
- nombre de lemes -> cantidad de lemas
- mot -------------> palabra
- lema ------------> lema
- temps -----------> tiempo
- mode ------------> modo
- persona ---------> persona
- mena ------------> modalidad
* Regla 0001 -> "flex+flex/n?"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "V"
- la palabra analitzada tiene la variable persona con valor "W"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "N"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable persona con valor "W"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "N"
* Regla 0002 -> "art+ vflex/nom"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra analitzada tiene la variable gènere con valor "X{MF}"
- la palabra analitzada tiene la variable nombre con valor "Y{SP}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "N"
- la palabra analitzada tiene la variable gènere con valor "X"
- la palabra analitzada tiene la variable nombre con valor "Y"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "N"
- de la palabra analitzada escogemos gènere = "X"
- de la palabra analitzada escogemos nombre = "Y"
* Regla 0003 -> "prep + flex/n"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "P"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "N"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "N"
* Regla 0004 -> "para + inf."
si
- la cantidad de lemas de la palabra analitzada es "3"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "1"
- la palabra analitzada es "para"
- la palabra siguiente a la palabra analitzada tiene la variable mode con valor "I"
entonces
- de la palabra analitzada escogemos categoria = "P"
* Regla 0005 -> "art/pron + nom"
si
- la cantidad de lemas de la palabra analitzada es "2"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "1"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra analitzada tiene la variable categoria con valor "R"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "X{NJ}"
entonces
- de la palabra analitzada escogemos categoria = "A"
* Regla 0006 -> "art/pron + flex"
si
- la cantidad de lemas de la palabra analitzada es "2"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "1"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra analitzada tiene la variable categoria con valor "R"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la palabra analitzada escogemos categoria = "R"
* Regla 0007 -> "art + flex/nom"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "X{NJ}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "X"
* Regla 0008 -> "de + art + nom/flex"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "1"
- la cantidad de lemas de la segunda palabra después de la palabra analitzada es "2"
- la palabra analitzada es "de"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "A"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "N"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "V"
- la segunda palabra después de la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la segunda palabra después de la palabra analitzada escogemos categoria = "N"
* Regla 0009 -> "de + art/pron + nom/flex"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la cantidad de lemas de la segunda palabra después de la palabra analitzada es "2"
- la palabra analitzada es "de"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "A"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "R"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "N"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "V"
- la segunda palabra después de la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "A"
- de la segunda palabra después de la palabra analitzada escogemos categoria = "N"
* Regla 0010 -> "art/pron + nom/imper: la libertad"
si
- la cantidad de lemas de la palabra analitzada es "2"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra analitzada tiene la variable categoria con valor "R"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "N"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable mode con valor "R"
entonces
- de la palabra analitzada escogemos categoria = "A"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "N"
* Regla 0011 -> "estar+part: estçn sujetos"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- el lema de la palabra analitzada es "estar"
- la palabra analitzada tiene la variable categoria con valor "V"
- la palabra analitzada tiene la variable temps con valor "W"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "J"
- la palabra siguiente a la palabra analitzada tiene la variable mode con valor "C"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "V"
* Regla 0012 -> "prep + part/nom"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "P"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "X{NJ}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable mode con valor "C"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "X"
* Regla 0013 -> "art/pron + nomin/part"
si
- la cantidad de lemas de la palabra analitzada es "2"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra analitzada tiene la variable categoria con valor "R"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "X{NJ}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable mode con valor "C"
entonces
- de la palabra analitzada escogemos categoria = "A"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "X"
* Regla 0014 -> "art + nomin/part"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "X{NJ}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable mode con valor "C"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "X"
* Regla 0015 -> "no pronp verb/nom/adj"
si
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "1"
- la cantidad de lemas de la segunda palabra después de la palabra analitzada es "3"
- la palabra analitzada es "no"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "R"
- la palabra siguiente a la palabra analitzada tiene la variable mena con valor "E"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "J"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "N"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "V"
- la segunda palabra después de la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la segunda palabra después de la palabra analitzada escogemos categoria = "V"
* Regla 0016 -> "no pronp verb/nom o adj"
si
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "1"
- la cantidad de lemas de la segunda palabra después de la palabra analitzada es "2"
- la palabra analitzada es "no"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "R"
- la palabra siguiente a la palabra analitzada tiene la variable mena con valor "E"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "X{NJ}"
- la segunda palabra después de la palabra analitzada tiene la variable categoria con valor "V"
- la segunda palabra después de la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la segunda palabra después de la palabra analitzada escogemos categoria = "V"
* Regla 0017 -> "prep verb/adj o nom"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "P"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "X{NJ}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable temps con valor "W"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "X"
* Regla 0018 -> "Haber+part?"
si
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- el lema de la palabra analitzada es "haber"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "X{NJ}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable mode con valor "C"
entonces
- de la palabra analitzada escogemos lema = "haber"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "V"
* Regla 0019 -> "prep+art/pron"
si
- la cantidad de lemas de la palabra analitzada es "1"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "P"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "A"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "R"
entonces
- de la palabra siguiente a la palabra analitzada escogemos categoria = "A"
* Regla 0020 -> "esta,esa,aquella + subst"
si
- la cantidad de lemas de la palabra analitzada es "2"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "1"
- la palabra analitzada tiene la variable categoria con valor "J"
- la palabra analitzada tiene la variable mena con valor "D"
- la palabra analitzada tiene la variable gènere con valor "X{MF}"
- la palabra analitzada tiene la variable nombre con valor "Y{SP}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "N"
- la palabra siguiente a la palabra analitzada tiene la variable gènere con valor "X"
- la palabra siguiente a la palabra analitzada tiene la variable nombre con valor "Y"
entonces
- de la palabra analitzada escogemos categoria = "J"
* Regla 0021 -> "art? + subs"
si
- la cantidad de lemas de la palabra analitzada es "2"
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "1"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra analitzada tiene la variable gènere con valor "X{MF}"
- la palabra analitzada tiene la variable nombre con valor "Y{SP}"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "N"
- la palabra siguiente a la palabra analitzada tiene la variable gènere con valor "X"
- la palabra siguiente a la palabra analitzada tiene la variable nombre con valor "Y"
entonces
- de la palabra analitzada escogemos categoria = "A"
* Regla 0022 -> "art + subs/1pers. vg. libro"
si
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra analitzada tiene la variable nombre con valor "S"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "N"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable persona con valor "1"
- la palabra siguiente a la palabra analitzada tiene la variable nombre con valor "S"
entonces
- de la palabra analitzada escogemos categoria = "A"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "N"
* Regla 0023 -> "art + subs/2pers. vg. libras"
si
- la cantidad de lemas de la palabra siguiente a la palabra analitzada es "2"
- la palabra analitzada tiene la variable categoria con valor "A"
- la palabra analitzada tiene la variable nombre con valor "P"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "N"
- la palabra siguiente a la palabra analitzada tiene la variable categoria con valor "V"
- la palabra siguiente a la palabra analitzada tiene la variable persona con valor "2"
entonces
- de la palabra analitzada escogemos categoria = "A"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "N"
* Regla 0501 -> "para que"
si
- la palabra analitzada es "para"
- la palabra siguiente a la palabra analitzada es "que"
entonces
- de la palabra analitzada escogemos categoria = "P"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "C"
* Regla 0502 -> "poco a poco"
si
- la palabra analitzada es "poco"
- la palabra siguiente a la palabra analitzada es "a"
- la segunda palabra después de la palabra analitzada es "poco"
entonces
- de la palabra analitzada escogemos categoria = "D"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "P"
- de la segunda palabra después de la palabra analitzada escogemos categoria = "D"
* Regla 0503 -> "Estado de Derecho"
si
- la palabra analitzada es "estado"
- la palabra siguiente a la palabra analitzada es "de"
- la segunda palabra después de la palabra analitzada es "derecho"
entonces
- de la palabra analitzada escogemos categoria = "N"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "P"
* Regla 0504 -> "mala leche"
si
- la palabra analitzada es "mala"
- la palabra siguiente a la palabra analitzada es "leche"
entonces
- de la palabra analitzada escogemos categoria = "J"
- de la palabra siguiente a la palabra analitzada escogemos categoria = "N"
Lluís de Yzaguirre i Maura
Institut de Lingüística Aplicada -
Universitat "Pompeu Fabra"
e-mail: de_yza @ upf.es