Fénix 28-29, 5-70
FENIX grupo dentro del tessuro o, igualmente, se pueden decidir si el término A riemplazará siempre al término B en un contexto X dado. El autor del dic- cioilario debe enfrentarse sólo con colecciones dentro de ciertos Iímítes es- trechos. Diseñar un cuestionario para obtener respuestas sobre cómo prepa- rar los t é rmi n~spara agruparlos e identificar así cada término de acuerdo al juego de respuestas obtenido. Pm ej.: uno podría preguntar: ¿Representa este término un objeto físico, un proceso o una abstracción; o, esta pregunta no se le puede aplicar?, se le da 1 punto si es un cbjrto físico; 2, si se tiata de una abstracción; 3, si no se le puede aplicar la pregunta. Al acabar este proceso, se identifica cada término por una serie de propiedades (en forma de contextos que se adccuan a un término dado, o como respuestas a preguntas formuladas sobre los términos), y el vocabu- lario completo puede representarse por una matriz de propiedades, Falta hallar la distancia semántica entre los términos, comparando las propieda- des que representan el uso respectivo de cada palabra. Específicamente, las popedades completamente idénticas pueden colocarse en un solo grupo iiinwktaniente; los términos que no son idénticcs, pueden agruparse d i - minando juiciosamente algunas de sus propiedades y alternativamente. Los términos ya agrupados pueden separarse introduciendo nuevas propiedade; para diferenciarlos. La matriz de propiedades puede usarse para "computar" un coefi- ciente entre cada par de términos y formular jerarquías automáticas. El sistema Passat descrito por Hoffman y otros autores actúa para facilitar la selección de palabras clave de los textos por análisis del contexto. El sistema requiere un diccionario (lista de palabras a comparar) que com- prenda información sobre el tratamiento gramatical de las palabras y su relación asociativa. Esta lista se construye mediante un piocedimieiito semi- automático: Se construye un diccionario de palabras basándosc en una co- lección representativa de textos. Esta construcción debe ser automática. A cada palabra se le asigna manualmente su información gramatical que con- siste en: Tipo de palabra; Lista de posibies sufijos; Reglas de segmentación; para finalmente unirse las palabras semánticamente similares. Manualmente se va elaborando un diccionario de palabras compuestas, mientras se indizan nuevos documentos. Rohinson muestra para el sistema Assasin, como se efectúa semiau- tomáticamenteeftesauro reactivo (de final abierto y estructurado): Cualquier término (y homógrafos) se coloca en el Indizador (que se convierte en un controlador de indización) para determinar su significado Fénix: Revista de la Biblioteca Nacional del Perú. N.28-29, 1983
Made with FlippingBook
RkJQdWJsaXNoZXIy MjgwMjMx