Fénix 28-29, 5-70

LITERATURA SOBRE DESCRIPTORES Y TESAUROS 65 Scheele ha desarrollado un sistema para construir un tesauro en com- putadora. Para estructurar las listas se extraen las entradas del texto automá- ticamente. Para toda entrada del tesauro, se asigna manualmente: Tipo de palabra (palabra funcional, nombres propios, abreviaciones, etc); Un código lingüístico; Un código para la forma de inflexión de la palabra; Un código para distinguir entre las diferentes estructuras de las palabras; Uno o más códigos de expresión para relaciones semánticas; Sinónimos y homónimos; Relaciones jerárquicas; Relaciones asociativas; Autonomía. El tesauro puede organizarse de diferentes formas, pero sienipre teniendo en cuenta estos códigos, para ayudar a1 especialista a integrar nuevas pala- bras. El texto verbal que ingresa es indizado manualmente por medio de palabras del lenguaje natural consideradas adecuadas para caracteri- zar el contenido del texto en opinión del indizador; estas entradas se procesan automáticamente. Las que no han sido aún registradas en el tesauro se pasan al lexicógrafo para chequearlas, revisarlas y eventualmente incorporarlas al mismo. El chequeo revela si un término es sinónimo de un concepto ya "me- morizado" o si se trata de un nuevo témino. Para colocar un nuevo término en la posición adecuada dentro del tesaoro y para hacer los envíos, el lexi- cógrafo tiene a su disposición un tesauro ordenado polijerárquicamente. Este orden se basa en tres tipos de relaciones: genéricas, parte- todo y por atribu- tos. Existe un método para construir un diccionario de final abierto, que lo utilizan expertos en diferentes materias, para la tarea básica de definir el significado de cada término introducido en el tesauro. La idea básica es empezar con una lista de frecuencia de las pala- bras incluidas en una colección particular de documentos. Además, es úti4 tener disponible una lista de las palabras en su contexto, para distinguir la utilización individual de los significados para términos ambiguos. Una lista standard KWIC puede prepararse automáticamente, de manera que permita al usuario asegurarse de los usos individuales de las palabras incluidas en una colección. Después de preparar la lista de usos de palabras a ser inclui- das, es necesario agruparlas en clases dentro del tesauro. Este puede hacer- se de varias formas: Un juicio informal para cada doble uso de palabras y así decidir si son sinónimos dentro de la materia considerada; si es así, pueden agruparse dentro de la misma clase en el tesauro. Un juego de enmarcamientos sintácticos, controlándose el uso de pa- labras que son convenientes en los mismos contextos, como en el mismo Fénix: Revista de la Biblioteca Nacional del Perú. N.28-29, 1983

RkJQdWJsaXNoZXIy MjgwMjMx