INTRODUCCIÓN | ¿QUÉ ES EL SILENCIO DOCUMENTAL? | CAUSAS POSIBLES | TÉCNICAS PARA EVITARLO | FORMAS DE MEDIRLO | ENLACES RELACIONADOS
|BIBLIOGRAFÍA |
Los errores que cometen los usuarios cuando abordan un proceso de búsqueda en Internet, son por el desconocimiento básico previo de lo que contiene y puede ofrecer Internet, como requisito indispensable para obtener resultados satisfactorios, ya que de lo contrario las experiencias frustradas hacen que el usuario se retrayese ante nuevas necesidades, y abandone los procesos de búsqueda, intentando obtener resultados por otros medio menos adecuados.
En muchos de los casos no comprenden los criterios que utilizan las herramientas de búsqueda para ofrecer resultados, ni cuál era el criterio de relevancia que establecen el orden de las respuestas.
Por otro lado, se establece la Recuperación de Información (RI) que nace de la necesidad de obtener información existente, sólo la información pertinente.
Problemas que surgen con la Recuperación de Información, es el denominado Ruido Documental ( que es cuando se recupera gran número de referencias irrelevantes), y el Silencio Documental que es del cual vamos a hablar a continuación.
¿Qué es el silencio documental?
El silencio o Silencio documental es cuando no se localiza ningún documento pese a que exista recursos útiles y pertinentes.
El SILENCIO a la hora de recuperar información, también conocido como silencio documental, es un inconveniente que consiste, por tanto, en la ausencia de resultados pertinentes ofrecidos por un motor de búsqueda cuando éste es interrogado.
Este silencio no es el único problema que presenta el uso del lenguaje natural con el que interrogamos los motores de Internet (Yahoo, Google, Altavista, Lycos...), existen otros como el ruido (producido por la polisemia, p.ej. banco, gato), homografía (p. ej. traje, vino) y ambiguedad.
Se produce por diversas causas que son:
Desconocimiento del usuario o mal uso del lenguaje de interrogación del motor que está utilizando para la búsqueda.
Sinonimia de los términos
Mala indización de los términos.
Dificultad para utilizar el motor de búsqueda.
Falta de conocimiento sobre ese motor.
Búsquedas poco específicas o demasiado específicas.
No buena utilización de las estrategias de búsqueda.
Se puede evitar teniendo en cuenta:
La Consulta:
- Emplear operadores booleanos OR.
- Utilizar variantes ortográficas (incluido acentos, mayúsculas, género, número, ...)
- Cambios idiomáticos y dialectales
- Expansión de búsqueda: con Términos genéricos y sinónimos.
Observar el Medio:
- Metabuscadores
- Motores
El silencio es la proporción de documentos relevantes no recuperados, sobre el total de documentos relevantes existentes en la base de datos.
S = nº de registros no relevantes recuperados
nº total de registros recuperados
Se puede conseguir los datos para la medición de la siguiente manera:
Examinar por medios estadísticos los resultados del examen de una muestra (aleatoria o seleccionada) de documentos no recuperados.
Examinar (el usuario o experto) todos los documentos no recuperados (sólo para BD's muy pequeñas; proporciona valores reales, no estimaciones).
Limitar la recuperación a una parte relativamente pequeña de la BD (aleatoria o seleccionada), y extrapolar los resultados de la búsqueda.
Hacer que el usuario identifique, antes de realizar la búsqueda, varios documentos relevantes que conoce y existen en la base de datos, y según cuántos de ellos se recuperen en la búsqueda, extrapolar los resultados de la recuperación.
Ampliar la versión final de una búsqueda, conviertiendo los Y's en O's, truncando términos, o haciendo uso de estructuras de clasificación jerárquica.
Aceptar que una serie más o menos larga de distintas estrategias de búsqueda acaba recuperando todos los documentos relevantes sobre un tema.
Página creada por: Miryam Rodríguez Lombán
Licenciatura en Documentación (UC3M)
Sistemas avanzados de recuperación de información (SARI)
Contacto: silenciodocumental@yahoo.es