Con la generalización de los buscadores como Google los usuarios se han acostumbrado a utilizar conceptos simples para encontrar una solución inmediata ante todo tipo de consultas personales o profesionales. Estos buscadores han creado un nivel alto de exigencia en los usuarios, llegando incluso a tener criterios propios a la hora de valorar y detectar errores o carencias en los resultados.
Aunque carecen de conocimientos sobre cómo funciona un buscador, los usuarios sí tienen altas expectativas gracias a Google. Aquí es donde se encuentra la “relevancia percibida”. Por ejemplo, en búsqueda de ámbito jurídico los profesionales esperan en primer lugar documentos con rangos superiores y territorios generales, con fragmentos y títulos que contengan todos los términos.
Actualmente, la Information Search and Retrieval (ISR), conocida como la ciencia de la búsqueda de información en documentos electrónicos y cualquier tipo de colección documental digital, encargada de la búsqueda dentro de estos mismos, búsqueda de metadatos y la búsqueda en bases de datos relacionales, ha identificado señales que pueden indicar los documentos con mayor “probabilidad de relevancia”. Para esto utiliza las estadísticas de los términos, los link que apuntan al documento, o los campos de las búsquedas de navegación.
Relevancia en las búsquedas legales
En el caso de los motores de búsqueda legales es especialmente importante la comprensión de todo el enriquecimiento de contenidos del que es propietario cada editorial jurídica. En suma, se trata de “traducir” todo el conocimiento jurídico que un buen documentalista tiene en cuenta cuando selecciona los mejores documentos y ofrece las respuestas a los problemas que se le plantean.
NEO de Lefebvre, la nueva solución jurídica basada en IA y aprendizaje automático, crea inteligencia jurídica porque incorpora nuevas tareas en torno a una tecnología de búsqueda. Tareas como añadir señales a contenidos públicos que no las tenían previamente y que pueden ser aprovechadas mejorar la precisión de los algoritmos de búsqueda. Por ejemplo, NEO puede evaluar qué documentos son más relevantes en una lista de resultados e identificar señales como el título y el resumen, la autoridad del tribunal o norma, la fecha, y según su necesidad de profundización, el tipo de documento o el trabajo de autor. Sin olvidar toda el enriquecimiento a nivel de voces o de clasificación que se realiza sobre los mismos.
Por último, cabe subrayar como factor fundamental la determinación de la autoridad de un documento. Es decir, no solo qué dice el documento, porque puede haber muchos que toquen ese tema, sino quién lo dice. No es lo mismo que algo lo afirme una sentencia del Tribunal Supremo que sea una Audiencia Provincial antigua. Esta idea fue la base del algoritmo PageRank con el que Google marcó un salto en la calidad. En este caso se apoyaron únicamente en el análisis del grafo de citas. En Lefebvre y gracias a los equipos técnicos y editoriales, con NEO se ha realizado un desarrollo puntero en el mercado europeo, combinándolo con el análisis editorial y el big data sobre logs de búsqueda, más el desarrollo de nuevos algoritmos.