Home  >   Profesionales   >   Crean un recomendador de textos legales basado en redes neuronales y big data

Crean un recomendador de textos legales basado en redes neuronales y big data

El sistema descubre relaciones entre los significados de las palabras y no queda limitado a coincidencias literales, como ocurre con InfoLeg

Por Carolina Klepp – cklepp@comercioyjusticia.info

Las limitaciones encontradas por abogados y jueces en el actual sistema de acceso a los textos normativos en el país, la plataforma InfoLeg del Ministerio de Justicia nacional, fue el puntapié inicial de una investigación cordobesa que derivó en un recomendador de textos legales para la legislación argentina.
El sistema desarrollado toma el texto de una norma o un texto cualquiera o incluso simples palabras clave, y recomienda textos normativos relacionados con la búsqueda inicial. Lo hace por medio de una amplia lista de resultados vinculados. A futuro estará disponible y con acceso gratuito desde una web de la Facultad de Matemática, Astronomía, Física y Computación (Famaf).
El desarrollo es la tesis de la Licenciatura en Ciencias de la Computación (UNC) de Agustín Capello, quien fue dirigido por la doctora en Lingüística -con especialidad en Lingüística Computacional- Laura Alonso Alemany. La docente e investigadora encabeza el grupo de investigación en Procesamiento de Lenguaje Natural de Famaf.
Según precisó, “el sistema que implementó Agustín se basa en word embeddings, una tecnología novedosa basada en redes neuronales y big data que descubre relaciones entre los significados de las palabras”.

Al aplicar esta tecnología, el sistema de recomendaciones no queda limitado a las coincidencias literales, a diferencia de lo que ocurre con InfoLeg, el buscador de información legislativa y documental de la cartera de Justicia de la Nación. “El sistema de búsqueda de InfoLeg es literal y no es capaz de relacionar palabras con significados equivalentes o expresiones con significados relacionados”, explicó la especialista.
En la presentación de la tesis se destaca que los sistemas de recomendación han mostrado ser un componente importante y hasta imprescindible en varias plataformas. Su principal atractivo reside en que ofrecen información relevante para el usuario de forma proactiva sin necesidad de que éste tenga conocimiento sobre los artículos recomendados o la consulta a realizar.
“La valía de esta información proviene del análisis previo de los datos, y su posible relación con usuarios. En este trabajo realizamos una solución para el desarrollo de un sistema de recomendación de documentos de texto el cual se lo instancia al dominio legal/jurídico, utilizando el corpus de normas de Argentina, accesible desde la página web oficial www.infoleg.gob.ar. Realizamos la investigación y desarrollo de algunos motores para recomendación de texto, junto a una plataforma para visualizar recomendaciones. Posteriormente se analizan cualitativamente los resultados obtenidos en cada caso”, precisa la tesis.

Testeo positivo
Consultada sobre el veredicto de los profesionales de la ley a la hora de la prueba piloto del sistema, Alonso Alemany señaló: “Uno de los evaluadores del sistema fue una abogada, y opinó que los resultados eran casi siempre pertinentes” y agregó: “El desarrollo fue a partir de la solicitud de algunos abogados de una herramienta de estas características, dadas las limitaciones del sistema de búsqueda InfoLeg, y de los propios sistemas personales de indexado y archivo, que también tienen limitaciones humanas. Este sistema es más exhaustivo que el humano e incorpora un cierto nivel de abstracción sobre la literalidad de InfoLeg”.
Finalmente, destacó la trayectoria del Grupo de Procesamiento del Lenguaje Natural de la Famaf en el área de textos legales y normativos. “Este grupo ha realizado colaboraciones con el Archivo de la Memoria y actualmente forma parte del proyecto de investigación europeo Mirel (Mining and Reasoning over Legal Texts, http://mirelproject.eu/)”.

 

Un comentario

Los comentarios están cerrados.