VSN CONTRIBUYE A RTVE EN SU PROYECTO DE CATALOGACIÓN AUTOMÁTICA UTILIZANDO INTELIGENCIA ARTIFICIAL

VSNExplorer MAM se integró a este proyecto como agregador de metadatos de contenido con los motores de búsqueda IA de Etiqmedia, que procesa el audio.

Compartir esta noticia:

La Corporación Radiotelevisión Española, más conocida como RTVE, desarrolló un proyecto para la catalogación automática de 11.000 horas de contenido producido por la televisora pública en la década de los 60 y 70 utilizando Inteligencia Artificial. VSNExplorer MAM se integró a este proyecto como agregador de metadatos de contenido con los motores de búsqueda IA de Etiqmedia, que procesa el audio; y de Azure, estuvo a cargo de procesar el vídeo. El sistema agrega todos los metadatos del contenido en una única interfaz para la validación de los mismos por parte de los documentalistas.

El Fondo Documental de RTVE es el encargado de gestionar y preservar el amplio bagaje histórico de la Corporación. RTVE cuenta con uno de los mayores fondos documentales de archivos sonoros y audiovisuales en español. La gestión de este archivo histórico resulta fundamental a muchos niveles.

RTVE no solo buscaba una solución que le permitiese automatizar la extracción de los metadatos inherentes a su contenido audiovisual, sino que el proyecto buscaba encontrar un sistema que le permitiese simplificar la presentación de esta información para ayudar a su servicio de documentación a validar los datos extraídos por el sistema. Asimismo, otro de los aspectos clave publicados en el pliego era que se debía tratar de una solución desarrollada en un entorno 100% cloud.

Gracias a la integración con los principales motores de Inteligencia Artificial que permite su plataforma de gestión de media, VSNExplorer MAM, sumada a la posibilidad de prestar un servicio cloud con esta tecnología, VSN decidió presentar su candidatura para este proyecto. En este caso, la compañía presentó su propuesta trabajando con el motor de la empresa Etiqmedia para el procesamiento de los metadatos procedentes del audio, y con Azure para aquellos provenientes del vídeo. Durante la licitación, VSN obtuvo la mejor valoración combinando los aspectos técnicos y económicos, lo que le posibilitó conseguir la adjudicación.

El proyecto se ha desarrollado en dos fases: una primera de prueba, que se realizó durante cuatro meses, y la posterior implantación definitiva del servicio, que comenzó en el mes de octubre de 2021 y que tiene un año de duración. Durante la primera fase, se realizó la instalación de los sistemas y se establecieron y coordinaron los equipos y flujos de trabajo entre RTVE y VSN. Para dar estos primeros pasos, se procesaron de forma satisfactoria 160 horas de vídeo y audio.

Durante el proceso de catalogación, los documentos procedentes del archivo de RTVE se ingestan en la plataforma VSNExplorer MAM. Estos incluyen un archivo de media y un documento XML con información sobre el contenido, que se refleja en el asset creado. En cuanto este contenido entra en el sistema, el proceso de metadatado automático se pone en marcha con el motor de Inteligencia Artificial, que nos muestra toda la información extraída en una única interfaz centralizada.

En términos de audio, esta tecnología es capaz de extraer en pocos minutos una transcripción total en texto, su capitalización y acentuación, el reconocimiento de las personas, lugares, eventos, productos, organizaciones y fechas que se mencionan, así como keywords y una clasificación automática del contenido. En vídeo, la visión artificial es capaz de realizar reconocimiento facial, identificar y catalogar la escena, junto con los objetos, etiquetas y rótulos que aparecen en las imágenes.

Toda esta información se muestra y se encuentra disponible en la interfaz web de VSNExplorer MAM para realizar un control de calidad sobre la misma. De este modo, los documentalistas de RTVE pueden consultar y editar los resultados obtenidos para que se ajusten a los parámetros de catalogación deseados de una forma sencilla y rápida. Por ejemplo, pueden corregir la transcripción del audio o introducir personajes que la inteligencia artificial haya pasado por alto. Una vez realizada esta corrección, el sistema calcula la WER (Word Error Rate), es decir, la ratio de errores cometidos en la transcripción.

Una vez finalizado el proceso, VSNExplorer MAM crea varios archivos XML con toda esta información que se envían de vuelta al Archivo de RTVE. De este modo, los assets de la cadena pública incorporan tras el proceso unos metadatos que permiten una catalogación completa, facilitando su búsqueda y recuperación para los usuarios de RTVE.

«Para el Fondo Documental RTVE, este proyecto no solo permite hacer accesibles miles de horas de contenidos de gran interés, sino que además constituye una oportunidad única de influir en el desarrollo de las tecnologías que serán cotidianas en un futuro, siendo además pioneros en su implantación en el trabajo diario del archivo», dijo Virginia Bazán Gil, Responsable de Proyectos en el Fondo Documental RTVE.

«Para VSN es un orgullo colaborar con una institución referente en innovación como RTVE en el desarrollo de nuevas capacidades de catalogación de contenido. En la compañía, continuamos trabajando día a día para que nuestros productos y soluciones sigan mereciendo la confianza de los referentes de la industria Broadcast & Media», concluyó Antonio Brotons, Jefe de Proyecto de VSN.

Por este proyecto, VSN y RTVE fueron reconocidas en los Premios FIAT/IFTA como finalistas del premio “Excellence in Media Management” por su aplicación de la Inteligencia Artificial para la catalogación automática de contenido del archivo histórico de la cadena.

Noticias relacionadas