Durante el ISE2023, que se celebra en Fira de Barcelona desde el 31 de enero hasta el 2 de febrero de 2023, ISID, empresa tecnológica español de plataformas de IA para audio y vídeo presentará la integración de Chat GPT en la plataforma de análisis y archivo de vídeo Videoma, para ampliar las funcionalidades de documentación existentes.

En ISID, somos compañía tecnológica centrada en soluciones y plataformas de AI para el almacenamiento y análisis avanzado de vídeo y audio y expondremos en el ISE2023 a partir del 31 de enero con nuestra última generación de la plataforma Videoma (de análisis avanzado y archivado de vídeo, audio y fotos) en el stand CS620.

En ISID estamos estudiando diversas formas de integrar Chat GPT en la función de metadatos y documentación de los vídeos que ofrecemos en Videoma actualmente. Esta extrae información textual y descriptiva de las imágenes, a partir de módulos de IA. Con la integración de las funcionalidades de Chat GPT, se abren nuevas posibilidades de documentación ampliada y con mayor profundidad, extensión y relacionable entre sí, de la que ofrecen los sistemas actuales de IA. Las diferentes posibilidades en estudio son las siguientes:

  • Resumen de la transcripción de un juicio. En este caso el sistema ofrecería resúmenes de los hechos, conclusiones a partir de los mismos, o relacionaría casos similares para estudio comparativo.
  • Resumen de prensa diario para un medio. Chat GPT puede resumir la información transcrita y extraída de la monitorización permanente de emisoras de TV o streaming.
  • Informe de apariciones de un personaje público. La detección de caras de Videoma permite localizar personajes específicos y la transcripción, enviada a Chat GPT puede analizar lo dicho, extraer el sentimiento, etc.
  • Elaboración de una nota de prensa en base a declaraciones de un personaje político. En este caso, las funciones relacionales de Chat GTP permitirían crear notas de prensa de forma automática, a partir de declaraciones.
  • Generación automática de contenido. En las áreas de contenidos web o de publicaciones periódicas, la generación automática de contenidos, a partir de un tema que se ha detectado de interés, es vital. En el caso de Videoma, Chat GPT podría escribir resúmenes y descripciones de los metadatos que Videoma ha extraído.
  • Resúmenes o conclusiones de eventos. Se usa la transcripción como input para Chat GPT a fin de resumir o comentar presentaciones, resultados financieros, entrevistas, debates, mesas redondas,…
  • Ampliación de conceptos. Relacionar varios conceptos individuales (a partir de metadatos extraídos de vídeo) y profundizar en ellos.
  • Documentación adicional de términos específicos/desconocidos. Para aquellas transcripciones con términos muy científicos o técnicos, a fin de facilitar la lectura por personal no especializado.
  • Síntesis estructurada de contenidos. Se utilizaría Chat GPT para sintetizar temas largos y complejos, estructurándolos de forma lógica en apartados coherentes.
  • Detección de contenido ofensivo/inapropiado. Ampliando la funcionalidad intrínseca de Videoma de búsqueda de keywords, el sistema podría localizar contenido no apropiado para ciertas franjas de edad y públicos objetivos.

Con la integración de nuevas modalidades de IA, más allá de los diversos algoritmos ya presentes en la plataforma (detección y reconocimiento de caras, de objetos, de sonidos, palabras, matrículas, textos, logos y signos, etc.) Videoma espera dar un salto cualitativo en los metadatos de documentación que el sistema es capaz de generar sin intervención humana, facilitando así la catalogación de bibliotecas amplias o con muchos elementos nuevos cada día. Esto facilita la creación de mediatecas que puedan ser consultadas con facilidad, reduciendo sustancialmente el permanente mantenimiento que supone mantenerlas a día.