Durante el ISE2023, que se celebra en Fira de Barcelona desde el 31 de enero hasta el 2 de febrero de 2023, ISID, empresa tecnológica español de plataformas de IA para audio y vídeo presentará la integración de Chat GPT en la plataforma de análisis y archivo de vídeo Videoma, para ampliar las funcionalidades de documentación existentes.
En ISID, somos compañía tecnológica centrada en soluciones y plataformas de AI para el almacenamiento y análisis avanzado de vídeo y audio y expondremos en el ISE2023 a partir del 31 de enero con nuestra última generación de la plataforma Videoma (de análisis avanzado y archivado de vídeo, audio y fotos) en el stand CS620.
En ISID estamos estudiando diversas formas de integrar Chat GPT en la función de metadatos y documentación de los vídeos que ofrecemos en Videoma actualmente. Esta extrae información textual y descriptiva de las imágenes, a partir de módulos de IA. Con la integración de las funcionalidades de Chat GPT, se abren nuevas posibilidades de documentación ampliada y con mayor profundidad, extensión y relacionable entre sí, de la que ofrecen los sistemas actuales de IA. Las diferentes posibilidades en estudio son las siguientes:
- Resumen de la transcripción de un juicio. En este caso el sistema ofrecería resúmenes de los hechos, conclusiones a partir de los mismos, o relacionaría casos similares para estudio comparativo.
- Resumen de prensa diario para un medio. Chat GPT puede resumir la información transcrita y extraída de la monitorización permanente de emisoras de TV o streaming.
- Informe de apariciones de un personaje público. La detección de caras de Videoma permite localizar personajes específicos y la transcripción, enviada a Chat GPT puede analizar lo dicho, extraer el sentimiento, etc.
- Elaboración de una nota de prensa en base a declaraciones de un personaje político. En este caso, las funciones relacionales de Chat GTP permitirían crear notas de prensa de forma automática, a partir de declaraciones.
- Generación automática de contenido. En las áreas de contenidos web o de publicaciones periódicas, la generación automática de contenidos, a partir de un tema que se ha detectado de interés, es vital. En el caso de Videoma, Chat GPT podría escribir resúmenes y descripciones de los metadatos que Videoma ha extraído.
- Resúmenes o conclusiones de eventos. Se usa la transcripción como input para Chat GPT a fin de resumir o comentar presentaciones, resultados financieros, entrevistas, debates, mesas redondas,…
- Ampliación de conceptos. Relacionar varios conceptos individuales (a partir de metadatos extraídos de vídeo) y profundizar en ellos.
- Documentación adicional de términos específicos/desconocidos. Para aquellas transcripciones con términos muy científicos o técnicos, a fin de facilitar la lectura por personal no especializado.
- Síntesis estructurada de contenidos. Se utilizaría Chat GPT para sintetizar temas largos y complejos, estructurándolos de forma lógica en apartados coherentes.
- Detección de contenido ofensivo/inapropiado. Ampliando la funcionalidad intrínseca de Videoma de búsqueda de keywords, el sistema podría localizar contenido no apropiado para ciertas franjas de edad y públicos objetivos.
Con la integración de nuevas modalidades de IA, más allá de los diversos algoritmos ya presentes en la plataforma (detección y reconocimiento de caras, de objetos, de sonidos, palabras, matrículas, textos, logos y signos, etc.) Videoma espera dar un salto cualitativo en los metadatos de documentación que el sistema es capaz de generar sin intervención humana, facilitando así la catalogación de bibliotecas amplias o con muchos elementos nuevos cada día. Esto facilita la creación de mediatecas que puedan ser consultadas con facilidad, reduciendo sustancialmente el permanente mantenimiento que supone mantenerlas a día.