Fecha de propuesta:
10/09/2024
(Aceptada)
Descripción:
Los editores de presentaciones de diapositivas (como PowerPoint) permiten incluir notas para el orador en cada una de las diapositivas mostradas. A menudo este contenido es el que el orador acaba narrando en la presentación. Gracias a los avances en modelos de traducción automática y de generación de voz es posible generar la narración de unas diapositivas, en un idioma concreto e incluso, con un estilo de voz de referencia.
Se propone el desarrollo de una aplicación web/escritorio que permita al usuario subir una presentación de diapositivas con notas del orador escritas en un idioma concreto y un audio de unos pocos segundos de una voz de referencia. A partir de esta información, la aplicación será capaz de generar las presentaciones con los textos en los idiomas destino elegidos. Finalmente, la aplicación permitirá generar un video de la presentación con el audio correspondiente en cada diapositiva por cada uno de los idiomas objetivo.
Objetivos funcionales:
La plataforma requerirá del desarrollo de:
- Módulo de gestión de usuarios
- Módulo de Gestión de modelos de traducción automática
- Módulo de Gestión de modelos TTS multi-idioma
- Modulo de gestión de proyectos de traducción
- Modulo de cola de trabajos
Entornos de desarrollo y explotación:
Posibles, pero no definitivos: Backend: Python, Celery, Redis, Fast API
Frontend: VueJS, React.
Aplicación de escritorio/web
Comentarios:
Complejidad (0-10): 9
Se llevará a cabo el desarrollo del proyecto empleando un proceso de desarrollo a convenir con el alumno (ya sea ágil o el Proceso Unificado). Se deberá realizar toda la documentación reglamentaria: Memoria y Anexos Técnicos.
Se recomiendan sólidos conocimientos de POO e interés personal por las temáticas involucradas en el proyecto.
|