Diseño e implementación de sistema de reconocimiento por voz basado en inteligencia artificial y procesamiento digital de señales / Jesús Herney Sánchez Rodriguez, Juan Carlos Cabrera Muñoz; Director Albeiro Cortés Cabezas
By: Sánchez Rodriguez, Jesús Herney [autor].
Contributor(s): Cabrera Muñoz, Juan Carlos [autor] | Cortés Cabezas, Albeiro [Director].
Neiva: Uniersidad Surcolombiana, 2022Description: 1 CD-ROM (55 páginas); diagramas, ilustraciones en general, tablas o cuadros; 12 cm.Content type: texto Media type: computadora Carrier type: disco de la computadoraSubject(s): Inteligencia artificial -- Espectrograma | Ingeniería Electrónica -- BiometríaDDC classification: Th IE 0377Item type | Current location | Collection | Call number | Copy number | Status | Date due | Barcode | Item holds |
---|---|---|---|---|---|---|---|---|
e-Tesis | Biblioteca Central | Tesis y Trabajos de Grado | Th IE 0377 (Browse shelf) | Ej.1 | Available | 900000023729 | ||
e-Tesis | Biblioteca Central | Tesis y Trabajos de Grado | Th IE 0377 (Browse shelf) | Ej.2 | Available | 900000023730 |
Tesis Ingeniero electrónico Universidad Surcolombiana. Facultad de Ingeniería. Ingeniería Electrónica 2022
Introducción -- Objetivos, general, específicos -- Planteamiento del problema, justificación -- Marco teórico -- Desarrollo del proyecto, análisis del desarrollo del proyecto -- Conclusiones
"El objetivo de este proyecto fue diseñar e implementar un sistema que permita reconocer la voz de un locutor haciendo uso de teorías de procedimiento digital de señal es y conceptos de inteligencia artificial. Para esto, se definió una serie de etapas correspondiente a la adquisición de los datos correspondiente a audios donde se definen las características con los que deben ser grabados, posteriormente su procesamiento mediante teoremas de tratamiento de audio tanto en el dominio temporal como en el dominio frecuencial, para así poder generar los coeficientes Cepstrales en la frecuencia de mel, que permiten representar mediante un espectrocrama las características de voz de un locutor, lo que se convierte en los datos que alimentan los modelos de inteligencia artificial, convirtiendo así la voz de un audio a una imagen.
Una vez estructurado un dataset con el conjunto de espectrogramas, se diseñó tres modelos de inteligencia artificial con el propósito de poder comparar las capacidades de sus topologías, para finalmente poder ejecutar el modelo escogido mediante un script que genera una interacción entre el sistema y el usuario, logrando definir un camino de cómo se puede construir un sistema de reconocimiento de locutor por medio de su voz, con el uso de lenguajes de programación libre, y conceptos que permiten reducir su complejidad contando con un resultado óptimo basado en los recursos implementados."
There are no comments for this item.