Logo de la biblioteca USCO

Normal view MARC view ISBD view

Diseño e implementación de sistema de reconocimiento por voz basado en inteligencia artificial y procesamiento digital de señales / Jesús Herney Sánchez Rodriguez, Juan Carlos Cabrera Muñoz; Director Albeiro Cortés Cabezas

By: Sánchez Rodriguez, Jesús Herney [autor].
Contributor(s): Cabrera Muñoz, Juan Carlos [autor] | Cortés Cabezas, Albeiro [Director].
Neiva: Uniersidad Surcolombiana, 2022Description: 1 CD-ROM (55 páginas); diagramas, ilustraciones en general, tablas o cuadros; 12 cm.Content type: texto Media type: computadora Carrier type: disco de la computadoraSubject(s): Inteligencia artificial -- Espectrograma | Ingeniería Electrónica -- BiometríaDDC classification: Th IE 0377
Contents:
Introducción -- Objetivos, general, específicos -- Planteamiento del problema, justificación -- Marco teórico -- Desarrollo del proyecto, análisis del desarrollo del proyecto -- Conclusiones
Dissertation note: Tesis Ingeniero electrónico Universidad Surcolombiana. Facultad de Ingeniería. Ingeniería Electrónica 2022 Summary: "El objetivo de este proyecto fue diseñar e implementar un sistema que permita reconocer la voz de un locutor haciendo uso de teorías de procedimiento digital de señal es y conceptos de inteligencia artificial. Para esto, se definió una serie de etapas correspondiente a la adquisición de los datos correspondiente a audios donde se definen las características con los que deben ser grabados, posteriormente su procesamiento mediante teoremas de tratamiento de audio tanto en el dominio temporal como en el dominio frecuencial, para así poder generar los coeficientes Cepstrales en la frecuencia de mel, que permiten representar mediante un espectrocrama las características de voz de un locutor, lo que se convierte en los datos que alimentan los modelos de inteligencia artificial, convirtiendo así la voz de un audio a una imagen. Una vez estructurado un dataset con el conjunto de espectrogramas, se diseñó tres modelos de inteligencia artificial con el propósito de poder comparar las capacidades de sus topologías, para finalmente poder ejecutar el modelo escogido mediante un script que genera una interacción entre el sistema y el usuario, logrando definir un camino de cómo se puede construir un sistema de reconocimiento de locutor por medio de su voz, con el uso de lenguajes de programación libre, y conceptos que permiten reducir su complejidad contando con un resultado óptimo basado en los recursos implementados."
Tags from this library: No tags from this library for this title. Log in to add tags.
    average rating: 0.0 (0 votes)
Item type Current location Collection Call number Copy number Status Date due Barcode Item holds
e-Tesis e-Tesis Biblioteca Central
Tesis y Trabajos de Grado Th IE 0377 (Browse shelf) Ej.1 Available 900000023729
e-Tesis e-Tesis Biblioteca Central
Tesis y Trabajos de Grado Th IE 0377 (Browse shelf) Ej.2 Available 900000023730
Total holds: 0

Tesis Ingeniero electrónico Universidad Surcolombiana. Facultad de Ingeniería. Ingeniería Electrónica 2022

Introducción -- Objetivos, general, específicos -- Planteamiento del problema, justificación -- Marco teórico -- Desarrollo del proyecto, análisis del desarrollo del proyecto -- Conclusiones

"El objetivo de este proyecto fue diseñar e implementar un sistema que permita reconocer la voz de un locutor haciendo uso de teorías de procedimiento digital de señal es y conceptos de inteligencia artificial. Para esto, se definió una serie de etapas correspondiente a la adquisición de los datos correspondiente a audios donde se definen las características con los que deben ser grabados, posteriormente su procesamiento mediante teoremas de tratamiento de audio tanto en el dominio temporal como en el dominio frecuencial, para así poder generar los coeficientes Cepstrales en la frecuencia de mel, que permiten representar mediante un espectrocrama las características de voz de un locutor, lo que se convierte en los datos que alimentan los modelos de inteligencia artificial, convirtiendo así la voz de un audio a una imagen.
Una vez estructurado un dataset con el conjunto de espectrogramas, se diseñó tres modelos de inteligencia artificial con el propósito de poder comparar las capacidades de sus topologías, para finalmente poder ejecutar el modelo escogido mediante un script que genera una interacción entre el sistema y el usuario, logrando definir un camino de cómo se puede construir un sistema de reconocimiento de locutor por medio de su voz, con el uso de lenguajes de programación libre, y conceptos que permiten reducir su complejidad contando con un resultado óptimo basado en los recursos implementados."

There are no comments for this item.

Log in to your account to post a comment.

Powered by Koha