mihalea matei conf. dr. ing. andrei olaru 04.07 · recunoașterea vocii sisteme cloud bazate pe...

13
Agent Asistent Inteligent Prelucrarea și generarea vorbirii Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07.2017 University Politehnica of Bucharest

Upload: others

Post on 03-Sep-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Agent Asistent InteligentPrelucrarea și generarea vorbirii

Mihalea MateiConf. Dr. Ing. Andrei Olaru

04.07.2017

University Politehnica of Bucharest

Page 2: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Introducere

• parte a proiectului Agent Asistent Inteligent

• are ca obiective implementarea unui asistent inteligent:

➔ local

➔ open-source

Page 3: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Arhitectura proiectului

Page 4: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Recunoașterea vocii● Sisteme cloud

➢ Bazate pe efectuarea de deep-learning pe date masive

➢ Performanțe foarte bune

● Sisteme locale➢ Permit utilizatorilor antrenarea și

folosirea propriilor modele➢ Dimensiunea datelor - limitată

Page 5: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Recunoașterea vocii – State of the Art

● Sisteme cloud➢ Google Cloud Speech API➢ Microsoft Bing Voice Recognition➢ IBM Speech to Text

● Sisteme locale➢ Mozilla DeepSpeech➢ CMU Sphinx➢ Kaldi

Page 6: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Recunoașterea vocii în cadrul proiectului

● Sphinx4● Mozilla DeepSpeech● Google Cloud Speech API

Page 7: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Înregistrarea comenzilor utilizatorului

Am ales folosirea fișierelor:

✗ Viteză de execuție✔ Debugging✔ Persistență✔ Corectarea erorilor

✗ Viteză de execuție

Modalități de înregistrare:● Folosind un microfon● Înregistrarea de pe placa de sunet

Page 8: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Corectarea erorilor

Page 9: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Eliminarea zgomotului

• Scop

➔ Performanța aplicației în orice condiții

• Funcționare

1)Se creează profilul zgomotului

2)Pe baza profilului, se elimină zgomotul pentru tot fișierul

Page 10: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

GUI

1.Buton pentru începerea înregistrării2.Selectează durata înregistrării3.Selectează modalitatea de traducere / înregistrare fișier

4.Bară de status

Page 11: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Rezultate - 1

Page 12: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

Rezultate - 2

Page 13: Mihalea Matei Conf. Dr. Ing. Andrei Olaru 04.07 · Recunoașterea vocii Sisteme cloud Bazate pe efectuarea de deep-learning pe date masive Performanțe foarte bune Sisteme locale

[email protected]

Thank you for your attention.