Format: HTML | BibTeX | DC | EndNote | NLM | MARC | Journal | MARCXML
Thesis / ROMDOC-THESIS-2017-1009

Interfeţe de comunicare prin voce cu dispozitive portabile

Ungurean, Cătălin
2011-10-10

Abstract: Teză de Doctorat  Abstract INTERFEŢE DE COMUNICARE PRIN VOCE CU DISPOZITIVE PORTABILE Autor: ing. Cătălin UNGUREAN Conducător de doctorat: Prof. dr. ing. Corneliu BURILEANU Scopul acestei lucrări a fost acela de a aduce contribuţii în domeniul tehnologiei vorbirii în general şi în cel al sintezei vorbirii pornind de la text pentru limba română în mod particular, având ca segment de aplicabilitate finală dispozitivele portabile. Colectivul din care autorul acestei lucrări a făcut parte şi-a propus să realizeze un sistem de sinteză pornind de la text (TTS) pentru limba română în care vorbirea generată să fie cât mai fluentă şi naturală. Cercetările efectuate în acest domeniu în ultimii ani au demonstrat faptul că realizarea acestui deziderat nu poate fi o reuşită individuală şi totodată că este necesară segmentarea problemei în cauză pe cel puţin două paliere mari: prelucrarea limbajului natural (NLP) respectiv generarea semnalului vorbit. Într-un sistem de sinteză a vorbirii pornind de la text prezenţa etajului de prelucrare a limbajului natural este esenţială dacă se doreşte obţinerea unei vorbiri sintetizate de cât mai bună calitate, pornind de la un text oarecare de intrare. Etajul de prelucrare a limbajului natural implementat de autor este compus din mai multe module care abordează diferitele sarcini specifice unui sistem TTS: preprocesarea şi normalizarea textului de intrare, refacerea semnelor diacritice, despărţirea în silabe, poziţionarea accentelor lexicale, conversia fonetică. Cercetările efectuate pe parcursul tezei au arătat că abordările statistice oferă cele mai bune rezultate în domeniu dar şi că abordările de tip hibrid (statistic plus reguli) pot îmbunătăţi atât rezultatele finale cât şi timpii de execuţie. Rezultatele obţinute de autor la nivelul tuturor modulelor implementate sunt cele mai bune raportate până în prezent în literatura de specialitate pentru limba română şi conturează cadrul obţinerii unui sistem TTS de calitate. Una dintre etapele importante parcurse în teză a fost aceea de obţinere a unor resurse lingvistice care să creeze infrastructura pe care să se desfăşoare etapa de implementare propriu-zisă. Aceasta se referă la: corpusuri de texte de antrenare – testare pentru limba română, dicţionare de despărţire în silabe, dicţionare de poziţionare a accentelor lexicale şi de conversie fonetică etc. Implementarea întregului etaj NLP pe un dispozitiv portabil, conformă cu specificaţiile Speech Synthesis Markup Language (SSML), punerea în evidenţă a constrângerilor arhitecturale aduse de aceste tipuri de dispozitive şi găsirea soluţiilor de rezolvare a acestora reprezintă o ultimă realizare a tezei. ABSTRACT of the PhD THESIS VOICE COMMUNICATION INTERFACES FOR MOBILE DEVICES Author: Eng. Cătălin UNGUREAN Scientific coordinator: Professor Corneliu BURILEANU The main purpose of the thesis was to bring contributions in the field of speech technology, more particularly in the field of the Romanian text-to-speech (TTS) synthesis, aiming towards mobile devices. The research team from which the author of this thesis took part projected the realization of a TTS system for the Romanian language where the speech to be very fluent and natural. The research made in this field during past years fully demonstrated that such an approach cannot be an individual success and proved the necessity of splitting the research effort after at least two directions: the natural language processing (NLP) level and the speech generation one. The presence of the natural language processing (NLP) stage in a text-to-speech (TTS) synthesis system is an essential condition to obtain a good naturalness of the synthesized speech in any spoken language, starting from unrestricted input text. The NLP stage developed by the author for the Romanian language consists in a number of modules which try to approach different tasks specific to every TTS system: preprocessing and normalization of the input text, diacritic restoration, syllabification, lexical stress resolution, grapheme-to-phoneme conversion. The research achieved throughout the thesis proved that statistic approaches can offer the best outcome in the field but also that hybrid approaches: statistic plus rules, can improve both the final results and the execution speed. The results reported by the author are the best known so far in the literature and anticipate a good quality Romanian TTS system. One of the other important parts of the thesis was to obtain a number of linguistic resources to create the infrastructure on which the actual implementation phases be developed. This refers to: Romanian text corpora for training & testing, hyphenation dictionaries, dictionaries for lexical stress positioning, phonetic conversion etc. A final achievement of the thesis consists in the implementation of the entire NLP level on a mobile device, by using Speech Synthesis Markup Language (SSML) tags, noticing the architectural constraints of these devices and finding the best solutions.

Keyword(s): Comunicare om-maşină (Calculatoare) -- Comunicare orală -- Teză de doctorat ; Interfaţă de vorbire -- Teză de doctorat ; Sinteza vorbirii -- Teză de doctorat
OPAC: See record in BC-UPB Web OPAC
Full Text: see files

Record created 2017-02-27, last modified 2017-02-27

Similar records


 
People who viewed this page also viewed:
(234)  Optimizarea conceptuală şi operaţională a instalaţiilor chimice multiscop - Voinescu, Sorin - ROMDOC-BC_UPB-THESIS-2003-000000054
(228)  Squaric acid as a versatile compound in the design of molecular solids - Şerb, Mihaela-Diana - ROMDOC-THESIS-2016-378
(217)  Managementul congestiilor în sistemele electroenergetice în prezenţa surselor regenerabile - Boambă, Claudia-Elena - ROMDOC-THESIS-2021-2325
(217)  Spectrometrie de masă cu acceleratorul în zona nucleelor actinide - Păceşilă, Doru Gheorghe - ROMDOC-THESIS-2020-2165
(217)  Aplicaţiile fizicii nucleare în datarea şi caracterizarea materialelor - Mihai, Oana - ROMDOC-THESIS-2020-2032

 
Rate this document:
Be the first to review this document.


Discuss this document:
Start a discussion about any aspect of this document.