Format: HTML | BibTeX | DC | EndNote | NLM | MARC | Journal | MARCXML
Thesis / ROMDOC-THESIS-2017-1332

Tehnici avansate pentru vederea artificială

Bărar, Andrei-Petru
2013-12-13

Abstract: Tehnici Avansate pentru Vederea Artificială Abstract - Domeniul de interes al acestei lucrări este Vederea Artificială (Computer Vision). Teza combină tehnici neurale și statistice pentru rezolvarea sarcinilor de vedere artificială. Teza aduce contribuții originale, prin propunerea unor algoritmi inovatori care acoperă mai multe direcții din domeniul vederii artificiale. Capitolul 2 propune metode neurale și statistice de interpolare a imaginilor color; modelul statistic folosește regresia liniară multivariabilă iar cel neural se bazează pe rețeaua Multilayer Perceptron (MLP). Ambele modele propuse obțin rezultate superioare tehnicilor clasice de interpolare considerate ca referință: nearest neighbor, bilinear și bicubic. Capitolul 3 dezvoltă o variantă neurală de Predictive Ordering and Linear Approximation (POLA), care aduce îmbunătățiri față de metoda statistică inițială publicată în IEEE Trans. on Communications de V. Neagoe, cu aplicabilitate în compresia cu pierderi a imaginilor. Modelul este intitulat Neural-POLA (N-POLA) și reușește obținerea unor performanțe crescute comparativ cu abordarea statistică din punct de vedere al factorului de compresie cât și al prezervării calității imaginii. Algoritmul are la bază predicția valorilor pixelilor liniei curente a imaginii folosindu-se de pixelii adiacenți din linia precedentă. Capitolul 4 abordează studiul algoritmilor de tip Deep Learning (DL) cu aplicabilitate în clasificarea imaginilor. Sunt propuse și testate mai multe arhitecturi de Convolutional Neural Network (CNN) și Deep Belief Network (DBN); sunt propuse metode de preprocesare a datelor având ca scop îmbunătățirea performanțelor de clasificare în contextul Deep Learning. Testarea algoritmilor DL s-a făcut pe două baze de date cu dificultăți diferite: Caltech101 și Pascal VOC2007. Rezultatele obținute sunt competitive comparativ cu algoritmii alternativi considerați (SVM-KNN). Capitolul 5 utilizează algoritmii introduși în Capitolul 4 pentru recunoașterea expresiilor faciale atât pentru cazul dependent de subiect cât și pentru cel independent de subiect (cu grad ridicat de dificultate). S-a ales baza de date JAFFE pentru a evalua modelele propuse. Folosind abordarea DL, rezultatele obținute arată o îmbunătățire a performanțelor de recunoaștere comparativ cu algoritmii non-Deep Learning considerați ca benchmark (SVM cu nucleu RBF sau liniar). Capitolul 6 studiază problema detecției pietonilor în imagistica termală folosind un clasificatorul neural Concurent Self-Organizing Maps (CSOM). Se folosește baza de date Thermal Pedestrian Database (OTCBVS). Abstract - The field of interest of this thesis is Computer Vision (CV). Neural and statistical techniques are combined for solving computer vision tasks. This thesis brings original contributions by proposing innovating algorithms, on CV field. By using neural networks with Pattern Recognition techniques, are studied and introduced original algorithms, covering several areas of CV field. Chapter 2 proposes neural and statistical methods for color image interpolation; the statistical model uses multivariable linear regression and the neural one is based on a Multilayer Perceptron (MLP) network. Both proposed models achieve better results than considered classical interpolation approaches: nearest neighbor, bilinear and bicubic. Chapter 3 develops a neural Predictive Ordering and Linear Approximation (POLA) which brings improvements to a statistical method initially published in IEEE Trans. on Communications by V. Neagoe, used for lossy image compression. The new model is called Neural-POLA (N-POLA) and achieves better compression performances compared with the ones from the statistical approach, from the point of compression rate and image quality. The proposed algorithm is based on the prediction of the current line pixel values of the image using the adjacent pixels of the previous line. Chapter 4 studies Deep Learning algorithms for image classification. Are proposed and tested multiple Convolutional Neural Network (CNN) and Deep Belief Network (DBN); methods of pre-processing the dataset are proposed, in order to improve the classification performances for the proposed methods. Testing was done using two distinct datasets with different difficulty levels: Caltech101 and Pascal VOC2007. The obtained results showed an improvement over the considered benchmark algorithm (SVM-KNN). Chapter 5 is based on the DL architectures introduced in Chapter 4 used for subject independent emotion recognition and also subject dependent emotion recognition. We have chosen the JAFFE database to evaluate the above proposed models. Using the DL approach we have obtained an increase for the recognition rate, over the non-DL considered benchmark algorithms (SVM with RBF or linear kernel). Chapter 6 studies pedestrian detection in thermal imagery using the Concurrent Self-Organizing Maps (CSOM) neural classifier. For testing the Thermal Pedestrian Database (OTCBVS) dataset is used.

Keyword(s): Vedere artificială -- Tehnici neurale -- Teză de doctorat ; Compresia imaginii -- Prelucrarea imaginilor -- Teză de doctorat ; Recunoaşterea imaginilor -- Faţa umană -- Teză de doctorat
OPAC: See record in BC-UPB Web OPAC
Full Text: see files

Record created 2017-06-06, last modified 2017-06-06

Similar records


 
People who viewed this page also viewed:
(252)  Optimizarea conceptuală şi operaţională a instalaţiilor chimice multiscop - Voinescu, Sorin - ROMDOC-BC_UPB-THESIS-2003-000000054
(246)  Tehnologiile informării şi comunicării : suport de curs - Curta, Olimpia - ROMDOC-BOOK-2007-005
(244)  Managementul congestiilor în sistemele electroenergetice în prezenţa surselor regenerabile - Boambă, Claudia-Elena - ROMDOC-THESIS-2021-2325
(242)  Bionanomateriale antiseptice - Nedelcu, Ioan-Avram - ROMDOC-THESIS-2019-1881
(242)  Procedee pentru obţinerea copolimerilor cu compozţie uniformă - Dumitrescu, Anca Mădălina - ROMDOC-BC_UPB-THESIS-2004-000000355

 
Rate this document:
Be the first to review this document.


Discuss this document:
Start a discussion about any aspect of this document.