Format: HTML | BibTeX | DC | EndNote | NLM | MARC | Journal | MARCXML
Thesis / ROMDOC-THESIS-2017-781

Generarea metadatelor aferente conţinutului video utilizând descriptori MPEG-7

Pirnog, Ionuţ
2011-02-29

Abstract: Generarea metadatelor aferente continutului video utilizând descriptori MPEG-7 - ABSTRACT - Lucrarea abordeaza o tematica indexarii si identificarii datelor multimedia bazate pe continut, precum si reprezentarea continutului cu ajutorul metadatelor. Teza este alcatuita pe 6 capitole, în ultimele subcapitole s-a pus accentul pe contributiile personale si perspectivele ulterioare de dezvoltare a acestei tematici de cercetare. Capitolul 1 realizeaza o introducere legata de tehnologiile de înregistrare digitala si aparitia de noi posibilitati de achizitie, stocare, schimb si distributie a informatiilor audio-vizuale. Pentru facilitarea accesului utilizatorului la continutul multimedia fara restrictii tehnice, MPEG a dezvoltat un standardul MPEG-7 care permite descrierea eficienta d. p. d. v. semantic a continutului multimedia si care faciliteaza interoperabilitatea. Capitolul 2 al acestei tezei trateaza notiunea de metadate folosite pentru o descriere cât mai exacta si relevanta a continutului multimedia utilizat. În cadrul descriptorilor video MPEG-7 sunt detaliati descriptorii de culoare, de textura, de forma, de miscare, de localizare, precum si descriptorul de recunoastere a fetelor. Capitolul 3 plaseaza accentul pe metodele de segmentare video bazata pe regiuni: „region growing” si „split and merge”. În cazul simularii metricilor Minkovsky, Canberra si Cilindica, d. p. d. v. al diferentei maxime dintre imaginea originala si imaginea segmentata este evident ca metrica Minkowsky are valorile cele mai mici. Sunt propusi doi algoritmi de segmentare spatiala: algoritmul de segmentare cu prag al nuantei si cu prag variabil al nuantei. S-a obtinut un numar mai mic de regiuni si folosind valorile pixelilor de start s-au determinat culorile dominante, procentul de aparitie si ceilalti parametri necesari descriptorului de culori dominante (DCD). În Capitolul 4 sunt prezentati algoritmi de estimare a miscarii obiectelor în secventele video: FS, TSS, NTSS, SES, FSS, DS, OS, OTS, TDLS, CS, SS, ARPS. Algoritmii rapizi prezentati se apropie destul de mult, din punct de vedere al preciziei de estimare, de algoritmul de cautare completa. Diferenta semnificativa apare în ceea ce priveste numarul de blocuri verificate, iar din simulari rezulta RSZ de vârf este mai mare pentru algoritmii care verifica un numar mai mare de blocuri. În Capitolul 5 au fost evaluate în Matlab performantele în doua scenarii diferite, realizându-se indexarea si identificarea imaginilor pe baza valorilor descriptorilor DCD. Din indexarea si identificarea celor 90 de imagini ale primului set s-a determinat o precizie medie de 30% pentru primele doua distante de nesimilaritate si de 40% pentru a treia. Precizia a fost calculata în raport cu clasificarea imaginilor în grupuri în functie de continut. Din indexarea si identificarea celor 1000 de imagini ale setului 2 s-a determinat o precizie medie de 35% pentru primele doua distante de nesimilaritate si de 73% pentru a treia. În acest caz deoarece imaginile nu erau clasificate în functie de continut s-a determinat precizia prin vizualizarea imaginilor rezultate si identificarea numarului de imagini relevante din primele 20 de rezultate. Video Content Metadata Extraction using MPEG-7 Descriptors - ABSTRACT - This thesis approaches the theme of indexing and identification of multimedia content-based data together with content representation using metadata. The paper is organized in six chapters and the last paragraphs reffer to personal contributions and further perspectives for development of this research theme. Chapter 1 contains an introduction in digital record technologies and the possibility of appearance of new methods for aquisition, storage, exchange and distributions of audio-video informations. To allow user’s access to multimedia content without any technical restrictions, MPEG created MPEG-7 standard. It permits an efficient description from semantic point of view of multimedia content and allows interoperability. In the 2nd Chapter metadata are defined for a more precise and relevant description of multimedia content. From MPEG-7 descriptors there are detailed: colour descriptor, texture and shape descriptors, motion, location and face recognition descriptors. Chapter 3 places the accent on region-based video segmentation: „region growing” and „split and merge”. When simulations for Minkovsky, Canberra and Cilindric metrcis are performed it can be noticed from the point of view of maximum difference between original and spatial segmentated image that Minkowsky metric leads to the smallest values. There are proposed two segmentation algorithms: hue threshold and variabile hue threshold. Small number of regions there are obtained and using values of start pixels there have been determined dominant colours, appearance procentage and other parameters needed for DCD. In Chapter 4 there are illustrated object-motion estimation algorithms in video sequences: FS, TSS, NTSS, SES, FSS, DS, OS, OTS, TDLS, CS, SS, ARPS. These fast algorithms approach, from estimation precision point of view, the complete search algorithm. The main difference is related to the number of selected blocks and from simulation the highest PSNR is achieved for those algorithms that select a large number of blocks. Chapter 5 contains Matlab simulations for two different scenarios. Image indexing and identification based on DCD descriptors values are achieved. From indexing and identification of 90 images from the first set there is achieved a 30% medium precision for the first two dissimilarity distances and 40% medium precision for the 3rd one. The precision was determined based in images classification in groups depending on content. From indexing and identification of 1000 images of the 2nd set there is obtained a 35% medium precision for the first two dissimilarity distances and 73% medium precision for the 3rd one. In the second case the precision was determined by visualization of resulted images and identification of the most relevant ones out of 20 results (the images were not clasiffied based on content).

Keyword(s): Web -- Regăsirea informaţiei -- Teză de doctorat ; Metadate multimedia -- Teză de doctorat
OPAC: See record in BC-UPB Web OPAC
Full Text: see files

Record created 2017-01-04, last modified 2017-01-04

Similar records


 
People who viewed this page also viewed:
(275)  Optimizarea conceptuală şi operaţională a instalaţiilor chimice multiscop - Voinescu, Sorin - ROMDOC-BC_UPB-THESIS-2003-000000054
(259)  Managementul congestiilor în sistemele electroenergetice în prezenţa surselor regenerabile - Boambă, Claudia-Elena - ROMDOC-THESIS-2021-2325
(251)  Studiul procesului de măcinare a nutreţurilor concentrate în morile cu ciocane - Păun, I. Anişoara - ROMDOC-BC_UPB-THESIS-2004-000000319
(245)  Designul platformei unificate pentru sisteme de securitate - Costea, Aurelian - ROMDOC-THESIS-2020-2172
(243)  Contribuţii la studiul influenţei vibraţiilor sculei asupra preciziei de prelucrare a pieselor de mecanică fină - Radcenco, Luminiţa - ROMDOC-BC_UPB-THESIS-1991-000001094

 
Rate this document:
Be the first to review this document.


Discuss this document:
Start a discussion about any aspect of this document.