loading

Localisation du locuteur dans une séquence audiovisuelle / VU, Ngoc Son

Tác giả : VU, Ngoc Son

Năm xuất bản : 2007

Chủ đề : 1. détection de visage. 2. localisation du locuteur. 3. multi modalité. 4. Thesis.

Thông tin chi tiết

Tóm tắt :

Le mouvement de la bouche d'un locuteur est fortement corrélé avec les données audio que celle-ci produit. L'objectif est ici de détecter le locuteur dans une vidéo en utilisant ces deux signaux : le signal de parole acoustique et le signal de parole visuel. La localisation du locuteur est la clé dans certaines applications : les vidéoconférences, les systèmes de sécurité, la reconnaissance des personnes, l'indexation de vidéos, l'amélioration des interfaces homme machine, l'analyse d'expressions humaines, la lecture sur les lèvres, etc. L'objectif de ce stage est d'étudier la localisation du locuteur en utilisant les données audio et les donnés visuelles. Dans ce rapport, je présente d'abord les principes de l'extraction des énergies visuelles et de l'énergie sonore. En suite j'étudie di érents méthodes pour mesurer leurs correspondances. L'extraction des caractéristiques peut être aidée par la détection et le suivi des visages, je présenterai aussi les résultats de localisation obtenus en utilisant ou non ces outils.

 Thông tin dữ liệu nguồn

 Thư viện  Ký hiệu xếp giá  Dữ liệu nguồn
Viện Quốc tế Pháp ngữ - ĐHQGHN
https://repository.vnu.edu.vn/handle/VNU_123/236