Localisation du locuteur dans une séquence audiovisuelle / VU, Ngoc Son
Tác giả : VU, Ngoc Son
Năm xuất bản : 2007
Chủ đề : 1. détection de visage. 2. localisation du locuteur. 3. multi modalité. 4. Thesis.
Thông tin chi tiết
Tóm tắt : | Le mouvement de la bouche d'un locuteur est fortement corrélé avec les données audio que celle-ci produit. L'objectif est ici de détecter le locuteur dans une vidéo en utilisant ces deux signaux : le signal de parole acoustique et le signal de parole visuel. La localisation du locuteur est la clé dans certaines applications : les vidéoconférences, les systèmes de sécurité, la reconnaissance des personnes, l'indexation de vidéos, l'amélioration des interfaces homme machine, l'analyse d'expressions humaines, la lecture sur les lèvres, etc. L'objectif de ce stage est d'étudier la localisation du locuteur en utilisant les données audio et les donnés visuelles. Dans ce rapport, je présente d'abord les principes de l'extraction des énergies visuelles et de l'énergie sonore. En suite j'étudie di érents méthodes pour mesurer leurs correspondances. L'extraction des caractéristiques peut être aidée par la détection et le suivi des visages, je présenterai aussi les résultats de localisation obtenus en utilisant ou non ces outils. |
Thông tin dữ liệu nguồn
Thư viện | Ký hiệu xếp giá | Dữ liệu nguồn |
---|---|---|
Viện Quốc tế Pháp ngữ - ĐHQGHN |
|
https://repository.vnu.edu.vn/handle/VNU_123/236 |