REDUCTION DE BASE DE DONNEES PAR LA CLASSIFICATION AUTOMATIQUE / LE, Anh Tuan; HEBRAIL, Georges
Tác giả : LE, Anh Tuan; HEBRAIL, Georges
Năm xuất bản : 2004
Chủ đề : 1. Thesis.
Thông tin chi tiết
Tóm tắt : | Aujourd’hui, il y a plus en plus des applications dont la base de données est très grosse et les données apparaissent sous la forme d’un flux de données infini comme des enregistrements de coup de téléphone, la surveillance de réseaux... Pour ce type de données, les systèmes de gestion de base de données (SGBDs) traditionnels semblent ne pas convenables parce que ils ne traitent que des données à taille limitée. Pour exploiter efficacement des données massives en utilisant un espace de stockage limité, il faut trouver un traitement spécial qui réduit les données afin d’obtenir des informations nécessaires appelées des résumés à partir de ces données. Il y a certaines méthodes pour ce fait : échantillonnage, compression et classification. Parmi eux, la classification est la solution la plus convenable. Dans ce rapport, nous parlons des algorithmes de classification en général et particulièrement de ceux qui sont pour le flux de données. Après avoir découvert plusieurs algorithmes de classification, nous avons trouvé que l’algorithme BIRCH est une solution de réduction de données très bonnes et le modèle CLUSTREAM permet de traiter efficacement les données sur un flux de données. Nous avons également implémenté l’algorithme BIRCH pour tester sa performance. |
Thông tin dữ liệu nguồn
Thư viện | Ký hiệu xếp giá | Dữ liệu nguồn |
---|---|---|
Viện Quốc tế Pháp ngữ - ĐHQGHN |
|
https://repository.vnu.edu.vn/handle/VNU_123/55 |