loading

Hệ thống bóc tách giá cả sản phẩm tự động / Chu, Phương Chi; Nguyễn, Văn Vy

Tác giả : Chu, Phương Chi; Nguyễn, Văn Vy

Năm xuất bản : 2009

Mô tả vật lý : 35 tr.

Chủ đề : 1. Cơ sở dữ liệu. 2. Công nghệ thông tin. 3. Phần mềm máy tính. 4. Sản phẩm. 5. Thesis.

Thông tin chi tiết

Tóm tắt :

Tổng quan về khai phá dữ liệu nói chung và khai thác Web nói riêng: phân loại nguồn dữ liệu Web, phân loại khai phá dữ liệu Web, các bước tiến hành khai phá nội dung Web. Trình bày cơ sở lý thuyết có liên quan đến hệ thống bóc tách giá cả sản phẩm tự động: các vấn đề liên quan đến phân tích ngôn ngữ đánh dấu siêu văn bản HTML; nguyên lí thu thập dữ liệu (Crawler); bài toán bóc tách thông tin; giải thuật bóc tách bản ghi dữ liệu có cấu trúc. Tiến hành xây dựng hệ thống chắt lọc thông tin sản phẩm trên Web: mô tả bài toán chắt lọc thông tin về sản phẩm trên Web; thiết kết kiến trúc hệ thống; thiết kế cơ sở dữ liệu; cài đặt hệ thống

 Thông tin dữ liệu nguồn

 Thư viện  Ký hiệu xếp giá  Dữ liệu nguồn
Đại học quốc gia Hà Nội
https://repository.vnu.edu.vn/handle/VNU_123/16387
Đại học Công nghệ - ĐHQGHN
https://repository.vnu.edu.vn/handle/VNU_123/42908