Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet / Đặng, Quang Huy
Tác giả : Đặng, Quang Huy
Nhà xuất bản : Đại học quốc gia Hà Nội
Năm xuất bản : 2007
Mô tả vật lý : 77 tr. + CD-ROM
Chủ đề : 1. Internet. 2. Khai phá dữ liệu. 3. Phân cụm tài liệu. 4. Tiếng Việt. 5. Thesis.
Thông tin chi tiết
Tóm tắt : | Giới thiệu tổng quan về khai phá dữ liệu; dữ liệu Fulltext và Hypertext; lĩnh vực khai phá dữ liệu Web; tổng quan về bài toán phân cụm tài liệu Web. Trình bày các phương pháp biểu diễn tài liệu: mô hình không gian vector và tách từ trong tiếng Việt. Đưa ra các thuật toán phân cụm tài liệu: phân hoạch Top-down, phân cụm dựa trên tính mới của tài liệu, phân hoạch Bottom-up, kết hợp giữa bottom-up và top-down. Qua việc so sánh các thuật toán phân cụm và phân cụm sử dụng tách từ tiếng Việt đưa ra kết quả thực nghiệm với phân cụm tiếng Việt |
Thông tin dữ liệu nguồn
Thư viện | Ký hiệu xếp giá | Dữ liệu nguồn |
---|---|---|
Đại học quốc gia Hà Nội |
|
https://repository.vnu.edu.vn/handle/VNU_123/14671 |
Đại học Công nghệ - ĐHQGHN |
|
https://repository.vnu.edu.vn/handle/VNU_123/42339 |