loading

Phương pháp thu thập, đánh giá và phân cụm thông tin tiếng Việt trên Internet / Đặng, Quang Huy

Tác giả : Đặng, Quang Huy

Nhà xuất bản : Đại học quốc gia Hà Nội

Năm xuất bản : 2007

Mô tả vật lý : 77 tr. + CD-ROM

Chủ đề : 1. Internet. 2. Khai phá dữ liệu. 3. Phân cụm tài liệu. 4. Tiếng Việt. 5. Thesis.

Thông tin chi tiết

Tóm tắt :

Giới thiệu tổng quan về khai phá dữ liệu; dữ liệu Fulltext và Hypertext; lĩnh vực khai phá dữ liệu Web; tổng quan về bài toán phân cụm tài liệu Web. Trình bày các phương pháp biểu diễn tài liệu: mô hình không gian vector và tách từ trong tiếng Việt. Đưa ra các thuật toán phân cụm tài liệu: phân hoạch Top-down, phân cụm dựa trên tính mới của tài liệu, phân hoạch Bottom-up, kết hợp giữa bottom-up và top-down. Qua việc so sánh các thuật toán phân cụm và phân cụm sử dụng tách từ tiếng Việt đưa ra kết quả thực nghiệm với phân cụm tiếng Việt

 Thông tin dữ liệu nguồn

 Thư viện  Ký hiệu xếp giá  Dữ liệu nguồn
Đại học quốc gia Hà Nội
https://repository.vnu.edu.vn/handle/VNU_123/14671
Đại học Công nghệ - ĐHQGHN
https://repository.vnu.edu.vn/handle/VNU_123/42339