loading

Phân nhóm văn bản tiếng Việt với Ghsom : : Luận văn Thạc sĩ Công nghệ thông tin. Chuyên ngành Hệ thống thông tin / Nguyễn Hữu Phon ; Trương Quốc Định (Hướng dẫn khoa học)

Tác giả : Nguyễn Hữu Phon ; Trương Quốc Định (Hướng dẫn khoa học)

Nhà xuất bản : Trường Đại học Cần Thơ

Năm xuất bản : 2013

Nơi xuất bản : Cần Thơ

Mô tả vật lý : 62 tr. : minh họa ; 28 cm

Số phân loại : 005.3

Chủ đề : 1. Giải thuật. 2. Ngôn ngữ tiếng Việt. 3. Văn bản. 4. Algorithms. 5. Texts. 6. Vietnamese language. 7. Giải thuật GHSOM. 8. Ngông ngữ tiếng Việt. 9. Văn bản.

Thông tin chi tiết

Tóm tắt :

Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma trận tài liệu - từ chỉ mục để xây dựng cấu trúc cây phân cấp theo chủ đề. Chương trình phân nhóm được viết bằng ngôn ngữ Java trên nền NetBeans 7.1.2.

 Thông tin dữ liệu nguồn

 Thư viện  Ký hiệu xếp giá  Dữ liệu nguồn
Thư viện đại học Cần Thơ
https://lrcopac.ctu.edu.vn/pages/opac/wpid-detailbib-id-184990.html