loading

Phân tách cụm danh từ cơ sở tiếng Việt sử dụng mô hình CRFs / Nguyễn, Thị Hương Thảo

Tác giả : Nguyễn, Thị Hương Thảo

Nhà xuất bản : Đại học Quốc gia Hà Nội

Năm xuất bản : 2010

Chủ đề : 1. Công nghệ thông tin. 2. Cụm danh từ tiếng Việt. 3. Hệ thống thông tin. 4. Mô hình CRFs. 5. Thesis.

Thông tin chi tiết

Tóm tắt :

Khái quát về bài toán phân tách cụm danh từ và các nghiên cứu trước đó cũng như kết quả đã đạt được về bài toán này. Trình bày một số thuật toán điển hình phân tách cụm danh từ, từ đó chọn ra hướng tiếp cận với ngôn ngữ tiếng Việt. Giới thiệu một số phương pháp biểu diễn dữ liệu. Nghiên cứu về CRFs - mô hình học máy được đánh giá là một trong những phương pháp tốt nhất cho bài toán gán nhãn dữ liệu dạng chuỗi. Tìm hiểu đặc điểm cấu trúc của cụm danh từ tiếng Việt, từ đó đề xuất phương pháp thích hợp xây dựng tập dữ liệu tiếng Việt. Trình bày các kết quả thực nghiệm khi áp dụng mô hình CRFs để phân tách cụm danh từ tiếng Việt với bộ dữ liệu do luận văn xây dựng. Đưa ra một số nhận xét, đánh giá tổng quát về vấn đề cần nghiên cứu.

 Thông tin dữ liệu nguồn

 Thư viện  Ký hiệu xếp giá  Dữ liệu nguồn
Đại học quốc gia Hà Nội
https://repository.vnu.edu.vn/handle/VNU_123/7798