loading

Kiểm tra lỗi tự động dữ liệu được gán nhãn trong tiếng Việt / Đặng, Hồng Hạnh

Tác giả : Đặng, Hồng Hạnh

Nhà xuất bản : Đại học Quốc gia Hà Nội

Năm xuất bản : 2014

Chủ đề : 1. Dữ liệu. 2. Hệ thống thông tin. 3. Kiểm tra lỗi tự động. 4. Thesis.

Thông tin chi tiết

Tóm tắt :

Trình bày các khái niệm cơ bản: Dữ liệu được gán nhãn, Lỗi trong gán nhãn dữ liệu. Bên cạnh đó, cũng trình bày chi tiết các nguyên nhân gây ra lỗi trong gán nhãn dữ liệu. Đồng thời, chúng tôi giới thiệu bài toán Kiểm tra lỗi dữ liệu được gán nhãn. Giới thiệu cụ thể Penn Treebank và VietTreebank. Với Penn Treebank, trình bày khái quát khái niệm và phương pháp thực hiện đối với ba kiểu lược đồ chú giải. Cùng với việc giới thiệu tổng quan về VietTreebank, chúng tôi cũng trình bày chi tiết bảng nhãn và hướng dẫn gán nhãn cho VietTreebank. Trình bày cơ sở để giải quyết bài toán đặt ra. Đầu tiên, chúng tôi trình bày các khái niệm của Dickinson về Lớp tương đương, Lớp tương đương hẹp. Tiếp theo là hai phương pháp tính điểm cho các luật trong tập dữ liệu do Dickinson đề xuất lần lượt được trình bày cụ thể. Trình bày quá trình chúng tôi thực nghiệm trên bộ dữ liệu VietTreebank và kết quả thu được sau khi thực nghiệm. Kết luận đánh giá về phương pháp phát hiện lỗi do Dickinson đề xuất và nêu hướng phát triển tiếp theo của đề tài.

 Thông tin dữ liệu nguồn

 Thư viện  Ký hiệu xếp giá  Dữ liệu nguồn
Đại học quốc gia Hà Nội
https://repository.vnu.edu.vn/handle/VNU_123/8141