loading

Ứng dụng độ tương đồng chuỗi trong chống trùng lặp cho các tập dữ liệu văn bản có cấu trúc dạng bảng = Using string similarity for table textual data deduplication / Trương, Lê Quân; Hoàng, Xuân Tùng

Tác giả : Trương, Lê Quân; Hoàng, Xuân Tùng

Năm xuất bản : 2015

Mô tả vật lý : 12 tr.

Chủ đề : 1. Công nghệ thông tin. 2. Tập dữ liệu. 3. Tin học. 4. Văn bản có cấu trúc dạng bảng. 5. Thesis.

Thông tin chi tiết

Tóm tắt :

Trong luận văn này tôi trình bày các phương pháp giải quyết khó khăn khi thực hiện các phương pháp chống trùng lặp thông thường trên các tập dữ liệu văn bản có cấu trúc dạng bảng. Khó khăn đó xuất hiện khi có lỗi nhập liệu, sự sai sót khi gõ máy dẫn tới việc những phương pháp thông thường không thể tìm được những dữ liệu bị trùng lặp. Để giải quyết khó khăn trên tôi đề xuất một phương pháp chống trùng lặp dựa vào cách tính độ tương đồng chuỗi nhằm đạt được kết quả cao nhất khi tìm ra các dữ liệu trùng lặp trên các tập dữ liệu văn bản khi ảy ra lỗi nhập liệu. Bằng phương pháp tính độ tương đồng này những dữ liệu khi được nhập vào trong tập văn bản cho dù có xảy ra lỗi nhập liệu vẫn có thể bị phát hiện và xử lý.

 Thông tin dữ liệu nguồn

 Thư viện  Ký hiệu xếp giá  Dữ liệu nguồn
Đại học quốc gia Hà Nội
https://repository.vnu.edu.vn/handle/VNU_123/11815