Thư viện tập trung - Thư viện điện tử

Sách, tuyển tập

MODULE D'EXTRACTION FOCALISE ET ANALYSE AUTOMATIQUE LINGUISTIQUE DU WEB / NGUYEN, Hong San

Tác giả : NGUYEN, Hong San

Năm xuất bản : 2007

Chủ đề : 1. Thesis.

Chia sẻ

Thông tin chi tiết

Tóm tắt :

Ce stage se déroule dans un cadre d'une collaboration entre l'Institut de Recherche en Informatique de Toulouse (IRIT) et l' Équipe de Recherche en Syntaxe et Sémantique (ERSS). Notre objectif est de développer un outil informatique pour la construction automatique des corpus à partir du web en utilisant les outils analyse linguistique existés. Il s'agit de la construction d'un crawl focalisé du web et de l'intégration des outils d'analyse linguistique pour analyser les pages Web. Dans un premier temps, nous présentons un modèle de crawl focalisé qui parcourait le Web pour télécharger les pages concernées à un sujet spécifique. Le crawl doit faire sortie deux résultats importants: les contenus textuelle des pages Web et le graphe des hyperliens des pages Web. Dans un deuxième temps, nous faisons une études sur les outils d'analyse linguistique TreeTagger, Syntex et Upery et les intégrons dans le système pour l'analyse des pages Web. Nous effectuons aussi le prétraitement des textes récupérés par le crawl avant de les passer à des outils linguistique. Le résultat final est des corpus analysés qui parlent d'un sujet spécifique.

Chia sẻ

Hiển thị MARC

Thông tin dữ liệu nguồn

Thư viện	Ký hiệu xếp giá	Dữ liệu nguồn
Viện Quốc tế Pháp ngữ - ĐHQGHN		https://repository.vnu.edu.vn/handle/VNU_123/145

Lời ngỏ

Để phục vụ nhu cầu tìm kiếm và xem tài liệu trên nhiều lĩnh vực khác nhau: Triết học, Tâm lý học, Tôn giáo, Khoa học xã hội, Ngôn ngữ, Khoa Học Tự Nhiên, Toán học, Công nghệ, Nghệ thuật, Văn học, Địa lý, Lịch sử,... tại các thư viện trung tâm, thư viện trường học, các tổ chức,... chúng tôi đã thu thập, liên kết các thông tin với nhau tạo thành mạng lưới thư viện (Thư viện tập trung) chia sẻ nguồn tài nguyên vô tận này; cùng với mong muốn giữ gìn di sản văn hóa của dân tộc, chúng tôi sưu tầm, sắp xếp, tổ chức và phân loại giúp bạn đọc có thể tìm kiếm, chia sẻ dễ dàng trên internet (IoT) thông qua các thiết bị truy cập như: điện thoại di động, máy tính bảng, máy tính cá nhân,...
Trong quá trình cập nhật, chúng tôi đã cố gắng liên kết thông tin kỹ lưỡng để có những tài liệu chất lượng cho bạn đọc. Tuy nhiên, với số lượng tài liệu quá nhiều, đôi khi không tránh khỏi sai sót. Rất mong các bạn đóng góp ý kiến để chất lượng tài liệu ngày một tốt hơn.

Mục đích và phương châm hoạt động

Trang website được xây dựng nhằm những mục đích sau:

+ Thu thập dữ liệu các thư viện theo thời gian thực (Hàng ngày, hàng tuần) dựa trên các giao thức chuẩn thư viện thông qua Internet.
+ Liên kết thư viện và xây dựng nguồn tài nguyên bách khoa toàn thư về tất cả các lĩnh vực khác nhau.
- Chia sẻ dữ liệu trực tiếp trong cùng hệ thống.
- Chia sẻ dữ liệu gián tiếp cho các thư viện khác qua giao thức chuẩn thư viện: OAI-PMH, METS.
+ Phục vụ nhu cầu tra cứu tìm đọc tài liệu ở khắp mọi nơi trên miền đất nước.
+ Phổ biến rộng rãi di sản văn hóa, phục vụ hoạt động nghiên cứu phát triển và đổi mới sáng tạo của các nhà khoa học, cán bộ nghiên cứu - giảng dạy, sinh viên, học sinh, doanh nghiệp và cộng đồng.

Bản quyền

Những tài liệu mà bạn đang tham khảo:
+ Là tài nguyên được quản lý ở tất cả các đơn vị mạng liên kết bao gồm các nguồn mở, nguồn nội sinh và nguồn ngoại sinh.

+ Là truy cập, chia sẻ tại các đơn vị mạng liên kết theo cơ chế mở và không thu phí.

Xin chân thành cảm ơn!

Kết nối và chia sẻ nguồn tri thức, những người yêu và đam mê đọc sách.

Chọn tất cả thư viện

Đại học Công nghệ - ĐHQGHN

Đại học Giáo dục - ĐHQGHN

Đại học khoa học tự nhiên - ĐHQGHN

Đại học Khoa học Xã hội và Nhân văn - ĐHQGHN

Đại học Kinh tế - ĐHQGHN

Đại học Ngoại ngữ - ĐHQGHN

Đại học quốc gia Hà Nội

Đại học sư phạm Đà Nẵng

Đại học Y - Dược - ĐHQGHN

Học Viện Hàng Không Việt Nam

Thư viện Huyện Bình Chánh - TVKHTH TP.HCM

Thư viện huyện Bình Minh - TV Vĩnh Long

Thư viện huyện Bình Tân - TV Vĩnh Long

Thư viện Huyện Cần Giờ - TVKHTH TP.HCM

Thư viện Huyện Củ Chi - TVKHTH TP.HCM

Thư viện Huyện Hóc Môn - TVKHTH TP.HCM

Thư viện huyện Long Hồ - TV Vĩnh Long

Thư viện huyện Mang Thít - TV Vĩnh Long

Thư viện Huyện Nhà Bè - TVKHTH TP.HCM

Thư viện huyện Tam Bình - TV Vĩnh Long

Thư viện huyện Trà Ôn - TV Vĩnh Long

Thư viện Khoa học Tổng hợp TP.HCM

Thư viện quận 1 - TVKHTH TP.HCM

Thư viện quận 10 - TVKHTH TP.HCM

Thư viện quận 11 - TVKHTH TP.HCM

Thư viện quận 12 - TVKHTH TP.HCM

Thư viện quận 2 - TVKHTH TP.HCM

Thư viện quận 3 - TVKHTH TP.HCM

Thư viện quận 4 - TVKHTH TP.HCM

Thư viện quận 5 - TVKHTH TP.HCM

Thư viện quận 6 - TVKHTH TP.HCM

Thư viện quận 7 - TVKHTH TP.HCM

Thư viện quận 8 - TVKHTH TP.HCM

Thư viện quận Bình Tân - TVKHTH TP.HCM

Thư viện quận Bình Thạnh - TVKHTH TP.HCM

Thư viện quận Gò Vấp - TVKHTH TP.HCM

Thư viện quận Phú Nhuận - TVKHTH TP.HCM

Thư viện quận Tân Bình - TVKHTH TP.HCM

Thư viện quận Tân Phú - TVKHTH TP.HCM

Thư viện Quốc gia Việt Nam

Thư viện thành phố Thủ Đức (cơ sở 1) - TVKHTH TP.HCM

Thư viện thành phố Thủ Đức (cơ sở 2) - TVKHTH TP.HCM

Thư Viện Tỉnh An Giang

Thư viện tỉnh Vĩnh Long

Tổ chức y tế thế giới

Trung tâm giáo dục quốc phòng và An ninh - ĐHQGHN

Trung tâm Hỗ trợ Sinh viên - ĐHQGHN

Trường Đại học Luật - ĐHQGHN

Trường Khoa học liên ngành và nghệ thuật - ĐHQGHN

Trường Quản trị và Kinh doanh - ĐHQGHN

Viện Công nghệ Thông tin - ĐHQGHN

Viện Đảm bảo chất lượng giáo dục - ĐHQGHN

Viện Quốc tế Pháp ngữ - ĐHQGHN

Viện Tài nguyên và Môi trường - ĐHQGHN

Viện Vi sinh vật và Công nghệ Sinh học - ĐHQGHN

Viện Việt Nam học và Khoa học phát triển - ĐHQGHN

Ldr		00025nam a2200024 a 4500
001		CLN240000112
041	__	$afr
100	__	$aNGUYEN, Hong San
245	__	$aMODULE D'EXTRACTION FOCALISE ET ANALYSE AUTOMATIQUE LINGUISTIQUE DU WEB /$cNGUYEN, Hong San
260	__	$c2007
500	__	$aLê, H. L. (2015). LỄ HỘI VÀ QUÁ TRÌNH VẬN ĐỘNG CỦA NÓ TRONG ĐỜI SỐNG KINH TẾ - XÃ HỘI. Hội thảo khoa học quốc tế kỷ niệm 1000 năm Thăng Long - Hà Nội. Phát triển bền vững thủ đô Hà Nội văn hiến, anh hùng, vì hòa bình
520	__	$aCe stage se déroule dans un cadre d'une collaboration entre l'Institut de Recherche en Informatique de Toulouse (IRIT) et l' Équipe de Recherche en Syntaxe et Sémantique (ERSS). Notre objectif est de développer un outil informatique pour la construction automatique des corpus à partir du web en utilisant les outils analyse linguistique existés. Il s'agit de la construction d'un crawl focalisé du web et de l'intégration des outils d'analyse linguistique pour analyser les pages Web. Dans un premier temps, nous présentons un modèle de crawl focalisé qui parcourait le Web pour télécharger les pages concernées à un sujet spécifique. Le crawl doit faire sortie deux résultats importants: les contenus textuelle des pages Web et le graphe des hyperliens des pages Web. Dans un deuxième temps, nous faisons une études sur les outils d'analyse linguistique TreeTagger, Syntex et Upery et les intégrons dans le système pour l'analyse des pages Web. Nous effectuons aussi le prétraitement des textes récupérés par le crawl avant de les passer à des outils linguistique. Le résultat final est des corpus analysés qui parlent d'un sujet spécifique.
655	__	$aThesis
856	__	$uhttps://repository.vnu.edu.vn/handle/VNU_123/145
900		1
907		https://repository.vnu.edu.vn/retrieve/31a1ab8a-c389-4fc5-ae8b-06b9ec8eafa4/stage-nguyen_hong_san.pdf.jpg
925		G
926		0
927		SH