Luận văn ThS: Xây dựng Ontology từ kho ngữ liệu dạng văn bản

Luận văn Xây dựng Ontology từ kho ngữ liệu dạng văn bản giới thiệu các khái niệm về bản thể học; phân tích, đánh giá các công trình nghiên cứu liên quan đến việc xây dựng bản thể học, chỉ ra những vấn đề mà đề tài cần tập trung nghiên cứu, giải quyết; trình bày cách xây dựng tập từ gốc, thực hiện phân tích nội dung, cách nhận dạng và tạo quan hệ ngữ nghĩa, cách tạo bản thể học bán tự động; cách thức và kết quả quá trình thực nghiệm.

Luận văn ThS: Xây dựng Ontology từ kho ngữ liệu dạng văn bản

1. Mở đầu

1.1 Lí do chọn đề tài

Trong những năm gần đây ontology (bản thể học) trở nên phổ biến vì những tiện ích mà nó mang lại cho người dùng. Bản thể học trở thành một chủ đề nghiên cứu phổ biến trong một loạt các ngành, với mục đích làm tăng sự hiểu biết và xây dựng một sự đồng thuận trong một lĩnh vực nhất định của tri thức. Bản thể học cũng hướng đến việc chia sẻ kiến thức giữa các hệ thống và con người. Việc xây dựng bản thể học từ kho ngữ liệu có sẵn là rất cần thiết trong việc tăng sự hiểu biết và xây dựng một sự đồng thuận trong một lĩnh vực nhất định của tri thức, chia sẻ thông tin giữa các người dùng cùng quan tâm đến một lĩnh vực.

1.2 Mục tiêu nghiên cứu

Luận văn thực hiện tìm hiểu phương pháp xây dựng bản thể học bán tự động từ kho ngữ liệu dạng văn bản.

1.3 Nhiệm vụ nghiên cứu

Để tìm hiểu phương pháp tạo bản thể học bán tự động từ kho ngữ liệu dạng văn bản đề tài tập trung thực hiện các nhiệm vụ sau:

  • Khảo sát các phương pháp xây dựng ontology từ kho ngữ liệu dạng văn bản.
  • Đề xuất (hoặc cải tiến) một phương pháp xây dựng ontology từ kho ngữ liệu dạng văn bản trên cơ sở kết hợp xử lý ngôn ngữ tự nhiên
  • Tiến hành thực nghiệm, đánh giá và hiệu chỉnh phương pháp

2. Nội dung

2.1 Tổng quan

Giới thiệu bản thể học

  • Khái niệm Bản thể học
  • Ứng dụng của bản thể học hiện nay
  • Hiệu quả mang lại từ việc sử dụng bản thể học
  • Cách tổ chức dữ liệu trong một bản thể học

Các công trình nghiên cứu đã có liên quan mật thiết đến đề tài

  • Học từ bản thể học
  • Tạo bản thể học bán tự động từ kho ngữ liệu văn bản
  • Kỹ thuật tạo bản thể học bán tự động sử dụng mô hình
  • Kỹ thuật bán tự động của bản thể học từ văn bản
  • Dafoe: Một Nền tảng cho việc xây dựng bản thể học từ văn bản

Những vấn đề mà đề tài tập trung nghiên cứu, giải quyết

  • Tìm hiểu bản thể học
  • Xây dựng tập từ gốc, xác định các từ, cụm từ
  • Nhận dạng và tạo các quan hệ ngữ nghĩa
  • Tạo bản thể học

2.2 Các nghiên cứu liên quan

Gate UK

  • ANNIE 
  • JAPE
  • Trình tự thực hiện tạo ứng dụng trong Gate UK

WordNet

Phương pháp thực hiện tạo bản thể học

Xây dựng tập từ gốc, xác định các từ, cụm từ 

Nhận dạng và tạo quan hệ ngữ nghĩa

Cách tạo bản thể học bán tự động

2.3 Thực nghiệm

Xác định lĩnh vực và phạm vi của bản thể học

Xây dựng tập từ gốc, xác định các từ, cụm từ 

  • Sưu tập các từ gốc
  • Xác định các từ, cụm từ liên quan 
  • Kết quả đạt được

Nhận dạng quan hệ ngữ nghĩa

Tạo bản thể học

  • Tạo các class theo hệ thống phân cấp đã phân tích trên
  • Tạo các thuộc tính của class, xây dựng mối quan hệ giữa các lớp
  • Tạo các thể hiện

3. Kết luận

Từ ý tưởng tìm hiểu phương pháp xây dựng bản thể học bán tự động từ kho ngữ liệu dạng văn bản, chúng tôi đã tìm hiểu, trình bày và hiện thực các thuật toán từ các ý tưởng trình bày trong các tài liệu. Phần tìm hiểu và hiện thực của luận văn đã đáp ứng nhiệm vụ đề ra của đề tài:

  • Khảo sát các phương pháp xây dựng ontology từ kho ngữ liệu dạng văn bản
  • Đề xuất (hoặc cải tiến) một phương pháp xây dựng ontology từ kho ngữ liệu dạng văn bản trên cơ sở kết hợp xử lý ngôn ngữ tự nhiên
  • Tiến hành thực nghiệm, đánh giá và hiệu chỉnh phương pháp

4. Tài liệu tham khảo

Nguyễn Chánh Thành (2010). Xây dựng mô hình mở rộng truy vấn trong truy xuất thông tin văn bản. Luận văn Tiến sĩ Kỹ thuật. Chuyên ngành Khoa học máy tính, Đại học Bách khoa tp HCM.

Mithun Balakrishna, Dan Moldovan, Marta Tatu, Marian Olteanu. “Semi-Automatic Domain Ontology Creation from Text Resources”(2010). Lymba Corporation Richardson TX75080 USA.3187-3194

Alexander Maedche, Steffen Staab. “Learning Ontologies for the Semantic Web”. IEEE Intelligent Systems archive Volume 16 Issue 2, March 2001 Page 72-79

Eva Blomqvist, “ Semi-automatic Ontology Engineering using Patterns” (2007), 6th International Semantic Web Conference, 2nd Asian Semantic Web Conference, ISWC 2007 + ASWC 2007, Busan, Korea, November 11-15, 2007....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:31/08/2020 Chia sẻ bởi:Nhi

CÓ THỂ BẠN QUAN TÂM