Luận văn ThS: Thuật toán hiệu quả cho khai thác tăng trưởng các mô hình duyệt web

Luận văn Thuật toán hiệu quả cho khai thác tăng trưởng các mô hình duyệt web nghiên cứu bài toán khai thác chuỗi; nghiên cứu bài toán khai thác mô hình duyệt Web, đặc biệt là mô hình có xem xét đến sự tăng trưởng và cài đặt thử nghiệm.

Luận văn ThS: Thuật toán hiệu quả cho khai thác tăng trưởng các mô hình duyệt web

1. Mở đầu

1.1 Mục tiêu nghiên cứu

Khai thác các mô hình duyệt Web trong trường hợp các trình tự sử dụng có thể được xóa khỏi cơ sở dữ liệu trình tự duyệt Web.

Khai thác các mô hình duyệt Web khi độ hỗ trợ được điều chỉnh.

Khai thác mô hình duyệt Web khi xóa bỏ liên kết trong cấu trúc trang Web.

Tập trung nghiên cứu xây dựng thuật toán cho khai thác tăng trưởng của mô hình duyệt Web khi cơ sở dữ liệu được cập nhật, cấu trúc trang Web dược cập nhật, hoặc khi độ hỗ trợ được điều chỉnh nhằm tìm ra mô hình duyệt Web của người dùng một cách chính xác và kịp thời trong bối cảnh cơ sở dữ liệu Web đang phát triển nhanh chóng

1.2 Đối tượng phạm vi nghiên cứu

Đối tượng nghiên cứu:

 • Các cơ sở dữ liệu duyệt Web: MSNBC, BMSWebView.
 • Các thuật toán tăng trưởng trong khai thác mô hình trình tự cụ thể là thuật toán ISL, thuật toán IncSpan.
 • Các thuật toán tăng trưởng trong khai thác mô hình trình tự duyệt Web như thuật toán MAFTP và thuật toán IncWTP

Phạm vi nghiên cứu: Nghiên cứu thuật toán sinh ứng viên trình tự duyệt Web (CandidateGen) và thuật toán IncWTP

1.3 Phương pháp nghiên cứu

Nghiên cứu và tìm kiếm tài liệu liên quan đến các từ khóa: Web mining, Incremental data mining, Traversal sequence, Web traversal pattern.

Nghiên cứu tài liệu liên quan đến các thuật toán tăng trưởng, trình tự duyệt và trình tự duyệt Web.

Cài đặt thuật toán.

Dùng phương pháp thực nghiệm trên cơ sở dữ liệu trình tự duyệt Web, sau đó nhận xét kết quả và hỏi ý kiến giáo viên hướng dẫn.

2. Nội dung

2.1 Tổng quan về khai thác web

Khai thác Web (Web mining)

Đặc điểm của khai thác Web

 • Khó khăn
 • Thuận lợi

Các lĩnh vực trong khai thác Web (Web mining)

 • Khai thác nội dung trang Web
 • Khai thác cấu trúc trang Web
 • Khai thác sử dụng Web

Các bài toán được đặt ra trong khai thác Web

Khai thác sử dụng Web 

 • Phân tích mô hình truy cập Web
 • Phân tích xu hướng cá nhân

Khai thác cấu trúc Web 

 • Khai thác đồ thị Web
 • Khai thác cấu trúc trang Web

Tổng quan về khai thác tăng trưởng mô hình duyệt Web

2.2 Thuật toán khai thác mô hình duyệt web

Các vấn đề liên quan

Cấu trúc dữ liệu được sử dụng cho khai thác mô hình duyệt Web 

Thuật toán

 • Thuật toán InWebTP
 • Thuật toán WebTP
 • Thuật toán IntWebTP
 • Thuật toán RemoveLink

2.3 Thực nghiệm và đánh giá

Môi trường thực nghiệm

Giới thiệu cơ sở dữ liệu thực nghiệm 

 • Thực nghiệm thứ nhất 
 • Thực nghiệm thứ hai

3. Kết luận

Luận văn đã đóng góp một số nội dung cho lĩnh vực khai thác sự dụng Web, cụ thể là khai thác mô hình truy cập Web như sau:

 • Nghiên cứu thuật toán IncWPT, thuật toán ISL, thuật toán IncSpan, và thuật toán sinh ứng viên trình tự duyệt Web (CandidateGen).
 • Nghiên cứu phương pháp sinh ứng viên của các mô hình duyệt Web dựa vào cấu trúc trang Web.
 • Nghiên cứu các bài toán được đặt ra trong khai thác Web nói chung, và cụ thể là bài toán khai thác mô hình duyệt Web.
 • Thực nghiệm khảo sát thời gian thực hiện các thuật thuật toán trên các bộ dữ liệu chuẩn

4. Tài liệu tham khảo

B. Liu (2011). Web Data Ming. 2nd ed., Springer Publishing Company, Heidelperg Dordrecht London New York.

Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú.(eds) (2009). Giáo trình khai phá dữ liệu Web. Nhà xuất bản giáo dục, Việt Nam.

B. Vo, T. Le, T.-P. Hong, B. Le, Fast Updated Frequent-itemset Lattice for Transaction Deletion. Data and Knowledge Engineering, 2015, pp. 96-97, 78-89.

M.S.Chen, J.S.Park, P.S.Yu, Effcient data mining for path traversal patterns in a web environment, IEEE Trans. Knowl. Data Eng. 10 (2) (1998) 209–221....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:05/09/2020 Chia sẻ bởi:Nguyễn Minh Duy

CÓ THỂ BẠN QUAN TÂM