Luận văn ThS: Nghiên cứu mô hình kiểm soát truy xuất cho dữ liệu lớn

Luận văn Nghiên cứu mô hình kiểm soát truy xuất cho dữ liệu lớn giới thiệu tổng uan về dữ liệu lớn; mô hình điều khiển truy xuất dữ liệu, điều khiển truy xuất dữ liệu lớn; thực nghiệm và các kết quả.

Luận văn ThS: Nghiên cứu mô hình kiểm soát truy xuất cho dữ liệu lớn

1. Mở đầu

Sự bùng nổ của các dịch vụ trực tuyến cùng sự phát triển không ngừng của công nghệ và các thiết bị di động đã làm gia tăng nhu cầu quản lý và chia sẻ thông tin, đặc biệt là trong các hệ thống quản lý giáo dục, y tế, giải trí,…, các phần mềm ứng dụng cho các cơ quan quản lý nhà nước nhằm đáp ứng yêu cầu quản lý, thống kê, dự báo, hoạch định,…. Các thông tin này được lưu trữ với số lượng dữ liệu lớn, dưới nhiều dạng khác nhau cũng như tốc độ sinh ra nhanh, các dữ liệu này được gọi là dữ liệu lớn. Số lượng dữ liệu càng tăng và đa dạng kéo theo việc bảo mật các dữ liệu trở nên cấp thiết và khó khăn hơn. Do đó, bảo mật dữ liệu lớn được xem là một trong những thách thức quan trọng đặt ra cho nghiên cứu về dữ liệu lớn và các ứng dụng liên quan.

2. Nội dung

2.1 Tổng quan về dữ liệu lớn

Giới thiệu

Định nghĩa và các đặc trưng

  • Big Data là gì?
  • Cơ bản về kiến trúc của Big Data

Các ứng dụng của dữ liệu lớn

Các mô hình dữ liệu lớn

  • Hadoop Apache
  • Hadoop Distributed File System (HDFS)
  • Map reduce

2.2 Mô hình điều khiển truy xuất dữ liệu

Tổng quan điều khiển truy cập

  • Giới thiệu điều khiển truy cập
  • Các kiểu xác thực
  • Các nguy cơ và các điểm yếu của điều khiển truy cập
  • Một số ứng tiêu biểu của điều khiển truy cập

Các điều khiển truy cập thông dụng

  • Điều khiển truy cập tùy quyền (DAC - Discretionary Access Control) 
  • Điều khiển truy cập bắt buộc (MAC – Mandatory access control) 
  • Mô hình điều khiển truy cập trên cơ sở vai trò (RBAC-Role-based Access Control) 
  • Điều khiển truy cập dựa trên luật (Rule BAC– Rule Based Access Control)

2.3 Điều khiển truy xuất dữ liệu lớn

Giới thiệu

Nutch - Ứng dụng Search Engine phân tán trên nền tảng Hadoop

  • Ngữ cảnh ra đời và lịch sử phát triển của Nutch
  • Giới thiệu Nutch
  • Kiến trúc ứng dụng Nutch
  • Kiến trúc Nutch
  • Nutch và việc áp dụng tính toán phân tán với mô hình MapReduce vào Nutch

2.4 Thực nghiệm và các kết quả

Giới thiệu

Thực nghiệm triển khai crawl và tạo chỉ mục

  • Mục đích
  • Phần cứng
  • Phương pháp thực hiện
  • Kết quả
  • Đánh giá
  • Kết luận

Thực nghiệm tìm kiếm trên tập chỉ mục

  • Mẫu dữ liệu
  • Phần cứng
  • Phương pháp thực hiện
  • Bảng kết quả thực hiện các truy vấn
  • Đánh giá

3. Kết luận

Luận văn đã đạt được một số kết quả sau:

  • Tìm hiểu được nền tảng kiến thức về kiến trúc, chu kì, các thành phần ứng dụng và các mô hình cho dữ liệu lớn.
  • Nghiên cứu về kiến trúc, các đặc điểm và cơ chế hoạt động của hai thành phần chính của Hadoop: HDFS và MapReduce Engine.
  • Biết cách phát triển và triển khai ứng dụng theo mô hình MapReduce với Hadoop.

4. Tài liệu tham khảo

Wittenauer,A.(2008), Deploying Grid Services Using Hadoop, ApacheCon EU

Bertino, E., Bonatti, P.A., Ferrari (2001), TRBAC: A temporal role -based access control model, ACM TISSEC, 4(3), 191 -233

Bughin, J., Chui, M., & Manyika (2010), Clouds, big data, and smart assets: Ten tech-enabled business trends to watch. McKinsey Quarterly, 56(1), 75-86.

Bertino, E., Ghinita, G., Kamra(2011), Access Control for Databases: Concepts and Systems. Now Publishers....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn trên ---

Ngày:03/09/2020 Chia sẻ bởi:Xuân Quỳnh

CÓ THỂ BẠN QUAN TÂM