Luận văn ThS: Phát triển tính năng loại bỏ dữ liệu trùng lặp - Data Deduplication cho dữ liệu đính kèm trong hệ thống thư điện tử sử dụng phần mềm hMailServer

Luận văn Phát triển tính năng loại bỏ dữ liệu trùng lặp - Data Deduplication cho dữ liệu đính kèm trong hệ thống thư điện tử sử dụng phần mềm hMailServer giới thiệu tổng quan về Data Deduplication, hệ thống Email, phương thức thực hiện Data Deduplication, Tích hợp tính năng Deduplication trong hệ thống hMailServer và thựuc nghiệm.

Luận văn ThS: Phát triển tính năng loại bỏ dữ liệu trùng lặp - Data Deduplication cho dữ liệu đính kèm trong hệ thống thư điện tử sử dụng phần mềm hMailServer

1. Mở đầu

Cùng với sự phát triển chung của toàn xã hội, công nghệ thông tin đã từng bước được phát triển và được ứng dụng rộng rãi trong thực tế. Ngày nay, mạng Internet đã phát triển thành một mạng số liệu toàn cầu cho phép nhiều loại hình thông tin truyền đi trên nó. Trong số đó, thư điện tử (email) là một dịch vụ đã và đang trở nên phổ biến hơn bao giờ hết. Email cho phép chúng ta có thể giao dịch, trao đổi các thông tin qua lại một cách nhanh chóng, chính xác với độ tin cậy cao. Tuy nhiên, do đặc thù của một hệ thống email sẽ bao gồm nhiều người dùng và một người dùng có thể nhận được email từ một hoặc nhiều người dùng khác ở trong hoặc ngoài hệ thống. Do vậy, có một vấn đề phát sinh là lượng dữ liệu trùng lặp (thông điệp thư gửi đi, tệp đính kèm,…) có thể sẽ được lưu trữ nhiều lần trên cùng một máy chủ email.

2. Nội dung

2.1 Tổng quan về Data Deduplication, hệ thống Email 

Giới thiệu về Data Deduplication

 • Data Deduplication là gì?
 • Mục đích của Data Deduplication
 • Phân loại Data Deduplication
 • So sánh các kiểu Data Deduplication

Tổng quan về hệ thống Email

 • Các khái niệm cơ bản về Email
 • Lợi ích của hệ thống Email
 • Kiến trúc chung một hệ thống Email
 • Phương thức hoạt động của một hệ thống Email
 • Các giao thức sử dụng trong hệ thống Email
 • Định dạng thư điện tử (Message format)

Vấn đề Data Deduplication trong các hệ thống Email

 • Lợi ích của Data Deduplication trong hệ thống Email
 • Hệ thống email và khả năng Data Deduplication

2.2 Phương thức thực hiện Data Deduplication

Phương thức thực hiện Data Deduplication

 • Source và Target Deduplication
 • Inline và Post-Process Deduplication
 • File và Sub-File Level
 • Fixed-Length Blocks và Variable-Length Data Segments
 • Thuật toán băm (Hash-based Algorithms)

Một số các sản phẩm ứng dụng Data Deduplication

Giải pháp chống trùng lặp dữ liệu trong Email

Đề xuất lựa chọn hMailServer để thực nghiệm

2.3 Tích hợp tính năng Deduplication trong hệ thống hMailServer

Tổng quan về hMailServer

 • Giới thiệu về hMailServer
 • Các tính năng của hMailServer
 • Thư viện COM và API sử dụng trong hMailServer
 • Môi trường phát triển của hMailServer

Xây dựng hệ thống Email với hMailServer

 • Giới thiệu các thành phần cài đặt và quản trị
 • Cài đặt máy chủ Active Directory và dịch vụ IIS
 • Cài đặt và Cấu hình hệ thống hMailServer
 • Nhận xét về khả năng chống trùng lặp dữ liệu của hMailServer

Tích hợp tính năng deduplication trong hMailServer

 • Xây dựng kịch bản triển khai
 • Cài đặt kịch bản
 • Hoạt động của hMailServer trong trường hợp tích hợp Deduplication
 • Tính bảo mật của hệ thống

So sánh kết quả thực nghiệm

3. Kết luận

Như vậy, việc ứng dụng thành công kỹ thuật Data Deduplication trong hệ thống hMailServer nói riêng và các hệ thống lưu trữ dữ liệu nói chung chắc chắn sẽ đem lại một lợi ích to lớn cho người dùng và các nhà cung cấp dịch vụ. Tùy theo từng ứng dụng cụ thể trong thực tế mà chúng ta có thể lựa chọn các công nghệ phù hợp nhất để triển khai nhằm đem lại hiệu quả tối đa về chi phí và tăng hiệu năng hoạt động của hệ thống. Luận văn đã thực hiện được các nội dung chính:

 • Nắm được tổng quan về kỹ thuật Data Deduplication, tổng quan về email và mỗi tương quan giữa email với Data Deduplication.
 • Các phương thức xử lý Data Deduplication nói chung và đề xuất giải pháp cho việc xử lý dữ liệu trùng lặp trong hệ thống email.
 • Trình bày tổng quan về máy chủ hMailServer và mở rộng tính năng Data Deduplication cho hệ thống hMailServer.
 • Đánh giá ở mức cơ bản về hiệu quả của kỹ thuật Data Deduplication khi triển khai cho hệ thống hMailServer so với hệ thống khi hoạt động thông thường.

4. Tài liệu tham khảo

Stephen J.Bigelow (2007), Data Deduplication Explained. Storage Magazine.

Jaspreet Singh. Understanding Data Deduplication. [online] Available at: http://www.druva.com/blog/understanding-data-deduplication/ [Accessed 28 July 2016].

Chris Poelker (2013). Data deduplication in the cloud explained. [online] Available at:http://www.computerworld.com/article/2474479/data-center/data-deduplicationin-the-cloud-explained--part-one.html [Accessed 24 July 2016]

Lauren Whitehouse. The pros and cons of file-level vs. block-level data deduplication technolog. [online] Available at: http://searchdatabackup.techtarget.com/tip/The-pros-and-cons-of-file-level-vsblock-level-data-deduplication-technology [Accessed 24 July 2016]....

--- Nhấn nút TẢI VỀ hoặc XEM ONLINE để tham khảo đầy đủ nội dung Luận văn Thạc sĩ trên ---

Ngày:27/08/2020 Chia sẻ bởi:Tuyết Trịnh

CÓ THỂ BẠN QUAN TÂM