Trong đề tài này, tôi sẽ thực hiện tìm hiểu về nền tảng phát triển các ứng dụng MapReduce trên framework Hadoop để phát triển các ứng dụng phân tán. Sau đó, tiến hành tích hợp với Oracle, là một ứng dụng quản trị cơ sở dữ liệu, để đánh giá được tác dụng của việc ứng dụng MapReduce vào trong các truy vấn thực tế. Với đặc thù của dữ liệu cuộc gọi là số lượng rất nhiều bản ghi dẫn đến việc thực hiện các câu truy vấn đọc dữ liệu trên một tập dữ liệu lớn sẽ mất nhiều thời gian. Trong khi đó kết quả của quá trình phân tích đánh giá rất cần thiết trong thời gian thực. Trong cơ sở dữ liệu nói chung đã có một số biện pháp cho phép đẩy nhanh quá trình đọc dữ liệu như đánh index, khoa ngoại…Nhưng trên một tập dữ liệu lớn các biện pháp trên không khả thi. Các câu truy vấn đọc dữ liệu cần được chia thành nhiều câu truy vấn nhỏ và thực hiện trên nhiều máy khác nhau. Do đó cần có sự kết hợp giữa mô hình MapReduce với một hệ quản trị cơ sở dữ liệu, trong trường hợp này tôi sử dụng Oracle.

Title: Ứng dụng cơ sở dữ liệu song song trong xử lý dữ liệu cuộc gọi : Luận văn ThS. Công nghệ thông tin: 60 48 01 04
Authors: Nguyễn, Hải Châu, người hướng dẫn
Trần, Xuân Hiếu
Issue Date: 2015
Publisher: ĐHCN
Abstract: 35 tr. + CD-ROM + Tóm tắt
Luận văn TS. Hệ thống thông tin — Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội, 2015
Electronic Resources
URI: http://repository.vnu.edu.vn/handle/VNU_123/43562
Appears in Collections: UET – Master Theses

Leave a Reply

Your email address will not be published. Required fields are marked *

Name *
Email *
Website

Bitnami