Trang chủ Thế giới nói gì 6 xu hướng của Dữ liệu lớn

6 xu hướng của Dữ liệu lớn

Dữ liệu là mỏ vàng mới của thế giới. Làm chủ dữ liệu là làm chủ thế giới. 6 xu hướng dưới đây của dữ liệu lớn sẽ là cơ sở để doanh nghiệp giành được lợi thế tiên phong trên thị trường.

1, Phân tích tăng cường

Phân tích tăng cường (Augmented Analytics) là một trong những xu hướng chính của dữ liệu lớn

Phân tích dữ liệu cung cấp nguồn tài nguyên trọng yếu cho tổ chức, doanh nghiệp đa ngành nghề. Phân tích tăng cường còn đi xa hơn phân tích dữ liệu thông thường, bởi nó tích hợp với các thuật toán học máy và xử lí ngôn ngữ tự nhiên, nhằm mang đến khả năng hiểu sâu dữ liệu và đề xuất những xu hướng có ý nghĩa. Hơn nữa, phân tích tăng cường còn cải thiện đáng kể tốc độ của toàn bộ quy trình phân tích dữ liệu. Ước tính, 80% nguồn lực của các nhà khoa học dữ liệu tiêu tốn cho việc thu thập và làm sạch dữ liệu. Nhờ tự động hóa quy trình này, phân tích tăng cường hỗ trợ chuyên gia trong các khâu chuẩn bị dữ liệu, từ đó, giúp họ tập trung vào các nhiệm vụ chuyên môn. Một số chuyên gia tin rằng, năm 2020, phân tích tăng cường sẽ trở thành giao dịch chính của các doanh nghiệp trong các tác vụ liên quan đến phân tích và kinh doanh thông minh.

2, Điện toán đám mây

Điện toán đám mây đang ngày càng được ứng dụng rộng rãi trong đời sống. Các hệ thống đám mây ưu việt bởi hiệu quả về chi phí, tốc độ nhanh chóng và tính thuận tiện. Song, điều này không có nghĩa là hệ thống đám mây đã được tối ưu hóa. Cold storage (lưu trữ lạnh) được cho là giải pháp hữu hiệu hơn cả. Nó cho phép lưu trữ dữ liệu đã cũ và không sử dụng đến, tạo điều kiện cho việc tiết kiệm không gian lưu trữ dành cho kho dữ liệu mới và giá trị hơn. Theo dự kiến, Cold Storage có thể tiết kiệm 50% chi phí lưu trữ chung. Bằng chứng là các gã khổng lồ như Google hay Microsoft thực tế đã làm việc trên nền tảng công nghệ này.

Trong xu hướng chung về điện toán đám mây, hai hạ tầng được kì vọng nhiều là đám mây lai (Hybrid Cloud –  sự kết hợp giữa nền tảng đám mây riêng và dịch vụ đám mây công cộng của bên thứ ba) và đa đám mây (Multi-cloud – sự pha trộn của nhiều chiến lược và giải pháp khác nhau)

3, Điện toán biên

Điện toán biên (Edge computing)

Điện toán biên là một mô hình điện toán phân tán, đưa tính toán và lưu trữ dữ liệu đến gần hơn với vị trí cần thiết nhằm cải thiện thời gian phản hồi và tiết kiệm băng thông. Điện toán biên có thể kết hợp với điện toán đám mây, nhằm mở rộng phạm vi hoạt động, không chỉ trong các máy chủ tập trung mà còn trong các hệ thống máy chủ phân tán, thậm chí tại chính các thiết bị. Chính bởi cách tiếp cận phi tập trung, điện toán biên được kì vọng sẽ cải thiện mức độ bảo mật, do giảm thiểu nhu cầu gửi dữ liệu qua mạng tới các bộ xử lí khác.

4, In-memory Computing

In-memory Computing là công nghệ được thiết kế để phát hiện các mẫu trong dữ liệu và phân tích một lượng dữ liệu khổng lồ. In-memory Computing lưu trữ dữ liệu trong bộ nhớ RAM và đây là giải pháp thay thế cho việc lưu trữ trong cơ sở dữ liệu quan hệ. Thực hiện phân tích dữ liệu thời gian thực, In-memory Computing có thể xử lí bộ dữ liệu lớn với hiệu suất và chi phí ấn tượng.

5, DataOps

Data Operation (DataOps) là một phương pháp tự động, hướng quy trình, được sử dụng để cải thiện chất lượng và giảm thiểu thời gian chu kì phân tích dữ liệu. Công nghệ DataOps bắt nguồn từ các phương thức Agile và DevOps và được áp dụng cho toàn bộ quy tắc phân tích dữ liệu. DataOps cho phép kiểm tra và phân tích dữ liệu tự động, từ đó đảm bảo phân tích dữ liệu chất lượng cao. Các giai đoạn của luồng xử lí dữ liệu, bao gồm Kinh doanh thông minh (Business Intelligence), Khoa học dữ liệu (Data Science) và Phân tích dữ liệu (Data Analytics), đều có thể được tự động hóa bởi DataOps.

6, Continuous Intelligence (CI)

Continuous Intelligence tích hợp phân tích thời gian thực trong vận hành kinh doanh. Công nghệ này xử lí cả dữ liệu hiện thời và dữ liệu trong quá khứ, nhằm hỗ trợ quá trình ra quyết định, hoặc trong một số trường hợp nhất định, tự động hóa quá trình này. CI được thực hiện nhờ phân tích tăng cường và sự phát triển của dữ liệu lớn cũng như các công nghệ trí tuệ nhân tạo khác. Tiềm năng ứng dụng của CI có thể kể đến: cung cấp dịch vụ hỗ trợ khách hàng, cá thể hóa chương trình ưu đãi và tối ưu hóa quá trình ra quyết định của công ty. Theo Gartner, hơn 50% hệ thống kinh doanh mới sẽ sử dụng CI vào cuối năm 2022.

BÀI MỚI NHẤT

Giảm chiều dữ liệu để tăng hiệu quả của mô hình AI

Các tập dữ liệu đa chiều (high-dimensionality datasets) hiện là tài nguyên quý giúp tổ chức nghiên cứu giải quyết những vấn đề phức...

Dữ liệu tổng hợp: Tất cả những điều bạn nên biết

Synthetic Data (Dữ liệu tổng hợp) đang ngày càng được sử dụng phổ biến, bởi nó tiết kiệm chi phí sản xuất, đồng thời...

10 kho dữ liệu mở dành cho cộng đồng Xử lý ảnh y tế

Một trong những thử thách lớn nhất hiện nay đối với cộng đồng AI nói chung, Xử lý ảnh y tế nói riêng chính...

Giám đốc Khoa học VinBigdata chia sẻ cách khai thác dữ liệu trong kỷ nguyên số

Ngày 08/01/2021, GS. Vũ Hà Văn, Giám đốc Khoa học Viện Nghiên cứu Dữ liệu lớn VinBigdata đã có bài giảng đại chúng về...

BÀI ĐỌC NHIỀU

Khái quát về Data Pipeline

Dữ liệu là chìa khóa trong việc khám phá tri thức sâu rộng, nâng cao hiệu quả quy trình và thúc đẩy đưa ra...

Data Lake và Data Warehouse: Đâu là lựa chọn phù hợp?

Data Lake và Data Warehouse là hai khái niệm hay bị nhầm lẫn trong dữ liệu lớn, song thực tế, điểm chung duy nhất...

Ảo hóa dữ liệu: bước đột phá của hồ dữ liệu

Khác với Kho dữ liệu (Data Warehouse) - nơi phát triển các lược đồ và phân cấp trước khi  lưu trữ dữ liệu, hồ...

Y học chính xác và căn bệnh ung thư

Theo BIS Research, tổng doanh thu toàn cầu của Y học chính xác được dự đoán sẽ tăng từ 43,59 tỷ USD lên mức...