Thế kỉ III trước Công nguyên, Thư viện Alexandria được coi là nơi chứa đựng toàn bộ kiến thức của loài người. 2400 năm sau, nhân loại bước sang thời kì bùng nổ dữ liệu, với tổng lượng thông tin trên mỗi đầu người thậm chí lớn gấp 320 lần kho lưu trữ của thư viện Alexandria.
Lịch sử cổ đại của dữ liệu
Bằng chứng sớm nhất cho việc lưu trữ dữ liệu thời tiền sử là những cây gậy kiểm đếm xuất hiện từ năm 18000 trước Công nguyên (TCN). Mãi đến năm 2400 TCN, bàn tính mới ra đời và được coi là thiết bị chuyên dụng đầu tiên để thực hiện các tính toán. Phát minh này đã đặt nền móng cho sự xuất hiện của Cơ chế Antikythera, máy tính cơ học được phát hiện sớm nhất, sản xuất bởi các nhà khoa học Hy Lạp vào khoảng năm 100 – 200 sau Công nguyên.
Sự xuất hiện của phương pháp thống kê
Năm 1663, phân tích dữ liệu thống kê được phát minh bởi John Graunt. 218 năm sau, Máy tạo bảng Hollerith ra đời, đánh dấu thời kì mới của phương pháp tính toán tự động trong lịch sử nhân loại.
Những ngày đầu của lưu trữ dữ liệu hiện đại
Trải qua một thời kì dài, cuối cùng, lưu trữ dữ liệu cũng chính thức được cải tiến toàn diện, với sự ra đời của phương pháp lưu trữ thông tin từ tính trên băng năm 1928. Năm 1965, Trung tâm dữ liệu đầu tiên của thế giới, xây dựng bởi Hoa Kì, đã lưu trữ 742 triệu tờ khai thuế và 175 triệu bộ dấu vân tay trên băng từ. Không lâu sau, năm 1970, mô hình cơ sở dữ liệu lưu trữ thông tin theo định dạng phân cấp ra đời.
Internet – bước ngoặt trong lưu trữ dữ liệu
Năm 1991, Internet ra đời và là mạng dữ liệu kĩ thuật số được kết nối trên toàn thế giới. Sau đó 6 năm, kho dữ liệu khổng lồ mà chúng ta biết đến ngày nay – Google Search chính thức ra mắt.
Dữ liệu lớn – Cuộc cách mạng trong lịch sử nhân loại
Thuật ngữ Dữ liệu lớn chính thức được đề cập vào năm 1999, và phát triển nhanh với hàng loạt các sáng chế như Software-as-a-Service (Dịch vụ phần mềm), Cloud-based applications (nền tảng đám mây), Web 2.0… Năm 2005, Hadoop – khung nguồn mở được tạo riêng để lưu trữ và phân tích các tập hợp Dữ liệu lớn ra đời, cho phép quản lý dữ liệu phi cấu trúc (giọng nói, video, văn bản thô, v.v.).
Thế giới đang vận động với một lượng dữ liệu khổng lồ, với Trí tuệ nhân tạo, Học máy, Học sâu, Điện toán đám mây… ai làm chủ dữ liệu sẽ là người làm chủ tương lai.
(Nguồn: World Economic Forum)