Trang chủ Chuyện bên lề Giám đốc Khoa học VinBigdata chia sẻ cách khai thác dữ liệu...

Giám đốc Khoa học VinBigdata chia sẻ cách khai thác dữ liệu trong kỷ nguyên số

Ngày 08/01/2021, GS. Vũ Hà Văn, Giám đốc Khoa học Viện Nghiên cứu Dữ liệu lớn VinBigdata đã có bài giảng đại chúng về tăng tốc giải quyết ma trận khổng lồ: “Fast computation – The magic of Sampling”.

Trong thế kỉ XXI, dữ liệu là “dầu mỏ” của thế giới số. Tuy nhiên, để phát triển các ứng dụng từ nguồn “dầu mỏ” này, việc tính toán và giải quyết các ma trận khổng lồ, với dữ liệu đầu vào đạt đến hàng triệu, trở thành một thách thức lớn. Thực tế, nhiều thuật toán chạy thời gian đa thức vẫn không thể áp dụng khi kích thước của ma trận vượt quá ngưỡng giới hạn. Do đó, bài toán mà GS. Vũ Hà Văn đặt ra là: Làm thế nào để tăng tốc độ giải quyết các ma trận lớn?

Đi tìm lời giải, Giám đốc Khoa học VinBigdata đã đề cập đến một hướng tiếp cận thịnh hành ở Mỹ trong khoảng 5-10 năm trở lại đây – lấy mẫu ngẫu nhiên (random sampling). Đây là một kĩ thuật cho phép mỗi mẫu có xác suất được chọn bằng nhau, vì thế, đảm bảo tính khách quan và không thiên kiến. Phương pháp này cũng giúp các nhà nghiên cứu thực hiện phân tích dữ liệu được thu thập với biên độ sai số thấp hơn và tốc độ nhanh hơn.

Theo GS. Vũ Hà Văn, bài toán lấy mẫu ngẫu nhiên để tăng tốc giải quyết các ma trận khổng lồ chính là tiền đề cho những ứng dụng quan trọng của dữ liệu lớn trong cuộc sống. Đơn cử là công nghệ nhận diện khuôn mặt. Thay vì phải đợi một thời gian dài để xử lý dữ liệu hình ảnh, nếu giải được bài toán này, hệ thống sẽ chỉ mất dưới 01 giây để xác thực nhận diện. Điều này sẽ giúp tăng trải nghiệm của người dùng và đẩy nhanh tốc độ ứng dụng công nghệ vào mọi mặt của đời sống.

Với nội dung thực tế và phương pháp tiếp cận hiện đại, bài giảng đại chúng của GS. Vũ Hà Văn đã thu hút được hàng trăm người đăng kí tham dự trực tiếp tại Viện Toán học và hơn 63.000 lượt theo dõi trực tiếp trên trang fanpage của Viện Nghiên cứu Dữ liệu lớn VinBigdata.

GS. Vũ Hà Văn hiện là Giám đốc Khoa học Viện Nghiên cứu Dữ liệu lớn VinBigdata, đồng thời đảm nhiệm vị trí giáo sư Toán học ĐH Yale, Hoa Kỳ. GS Văn từng đoạt giải Pólya (SIAM) năm 2008 của Hội toán công nghiêp (SIAM) dành cho công trình nghiên cứu về tập trung độ đo. Năm 2012, anh đoạt giải thưởng Fulkerson của Hội toán học Mỹ về lời giải cho bài toán Shamir trong lý thuyết đồ thị. Cùng năm, anh trở thành thành viên danh dự của hội toán học Mỹ. Năm 2020, GS. vũ Hà Văn vinh dự được bầu chọn trở thành Hội viên danh dự (Fellow) của hiệp hội Toán thống kê (Institute of Mathematical Statistics).

BÀI ĐỌC NHIỀU

Giải mã Vaccine thế hệ mới chống COVID-19

Đại dịch COVID-19 diễn biến phức tạp ở quy mô toàn cầu suốt cả năm nay, với số ca nhiễm và tử vong không...

VinBigdata đứng số 01 cuộc thi Global Wheat Detection, CVPPP 2020

Sau 2 tháng tranh tài, vượt qua 2245 đội thi hùng mạnh của thế giới, ngày 28/08/2020, Phòng Xử lý ảnh y tế, Viện...

Khái quát về Data Pipeline

Dữ liệu là chìa khóa trong việc khám phá tri thức sâu rộng, nâng cao hiệu quả quy trình và thúc đẩy đưa ra...

Data Lake và Data Warehouse: Đâu là lựa chọn phù hợp?

Data Lake và Data Warehouse là hai khái niệm hay bị nhầm lẫn trong dữ liệu lớn, song thực tế, điểm chung duy nhất...

BÀI ĐƯỢC LỰA CHỌN

Tìm hiểu về một Mô hình dự báo dịch Covid-19 từ Vũ Hán

Chúng tôi trình bày và giải thích về một mô hình dự báo ngắn hạn và dài hạn (gọi tắt là mô hình SEIR-C19)...

Giải Nobel Hóa học 2020 vinh danh công nghệ chỉnh sửa gene

Giải Nobel Hóa học năm nay được trao cho thành tựu “viết lại bộ mã của sự sống” của hai nhà khoa học nữ:...

Giải Nobel Y học 2020 vinh danh thành tựu nghiên cứu virus viêm gan C

Giải Nobel Y học 2020 được trao cho Harvey J. Alter, Michael Houghton và Charles M. Rice. Ba nhà khoa học được trao giải vì đã có những...

Điều trị tự kỷ bằng ghép tế bào gốc phối hợp với can thiệp giáo dục

1. Giới thiệu chungTự kỷ (autism) hay rối loạn phổ tự kỷ (autism spectrum disorder) là thuật ngữ được dùng để chỉ một...

BÀI MỚI NHẤT

GS. Vũ Hà Văn: “Most mathematicians love what they do, because they can do what they love”.

Đây là câu trả lời của GS. Vũ Hà Văn, Giám đốc Khoa học Viện Nghiên cứu Dữ liệu lớn VinBigdata, Giáo sư ĐH...

Bộ gen tham chiếu đã được xây dựng như thế nào?

Thật khó để tưởng tượng các nghiên cứu Sinh học, Tin sinh học ngày nay sẽ được thực hiện như thế nào nếu bộ...

Một vũ trụ hài hòa khơi nguồn bao sáng tạo!

Năm 2021, Quỹ VINIF đã gửi gắm mong ước về một vũ trũ hài hòa và sáng tạo trong Khối lịch 12 mặt của...

10 cuốn sách nên đọc về Khoa học dữ liệu

Theo Harvard Business Review, Data Scientist (Nhà Khoa học dữ liệu) được xem là ngành nghề “quyến rũ” nhất thế kỉ XXI. Nhu cầu...