Supervised Learning và Unsupervised Learning: Khác biệt là gì?

12/03/2021

11617

Supervised learning (Học có giám sát) và Unsupervised learning (Học không giám sát) là hai trong số những phương pháp kỹ thuật cơ bản của Machine Learning (Học máy). Vậy cụ thể hai phương pháp này là gì và khác nhau như thế nào?

Supervised Learning là gì?

Cách thức học của mô hình Supervised Learning. Ảnh: Big Data made simple

Supervised Learning (Học có giám sát) là một nhóm thuật toán sử dụng dữ liệu được gán nhãn nhằm mô hình hóa mối quan hệ giữa biến đầu vào (x) và biến đầu ra (y). Hai nhóm bài toán cơ bản trong học có giám sát là classification (phân loại) và regression (hồi quy), trong đó biến đầu ra của bài toán phân loại có các giá trị rời rạc trong khi biến đầu ra của bài toán hồi quy có các giá trị liên tục. Với Supervised Learning, bên cạnh xây dựng các mô hình mạnh, việc thu thập và gán nhãn dữ liệu tốt và hợp lý cũng đóng vai trò then chốt để giải quyết các bài toán trong thực tế.

Unsupervised Learning là gì?

Cách thức học của mô hình Unsupervised Learning. *Ảnh:* Big Data made simple

Ngược lại, Unsupervised Learning (Học không giám sát) là một nhóm thuật toán sử dụng dữ liệu không có nhãn. Các thuật toán theo cách tiếp cận này hướng đến việc mô hình hóa được cấu trúc hay thông tin ẩn trong dữ liệu. Hay nói cách khác, sử dụng các phương pháp này thiên về việc mô tả tính chất hay đặc tính của dữ liệu. Thông thường, các thuật toán này dựa trên những thông tin sau:

Mối quan hệ tương tự (similarity) giữa các ví dụ (được gọi là instance) trong dữ liệu như trong các thuật toán clustering (phân cụm)
Xác suất đồng xuất hiện của các đối tượng như trong Association mining
Các phép biến đổi ma trận để trích xuất các đặc trưng như PCA, SVD.

So sánh Supervised Learning và Unsupervised Learning

Những khác biệt cơ bản của phương pháp Supervised Learning và Unsupervised Learning được chỉ ra tại bảng so sánh dưới đây:

Tiêu chí	Supervised Learning	Unsupervised Learning
Dữ liệu để huấn luyện mô hình	Dữ liệu có nhãn	Dữ liệu không có nhãn
Cách thức học của mô hình	Mô hình hóa mối quan hệ giữa biến đầu vào và biến đầu ra	Học dựa trên các quan hệ tương tự, sự đồng xuất hiện, hay các phép biến đổi ma trận
Thuật toán	Support vector machine, Neural network, Hồi quy tuyến tính, Hồi quy logistics, Random forest và Classification trees.	– Các thuật toán clustering như K-mean, DBSCAN, Spectral Clustering, Hierarchical clustering- Apriori (Association Rule Mining)- PCA, SVD
Kết quả	Độ chính xác và tin cậy cao	Ít chính xác hơn

Bảng so sánh Supervised Learning và Unsupervised Learning

Bài trướcBộ gen tham chiếu đã được xây dựng như thế nào?

Bài sauBài phỏng vấn Giáo sư Vũ Hà Văn

Supervised Learning và Unsupervised Learning: Khác biệt là gì?

Supervised Learning là gì?

Unsupervised Learning là gì?

So sánh Supervised Learning và Unsupervised Learning

TIN LIÊN QUAN

BÀI MỚI NHẤT

BÀI ĐỌC NHIỀU

Nghiên cứu

Sản phẩm

Blog

Tin tức

Vingroup Big Data Institute

Đăng ký để nhận email