Trang chủ Thế giới nói gì Supervised Learning và Unsupervised Learning: Khác biệt là gì?

Supervised Learning và Unsupervised Learning: Khác biệt là gì?

Supervised learning (Học có giám sát) và Unsupervised learning (Học không giám sát) là hai trong số những phương pháp kỹ thuật cơ bản của Machine Learning (Học máy). Vậy cụ thể hai phương pháp này là gì và khác nhau như thế nào? 

Supervised Learning là gì?

Cách thức học của mô hình Supervised Learning
Cách thức học của mô hình Supervised Learning. Ảnh: Big Data made simple

Supervised Learning (Học có giám sát) là một nhóm thuật toán sử dụng dữ liệu được gán nhãn nhằm mô hình hóa mối quan hệ giữa biến đầu vào (x) và biến đầu ra (y). Hai nhóm bài toán cơ bản trong học có giám sát là classification (phân loại) và regression (hồi quy), trong đó biến đầu ra của bài toán phân loại có các giá trị rời rạc trong khi biến đầu ra của bài toán hồi quy có các giá trị liên tục. Với Supervised Learning, bên cạnh xây dựng các mô hình mạnh, việc thu thập và gán nhãn dữ liệu tốt và hợp lý cũng đóng vai trò then chốt để giải quyết các bài toán trong thực tế.

Unsupervised Learning là gì?

Cách thức học của mô hình Unsupervised Learning
Cách thức học của mô hình Unsupervised Learning. Ảnh: Big Data made simple

Ngược lại, Unsupervised Learning (Học không giám sát) là một nhóm thuật toán sử dụng dữ liệu không có nhãn. Các thuật toán theo cách tiếp cận này hướng đến việc mô hình hóa được cấu trúc hay thông tin ẩn trong dữ liệu. Hay nói cách khác, sử dụng các phương pháp này thiên về việc mô tả tính chất hay đặc tính của dữ liệu. Thông thường, các thuật toán này dựa trên những thông tin sau:

  • Mối quan hệ tương tự (similarity) giữa các ví dụ (được gọi là instance) trong dữ liệu như trong các thuật toán clustering (phân cụm)
  • Xác suất đồng xuất hiện của các đối tượng như trong Association mining
  • Các phép biến đổi ma trận để trích xuất các đặc trưng như PCA, SVD.

So sánh Supervised Learning và Unsupervised Learning

Những khác biệt cơ bản của phương pháp Supervised Learning và Unsupervised Learning được chỉ ra tại bảng so sánh dưới đây:

Tiêu chíSupervised LearningUnsupervised Learning
Dữ liệu để huấn luyện mô hìnhDữ liệu có nhãnDữ liệu không có nhãn
Cách thức học của mô hìnhMô hình hóa mối quan hệ giữa biến đầu vào và biến đầu raHọc dựa trên các quan hệ tương tự, sự đồng xuất hiện, hay các phép biến đổi ma trận
Thuật toánSupport vector machine, Neural network, Hồi quy tuyến tính, Hồi quy logistics, Random forest và Classification trees.– Các thuật toán clustering như K-mean, DBSCAN, Spectral Clustering, Hierarchical clustering- Apriori (Association Rule Mining)- PCA, SVD
Kết quảĐộ chính xác và tin cậy caoÍt chính xác hơn
Bảng so sánh Supervised Learning và Unsupervised Learning

BÀI MỚI NHẤT

Hệ thống IOT theo dõi điện tim thai nhi với cảm biến không tiếp xúc

Trong bối cảnh tỷ lệ thai chết lưu do dị tật tim bẩm sinh ngày càng tăng cao, đặc biệt tại Việt Nam với con số báo động 6% so với mức trung bình toàn cầu 1% [1, 2], việc theo dõi sức khỏe thai nhi trở thành một trong những ưu tiên hàng đầu. Tỷ lệ sinh non gia tăng, chiếm từ 5 - 9%, đòi hỏi sự chăm sóc đặc biệt để bảo đảm sự sống và phát triển khỏe mạnh của trẻ. Do đó việc theo dõi sức khỏe thai nhi trở nên vô cùng cấp thiết nhằm giảm thiểu nguy cơ thai chết lưu và sinh non, đảm bảo sự phát triển toàn diện cho trẻ. Hệ thống thông tin y tế đóng vai trò then chốt trong việc hỗ trợ các cơ sở y tế còn hạn chế, giảm tải áp lực cho bệnh viện và đảm bảo xử lý kịp thời các tình huống khẩn cấp, đồng thời tối ưu hóa năng lực của đội ngũ y bác sĩ. Hơn thế nữa, xây dựng một cơ sở dữ liệu về bà mẹ mang thai người Việt là bước đi quan trọng, giúp tìm hiểu nguyên nhân của những vấn đề sức khỏe của trẻ em, từ đó góp phần cải thiện chất lượng chăm sóc sức khỏe cho thế hệ tương lai.

Transformer Neural Network – Mô hình học máy biến đổi thế giới NLP

Năm 2017, Google công bố bài báo “Attention Is All You Need” thông tin về Transformer như tạo ra bước ngoặt mới trong lĩnh...

Dự báo chuỗi thời gian cùng công nghệ Học sâu

Dự báo chuỗi thời gian (Time series forecasting) hiện là lĩnh vực nghiên cứu rất phổ biến. Dễ dàng tìm thấy nhiều loại dữ...

08 khóa học Machine Learning miễn phí

Những khóa học Machine Learning dưới đây đều được triển khai bởi những trường đại học, viện nghiên cứu hay công ty công nghệ...

BÀI ĐỌC NHIỀU

Transformer Neural Network – Mô hình học máy biến đổi thế giới NLP

Năm 2017, Google công bố bài báo “Attention Is All You Need” thông tin về Transformer như tạo ra bước ngoặt mới trong lĩnh...

Phần mềm mã nguồn mở là gì? Tất cả những điều bạn nên biết

Mã nguồn mở thường được lưu trữ trong kho lưu trữ công cộng và được chia sẻ công khai. Bất kỳ ai cũng có...

03 bài toán kinh điển trong Xử lý ngôn ngữ tự nhiên

Các bài toán trong Xử lý ngôn ngữ tự nhiên (NLP) từ cơ bản đến nâng cao bao gồm part-of-speech tagging, chunking, dependency parsing,...

Khái quát về Explainable AI

Trong khi trí tuệ nhân tạo (AI) thâm nhập ngày càng sâu rộng vào mọi lĩnh vực của đời sống (từ nhận dạng khuôn...