MACHINE LEARNING GROUPING - phân nhóm thuật toán machine learning
Tùy tiêu chí lựa chọn mà có nhiều cách phân nhóm các thuật toán Machine Learning khác nhau.
A. PHÂN NHÓM THEO PHONG CÁCH HỌC TẬP
1/ Học có giám sát (Supervised Learning):

Trong thuật toán học có giám sát, dữ liệu đầu vào được gọi phải có nhãn (kết quả đã biết).
Trong đó, một mô hình được chuẩn bị thông qua một quá trình đào tạo. Ngoài ra, điều này cần thiết để đưa ra dự đoán. Và được sửa chữa khi những dự đoán đó là sai. Quá trình đào tạo tiếp tục cho đến khi mô hình đạt được mức độ mong muốn.
2/ Học tập không giám sát (Unsupervised Learning)

Trong cách học không giám sát này, dữ liệu đầu vào không được dán nhãn (không có kết quả đã biết).
Chúng ta phải chuẩn bị một mô hình bằng cách suy ra các cấu trúc có trong dữ liệu đầu vào. Điều này có thể là để trích xuất các quy tắc chung. Nó có thể thông qua một quá trình toán học để tối ưu nhất có thể.
3/ Học bán giám sát (Semi-supervised learning)

Dữ liệu đầu vào là một hỗn hợp của các ví dụ được dán nhãn và không nhãn.
Có một vấn đề dự đoán mong muốn. Nhưng mô hình phải học các cấu trúc để tổ chức dữ liệu cũng như đưa ra dự đoán.
B/ PHÂN NHÓM THEO SỰ TƯƠNG ĐỒNG
1/ Thuật toán hồi quy (Regression)

Thuật toán hồi quy liên quan đến việc mô hình hóa mối quan hệ giữa các biến. Chúng ta có thể tinh chỉnh bằng cách sử dụng phương pháp đo lỗi trong các dự đoán được đưa ra bởi mô hình.
2/ Thuật toán Instance-based

Đầu tiên cần xây dựng một cơ sở dữ liệu của dữ liệu mẫu. Và nó cần so sánh dữ liệu mới với cơ sở dữ liệu.
Để so sánh, chúng tôi sử dụng một biện pháp tương tự để tìm ra kết quả phù hợp nhất và đưa ra dự đoán. Vì lý do này, các phương thức dựa trên cá thể cũng được gọi là phương pháp học tập dựa trên bộ nhớ.
3/ Thuật toán chuẩn hóa (Regularization)

Đây là nhóm thuật toán bổ trợ. Tác dụng để loại bỏ các dư thừa dữ liệu và các lỗi khi thao tác dư thừa và các lỗi khi thao tác dữ liệu. Như cái tên của nó, dữ liệu sau khi được chuẩn hóa sẽ giúp các mô hình hoạt dộng hiệu quả hơn.
4/ Thuật toán cây quyết định (Decision Tree)

Phương pháp cây quyết định xây dựng một mô hình của các quyết định. Điều đó được thực hiện dựa trên giá trị thực tế của các thuộc tính trong dữ liệu.
Quyết định ngã ba trong cấu trúc cây cho đến khi quyết định dự đoán được đưa ra. Cây quyết định được huấn luyện về dữ liệu cho các vấn đề phân loại và hồi quy. Cây quyết định thường nhanh và chính xác và là một yêu thích lớn trong machine learning.
5/ Thuật toán Bayesian

Những phương pháp này là những phương pháp áp dụng Định lý Bayes cho các vấn đề. Chẳng hạn như phân loại và hồi quy.
6/ Thuật toán gom cụm (Clustering)

Clustering, giống như hồi quy, mô tả lớp vấn đề và lớp phương thức.
Các phương pháp Clustering được tổ chức theo các phương pháp mô hình hóa như dựa trên centroid và phân cấp. Tất cả các phương pháp đều liên quan đến việc sử dụng các cấu trúc vốn có trong dữ liệu. Đó là một nhu cầu tổ chức tốt nhất dữ liệu thành các nhóm phổ biến tối đa.
7/ Thuật toán học quy tắc kết hợp

Thuật toán học quy tắc kết hợp trích xuất quy tắc. Điều đó giải thích tốt nhất mối quan hệ giữa các biến trong dữ liệu.
Các quy tắc này có thể khám phá các sự kết hợp quan trọng và hữu ích trong các bộ dữ liệu đa chiều lớn.
8/ Thuật toán mạng nơ ron nhân tạo (ANN)

Đây là những mô hình được lấy cảm hứng từ cấu trúc của mạng lưới thần kinh sinh học.
Chúng là một lớp phù hợp với mô hình. Rằng chúng tôi sử dụng cho các vấn đề hồi quy và phân loại. Nó kết hợp hàng trăm thuật toán và biến thể.
9/ Thuật toán học sâu (Deep Learning)

Phương pháp Deep Learning là một bản cập nhật hiện đại cho Mạng nơ ron nhân tạo. Đó là khai thác việc tính toán giá rẻ dồi dào.
Chúng quan tâm đến việc xây dựng các mạng lưới thần kinh lớn hơn và phức tạp hơn nhiều.
10/ Thuật toán giảm kích thước

Giống như các phương pháp phân cụm, giảm kích thước tìm kiếm cấu trúc vốn có trong dữ liệu. Mặc dù, trong trường hợp này là để tóm tắt.
Nói chung, nó có thể hữu ích để trực quan hóa dữ liệu đa chiều. Ngoài ra, chúng ta có thể sử dụng nó trong một phương pháp học có giám sát. Nhiều phương pháp chúng tôi áp dụng để phân loại và hồi quy.
11/ Thuật toán tập hợp

Về cơ bản, các phương thức này là các mô hình bao gồm các mô hình yếu hơn. Ngoài ra, khi chúng được đào tạo và dự đoán của chúng được kết hợp theo một cách nào đó để đưa ra dự đoán.
Hơn nữa, nhiều nỗ lực được đưa vào loại học yếu để kết hợp và cách kết hợp chúng. Do đó, đây là một lớp kỹ thuật rất mạnh và như vậy là rất phổ biến.
_______________________________________________
Có tham khảo nguồn: https://nordiccoder.com/blog/phan-nhom-thuat-toan-machine-learning-nhung-dieu-ban-can-phai-biet/
Mọi người không hiểu chỗ nào hay có đóng góp gì cứ bình luận ở dưới mình sẽ giải đáp hoặc cùng nhau học tập nha.
Cảm ơn mọi người rất nhiều...! 💚💙💛
Nhận xét
Đăng nhận xét