Trong quá khứ, với phương pháp lập trình truyền thống (Rule-based programming), con người phải cung cấp dữ liệu và tự tay viết ra các quy tắc logic (các lệnh If-Else) để máy tính tính toán ra kết quả. Machine Learning (Học máy) ra đời đã lật ngược hoàn toàn phương trình này: con người chỉ cần cung cấp dữ liệu và kết quả mong muốn, máy tính sẽ tự động học hỏi để tìm ra quy luật ẩn bên trong.
Định nghĩa mang tính chuẩn mực và học thuật nhất về Machine Learning được Tom Mitchell (1997) phát biểu như sau: "Một chương trình máy tính được gọi là học từ kinh nghiệm (E) đối với một lớp nhiệm vụ (T) và độ đo hiệu suất (P), nếu hiệu suất của nó trên T - được đo bằng P - cải thiện theo kinh nghiệm (E)". Ví dụ, trong bài toán lọc email rác, "Nhiệm vụ T" là phân loại email, "Kinh nghiệm E" là việc quan sát hàng ngàn email đã được gắn nhãn trước đó, và "Hiệu suất P" là tỷ lệ phân loại chính xác; máy tính được coi là "học" thành công nếu càng phân tích nhiều email, tỷ lệ nhận diện đúng của nó càng tăng lên.
Machine Learning hiện đại được chia thành 4 nhánh chính dựa trên cách thức hệ thống tiếp nhận và xử lý dữ liệu:
Đây là phương pháp phổ biến nhất, trong đó mô hình được huấn luyện trên một tập dữ liệu đã được gán nhãn (labeled data). Nghĩa là với mỗi dữ liệu đầu vào (Input - X), chúng ta đã cung cấp sẵn cho máy tính câu trả lời đúng (Output - Y),. Quá trình này giống như việc học từ các bài tập mẫu đã có sẵn đáp án để tìm ra hàm ánh xạ $f(X) = Y$, từ đó dự báo cho các trường hợp mới trong tương lai.
Học có giám sát được chia thành hai bài toán cốt lõi:
Hồi quy (Regression): Áp dụng khi biến mục tiêu (Y) là một giá trị số thực liên tục. Các ứng dụng kinh tế điển hình bao gồm: dự báo giá nhà, ước tính doanh thu hoặc dự báo tăng trưởng GDP.
Phân lớp (Classification): Áp dụng khi biến mục tiêu (Y) là các nhãn danh mục rời rạc (ví dụ: Có/Không, A/B/C),. Trong tài chính, phân lớp thường dùng để chấm điểm tín dụng (dự báo vỡ nợ/không vỡ nợ), phát hiện gian lận thẻ tín dụng, hoặc nhận diện khách hàng rời bỏ dịch vụ.
Khác biệt hoàn toàn với học có giám sát, mô hình học không giám sát làm việc với các bộ dữ liệu hoàn toàn thô, không có nhãn đầu ra (unlabeled data),. Không có bất kỳ một "đáp án" nào được cung cấp trước, nhiệm vụ của thuật toán là tự động đo lường, phân tích các đặc trưng toán học để tự khám phá ra cấu trúc, quy luật tiềm ẩn bên trong dữ liệu,.
Hai ứng dụng mang lại giá trị kinh tế lớn nhất của phương pháp này gồm:
Phân cụm (Clustering): Gom các đối tượng có đặc điểm tương đồng vào cùng một nhóm, đồng thời tạo ra sự khác biệt tối đa giữa các nhóm. Ứng dụng phổ biến nhất là phân khúc khách hàng (Customer Segmentation) để phục vụ các chiến dịch marketing cá nhân hóa,.
Quy luật kết hợp (Association Rules): Tìm kiếm mối liên hệ đồng xuất hiện giữa các sự kiện hoặc sản phẩm. Ví dụ kinh điển là "Phân tích giỏ hàng" (Market Basket Analysis) giúp siêu thị nhận ra quy luật khách hàng mua bánh mì thường mua kèm theo bơ, từ đó tối ưu hóa chiến lược trưng bày và bán chéo (Cross-selling).
Đây là giải pháp cầu nối, được sử dụng trong các tình huống thực tế khi số lượng dữ liệu có nhãn rất khan hiếm và đắt đỏ để thu thập, trong khi dữ liệu thô (không nhãn) lại vô cùng dồi dào. Học bán giám sát tận dụng một lượng nhỏ dữ liệu đã dán nhãn kết hợp với lượng lớn dữ liệu không nhãn để huấn luyện mô hình, giúp doanh nghiệp tiết kiệm tối đa chi phí nhân sự dán nhãn dữ liệu thủ công (ví dụ trong phân tích hình ảnh y tế hoặc phân tích cảm xúc từ hàng triệu bình luận trên mạng xã hội).
Học tăng cường không học qua một tập dữ liệu tĩnh có sẵn, mà học qua cơ chế tương tác liên tục giữa một tác nhân (agent) và môi trường (environment),. Tại mỗi bước, tác nhân thực hiện một hành động và nhận lại một phần thưởng (Reward) hoặc hình phạt (Penalty). Thông qua quá trình Thử - Sai (Trial-and-Error) hàng triệu lần, hệ thống tự đúc kết ra một chiến lược (Policy) tối ưu nhằm thu về tổng phần thưởng tích lũy cao nhất trong dài hạn.
Trong nền kinh tế số, Học tăng cường là thuật toán lõi đứng sau các hệ thống Giao dịch thuật toán (Algorithmic Trading) tự động mua bán cổ phiếu, tối ưu hóa chuỗi cung ứng logistics theo thời gian thực, và tinh chỉnh các mô hình ngôn ngữ lớn như ChatGPT (RLHF - Học tăng cường từ phản hồi của con người).
Sự xuất hiện của Machine Learning không chỉ đơn thuần là sự nâng cấp về mặt công cụ IT, mà nó đánh dấu một cuộc cách mạng về tư duy quản trị kinh tế. Trong nền kinh tế số, lợi thế cạnh tranh của một doanh nghiệp không còn phụ thuộc vào quy mô tài sản hữu hình, mà nằm ở năng lực biến dữ liệu thành tri thức, biến tri thức thành dự báo và biến dự báo thành hành động chiến lược.
Bằng cách dịch chuyển từ phương pháp phân tích mô tả truyền thống (nhìn vào quá khứ xem chuyện gì đã xảy ra) sang năng lực dự báo chủ động (Predictive Analytics) bằng Học có giám sát, và khả năng khám phá thị trường (Exploratory Analytics) bằng Học không giám sát, Machine Learning giúp Ban lãnh đạo thiết lập một mô hình ra quyết định dựa trên bằng chứng dữ liệu (Data-driven decision making). Những tổ chức làm chủ được sự phân loại và ứng dụng đúng các thuật toán này sẽ nắm trong tay quyền lực để tối ưu hóa chuỗi giá trị, cá nhân hóa trải nghiệm khách hàng và quản trị rủi ro với độ chính xác vượt trội.