- Xuất bản vào
Bạn đã bao giờ tự hỏi: ChatGPT hoạt động như thế nào chưa?
- Tác giả
- Tên
- AbnAsia.org
- @steven_n_t
Hầu hết mọi người đều sử dụng ChatGPT! Nhưng bạn đã bao giờ tự hỏi — nó thực sự "HOẠT ĐỘNG" như thế nào chưa?
Dưới đây là một cái nhìn tổng quan đơn giản về những gì diễn ra bên trong một LLM — không cần bằng tiến sĩ. Hãy phân tích nó theo cách ĐƠN GIẢN: ⬇️
Vậy, mô hình học sâu thực sự là gì? Ở cốt lõi của nó, chỉ là toán học. Một mô hình học sâu nhận đầu vào — như văn bản hoặc hình ảnh — và chuyển đổi nó qua các lớp nơ-ron để tạo ra đầu ra. Mỗi lớp thêm một chút trừu tượng, định hình dữ liệu thô thành thông tin. Nó giống như một nhà máy — dữ liệu thô đi vào, trí tuệ đi ra.
Đầu vào & đầu ra thực sự có nghĩa là gì? Tất cả đều là con số bên trong. → Đầu vào: Từ ngữ, hình ảnh, âm thanh — được chuyển đổi thành vector. → Đầu ra: Một nhãn, một điểm số, một câu — cũng là con số. Mô hình học cách ánh xạ một cái với cái khác, giống như bạn học cách liên kết âm thanh với ý nghĩa.
Nhưng việc ánh xạ đó diễn ra như thế nào? Mỗi nút nhận đầu ra của lớp trước, nhân nó với một trọng số, thêm một độ lệch, và chuyển tiếp. Lặp lại qua các lớp và bạn có một chuỗi phức tạp của các phép toán — chuyển đổi đầu vào từng bước thành thứ gì đó có ý nghĩa. Đó là cấu trúc + logic + rất nhiều tính toán.
Chờ đã, làm thế nào mô hình "hiểu" một từ? Đó là nơi mà các mô hình nhúng xuất hiện. Chúng biến từ ngữ thành vector — các biểu diễn đa chiều của ý nghĩa. Vì vậy, "king" và "queen" kết thúc gần nhau trong không gian vector. Đó là cách AI nắm bắt ngữ cảnh, không chỉ là chính tả.
Được rồi, nhưng mô hình AI học như thế nào? Thông qua đào tạo. Nó bắt đầu với những dự đoán ngẫu nhiên. Sau đó, nó so sánh đầu ra của mình với câu trả lời đúng, xem nó sai lệch bao nhiêu, và điều chỉnh các trọng số nội bộ. Vòng phản hồi này được gọi là lan truyền ngược. Và khi bạn lặp lại điều này hàng triệu lần — mô hình bắt đầu trở nên rất tốt.
Còn AI tạo sinh thì sao? Đó là phép thuật đằng sau các công cụ như ChatGPT. Chúng không phân loại — chúng tạo ra. Từng từ (hoặc token) một, dự đoán những gì nên xuất hiện tiếp theo dựa trên mọi thứ đã có trước đó. Nó giống như tự động hoàn thành — nhưng với nhiều trí tuệ, sắc thái và đào tạo hơn rất nhiều.
Biểu đồ này là một viên ngọc 💎 cho những người mới bắt đầu với AI — hoặc thậm chí các chuyên gia cần giải thích đơn giản.
TÁC GIẢ
Về ABN Asia: AiUTOMATING PEOPLE, ABN Asia được thành lập từ năm 2012, là một công ty xuất phát từ học thuật, do những giảng viên, cựu du học sinh Hungary, Hà Lan, Nga, Đức, và Nhật Bản sáng lập. Chúng tôi chia sẻ đam mê chung và tầm nhìn vững chắc về công nghệ, mang đến sự đổi mới và chất lượng đỉnh cao cho khách hàng. Phương châm của chúng tôi là: Tốt hơn. Nhanh hơn. An toàn hơn. Trong nhiều trường hợp: Rẻ hơn.
Hãy liên hệ với chúng tôi khi Quý doanh nghiệp có các nhu cầu về dịch vụ công nghệ thông tin, tư vấn chuyển đổi số, tìm kiếm các giải pháp phần mềm phù hợp, hoặc nếu Quý doanh nghiệp có đấu thầu CNTT (RFP) để chúng tôi tham dự. Quý doanh nghiệp có thể liên hệ với chúng tôi qua địa chỉ email [email protected]. Chúng tôi sẵn lòng hỗ trợ với mọi nhu cầu công nghệ của Quý doanh nghiệp.
© ABN ASIA