Giới hạn của Việc Huấn luyện Trí tuệ Nhân tạo

Giới hạn của Việc Huấn luyện Trí tuệ Nhân tạo — và Cuộc đua Xây dựng “Trí tuệ Nhân tạo Phát triển”

Hiện nay có hai cuộc tranh luận lớn về việc huấn luyện trí tuệ nhân tạo, và chúng chỉ đến hai tương lai rất khác nhau:

Phương pháp Hiện tại

Một khi mô hình ngôn ngữ lớn (LLM) được huấn luyện, "bộ não" của nó基本 được cố định. Việc thêm kiến thức mới là cực kỳ hạn chế; các kỹ thuật như học tăng cường (RL) chỉ vá những mảnh nhỏ. Nếu bạn muốn mô hình trở nên thông minh hơn, bạn phải huấn luyện lại từ đầu.

Hãy tưởng tượng "tạo ra" một đứa trẻ 5 tuổi. Sau vài năm, bạn muốn một đứa trẻ 10 tuổi? Bạn cần tạo ra một đứa trẻ mới — hoặc mượn một đứa. Muốn một đứa trẻ 15 tuổi? Lặp lại.

Đương nhiên, điều đó không hiệu quả. Điều chúng ta thực sự muốn là tạo ra một đứa trẻ 5 tuổi và để nó học, phát triển, và tự nhiên trở thành 10, sau đó là 15. Không ai muốn sản xuất một đứa trẻ mới mỗi năm chỉ vì đứa trẻ cũ đã lỗi thời.

Phương pháp Mong muốn

Nhiều phòng thí nghiệm hàng đầu đang khám phá hướng này.

Mục tiêu là huấn luyện một mô hình cơ bản mạnh mẽ một lần, sau đó phát hành nó ra thế giới. Khi nó hoạt động, mô hình liên tục học, cải thiện, và nâng cấp khả năng nhận thức của mình.

Thỉnh thoảng, bạn áp dụng huấn luyện tăng dần trực tiếp vào mô hình đang chạy, thay vì thay thế nó bằng một mô hình hoàn toàn mới. Nói cách khác: tạo ra một "đứa trẻ trí tuệ nhân tạo" và để nó phát triển — thay vì sản xuất một đứa trẻ mới mỗi năm và loại bỏ đứa cũ.

Chúng ta đang ở đâu Ngày nay

Tất cả các công ty trí tuệ nhân tạo thương mại vẫn đang sử dụng phương pháp (1): sản xuất một mô hình mới mỗi năm, nghỉ hưu mô hình trước đó. Vẫn còn phòng để tối ưu hóa, nhưng tiềm năng phát triển sẽ đạt đến trần trong vài năm tới.

Một số phòng thí nghiệm uy tín đang theo đuổi phương pháp (2), nhưng chưa có đột phá nào xuất hiện — mặc dù một lượng lớn tiền đang chảy vào việc tìm kiếm này.

Nếu phương pháp mới này thành công, chi phí huấn luyện có thể giảm đáng kể. Huấn luyện tăng dần rẻ hơn nhiều so với huấn luyện lại hoàn toàn, và nó cuối cùng sẽ cho phép các mô hình tích lũy trí tuệ liên tục thay vì được xây dựng lại từ đầu mỗi chu kỳ.

Phương diện mới của trí tuệ nhân tạo không chỉ là "mô hình lớn hơn." Đó là mô hình có thể học như con người — liên tục, không cần khởi động lại, không cần bắt đầu lại mỗi năm.

Viết bởi Steven Nguyen

TÁC GIẢ

Về ABN Asia: Ai Base Network (ABN), ABN Asia được thành lập từ năm 2012, là một công ty xuất phát từ học thuật, do những giảng viên, cựu du học sinh Hungary, Hà Lan, Nga, Đức, và Nhật Bản sáng lập. Chúng tôi chia sẻ đam mê chung và tầm nhìn vững chắc về công nghệ, mang đến sự đổi mới và chất lượng đỉnh cao cho khách hàng. Phương châm của chúng tôi là: Tốt hơn. Nhanh hơn. An toàn hơn. Trong nhiều trường hợp: Rẻ hơn.

Hãy liên hệ với chúng tôi khi Quý doanh nghiệp có các nhu cầu về dịch vụ công nghệ thông tin, tư vấn chuyển đổi số, tìm kiếm các giải pháp phần mềm phù hợp, hoặc nếu Quý doanh nghiệp có đấu thầu CNTT (RFP) để chúng tôi tham dự. Quý doanh nghiệp có thể liên hệ với chúng tôi qua địa chỉ email [email protected]. Chúng tôi sẵn lòng hỗ trợ với mọi nhu cầu công nghệ của Quý doanh nghiệp.