Các Mô Hình Ngôn Ngữ Lớn Sẽ Không Bao Giờ Thông Minh, Chuyên Gia Nói

Các mô hình ngôn ngữ lớn (LLM) chỉ đơn giản là các công cụ mô phỏng chức năng giao tiếp của ngôn ngữ.

Liệu các công ty công nghệ có đang ở trên ngưỡng tạo ra các máy tính có khả năng suy nghĩ với các mô hình AI tuyệt vời của họ, như các giám đốc điều hành hàng đầu tuyên bố? Không theo một chuyên gia.

Con người chúng ta có xu hướng liên kết ngôn ngữ với trí thông minh. Chúng ta có xu hướng bị thu hút bởi những người có kỹ năng ngôn ngữ lớn hơn như những người nói chuyện hoặc nhà văn.

Nhưng nghiên cứu mới nhất cho thấy ngôn ngữ không phải là trí thông minh, theo Benjamin Riley, người sáng lập công ty Cognitive Resonance, trong một bài viết trên The Verge. Và đó là tin xấu cho ngành công nghiệp AI, đang đặt hy vọng và giấc mơ tạo ra một trí thông minh nhân tạo tổng quát, hoặc AGI, trên kiến trúc mô hình ngôn ngữ lớn mà họ đang sử dụng.

"Vấn đề là theo khoa học thần kinh hiện tại, suy nghĩ của con người chủ yếu độc lập với ngôn ngữ của con người - và chúng ta không có lý do để tin rằng việc mô hình hóa ngôn ngữ tinh vi hơn sẽ tạo ra một hình thức trí thông minh đáp ứng hoặc vượt qua trí thông minh của chúng ta", Riley viết. "Chúng ta sử dụng ngôn ngữ để suy nghĩ, nhưng điều đó không làm cho ngôn ngữ giống như suy nghĩ. Hiểu được sự khác biệt này là chìa khóa để phân biệt sự thật khoa học với khoa học viễn tưởng mang tính suy đoán của các CEO say mê AI."

AGI, để làm rõ, sẽ là một hệ thống AI toàn diện có khả năng bằng hoặc vượt qua nhận thức của con người trong nhiều nhiệm vụ khác nhau. Nhưng trong thực tế, nó thường được hình dung như một giải pháp giúp giải quyết tất cả các vấn đề lớn nhất mà loài người không thể, từ ung thư đến biến đổi khí hậu. Và bằng cách nói rằng họ đang tạo ra một hệ thống như vậy, các nhà lãnh đạo AI có thể biện minh cho chi tiêu quá mức và tác động môi trường thảm khốc của ngành công nghiệp.

Một phần lý do tại sao chi tiêu vốn của AI đã quá mức là do sự ám ảnh với việc mở rộng quy mô: bằng cách cung cấp cho các mô hình AI nhiều dữ liệu hơn và cung cấp năng lượng cho chúng với số lượng GPU ngày càng tăng, các công ty AI đã làm cho các mô hình của họ trở thành những người giải quyết vấn đề tốt hơn và giống con người hơn trong khả năng tham gia vào một cuộc trò chuyện.

Nhưng "các mô hình ngôn ngữ lớn chỉ đơn giản là các công cụ mô phỏng chức năng giao tiếp của ngôn ngữ, không phải là quá trình nhận thức và suy luận riêng biệt và khác biệt, bất kể chúng ta xây dựng bao nhiêu trung tâm dữ liệu", Riley viết.

Nếu ngôn ngữ là thiết yếu cho suy nghĩ, thì việc loại bỏ nó sẽ loại bỏ khả năng suy nghĩ của chúng ta. Nhưng điều này không xảy ra, Riley chỉ ra, trích dẫn nhiều thập kỷ nghiên cứu được tóm tắt trong một bài bình luận được xuất bản trên tạp chí Nature vào năm ngoái.

Ví dụ, hình ảnh cộng hưởng từ chức năng (fMRI) của não người đã chỉ ra rằng các phần khác nhau của não được kích hoạt trong các hoạt động nhận thức khác nhau, Riley lưu ý. Chúng ta không tuyển dụng cùng một vùng nơ-ron khi suy nghĩ về một vấn đề toán học so với một vấn đề ngôn ngữ. Trong khi đó, các nghiên cứu về những người mất khả năng ngôn ngữ cho thấy khả năng suy nghĩ của họ chủ yếu không bị ảnh hưởng, vì họ vẫn có thể giải quyết các vấn đề toán học, tuân theo các hướng dẫn phi ngôn ngữ và hiểu cảm xúc của người khác.

Thậm chí một số nhân vật hàng đầu trong lĩnh vực AI cũng hoài nghi về các mô hình ngôn ngữ lớn. Người nổi tiếng nhất trong số đó là người đoạt giải Turing và "cha đẻ" của AI hiện đại Yann LeCun, người cho đến gần đây là nhà khoa học hàng đầu về AI của Meta. LeCun đã lập luận trong một thời gian dài rằng các mô hình ngôn ngữ lớn sẽ không bao giờ đạt được trí thông minh tổng quát, và thay vào đó tin rằng nên theo đuổi các mô hình "thế giới" được thiết kế để hiểu thế giới ba chiều bằng cách đào tạo chúng trên nhiều loại dữ liệu vật lý, chứ không chỉ ngôn ngữ. Có khả năng quan điểm này đã dẫn đến việc ông rời đi gần đây; mặc dù LeCun có vị trí như vậy, nhưng CEO Mark Zuckerberg của Meta đã chuyển sang đầu tư hàng tỷ đô la vào một bộ phận AI mới để tạo ra một "siêu trí thông minh" nhân tạo bằng công nghệ mô hình ngôn ngữ lớn.

Các nghiên cứu khác cũng bổ sung cho ý tưởng rằng các mô hình ngôn ngữ lớn có một trần giới hạn. Trong một phân tích mới được xuất bản trên Tạp chí Hành vi Sáng tạo, một nhà nghiên cứu đã sử dụng một công thức toán học để xác định giới hạn "sáng tạo" của AI, với kết quả đáng thất vọng. Vì các mô hình ngôn ngữ lớn là một hệ thống xác suất, chúng đạt đến một điểm mà chúng không còn có khả năng tạo ra các đầu ra mới và độc đáo mà không vô nghĩa. Do đó, nghiên cứu kết luận rằng ngay cả những hệ thống AI tốt nhất sẽ không bao giờ là gì hơn là những nghệ sĩ phục vụ có thể viết cho bạn một email hay.

"Trong khi AI có thể bắt chước hành vi sáng tạo - khá thuyết phục vào một số thời điểm - khả năng sáng tạo thực sự của nó bị giới hạn ở mức của một con người trung bình và không bao giờ đạt được tiêu chuẩn chuyên nghiệp hoặc chuyên gia theo các nguyên tắc thiết kế hiện tại", tác giả nghiên cứu David H Cropley, giáo sư về đổi mới kỹ thuật tại Đại học Nam Úc, cho biết trong một tuyên bố về công việc.

"Một nhà văn, nghệ sĩ hoặc nhà thiết kế có tay nghề cao có thể thỉnh thoảng tạo ra điều gì đó thực sự nguyên bản và hiệu quả", Cropley thêm. "Một mô hình ngôn ngữ lớn không bao giờ làm được. Nó sẽ luôn tạo ra điều gì đó trung bình, và nếu các ngành công nghiệp phụ thuộc quá nhiều vào nó, họ sẽ kết thúc với công việc theo công thức và lặp đi lặp lại."

Điều đó không phải là một điềm báo hứa hẹn nếu AI được hỗ trợ bởi mô hình ngôn ngữ lớn được cho là sẽ nghĩ ra những đổi mới mới và đẩy giới hạn hiểu biết của chúng ta về thế giới. Làm thế nào nó có thể "phát minh ra vật lý mới", như Elon Musk nói, hoặc giải quyết cuộc khủng hoảng khí hậu, như CEO OpenAI Sam Altman đã gợi ý, nếu công nghệ gặp khó khăn trong việc tạo ra các câu mới không dựa trên văn bản hiện có?

"Vâng, một hệ thống AI có thể trộn và tái chế kiến thức của chúng ta theo những cách thú vị", Riley viết. "Nhưng đó là tất cả những gì nó có thể làm. Nó sẽ bị mắc kẹt mãi mãi trong từ vựng mà chúng ta đã mã hóa trong dữ liệu và đào tạo nó - một máy ẩn dụ chết.

TÁC GIẢ

Về ABN Asia: Ai Base Network (ABN), ABN Asia được thành lập từ năm 2012, là một công ty xuất phát từ học thuật, do những giảng viên, cựu du học sinh Hungary, Hà Lan, Nga, Đức, và Nhật Bản sáng lập. Chúng tôi chia sẻ đam mê chung và tầm nhìn vững chắc về công nghệ, mang đến sự đổi mới và chất lượng đỉnh cao cho khách hàng. Phương châm của chúng tôi là: Tốt hơn. Nhanh hơn. An toàn hơn. Trong nhiều trường hợp: Rẻ hơn.

Hãy liên hệ với chúng tôi khi Quý doanh nghiệp có các nhu cầu về dịch vụ công nghệ thông tin, tư vấn chuyển đổi số, tìm kiếm các giải pháp phần mềm phù hợp, hoặc nếu Quý doanh nghiệp có đấu thầu CNTT (RFP) để chúng tôi tham dự. Quý doanh nghiệp có thể liên hệ với chúng tôi qua địa chỉ email [email protected]. Chúng tôi sẵn lòng hỗ trợ với mọi nhu cầu công nghệ của Quý doanh nghiệp.