OpenAI o1: AI mới có thể nghĩ trước khi trả lời – Bước tiến trong tư duy hay chỉ là sự thổi phồng?

Pro

Lộc Nguyễn

(Chuyên gia phân tích tài chính chứng khoán)

M.AI tóm tắt

Giá Dầu 24h: Xem ngay!

#Chuyên gia

24HMONEY đã kiểm duyệt

14/09/2024

OpenAI o1: AI mới có thể nghĩ trước khi trả lời – Bước tiến trong tư duy hay chỉ là sự thổi phồng?

Đánh Giá Đầu Tiên Về OpenAI o1: AI Được Thiết Kế Để 'Suy Nghĩ' Trước Khi Trả Lời

OpenAI vừa ra mắt các mô hình o1 mới vào thứ Năm, mang đến cho người dùng ChatGPT cơ hội đầu tiên trải nghiệm mô hình AI có khả năng tạm dừng để "suy nghĩ" trước khi trả lời. Được biết đến với tên mã "Strawberry" bên trong OpenAI, o1 nhận được rất nhiều kỳ vọng. Nhưng liệu mô hình này có thực sự đáp ứng được sự kỳ vọng đó?

Có, nhưng chưa thực sự vượt trội.

So với GPT-4o, các mô hình o1 có vẻ như là một bước tiến trong việc giải quyết các câu hỏi phức tạp, nhưng đồng thời lại mang đến nhiều điểm hạn chế. Đáng chú ý, mô hình này có chi phí sử dụng gấp bốn lần so với GPT-4o. Mặc dù o1 xuất sắc trong việc suy luận và trả lời các câu hỏi phức tạp, nó lại thiếu các công cụ, khả năng đa phương tiện, và tốc độ mà GPT-4o từng gây ấn tượng. Thậm chí, OpenAI còn thừa nhận rằng "GPT-4o vẫn là lựa chọn tốt nhất cho hầu hết các câu hỏi" và lưu ý rằng o1 gặp khó khăn với các nhiệm vụ đơn giản.

AI tư duy từng bước: Điểm mạnh của o1

OpenAI o1 đặc biệt ở chỗ nó "suy nghĩ" trước khi trả lời, chia các vấn đề lớn thành các bước nhỏ và cố gắng nhận diện những bước đúng hoặc sai. Khả năng "suy luận đa bước" không phải hoàn toàn mới (đã được đề xuất từ nhiều năm trước), nhưng chưa thực sự khả thi cho đến gần đây.

"Đây là một bước tiến thú vị trong cộng đồng AI," Kian Katanforoosh, CEO của Workera và giảng viên tại Stanford, chia sẻ trong một cuộc phỏng vấn. "Nếu bạn có thể huấn luyện một thuật toán học tăng cường kết hợp với các kỹ thuật mô hình ngôn ngữ của OpenAI, bạn có thể tạo ra một AI có khả năng suy nghĩ từng bước và giúp giải quyết các ý tưởng lớn."

Chi phí đắt đỏ đi kèm sự cẩn trọng

Một trong những yếu tố đáng chú ý của OpenAI o1 chính là giá cả. Thông thường, bạn trả phí cho số lượng token đầu vào và đầu ra. Tuy nhiên, với o1, có một quá trình ẩn (các bước nhỏ mà mô hình chia nhỏ vấn đề lớn), và điều này tạo ra một khối lượng tính toán mà bạn không nhìn thấy. Điều này cũng làm tăng chi phí tính toán, và người dùng sẽ phải trả phí dưới dạng "token suy luận." Điều này cho thấy bạn cần thận trọng khi sử dụng o1 để tránh bị tính phí cao cho các câu hỏi đơn giản.

Hiệu suất thực tế của o1

Trong một thử nghiệm, tôi yêu cầu ChatGPT o1 hỗ trợ gia đình mình lên kế hoạch cho bữa tiệc Lễ Tạ Ơn. Sau 12 giây "suy nghĩ", o1 đã cung cấp cho tôi một câu trả lời chi tiết hơn 750 từ, với lời khuyên rằng hai lò nướng là đủ, miễn là có sự chiến lược. Nó cũng đề xuất cách quản lý không gian lò nướng và thậm chí gợi ý thuê một lò di động. Trong khi đó, GPT-4o chỉ đưa ra các câu trả lời đơn giản và yêu cầu tôi phải hỏi lại nhiều lần để có thông tin đầy đủ.

Tuy nhiên, với các câu hỏi đơn giản, o1 lại "quá đà." Khi tôi hỏi về việc tìm cây tuyết tùng ở Mỹ, o1 cung cấp một câu trả lời dài hơn 800 từ, bao gồm cả tên khoa học của từng loại cây. Trong khi đó, GPT-4o chỉ cần vài câu ngắn gọn để trả lời thắc mắc này.

Kỳ vọng và thực tế

Ngay từ đầu, Strawberry (tên mã của o1) đã không thực sự đáp ứng được mọi kỳ vọng. Các báo cáo về mô hình tư duy của OpenAI đã có từ tháng 11 năm 2023, khi mọi người đang tìm kiếm câu trả lời về sự ra đi của Sam Altman tại OpenAI. Điều này đã thổi bùng lên nhiều tin đồn, khiến một số người hy vọng rằng Strawberry là một dạng trí tuệ nhân tạo tổng quát (AGI), mục tiêu cuối cùng của OpenAI.

Kết luận

OpenAI o1 đại diện cho một bước tiến trong việc cải thiện khả năng suy luận của AI, giúp giải quyết các câu hỏi phức tạp. Tuy nhiên, với chi phí cao và khả năng "quá suy nghĩ" trong các nhiệm vụ đơn giản, nó chưa thực sự là lựa chọn tối ưu cho mọi tình huống. Dù vậy, trong việc giải quyết những câu hỏi lớn, mô hình này có thể là một công cụ đắc lực, đặc biệt khi người dùng cần tư duy từng bước để đạt được kết quả tốt hơn.

NQL STOCK