Review Grok 3: liệu có phải là AI thông minh nhất hiện nay?

Vào ngày 18/02/2025, Andrej Karpathy – nhà sáng lập Eureka Labs và cựu thành viên của OpenAI, cựu giám đốc AI của Tesla – đã chia sẻ trải nghiệm ban đầu với Grok 3, chatbot AI mới nhất từ xAI, công ty do Elon Musk sáng lập. Trong bài đăng trên X, Karpathy khẳng định Grok 3 xAI có khả năng vượt trội, sánh ngang hoặc thậm chí vượt qua các mô hình AI hàng đầu như OpenAI’s o1-pro ($200/tháng), DeepSeek-R1, và Gemini 2.0 Flash Thinking. Với tuyên bố mạnh mẽ rằng đây là “AI thông minh nhất trên Trái Đất,” Grok 3 đang tạo nên làn sóng lớn trong cộng đồng công nghệ.

Mục Lục

Tại Sao Grok 3 Gây Chú Ý?

Grok 3 được ra mắt vào ngày 17/02/2025, đánh dấu một cột mốc quan trọng trong cuộc đua trí tuệ nhân tạo (AI). Elon Musk và đội ngũ xAI đã sử dụng siêu máy tính Colossus tại Memphis – với 200.000 GPU Nvidia H100 – để đào tạo mẫu AI này, khẳng định tốc độ và hiệu suất vượt bậc. Karpathy đã thử nghiệm Grok 3 trong hơn 2 giờ, tập trung vào các bài kiểm tra lý luận, toán học, lập trình, và tìm kiếm, với những kết quả ấn tượng:

Lý luận nâng cao: Grok 3 giải quyết tốt câu hỏi về tạo lưới lục giác (hex grid) cho trò chơi Settlers of Catan, một nhiệm vụ mà nhiều mô hình AI khác như DeepSeek-R1 hay Claude 3.5 Sonnet không thể thực hiện chính xác.
Tính toán phức tạp: Khi phân tích tài liệu GPT-2 của OpenAI, Grok 3 ước tính số lượng FLOPs cần để huấn luyện mô hình, vượt qua cả o1-pro của OpenAI khi bật chế độ “Thinking” (lý luận).
Deep Search: Tính năng mới của Grok 3, Deep Search, cung cấp khả năng tìm kiếm thông minh, cạnh tranh với OpenAI và Perplexity, trả lời các câu hỏi như “Tin đồn về sự kiện ra mắt Apple sắp tới?” hoặc “Tại sao cổ phiếu Palantir tăng mạnh gần đây?”

Xem Thêm: NVIDIA mua lại VinBrain: bước đi chiến lược thúc đẩy AI và Y Tế

Tuy nhiên, Grok 3 vẫn có một số hạn chế, như khó xử lý các câu đố emoji phức tạp hoặc tạo ra nội dung hài hước, một thách thức chung của các mô hình AI hiện nay.

grok-3-vs-chatgpt-gemini-deepseek-scaled

So Sánh Grok 3 với Các Mô Hình AI Khác

Karpathy đánh giá Grok 3 xAI có hiệu suất tương đương hoặc nhỉnh hơn so với OpenAI’s o1-pro, nhưng vượt trội hơn DeepSeek-R1 và Gemini 2.0 Flash Thinking. Dưới đây là một số điểm nổi bật:

Toán học và khoa học: Grok 3 giải quyết tốt các bài toán cờ ca-rô (tic-tac-toe) và câu hỏi về lực hấp dẫn sao Hỏa, nhưng thất bại khi tạo các bảng cờ ca-rô “khó.”
Lập trình: Mô hình tạo mã SVG cho hình ảnh “con cò đạp xe đạp” khá tốt, dù không hoàn hảo so với Claude 3.5 Sonnet – mẫu có khả năng SVG vượt trội.
Tìm kiếm thông minh: Deep Search của Grok 3 ngang ngửa với Perplexity DeepResearch nhưng chưa đạt đến độ chính xác và độ tin cậy của OpenAI Deep Research, với một số trường hợp đưa ra thông tin sai hoặc không trích dẫn nguồn.

Dù vậy, Karpathy nhấn mạnh rằng xAI chỉ bắt đầu từ con số 0 cách đây khoảng 1 năm, và việc đạt đến trình độ này là “chưa từng có tiền lệ” trong ngành AI.

Tính Năng Đột Phá của Grok 3: Deep Search và Lý Luận Nâng Cao

Một trong những điểm sáng của Grok 3 là tính năng Deep Search – công cụ tìm kiếm AI dựa trên lý luận, giúp người dùng trả lời các câu hỏi nghiên cứu phức tạp. Ví dụ, Grok 3 có thể:

Cung cấp thông tin chi tiết về tin đồn Apple, xu hướng cổ phiếu Palantir, hoặc địa điểm quay phim của White Lotus 3.
Tạo báo cáo về các phòng thí nghiệm AI lớn (dù lỡ bỏ sót xAI trong danh sách, cho thấy vẫn còn hạn chế).

Xem Thêm: ChatGPT là gì? Chia sẻ account ChatGPT miễn phí

Chế độ “Thinking” của Grok 3 cho phép mô hình trình bày quy trình lý luận, giống như cách con người suy nghĩ, giúp giải quyết các vấn đề toán học và khoa học phức tạp một cách rõ ràng.

Hạn Chế & Những Điểm Cần Cải Thiện

Dù ấn tượng, Grok 3 xAI vẫn có một số điểm cần khắc phục:

Hài hước: Mô hình gặp khó khăn trong việc tạo nội dung hài hước, với các câu đùa như “Tại sao gà gia nhập ban nhạc? Vì nó có đùi gà và muốn trở thành ngôi sao cluck!” được đánh giá là chưa đủ sáng tạo.
Đạo đức: Grok 3 có xu hướng quá nhạy cảm với các vấn đề đạo đức, từ chối trả lời một số câu hỏi “nhạy cảm” dù có ý nghĩa thực tiễn.
Hallucination: Một số URL và thông tin thực tế mà Deep Search cung cấp là sai hoặc không có nguồn trích dẫn.

Grok 3 và Tương Lai của Trí Tuệ Nhân Tạo

Sự ra mắt của Grok 3 vào năm 2025 đánh dấu bước tiến lớn của xAI trong cuộc đua AI chatbot. Với sự hỗ trợ từ siêu máy tính Colossus và kế hoạch nâng cấp lên GPU Nvidia H200, xAI đang chứng minh khả năng cạnh tranh với OpenAI (GPT-4.5, GPT-5 sắp tới) và các đối thủ như DeepSeek, Google, hay Anthropic.

Karpathy kết luận rằng Grok 3 + Thinking “đang ở mức hàng đầu thế giới,” nhưng cần thêm thời gian và đánh giá thực tế để xác nhận. Ông cũng ca ngợi tốc độ phát triển của xAI, chỉ sau 1 năm đã đạt đến trình độ này, và dự đoán cần những “bước đột phá lớn” tiếp theo để tiến gần hơn đến AGI (trí tuệ nhân tạo tổng quát).

Xem Thêm: Grok Vision - AI của Elon Musk đã có thể "nghe nhìn" thế giới xung quanh

06/03/2025 update: giá gói Super Grok là $30/tháng.

Kết Luận: Grok 3 – Lựa Chọn Hàng Đầu cho AI vào Năm 2025?

Grok 3 xAI không chỉ là một chatbot AI, mà còn là biểu tượng của sự tiến bộ trong trí tuệ nhân tạo. Với giá đăng ký Premium+ $40/tháng, người dùng có thể trải nghiệm toàn bộ khả năng của Grok 3 mà không giới hạn thời gian, cạnh tranh trực tiếp với OpenAI và các nền tảng khác.

Nếu bạn quan tâm đến AI chatbot, bảng xếp hạng AI, hoặc công nghệ xAI, Grok 3 chắc chắn là một cái tên đáng theo dõi. Theo dõi các cập nhật mới nhất từ xAI và Elon Musk để không bỏ lỡ những cải tiến tiếp theo!