Google giới thiệu Gemini 2.0: Kỷ nguyên AI đa phương thức

Google vừa chính thức công bố Gemini 2.0, thế hệ tiếp theo của mô hình trí tuệ nhân tạo (AI) đầy tham vọng, hứa hẹn mang đến những cải tiến vượt bậc so với các phiên bản trước đó và mở ra kỷ nguyên mới cho AI đa phương thức.

Gemini 2.0

Sự kiện này đánh dấu một cột mốc quan trọng, báo hiệu sự chuyển giao từ kỷ nguyên chatbot sang thời đại của các tác nhân AI (AI Agents) - những phần mềm thông minh có khả năng hoạt động tự chủ và thực hiện nhiều tác vụ thay cho con người.

Vậy Gemini 2.0 có gì đặc biệt?

Đa phương thức mạnh mẽ: Không chỉ xử lý văn bản, Gemini 2.0 còn có khả năng tạo và hiểu nội dung từ nhiều dạng dữ liệu khác nhau như hình ảnh, âm thanh và mã code. Điều này mở ra tiềm năng ứng dụng rộng lớn, từ việc tạo ra hình ảnh từ mô tả văn bản, phân tích nội dung video đến hỗ trợ lập trình.
Hiệu năng vượt trội: So với Gemini 1.5, phiên bản 2.0 được cải thiện đáng kể về hiệu năng, đặc biệt là phiên bản Gemini 2.0 Flash với tốc độ xử lý nhanh gấp đôi. Khả năng viết code (Python, Java, C++) và giải toán cũng được nâng cao đáng kể.
"Các tác nhân" (Agents): Điểm khác biệt then chốt của Gemini 2.0 so với các phiên bản trước nằm ở khái niệm "các tác nhân". Thay vì chỉ sắp xếp và hiểu thông tin, Gemini 2.0 hướng đến việc biến thông tin trở nên hữu ích hơn thông qua các tác nhân AI, có khả năng tương tác và thực hiện các nhiệm vụ phức tạp.
Project Astra: Một trong những ứng dụng nổi bật của Gemini 2.0 là Project Astra, một trợ lý AI toàn diện dành riêng cho điện thoại Android. Astra được tích hợp sâu vào các công cụ của Google như Search, Lens và Maps, mang lại trải nghiệm liền mạch và tiện lợi hơn cho người dùng.

Theo chia sẻ từ ông Demis Hassabis, CEO của Google DeepMind kiêm người đứng đầu bộ phận AI, Gemini 2.0 là thành quả của quá trình nghiên cứu và phát triển không ngừng nghỉ nhằm tạo ra một mô hình AI tổng quát và đa năng nhất từ trước đến nay. Phiên bản đầu tiên được giới thiệu là Gemini 2.0 Flash - một bản "xem trước thử nghiệm" với nhiều cải tiến vượt bậc so với tiền nhiệm Gemini 1.5. Cụ thể, Gemini 2.0 Flash sở hữu hiệu năng tương đương phiên bản Pro trước đó, nhưng lại có tốc độ xử lý nhanh gấp đôi và tối ưu hơn về mặt chi phí.

Google giới thiệu Gemini 2.0

Gemini 2.0 đánh dấu một bước tiến quan trọng trong lĩnh vực AI, mở ra kỷ nguyên của AI đa phương thức và các tác nhân thông minh. Với khả năng xử lý đa dạng các loại dữ liệu và hiệu năng vượt trội, Gemini 2.0 hứa hẹn sẽ mang lại những trải nghiệm mới mẻ và hữu ích cho người dùng trong tương lai.

Bên cạnh các nâng cấp về hiệu năng, điểm nhấn đáng chú ý nhất của Gemini 2.0 chính là khả năng tạo sinh nội dung đa phương tiện như văn bản, hình ảnh, âm thanh một cách tự nhiên, linh hoạt. Mô hình mới cũng thể hiện sự vượt trội trong việc hiểu và phân tích thông tin hình ảnh, video so với phiên bản trước. Những cải tiến này tạo tiền đề vững chắc cho việc phát triển và ứng dụng các tác nhân AI - điều mà Google tin rằng sẽ là tương lai của ngành công nghiệp công nghệ.

Việc Google tung ra Gemini 2.0 và đi tiên phong trong việc phát triển các tác nhân AI cho thấy tham vọng to lớn cũng như quyết tâm dẫn đầu cuộc chơi của họ. Đây được xem là nước cờ then chốt giúp Google cạnh tranh sòng phẳng với các ông lớn khác trong làng công nghệ như Microsoft, Amazon hay OpenAI. Theo dự kiến, Gemini 2.0 Flash sẽ sớm được tích hợp rộng rãi vào các nền tảng của Google từ đầu năm sau, hứa hẹn tác động mạnh mẽ và làm thay đổi bộ mặt ngành công nghiệp AI.

Xem nhiều

Google giới thiệu Gemini 2.0: Kỷ nguyên AI đa phương thức

Robot Tesla Optimus nhảy như dancer khiến giới công nghệ chấn động