Google ra mắt Gemini – mô hình AI 'mạnh hơn GPT-4'

google launches gemini ai model more powerful than gpt 4 657c97462dbf2 | Dang Ngoc Duy

Gemini ra mắt vào tối ngày 6/12, là mẫu AI tổng hợp và tiên tiến nhất của Google tính đến thời điểm hiện tại, cạnh tranh với GPT-4 của OpenAI.

Không giống như các mô hình ngôn ngữ lớn phổ biến khác trong thời gian gần đây, Gemini được xây dựng theo hướng đa phương thức, nghĩa là nó có thể khái quát, vận hành và kết hợp trên nhiều loại thông tin khác nhau bao gồm văn bản, mã và âm thanh. âm thanh, hình ảnh và video.

Để đáp ứng nhu cầu sử dụng linh hoạt, từ trung tâm dữ liệu đến thiết bị di động, Google cho biết Gemini 1.0 sẽ được cung cấp với ba kích cỡ khác nhau, bao gồm: Gemini Ultra, Gemini Pro và Gemini Nano. Trong số này, Gemini Ultra là mẫu có kích thước lớn nhất và mạnh mẽ nhất.

Correlating the three dimension versions of the Gemini AI model. Photo: Google

Tương quan các phiên bản ba chiều của mô hình Gemini AI. Hình chụp: Google

Theo kết quả kiểm tra do Google công bố, Gemini Ultra đạt điểm 90% trong bài kiểm tra Hiểu ngôn ngữ đa nhiệm quy mô lớn (MMLU – Massive Multitask Ngôn ngữ hiểu). Mô hình này sử dụng kết hợp 57 môn học như toán, vật lý, lịch sử, luật, y học và đạo đức để kiểm tra cả kiến thức thế giới lẫn khả năng giải quyết vấn đề, đồng thời có thể “sử dụng khả năng suy nghĩ cẩn thận hơn trước khi trả lời những câu hỏi khó của mình”. ”

Với kết quả này, Gemini là AI đầu tiên vượt qua con người ở cấp độ chuyên gia, đạt điểm 89,8% trong cùng bài kiểm tra. Kết quả GPT-4 là 87%, LLAMA-2 đạt 68% và Claude 2 của Anthropic đạt 78,5%.

Ngoài ra, phiên bản mạnh nhất này của Gemini còn vượt 30/32 tiêu chuẩn về nghiên cứu và phát triển mô hình ngôn ngữ lớn, đạt 59,4% ở khả năng MMMU (hiểu đa phương thức lớn về hiểu đa phương thức). ngành), bao gồm các nhiệm vụ đa phương thức trải rộng trên các lĩnh vực khác nhau đòi hỏi phải suy luận có chủ ý.

Demis Hassabis, CEO của Google DeepMind, đại diện của Gemini Team, cho biết công ty muốn xây dựng một thế hệ mô hình AI mới lấy cảm hứng từ cách con người nhận biết và tương tác với thế giới. Nhờ đó, AI sẽ không chỉ dừng lại là phần mềm thông minh mà có thể trở nên hữu ích và trực quan hơn, tương tự như một đối tác của người dùng.

Hassabis cho biết: “Hôm nay, chúng tôi tiến một bước gần hơn tới tầm nhìn này bằng cách giới thiệu Gemini, mô hình AI tổng quát và tiên tiến nhất từng được Google phát triển”.

Ngoài hiệu suất mạnh mẽ, Google cho biết Gemini 1.0 còn được đào tạo để nhận dạng văn bản, hình ảnh, âm thanh và hơn thế nữa cùng lúc, giúp nó hiểu rõ hơn về thông tin có nhiều sắc thái và phản hồi. Các câu hỏi liên quan đến chủ đề phức tạp. Mô hình này cũng có thể được diễn giải và mã hóa bằng các ngôn ngữ lập trình phổ biến hiện nay như Python, Java, C++ và Golang.

Illustration of the types of information that Gemini can process, such as: text, photos, sounds, videos. Photo: Google

Minh họa các loại thông tin mà Song Tử có thể xử lý như: văn bản, hình ảnh, âm thanh, video. Hình chụp: Google

Theo Google, những tính năng này giúp Gemini đọc và trích xuất thông tin từ hàng trăm nghìn tài liệu, từ đó mở ra khả năng tạo ra những đột phá mới trong nhiều lĩnh vực, từ khoa học đến tài chính trong thời gian ngắn. .

Trong buổi ra mắt, Google cho biết phiên bản Gemini Ultra là phiên bản dành cho những tác vụ phức tạp nhất và đang trong quá trình hoàn tất thử nghiệm an toàn trước khi ra mắt chính thức. . Gemini Nano là phiên bản dành cho các tác vụ thực hiện trên thiết bị di động sẽ được trang bị trên Pixel 8 Pro. Khi đó, điện thoại sẽ có thêm một số tính năng như tóm tắt nội dung ghi và trả lời thông minh trên bàn phím Gboard. Hai phiên bản Gemini này sẽ được tung ra thị trường vào năm sau.

Trong khi đó, phiên bản Pro hiện được sử dụng trong chatbot Bard. Người dùng có thể trải nghiệm những thay đổi thông qua một số yêu cầu đọc hiểu, tóm tắt, lập luận, lập trình và lập kế hoạch.

Đây cũng là lần nâng cấp lớn nhất của Bard kể từ khi ra mắt. Tuy nhiên, Bard sử dụng Gemini Pro hiện chỉ hỗ trợ tiếng Anh và có thể sử dụng ở 180 quốc gia và vùng lãnh thổ. Google cho biết sẽ mở rộng ngôn ngữ cho Bard trong thời gian tới. Năm sau Bard sẽ được nâng cấp và sử dụng phiên bản mạnh nhất của Gemini Ultra.

Lưu Quý

Trả lời

viVI