- Gemini – Siêu AI mới của Google
- Tìm kiếm bằng video trong Google Lens
- Phiên bản Gemini 1.5 Flash hiệu suất nhanh và mạnh hơn
- Tạo video thông qua văn bản với VEO
- Nâng cấp công cụ tìm kiếm Google Search bằng AI
- Tính năng Ask Photos hỗ trợ giải đáp về hình ảnh trong thư viện
- Circle to Search – giải toán thông minh bằng AI
- Gemini Live trò chuyện thông minh và mượt mà hơn
- Trình duyệt Chrome bổ sung trợ lý ảo AI
- Phát hiện cuộc gọi lừa đảo trên Android thông qua AI
Gemini – Siêu AI mới của Google
Gemini là mô hình AI đa năng mới nhất của Google, được thiết kế để vượt trội trong nhiều lĩnh vực khác nhau. Nó được xây dựng dựa trên kiến trúc transformer tiên tiến và được đào tạo trên một tập dữ liệu đa dạng, bao gồm văn bản, hình ảnh, âm thanh và video.
Một số tính năng nổi bật của Gemini có thể kể tới:
- Khả năng hiểu và tạo ra nội dung đa phương tiện như hình ảnh, video, bảng biểu,…
- Cải thiện đáng kể trong việc hiểu ngữ cảnh và ý định của người dùng. Thông qua đó, kết quả phản hồi có tính chính xác cao hơn, đáp ứng đúng nhu cầu người dùng.
- Khả năng thực hiện các tác vụ phức tạp đòi hỏi suy luận và lập luận
- Tích hợp liền mạch với các sản phẩm khác của Google như Search, Assistant và Cloud, mang đến trải nghiệm người dùng tốt hơn khi tìm kiếm, cần hỗ trợ từ trợ lý ảo và làm việc trên đám
Với tiềm năng to lớn, Gemini có thể được triển khai trong nhiều ứng dụng đa dạng. Từ trợ lý ảo cá nhân hỗ trợ cuộc sống hàng ngày (lên lịch trình cá nhân, search thông tin, dịch thuật, giải trí) đến các công cụ phân tích dữ liệu phức tạp ( phân tích xu hướng, tự động hoá quy trình làm việc, sáng tạo nội dung) phục vụ cho hoạt động kinh doanh của doanh nghiệp.
Tìm kiếm bằng video trong Google Lens
Trong bản cập nhật về AI gần đây, Google Lens đã mở rộng khả năng của mình bằng cách thêm tính năng tìm kiếm bằng video. Điều này cho phép người dùng:
- Quét các đoạn video để nhận dạng đối tượng, địa điểm hoặc văn bản xuất hiện trong video
- Tìm kiếm thông tin liên quan đến nội dung xuất hiện trong video
- Trích xuất và dịch văn bản từ video trong thời gian thực
- Nhận gợi ý về các video tương tự hoặc liên quan dựa trên nội dung
Tính năng này đặc biệt hữu ích cho các nhà sáng tạo nội dung, nhà nghiên cứu và người dùng thông thường muốn khai thác thông tin từ nội dung video.
Phiên bản Gemini 1.5 Flash hiệu suất nhanh và mạnh hơn
Gemini 1.5 Flash là phiên bản mới nhất của mô hình ngôn ngữ lớn Gemini do Google phát triển. Đây là một bản nâng cấp đáng kể so với phiên bản gốc, mang lại nhiều cải tiến như:
- Tốc độ xử lý nhanh hơn, cho phép phản hồi gần như tức thì với các truy vấn phức tạp
- Khả năng xử lý đồng thời nhiều luồng dữ liệu, cải thiện hiệu suất trong các tác vụ đa nhiệm
- Tối ưu hóa sử dụng bộ nhớ, cho phép xử lý các tập dữ liệu lớn hơn
- Cải thiện độ chính xác trong các tác vụ như dịch thuật, tóm tắt và tạo nội dung
- Khả năng học liên tục, cho phép mô hình cập nhật kiến thức của mình dựa trên dữ liệu mới
Với những cải tiến vượt trội này, Gemini 1.5 Flash có thể được triển khai linh hoạt trên nhiều thiết bị. Từ điện thoại thông minh đến máy chủ doanh nghiệp, Gemini 1.5 Flash mang lại trải nghiệm AI mạnh mẽ và nhanh nhạy hơn cho người dùng ở mọi quy mô.
Tạo video thông qua văn bản với VEO
VEO (Video Engine Optimizer) là công cụ AI mới của Google cho phép tạo video từ mô tả văn bản. Công cụ này sử dụng các mô hình học sâu phức tạp để hiểu ý nghĩa của văn bản và chuyển đổi nó thành các hình ảnh động, âm thanh và chuyển cảnh phù hợp. Các tính năng chính bao gồm:
- Tạo video ngắn hoặc dài dựa trên kịch bản văn bản
- Tùy chỉnh phong cách hình ảnh, âm thanh và chuyển động
- Tích hợp với thư viện nội dung phong phú của Google để thêm hình ảnh, video clip và âm nhạc
- Khả năng chỉnh sửa và tinh chỉnh video được tạo ra
- Hỗ trợ xuất video ở nhiều định dạng và độ phân giải khác nhau
Sự ra đời của VEO hứa hẹn sẽ cách mạng hóa cách tạo nội dung video. Đặc biệt với các doanh nghiệp nhỏ, nhà giáo dục và người sáng tạo nội dung cá nhân, VEO giúp tiết kiệm đáng kể thời gian và công sức trong quá trình sản xuất video chuyên nghiệp.
Nâng cấp công cụ tìm kiếm Google Search bằng AI
Google đang tích hợp AI sâu hơn vào công cụ tìm kiếm của mình, mang lại nhiều cải tiến như:
- Hiểu ngữ cảnh và ý định tìm kiếm tốt hơn, dẫn đến kết quả chính xác hơn
- Cung cấp tóm tắt thông minh của thông tin từ nhiều nguồn
- Tích hợp tìm kiếm đa phương tiện, cho phép tìm kiếm bằng hình ảnh, âm thanh và video
- Cá nhân hóa kết quả tìm kiếm dựa trên lịch sử và sở thích của người dùng
- Hỗ trợ trò chuyện tương tác để tinh chỉnh tìm kiếm và đào sâu vào chủ đề
Tính năng Ask Photos hỗ trợ giải đáp về hình ảnh trong thư viện
Ask Photos là một tính năng mới đầy hứa hẹn được tích hợp vào ứng dụng Google Photos,. Nó cho phép người dùng tương tác trực tiếp với kho ảnh của mình thông qua các câu hỏi. Cụ thể:
- Người dùng có thể hỏi về địa điểm, đối tượng, sự kiện hoặc bất kỳ chi tiết nào trong ảnh
- AI sẽ phân tích hình ảnh và cung cấp thông tin chi tiết dựa trên nội dung và metadata
- Tính năng này có thể giúp người dùng tìm kiếm và tổ chức ảnh hiệu quả hơn
- Nó cũng có thể cung cấp thông tin bổ sung về các địa điểm hoặc đối tượng trong ảnh
Các tính năng này giúp người dùng tìm kiếm và tổ chức ảnh hiệu quả hơn. Bên cạnh đó, nó còn có thể cung cấp thông tin bổ sung thú vị về các địa điểm hoặc đối tượng trong ảnh, mở ra những khám phá bất ngờ từ chính bộ sưu tập cá nhân của bạn.
Circle to Search – giải toán thông minh bằng AI
Circle to Search là một công cụ mới cho phép người dùng giải các bài toán bằng cách vẽ vòng tròn quanh phần họ cần giải đáp. Đây là một bước tiến lớn trong việc ứng dụng AI vào giáo dục, giúp việc học toán trở nên thú vị và dễ tiếp cận hơn. Tính năng này không chỉ cung cấp đáp án mà còn giải thích chi tiết các bước giải, giúp người dùng hiểu rõ bản chất vấn đề và cải thiện khả năng tư duy logic.
- Người dùng có thể vẽ vòng tròn quanh một phương trình hoặc bài toán trên màn hình
- AI sẽ nhận diện và giải bài toán, cung cấp các bước giải chi tiết
- Tính năng này hỗ trợ nhiều loại toán học, từ số học cơ bản đến đại số và hình học phức tạp
- Có thể được sử dụng trên nhiều ứng dụng và nền tảng khác nhau của Google
Gemini Live trò chuyện thông minh và mượt mà hơn
Gemini Live đã được nâng cấp đáng kể, mang đến trải nghiệm trò chuyện tự nhiên và mượt mà hơn, gần giống với giao tiếp giữa người với người:
- Có khả năng hiểu ngữ cảnh và duy trì cuộc trò chuyện dài hơn
- Hỗ trợ đa phương tiện, cho phép người dùng tương tác bằng giọng nói, văn bản và hình ảnh
- Tích hợp với các dịch vụ khác của Google để cung cấp thông tin và thực hiện tác vụ một cách liền mạch
Gemini Live là minh chứng cho sự tiến bộ vượt bậc của công nghệ xử lý ngôn ngữ tự nhiên. Với khả năng hiểu ngữ cảnh và tương tác đa phương tiện, Gemini Live không chỉ là một trợ lý ảo thông minh mà còn là một người bạn đồng hành thú vị, sẵn sàng hỗ trợ và trò chuyện cùng người dùng.
Trình duyệt Chrome bổ sung trợ lý ảo AI
Google đã nâng cấp trải nghiệm duyệt web trên Chrome bằng việc tích hợp một trợ lý ảo AI thông minh. Trợ lý ảo AI của Google Chrome đáp ứng nhiều tác vụ đa dạng như:
- Giúp tìm kiếm thông tin, tóm tắt nội dung trang web, và trả lời câu hỏi
- Hỗ trợ dịch thuật tức thì và giải thích các thuật ngữ phức tạp
- Có khả năng đề xuất các trang web liên quan hoặc nguồn thông tin bổ sung
- Tích hợp với các tính năng bảo mật của Chrome để đảm bảo quyền riêng tư của người dùng
Phát hiện cuộc gọi lừa đảo trên Android thông qua AI
Google đang nỗ lực bảo vệ người dùng Android khỏi nạn lừa đảo ngày càng tinh vi bằng cách phát triển một hệ thống AI tiên tiến. Hệ thống này có khả năng phát hiện và cảnh báo các cuộc gọi đáng ngờ ngay trên thiết bị. Điểm đặc biệt nằm ở khả năng học hỏi và cập nhật liên tục, cho phép nó phát hiện các hình thức lừa đảo mới và ngày càng tinh vi. Cụ thể:
- AI phân tích mẫu cuộc gọi, số điện thoại và nội dung để xác định khả năng lừa đảo
- Người dùng sẽ nhận được cảnh báo theo thời gian thực khi có cuộc gọi đáng ngờ
- Hệ thống có khả năng học hỏi và cập nhật liên tục để phát hiện các hình thức lừa đảo mới
- Tính năng này được tích hợp sâu vào hệ điều hành Android, cung cấp bảo vệ toàn diện cho người dùng
Google I/O 2024 đã chứng minh rằng tương lai của công nghệ gắn liền với sự phát triển của AI. Từ Gemini – siêu AI mới nhất, đến những cải tiến trong tìm kiếm, xử lý hình ảnh và video, Google đang đưa AI trở thành một phần không thể thiếu trong cuộc sống số của chúng ta. Những cập nhật này không chỉ thể hiện sự đổi mới công nghệ mà còn phản ánh tầm nhìn của Google về một thế giới nơi AI hỗ trợ và nâng cao khả năng của con người trong mọi khía cạnh.
Xem thêm: