Pod względem oferowanych możliwości, dostarczany przez Google model Gemini 2.5 Pro jest w stanie przegonić konkurencję. W standardowym teście branżowym SWE-Bench Verified do weryfikacji szczegółowej agentów AI osiągana trafność odpowiedzi jest nie gorsza od 63,8%, podczas gdy dla kategorii Humanity’s Last Exam jest to z kolei 18,8% - na tle reszty modeli to fantastyczny wręcz wynik, biorąc pod uwagę to, że testy były prowadzone na zbiorze danych dostarczonych przez ekspertów w swoich dziedzinach. Po wyłączeniu wielu kosztownych, jak też czasochłonnych technik testowania opisywany model osiąga najwyższe wskaźniki: GPQA oraz AIME 2025. Spisuje się doskonale zarówno kiedy ma wygenerować atrakcyjne wizualnie aplikacje internetowe, jak i agentowe aplikacje z kodami. Potrafi też przekształcać i edytować wszystkie kody, pozwalając sięgać do granic ludzkiej wiedzy oraz możliwości wnioskowania - wystarczy skorzystać z Google AI Studio, aby się o tym przekonać lub z aplikacji Gemini, albo wkrótce też w Vertex AI, zgodnie z tym co zapowiedziała firma Google już pewien czas temu.
Więcej informacji pod adresem: blog.google