Gemini 2.5, nasz najinteligentniejszy model AI

Dziś przedstawiamy Gemini 2.5, nasz najinteligentniejszy model AI. Jako pierwszą prezentujemy wersję 2.5 Pro, która w wielu kategoriach porównawczych deklasuje konkurencję i debiutuje na miejscu nr 1 w klasyfikacji botów LMArena, znacznie wyprzedzając modele innych firm.
Modele Gemini 2.5 to modele myślące. Zanim odpowiedzą, są w stanie przeprowadzić rozumowanie, czego wynikiem jest lepsza wydajność i zwiększona dokładność odpowiedzi.
W dziedzinie sztucznej inteligencji zdolność systemu do racjonalnego myślenia oznacza więcej niż tylko możliwość klasyfikowania danych i prognozowania wyników. Jest to zdolność do prowadzenia analiz, wyciągania logicznych wniosków, brania pod uwagę kontekstu, uwzględniania niuansów oraz podejmowania decyzji na podstawie faktów.
Długo poszukiwaliśmy sposobów na to, by nasza AI była inteligentniejsza i bardziej zdolna do rozumowania. Stosowaliśmy m.in. techniki uczenia się przez wzmacnianie oraz wykorzystania w prompcie łańcucha myśli. Na tym fundamencie oparliśmy nasz pierwszy model myślący, Gemini 2.0 Flash Thinking.
Gemini 2.5 jest efektem naszych prac nad ulepszeniem trenowania oraz modelu podstawowego, przez co wprowadza nowy poziom wydajności. W przyszłości planujemy wyposażyć w zdolność rozumowania wszystkie nasze modele, tak aby mogły mierzyć się z bardziej skomplikowanymi zagadnieniami. Na ich podstawie będzie można też tworzyć lepsze i bardziej wrażliwe na kontekst agenty.
Więcej o Gemini 2.5 Pro
Gemini 2.5 Pro Experimental jest naszym najbardziej zaawansowanym modelem do skomplikowanych zadań. Znalazł się na szczycie rankingu LMArena, który mierzy dostosowanie do preferencji użytkowników, a wyniki modeli innych firm daleko odbiegają od jego osiągnięć. Jest to model o dużych możliwościach, które potrafi realizować w świetnym stylu. Jego mocną stroną jest rozumowanie i pisanie kodu. Wyprzedza on konkurencję pod względem zwykłego kodowania, rozwiązywania zadań matematycznych oraz odpowiedzi na pytania z zakresu nauk ścisłych i przyrodniczych.
Gemini 2.5 Pro jest dostępny w Google AI Studio i w aplikacji Gemini, dla użytkowników Gemini Advanced. Wkrótce udostępnimy go również w Vertex AI. W nadchodzących tygodniach przedstawimy też cennik, który będzie umożliwiał wykorzystanie modelu 2.5 Pro z wyższą liczbą żądań do skalowalnych zadań produkcyjnych.

Ulepszone wnioskowanie
Gemini 2.5 Pro znacząco wyprzedza konkurencję pod względem wielu wskaźników porównawczych wymagających zaawansowanego wnioskowania. Po wyłączeniu kosztownych i czasochłonnych technik testowania, takich jak głosowanie większościowe, prowadzi w matematyce i innych naukach ścisłych oraz przyrodniczych, osiągając najwyższe wskaźniki GPQA oraz AIME 2025.
Model 2.5 Pro może się też poszczycić doskonałym wynikiem 18,8% wśród modeli niekorzystających z narzędzi, w kategorii Humanity’s Last Exam, w której testy prowadzone na zbiorze danych opracowanych przez setki ekspertów w swoich dziedzinach mają sięgnąć do granic ludzkiej wiedzy i możliwości wnioskowania.

Zaawansowane pisanie kodu
Skupiliśmy się na poprawie umiejętności kodowania i Gemini 2.5 ma pod tym względem wielką przewagę nad modelem 2.0. Wkrótce planujemy wprowadzenie dalszych ulepszeń. Model 2.5 Pro doskonale spisuje się zarówno, gdy ma stworzyć atrakcyjne wizualnie aplikacje internetowe, jak i agentowe aplikacje z samym kodem. Potrafi też przekształcać i edytować kod. W teście SWE-Bench Verified, który jest standardem branżowym do porównywania kodu aplikacji agentowych, Gemini 2.5 Pro ze skonfigurowanym własnym agentem osiąga wynik 63.8%.
Oto przykład tego, jak model 2.5 Pro potrafi wykorzystać rozumowanie do tworzenia gry wideo, pisząc wykonywalny kod w odpowiedzi na prompta zajmującego tylko jedną linię.
Największe zalety Gemini
Gemini 2.5 wykorzystuje największe zalety modeli Gemini – natywną multimodalność i długie okno kontekstu. Dzisiaj w modelu 2.5 Pro obejmuje ono 1 milion tokenów (wkrótce będą to 2 miliony). W porównaniu do poprzednich generacji model ten pozwala też na sprawne wykonywanie bardziej zaawansowanych działań. Może zrozumieć obszerne zbiory danych i analizować złożone problemy na podstawie różnych źródeł, w tym tekstu, dźwięku, obrazów oraz filmów, a nawet całych repozytoriów kodu.
Firmy i deweloperzy mogą wypróbować Gemini 2.5 Pro w Google AI Studio, a użytkownicy Gemini Advanced mogą wybrać go z menu na telefonach i komputerach. W ciągu kilku tygodni udostępnimy ten model także w Vertex AI.
Mamy nadzieję, że użytkownicy zechcą podzielić się z nami wrażeniami, co pozwoli nam dalej ulepszać niesamowite nowe możliwości Gemini w tak szybkim tempie. Chcemy, żeby nasza AI była tak przydatna, jak to tylko możliwe.