AI Gemini Deep Think zdobyła złoto na Międzynarodowej Olimpiadzie Matematycznej

itreseller.com.pl 4 dni temu

Sztuczna inteligencja Google DeepMind triumfuje na Międzynarodowej Olimpiadzie Matematycznej, pokonując większość ludzkich rywali i udowadniając rosnący potencjał AI w rozwiązywaniu skomplikowanych problemów matematycznych. Gemini Deep Think jako jedyny system AI przeszedł oficjalną weryfikację organizatorów IMO i zdobył złoty medal, rozwiązując pięć z sześciu zadań.

Era sztucznej inteligencji w matematyce

Google DeepMind nie po raz pierwszy mierzy się z wyzwaniami Międzynarodowej Olimpiady Matematycznej (IMO). W ubiegłym roku, korzystając z modeli AlphaProof oraz AlphaGeometry 2, zespół zdobył srebrny medal. W 2025 roku, dzięki nowemu modelowi Gemini Deep Think, AI poprawiła swoje osiągnięcia i sięgnęła po złoto. Co kluczowe, system został oceniony według tych samych zasad co zwykli uczestnicy, a nad poprawnością procesu czuwała oficjalna komisja IMO.

Gemini Deep Think wyróżnia się podejściem do rozumowania – zamiast jednego, liniowego ciągu myśli, model przeprowadza wiele procesów analitycznych jednocześnie, a następnie integruje i porównuje wyniki.

„To zupełnie nowy paradygmat w stosunku do ubiegłego roku” – tłumaczy Thang Luong, główny naukowiec DeepMind i lider zespołu IMO.

W odróżnieniu od poprzednich lat, Deep Think nie wymaga tłumaczenia zadań na język programistyczny ani interpretowania wyników przez ekspertów – model pracuje w pełni w języku naturalnym.

Zespół DeepMind IMO / Źródło: Google DeepMind

Wyzwania i wyniki rywalizacji

Przygotowania do tegorocznego IMO wymagały od zespołu DeepMind zastosowania nowych technik uczenia ze wzmocnieniem, w których AI otrzymywała szczegółowe, „długie odpowiedzi”, uwzględniające nie tylko końcowe rezultaty, ale też całość rozumowania krok po kroku. Dzięki temu Gemini Deep Think potrafi generować pełne, formalne dowody – umiejętność, która była warunkiem sukcesu w IMO.

W tym roku AI rozwiązała pięć z sześciu zadań, zdobywając 35 punktów – wynik, który zapewnił złoty medal. Szczególną uwagę zwróciła strategia zastosowana w jednym z najtrudniejszych zadań, gdzie wielu uczestników sięgało po wyrafinowane twierdzenia z wyższej matematyki. Deep Think znalazł własną, znacznie prostszą drogę do rozwiązania, opierając się na elementarnych metodach teorii liczb. To przykład, jak sztuczna inteligencja potrafi nie tylko powielać ludzkie strategie, ale także znajdować nieoczywiste rozwiązania.

Jedyną „wpadką” modelu okazało się zadanie dotyczące minimalnej liczby prostokątów potrzebnych do pokrycia danego obszaru. Model wybrał błędną hipotezę, przez co nie był w stanie znaleźć poprawnej odpowiedzi. Warto dodać, iż tylko pięciu uczestników spośród setek obecnych rozwiązało to zadanie poprawnie.

Idź do oryginalnego materiału