Mentionsy

Opanuj.AI Podcast
01.12.2025 12:38

Gemini 3 to hit, ale konkurencja nie śpi! GPT-5.1, Grok 4.1 i Opus 4.5, a także emocje w LLMach i nowy Projekt Manhattan w USA

Listopad 2025 przejdzie do historii jako jeden z najintensywniejszych miesięcy w rozwoju sztucznej inteligencji. W dzisiejszym odcinku analizujemy "listopadowe szaleństwo", podczas którego w niespełna dwa tygodnie zobaczyliśmy premiery aż 10 topowych modeli, w tym wyczekiwanego Gemini 3 Pro i GPT-5.1. Sprawdzamy, kto wygrywa w benchmarkach i dlaczego "Emotional Intelligence" (EQ) staje się nowym polem bitwy gigantów.

W drugiej części odcinka przyglądamy się Projektowi Genesis – inicjatywie administracji Trumpa, która ma być dla AI tym, czym Projekt Manhattan był dla energii atomowej. Na koniec głębokie zanurzenie w umysł Ilyi Sutskevera. Analizujemy jego rozmowę z Dwarkeshem Patelem, wizję Safe Superintelligence i dlaczego legenda deep learningu uważa, że proste dokładanie kart graficznych (skalowanie) przestaje wystarczać.

Szukaj w treści odcinka

Znaleziono 5 wyników dla "DeepThink"

Teraz to Gemini 3 DeepThink wchodzi na rynek jako kolejna generacja właśnie tego złożonego rozumowania, natomiast tam w przypadku tej olimpiady matematycznej nie było tak naprawdę do końca sprecyzowane, czy mieliśmy tam DeepThink 2.5, czy DeepThink 3, czy mieliśmy jakieś inne niestandardowe rozwiązanie.

W każdym razie ten tryb DeepThink również jest teraz dostępny, jeśli macie najwyższą subskrypcję związaną ze sztuczną inteligencją od Google, a właśnie to Google Ultra, tam można na tych najbardziej złożonych problemach

Mamy tutaj 37,5% skuteczności Gemini 3 Pro i aż 41% w trybie DeepThink.

GPQA Diamond wiedza naukowa 93,8% w trybie DeepThink, czyli praktycznie sufit tego benchmarku.

jak chociażby jakieś human evale, jakieś proste odpowiadanie na pytanie, to są złożone problemy i tutaj zarówno Gemini 3 Pro, jak i ten tryb 3 DeepThink osiągają state of the art praktycznie w każdym liczącym się obecnie benchmarku.