Mentionsy

Opanuj.AI Podcast
01.12.2025 12:38

Gemini 3 to hit, ale konkurencja nie śpi! GPT-5.1, Grok 4.1 i Opus 4.5, a także emocje w LLMach i nowy Projekt Manhattan w USA

Listopad 2025 przejdzie do historii jako jeden z najintensywniejszych miesięcy w rozwoju sztucznej inteligencji. W dzisiejszym odcinku analizujemy "listopadowe szaleństwo", podczas którego w niespełna dwa tygodnie zobaczyliśmy premiery aż 10 topowych modeli, w tym wyczekiwanego Gemini 3 Pro i GPT-5.1. Sprawdzamy, kto wygrywa w benchmarkach i dlaczego "Emotional Intelligence" (EQ) staje się nowym polem bitwy gigantów.

W drugiej części odcinka przyglądamy się Projektowi Genesis – inicjatywie administracji Trumpa, która ma być dla AI tym, czym Projekt Manhattan był dla energii atomowej. Na koniec głębokie zanurzenie w umysł Ilyi Sutskevera. Analizujemy jego rozmowę z Dwarkeshem Patelem, wizję Safe Superintelligence i dlaczego legenda deep learningu uważa, że proste dokładanie kart graficznych (skalowanie) przestaje wystarczać.

Szukaj w treści odcinka

Znaleziono 6 wyników dla "Opusa"

Zależy jak tutaj czytać Cloud Opusa, tak naprawdę mamy tylko jeden lepszy model w kontekście web developmentu od Gemini 3 Pro, czyli Cloud Opus w dwóch wariantach, klasycznym oraz w tej wersji Thinking z tym rozszerzonym.

W przypadku Opusa 4.5 po raz pierwszy wchodzimy powyżej progu 80% skuteczności w tym benchmarku.

I tutaj jeszcze jeden bardzo istotny aspekt w kontekście premiery Cloud Opusa.

W przypadku Opusa 4.5 kosztowało go 10 tysięcy tokenów wyjściowych, w przypadku gdy Sonnet spalił praktycznie dwa razy więcej tokenów, żeby osiągnąć zaledwie 76-77% w tym samym benchmarku, czyli praktycznie dwa razy więcej musieliśmy tokenów poświęcić na to, żeby i tak być poniżej tego poziomu jakości, który Opus tutaj ze sobą reprezentuje.

O ile w przypadku Opusa 4.5 czytamy tutaj o 200 tysiącach okna kontekstowego, tak firma OpenAI mówi, że GPT-51 Codex Max tak naprawdę przestaje się interesować problemem okna kontekstowego, bo model będzie sobie na bieżąco streszczał i kompaktował właśnie te...

Jeśli natomiast zaczynaliśmy od czystej kartki i prosiliśmy Opusa o to, żeby zaprojektował dane rozwiązanie,