Mentionsy
Gemini 3 to hit, ale konkurencja nie śpi! GPT-5.1, Grok 4.1 i Opus 4.5, a także emocje w LLMach i nowy Projekt Manhattan w USA
Listopad 2025 przejdzie do historii jako jeden z najintensywniejszych miesięcy w rozwoju sztucznej inteligencji. W dzisiejszym odcinku analizujemy "listopadowe szaleństwo", podczas którego w niespełna dwa tygodnie zobaczyliśmy premiery aż 10 topowych modeli, w tym wyczekiwanego Gemini 3 Pro i GPT-5.1. Sprawdzamy, kto wygrywa w benchmarkach i dlaczego "Emotional Intelligence" (EQ) staje się nowym polem bitwy gigantów.
W drugiej części odcinka przyglądamy się Projektowi Genesis – inicjatywie administracji Trumpa, która ma być dla AI tym, czym Projekt Manhattan był dla energii atomowej. Na koniec głębokie zanurzenie w umysł Ilyi Sutskevera. Analizujemy jego rozmowę z Dwarkeshem Patelem, wizję Safe Superintelligence i dlaczego legenda deep learningu uważa, że proste dokładanie kart graficznych (skalowanie) przestaje wystarczać.
Szukaj w treści odcinka
18 listopada Gemini 3 Pro, duża bomba od Google'a.
Te wszystkie premiery sobie skategoryzowałem, natomiast chciałbym zacząć od Google, bo Google tak naprawdę pozamiatał premierą swojej rodziny Gemini 3.
Dzisiaj dostępne mamy dwa rozwiązania, czyli Gemini 3 Pro i Nano Banana Pro, czyli Gemini 3 Pro Image.
Czekamy jeszcze na Gemini 3 Flash, które gdzieś tam na mediach społecznościowych już lata w formie takich plotek i pogłosach.
Ma to być super tani model o potencjale Gemini 2.5 Pro, natomiast jeszcze go nie ma.
Skupimy się na tych dwóch pierwszych i omówię Wam to, co Google tak naprawdę zaprezentowało, na czym oni się skupiają, na czym ta ich strategia właśnie w kontekście rodziny Gemini 3 Pro ma polegać.
na taki benchmark, o którym wielokrotnie już tutaj mówiliśmy i możemy sobie zaobserwować, na jakich pozycjach ulokowały się poszczególne rozwiązania od Google właśnie z tej rodziny Gemini 3, żeby właściwie wiedzieć, czy warto tutaj rozmawiać o konkretach, czy warto tutaj spędzać czas na dyskusji o Gemini 3.
Zależy jak tutaj czytać Cloud Opusa, tak naprawdę mamy tylko jeden lepszy model w kontekście web developmentu od Gemini 3 Pro, czyli Cloud Opus w dwóch wariantach, klasycznym oraz w tej wersji Thinking z tym rozszerzonym.
No więc jak widzicie na LM Arenie praktycznie w każdej kategorii Gemini 3 jest liderem i również w takim podsumowaniu zbiorczym obecnie jest to model, który wypada po prostu najlepiej, właściwie rodzina modeli, która wypada najlepiej, bo tutaj Gemini 3 Pro i Nana Banana Pro są troszkę innymi rozwiązaniami.
Jeśli przyjrzymy się temu, jak do tej premiery odnosi się Google, no to widzimy tutaj takie cztery strategiczne filary tego wszystkiego, co wydarzyło się w listopadzie, na co tak naprawdę Google stawia, na czym im zależało w trakcie pracy nad rodziną Gemini 3.
Multimodalność, od samego początku mamy być w stanie tworzyć różnego rodzaju treści z Gemini 3, nie tylko tekst, ale właśnie również...
Gemini 3 nie ma być rozwiązaniem, które gdzieś tam jest pochowane za feature flagami, ale już od praktycznie pierwszego tygodnia dostaliśmy go chociażby w wyszukiwarce Google w tym trybie...
AI, mamy Gemini 3 w wielu edytorach dla programistów, mamy Gemini 3 na Google Vertexie, w Google AI Studio, na Google Cloud Platform, wszędzie tam, gdzie konsumenci, zarówno ci B2C, B2B korzystają z rozwiązań Google'a, to Gemini 3 miało być już tutaj dostępne.
Google wspomina, że Gemini 3 to jest taka rodzina modeli, która ma wychwytywać subtelne wskazówki i czytać między wierszami.
To zaawansowane rozumowanie jest również reprezentowane przez dedykowany tryb, czyli Gemini 3 Deep Think.
To jest taki tryb wzmocnionego rozumowania, który był już dostępny wcześniej w przypadku Gemini 2.5 Pro, który tym razem jest dostępny dla subskrybentów Google A Ultra i on pozwala modelowi myśleć o problemie z różnych kierunków.
Teraz to Gemini 3 DeepThink wchodzi na rynek jako kolejna generacja właśnie tego złożonego rozumowania, natomiast tam w przypadku tej olimpiady matematycznej nie było tak naprawdę do końca sprecyzowane, czy mieliśmy tam DeepThink 2.5, czy DeepThink 3, czy mieliśmy jakieś inne niestandardowe rozwiązanie.
pracować właśnie w takim trybie, który teraz Gemini 3 jakby wznosi na kolejny level.
Mamy tutaj 37,5% skuteczności Gemini 3 Pro i aż 41% w trybie DeepThink.
jak chociażby jakieś human evale, jakieś proste odpowiadanie na pytanie, to są złożone problemy i tutaj zarówno Gemini 3 Pro, jak i ten tryb 3 DeepThink osiągają state of the art praktycznie w każdym liczącym się obecnie benchmarku.
No i tutaj Gemini 3 Pro wypada najlepiej, a według tych symulacji, o których Google mówi, Gemini 3 zasymulowało sobie tutaj taki rok operacyjny prowadzenia tego biznesu, generując znacznie wyższe zwroty finansowe niż konkurencyjne modele.
to prawdopodobnie najwięcej korzyści uzyskacie z podpięcia jednego z modeli z rodziny Gemini 3.
Jeśli chodzi o cały ten wysiłek dotyczący właśnie pracy agentowej i tego, że właśnie Gemini przestaje być chatbotem, a staje się agentem.
Kolejnym etapem tej premiery modeli z rodziny Gemini był etap dotyczący obrazów, grafiki czy ilustracji, oczywiście NanoBanana Pro.
albo teraz model o oficjalnej nazwie Gemini 3 Pro Image.
Jest to takie właśnie rozszerzenie tej rodziny Gemini 3, które jest przede wszystkim skupione na generowaniu obrazów i tutaj w wielu obszarach tego generowania obrazów uzyskujemy efekty, jakich wcześniej tak naprawdę nie widzieliśmy, bo NanoBanana Pro naprawdę dobrze radzi sobie z renderowaniem tekstu, co było takim odwiecznym problemem modeli właśnie pracujących na tej modalności.
W samej aplikacji Gemini to NanoBanana Pro zostało również wdrożone w ten sposób, że kiedy wygenerujemy sobie obraz i ten obraz jest infografiką, to poszczególne jego elementy są interaktywne i możemy sobie z modelem językowym rozmawiać.
czy to o jakiejś strzałce, czy to o jakimś komponencie, który jest na tym obrazku, czy to o jakiejś postaci, naprawdę fajnie to działa i też w sieci jest coraz większy taki pozytywny hype wokół samej tej aplikacji Gemini, która odbiera, by oni byli użytkowników chatowi GPT, czyli takiemu defaultowi, jeśli chodzi o generatywną sztuczną inteligencję.
Jeśli chodzi o kilka takich informacji technicznych, szybkich dla tych, którzy budują na przykład właśnie integracje techniczne, no a tutaj jeszcze warto wiedzieć, że Gemini 3 Pro ma 1 milion okna kontekstowego, czyli taką wartość, którą
Jeśli chodzi o architekturę, to Google nie jest tutaj bardzo precyzyjny, natomiast wspominam, że Gemini 3 bazuje na architekturze Mixture of Experts, co pozwala im oszczędzić na kosztach inferencji w momencie, kiedy generuje się tutaj...
W kontekście technicznym mamy tutaj również jedną istotną informację, która wywołała pewnego rodzaju burzę właśnie w momencie, kiedy Gemini 3 się pojawia, kiedy pojawiły się notatki prasowe.
Google wspomina, że rodzina Gemini 3 w pełni była trenowana na ich jednostkach obliczeniowych TPU, czyli Tensor Processing Unit, co oczywiście jest pewnego rodzaju być może takim kamyczkiem do ogródka, taką zaczepką w stronę NVD.
Mamy też naprawdę obiecującą adopcję aplikacji Gemini.
Coraz więcej użytkowników pozytywnie w stronę tego Gemini patrzy.
Google tutaj wspomina przy okazji tej premiery, że 650 milionów użytkowników miesięcznie korzysta z Gemini.
To Gemini naprawdę zaczyna gonić, a w wielu modalnościach po prostu przebija to, co ma do zaoferowania firma OpenAI.
Gemini 3 Pro na miejscu numer 4 i dopiero później GPT-5-1, więc nieco inne wyniki w zależności od tego, czy mówi o nich firma stojąca za modelem, czy właśnie autorzy samego frameworka.
żeby czy to ChatGPT, czy Gemini, czy Grog pozostawał po prostu jak najdłużej przed waszymi oczami, żebyście byli po prostu jak najmocniej zaangażowani w prowadzenie tych konwersacji, żebyście jak najmocniej zawierzyli się temu, że sztuczna inteligencja jest takim codziennym asystentem w wielu aspektach waszego życia.
Sona 4.5 ma 77%, Gemini 3 Pro ma 76%, a GPT-51 Codex Max ma 77,9%.
Tutaj ustępuje miejsce zarówno Gemini 3 Pro, jak i GPT-5.1.
Są jakieś funkcje pamięci, są jakieś instrukcje niestandardowe, są może jakieś customowe GPT-sy albo GEM-y w kontekście Gemini.
Ostatnie odcinki
-
AI zamiast lekarza? ChatGPT Health vs Google Me...
01.02.2026 18:45
-
Wielkie Podsumowanie AI w 2025 - Modele, Narzęd...
09.01.2026 05:00
-
GPT-5.2 to GEMINI KILLER? Google VS OpenAI, MCP...
01.01.2026 10:51
-
Gemini 3 to hit, ale konkurencja nie śpi! GPT-5...
01.12.2025 12:38
-
Cursor 2.0 vs Windsurf SWE-1.5 - dobrze, szybko...
04.11.2025 05:00
-
Czy agenci AI zdominują branżę e-commerce? Chat...
04.10.2025 06:10
-
Czy agenci AI zdominują branżę e-commerce? Chat...
03.10.2025 05:05
-
GPT-5: sukces i porażka. Koniec marzeń o AGI pr...
01.09.2025 09:02
-
Czy AI spowalnia programistów? Halucynacje w NC...
02.08.2025 06:27
-
5 mitów programowania z AI - zapomnij o Vibe Co...
29.07.2025 06:00