Mentionsy
Gemini 3 to hit, ale konkurencja nie śpi! GPT-5.1, Grok 4.1 i Opus 4.5, a także emocje w LLMach i nowy Projekt Manhattan w USA
Listopad 2025 przejdzie do historii jako jeden z najintensywniejszych miesięcy w rozwoju sztucznej inteligencji. W dzisiejszym odcinku analizujemy "listopadowe szaleństwo", podczas którego w niespełna dwa tygodnie zobaczyliśmy premiery aż 10 topowych modeli, w tym wyczekiwanego Gemini 3 Pro i GPT-5.1. Sprawdzamy, kto wygrywa w benchmarkach i dlaczego "Emotional Intelligence" (EQ) staje się nowym polem bitwy gigantów.
W drugiej części odcinka przyglądamy się Projektowi Genesis – inicjatywie administracji Trumpa, która ma być dla AI tym, czym Projekt Manhattan był dla energii atomowej. Na koniec głębokie zanurzenie w umysł Ilyi Sutskevera. Analizujemy jego rozmowę z Dwarkeshem Patelem, wizję Safe Superintelligence i dlaczego legenda deep learningu uważa, że proste dokładanie kart graficznych (skalowanie) przestaje wystarczać.
Szukaj w treści odcinka
Ja nazywam się Przemek Smyrdek, a to jest kolejny odcinek naszego podcastu Opanuj AI.
Zachęcam również do tego, żeby zapisać się na nasz newsletter opanuj.ai.
Na opanuj.ai, łamany przez newsletter, znajdziecie właśnie taką przestrzeń do śledzenia naszych co poniedziałkowych publikacji na temat sztucznej inteligencji.
Jeśli podacie tam swojego maila, to co poniedziałek na waszej skrzynce
mailowej wylądują trzy linki ręcznie wyselekcjonowane raz przeze mnie, a raz przez Marcina Właś na temat sztucznej inteligencji, dedykowane wszystkim tym, którzy w praktyczny sposób chcą właśnie posługiwać się tą sztuczną inteligencją, chcą rozumieć, co dzieje się w szerszym kontekście, często właśnie takim politycznym, geopolitycznym, geostrategicznym i czasami chcą się po prostu przy tym wszystkim dobrze bawić, więc opany.ai łamane przez newsletter.
Na samej stronie opany.ai znajdziecie również mapę drogową AI,
Ta mapa drogowa, raz jeszcze przypomnę, znajduje się na stronie opanuj.ai.
Chcemy w to zainwestować jeszcze mocniej i raz jeszcze zaprezentować wartość i jakość, której na naszym rynku do tej pory nie było.
17 listopada od XAI mieliśmy Groka 4.1 i 4.1 Thinking, również 4.1 Fast.
19 listopada GPT-51 Codex Max, czyli rozszerzenie technologii dla programistów od OpenAI.
AI, mamy Gemini 3 w wielu edytorach dla programistów, mamy Gemini 3 na Google Vertexie, w Google AI Studio, na Google Cloud Platform, wszędzie tam, gdzie konsumenci, zarówno ci B2C, B2B korzystają z rozwiązań Google'a, to Gemini 3 miało być już tutaj dostępne.
Windsurfa, czyli jednego z najbardziej popularnych edytorów programistycznych, gdzie AI było wdrożone w taki sposób natywny.
Jeśli chodzi o język polski, mamy tutaj dużą skuteczność, czasami w znakach takich jak EŁ, ZI, CI, ZI, czasami pojawia się jakiś błąd, jakiś artefakt, natomiast nie ma problemu z tym, żeby wygenerować sobie jakąś infografikę, jakąś wizualizację procesu biznesowego, czy połączenie właśnie symboli graficznych z tekstem, co od zawsze było wyzwaniem, czego nie znajdziecie chociażby w rozwiązaniach od konkurencji, w tym co robi dzisiaj OpenAI.
Natomiast nie ma co ukrywać, naprawdę Google zrobiło robotę, sporo dyskusji o tym, jak duży cios będzie to w kontekście OpenAI, w kontekście czata GPT, portal deinformation.com wspomina, że sam Altman zdecydował się na taką wewnętrzną notatkę do pracowników, gdzie po prostu ostrzega przed pewnego rodzaju takimi wyzwaniami ekonomicznymi, patrząc na to, co robi Google, więc myślę, że tam
To Gemini naprawdę zaczyna gonić, a w wielu modalnościach po prostu przebija to, co ma do zaoferowania firma OpenAI.
To pierwsze takie pozorne podobieństwo dotyczy tego, że mamy kropkę 1 i mamy po dwie wersje modeli, ale to bardziej istotne podobieństwo dotyczy również takiego priorytetu strategicznego, o którym czytamy właśnie w notatkach pressowych, bo zarówno OpenAI, jak i XAI wspominają, że ich celem nie jest to, żeby stworzyć takie naprawdę syntetyczne, surowe modele, które mają IQ na wysokim poziomie, czyli takie można powiedzieć kalkulatory, które nie mają żadnych emocji,
Firma XAI, która zaprezentowała Groka 4.1, bardzo mocno akcentuje rozwój kompetencji społecznych modelu.
W przypadku GPT-51 od OpenAI mamy tutaj podkreślenie bardziej ludzkiego tonu i naturalnej modulacji stylu.
Pierwszy przykład od firmy XAI, mamy prompta,
Była tutaj taka duża podatność do tego, że model po prostu lepiej się oceni, bo na przykład czegoś się nauczył na etapie pre-trainingu.
No i zgodnie z notatkami, które opublikowała firma XAI, tutaj akurat GROG 4.1 i GROG 4.1 Thinking są aktualnie liderami tego benchmarku EQBench.
ignorowanie tego, że wiecie, że coś w rzeczywistości wygląda inaczej, ale jeśli wasz wiarygodny asystent AI o czymś mówi, no to być może to jest jednak prawda i zaczniecie tutaj podważać bardzo osobiste doświadczenie, więc na to należy uważać.
I na koniec tej części krótkie omówienie dwóch modeli, którymi szczególnie mocno będą zainteresowani programiści korzystający z takich rozwiązań jak Cloud Code oraz Codex CLI.
Firmy stojące za tymi rozwiązaniami, czyli odpowiednio Anthropic i OpenAI, wypuściły w listopadzie dwa flagowe modele, które właśnie w takiej formie agentowej mają być jeszcze lepszymi asystentami programistów, mają jeszcze w bardziej sprawczy sposób poruszać się po różnych problemach i zadaniach, które do tych modeli przekazujemy.
Nie można tego jeden do jeden zmapować pomiędzy wynikami Anthropica a OpenAI, bo tam są nieco inne triki pod spodem zaszyte.
Firma OpenAI prezentuje podobne rezultaty w kontekście tego samego benchmarku, również stara się pokazać nam tutaj tą relację koszt-efekt, natomiast tutaj to równanie jest nieco inne, bo oni tutaj prezentują wykorzystanie tzw.
Jeśli natomiast chodzi o GPT-51 Codex Max, to również będzie to flagowe rozwiązanie dla użytkowników Codex CLI, czyli tego ekosystemu, tego narzędzia terminalowego od OpenAI.
O ile w przypadku Opusa 4.5 czytamy tutaj o 200 tysiącach okna kontekstowego, tak firma OpenAI mówi, że GPT-51 Codex Max tak naprawdę przestaje się interesować problemem okna kontekstowego, bo model będzie sobie na bieżąco streszczał i kompaktował właśnie te...
Jeśli jesteście właśnie w Codex CLI od firmy OpenAI, to na pewno to GPT-51 Codex Max będzie tym właściwym rozwiązaniem.
Jeśli pracujecie z Cloud Codem, tutaj Cloud Opus wraz z pomocnikami z Sonetem i z Haiku będą tymi modelami, z których warto korzystać.
Natomiast jak widzicie naprawdę sporo się dzieje, tutaj ten świat software developmentu napędzonego AI nie zamierza się zatrzymywać i stąd również my w trzeciej edycji Tanex Devs wejdziemy na kolejny poziom tej tematyki mówiąc więcej o tym jak tutaj zespoły mogą tego typu rozwiązania wdrażać w swojej codziennej pracy w takich procesach, które dotyczą wytwarzania oprogramowania.
tak zwanym carem AI i kryptowalut w administracji Donalda Trumpa.
Tutaj również WXAM i Stany Zjednoczone zainwestowały, rozwijały projekty badawcze i dzisiaj coś podobnego ma mieć miejsce właśnie w kontekście sztucznej inteligencji.
Nie tak dawno mieliśmy afery związaną z tym, że CFO firmy OpenAI apelowała do rządów Stanów Zjednoczonych o to, żeby właśnie wybrał jakąś taką firmę, takiego prymusa, który będą wspierać państwowymi pieniędzmi.
I to ma wyglądać tak, że w 27 roku 70% kluczowych sektorów ma być zintegrowanych z AI,
Wydaje się, że jednym z istotnych aspektów jest tutaj również stabilizacja tego szalonego rynku sztucznej inteligencji w ten sposób, żeby chociażby na rynku właśnie Stanów Zjednoczonych nie pojawiło się jakieś takie nagłe tąpnięcie, więc nawet jeśli w bezpośrednich projektach, które teraz takie firmy jak Nvidia, OpenAI czy Google realizują,
Zobaczymy, jak to wpłynie również na wycenę gigantów technologicznych, firm takich jak właśnie Nvidia, Microsoft czy OpenAI, no bo może się okazać, że przy tym wsparciu rządu Stanów Zjednoczonych, ta ich przyszłość jest zdecydowanie bardziej przewidywalna, stabilna, pozytywna niż w momencie, kiedy tego wsparcia by tutaj po prostu nie było.
natomiast dzisiaj mamy już takie dwa ośrodki, które w ramach tych AI Factories mają już tutaj wchodzić w skład całej tej inicjatywy.
3 miliardów dolarów, więc więcej niż cały projekt AI Factories w Unii Europejskiej.
Przedstawiciele Komisji Europejskiej mówią o zapewnieniu tak zwanej suwerenności AI.
Na szczęście wygląda na to, że powoli te regulacje takie jak AI Act również zostają poluzowywane na skutek tego, co dzieje się w innych
W kontekście tej inicjatywy europejskiej, czyli AI Factories, również u nas w Polsce powstaną centra badawcze, powstaną pewnego rodzaju artefakty po tym, co na poziomie właśnie kontynentalnym jest planowane.
Po pierwsze w Poznaniu pojawi się Piast AI Factory.
Druga jednostka będzie rozwijana w Krakowie, ma być to fabryka sztucznej inteligencji o nazwie Gaia.
Natomiast cele są podobne, udostępnienie mocy obliczeniowej dla nauki, dla przemysłu, taka forma AI as a service.
Również w kontekście AI Act była mowa o tych sandboxach, które mają być udostępniane małym i średnim firmom.
na którym potencjalnie część z naszych, powiedzmy, krajowych rozwiązań AI będzie uruchamiana.
Państwa nie ukrywają już swojego zainteresowania tematyką sztucznej inteligencji.
Autora, założyciela firmy Safe Super Intelligence, który po zeszłorocznym puczu odszedł z firmy OpenAI, skupiając się na rozwijaniu własnej inicjatywy koncentrującej się na badaniach nad bezpieczną, sztuczną inteligencją.
I teraz po czasie takiej ciszy, po czasie różnych afer, między innymi tego głośnego odejścia z OpenAI, gdzie z samym Altmanem mieli duży konflikt,
Dodatkowo tutaj panowie rozmawiają o problemie pre-trainingu, o tym etapie przygotowywania modeli językowych.
Jak to jest, że my tego pre-trainingu jako ludzie tak naprawdę nie realizowaliśmy na tak dużą skalę, a tak dobrze radzimy sobie w świecie rzeczywistym, podczas gdy te modele, pomimo tego, że widziały znacznie więcej opracowań, znacznie więcej badań i raportów, nie potrafią tego przekuwać na jakąś użyteczną syntezę, na jakieś wnioski.
I tutaj Ilja Suskawa raz jeszcze mówi, że musimy odejść od gotowej wiedzy, od takiego podejścia do pre-trainingu, gdzie staramy się zgromadzić informacje na temat wszystkiego, co znamy i co widzieliśmy, do takiego modelu inteligentnego stażysty, gdzie model będzie miał jakąś minimalną porcję bazowej wiedzy, ale będzie miał ogromny potencjał do tego, żeby w jakimś kierunku...
wyciągnąć więcej niż z tego etapu pre-trainingu, czyli tego etapu gromadzenia tej wiedzy i uczenia tych wzorców.
Ostatnie odcinki
-
AI zamiast lekarza? ChatGPT Health vs Google Me...
01.02.2026 18:45
-
Wielkie Podsumowanie AI w 2025 - Modele, Narzęd...
09.01.2026 05:00
-
GPT-5.2 to GEMINI KILLER? Google VS OpenAI, MCP...
01.01.2026 10:51
-
Gemini 3 to hit, ale konkurencja nie śpi! GPT-5...
01.12.2025 12:38
-
Cursor 2.0 vs Windsurf SWE-1.5 - dobrze, szybko...
04.11.2025 05:00
-
Czy agenci AI zdominują branżę e-commerce? Chat...
04.10.2025 06:10
-
Czy agenci AI zdominują branżę e-commerce? Chat...
03.10.2025 05:05
-
GPT-5: sukces i porażka. Koniec marzeń o AGI pr...
01.09.2025 09:02
-
Czy AI spowalnia programistów? Halucynacje w NC...
02.08.2025 06:27
-
5 mitów programowania z AI - zapomnij o Vibe Co...
29.07.2025 06:00