Mentionsy

Opanuj.AI Podcast
02.08.2025 06:27

Czy AI spowalnia programistów? Halucynacje w NCBR, koniec AI za pół darmo i Kimi K2 czyli nowy chiński król OpenSource. | Opanuj.AI Lipiec 2025

W najnowszym odcinku podcastu omawiamy wpływ AI na polskie innowacje, w tym kontrowersyjny przypadek firmy KP Labs, której projekt kosmiczny został odrzucony przez NCBR na podstawie domniemanych halucynacji. Rozmawiamy także o badaniu, które wykazało spadek produktywności programistów o 19%, analizujemy zmiany w modelach cenowych w narzędziach takich jak Cursor i Claude Code oraz oceniamy jakość benchmarków AI, w tym głośny test "Humanity's Last Exam" oraz zmieniające się warunki rynkowe dla narzędzi AI. Dodatkowo, przyglądamy się najnowszym chińskim open-source’owym modelom AI czyli Kimi-K2 oraz Qwen3-Coder. Posłuchajcie i koniecznie podzielcie się opinią w komentarzach!


00:00 - Zapowiedź odcinka

04:45 - Halucynacje w NCBR

20:36 - AI spowalnia programistów? Komentujemy badanie

45:26 - Zmiany w cennikach AI dev-tools

01:08:50 - Kryzys w benchmarkach

01:19:55 - Nowy król OS z Chin: Kimi-K2


Szukaj w treści odcinka

Znaleziono 2 wyniki dla "Crowe"

Badacze skupili się tutaj na 321 pytaniach z tego benchmarku z zakresu chemii i biologii, bo tam również mieli dostęp do niezależnych ekspertów, którzy mogli weryfikować wyniki wykazane przez ich agenta Crowe.

Rzecz w tym, że Crowe wykazał, że aż 53% tych pytań, tych uzasadnień odpowiedzi na te pytania bezpośrednio się kłóci z dowodami naukowymi i nie ma