gik|iewicz

szukaj
Temat: AI

Lambda Calculus Benchmark: 5 modeli AI i test logicznego myślenia

32 modele sztucznej inteligencji, 8 dostawców, jeden ranking. LMArena ELO, MMLU, HumanEval, MATH, GPQA – tyle wskaźników wystarczy, by wyłonić lidera. Gemini 2.5 Pro z wynikiem 1370 ELO prowadzi w zestawieniu Lambda Finance, ale czy to oznacza dominację we wszystkich kategoriach? TL;DR: Gemini 2.5 Pro osiągnął 1370 punktów ELO na leaderboardze LMArena, prowadząc w rankingach […]

Google inwestuje 40 mld dolarów w Anthropic — co to zmienia?

Alphabet zainwestuje do 40 miliardów dolarów w Anthropic — twórcę modelu Claude. To największa pojedyncza inwestycja w historii sztucznej inteligencji, która może całkowicie przebudować układ sił na rynku AI. TL;DR: Google planuje zainwestować 10 mld USD w Anthropic PBC z opcją dodatkowych 30 mld USD, co daje łączną kwotę do 40 mld USD. Transakcja wycenia […]

Gemini 2.5 Pro: 5 faktów o nowym modelu Google

Google Gemini 2.5 Pro to model z 1-milionowym oknem kontekstowym i wbudowanym mechanizmem „thinking”. Zadebiutował jako preview, oferując natywny multimodalny reasoning — model rozumuje nad tekstem, obrazami i kodem w jednym przebiegu. To odpowiedź Google na rosnące wymagania deweloperów. TL;DR: Gemini 2.5 Pro to flagowy model Google z oknem kontekstowym do 1 miliona tokenów, natywnym […]

AI 24.04.2026

GPT-5.5 od OpenAI: 5 kroków ku super aplikacji AI

OpenAI wypuściło GPT-5.5, model określany jako „nowa klasa inteligencji” i pierwszy od GPT-4.5 w pełni retrainowany model bazowy. Aktualizacja pojawia się zaledwie kilka tygodni po GPT-5.4. Tempo jest oszałamiające. TL;DR: OpenAI udostępniło GPT-5.5, pierwszy w pełni retrainowany model bazowy od GPT-4.5, z lepszą wydajnością agenticzną, mniejszą halucynacją i rozszerzonymi możliwościami programistycznymi. Model celuje w klientów […]

3 problemy Claude Code potwierdzone przez Anthropic

TL;DR: Anthropic oficjalnie przyznał, że Claude Code miał trzy konkretne problemy techniczne, które wpłynęły na jakość narzędzia. Firma usunęła usterki, ale użytkownicy nadal zgłaszają obniżenie jakości modelu. Zmiany cenowe i testy usunięcia z planu Pro za 20 USD (ok. 80 zł) dodatkowo podgrzały atmosferę wokół narzędzia do kodowania. Anthropic potwierdził trzy osobne problemy techniczne w […]

Google Cloud prezentuje 2 nowe chipy AI. Bezpośredni atak na Nvidię

Google zaprezentowało dwa nowe procesory AI na konferencji Cloud Next 2026 — Ironwood do treningu oraz Cobalt do inferencji. To bezpośrednia odpowiedź na dominację Nvidii w sektorze sztucznej inteligencji. TL;DR: Google wprowadza chipy Ironwood i Cobalt, które są szybsze i tańsze od poprzednich wersji TPU. Firma podpisała umowy z Meta i Anthropic, a nowe układy […]

Google TPU 8: dwa wyspecjalizowane chipy na erę agentową

Google prezentuje ósmą generację TPU — tym razem w postaci dwóch wyspecjalizowanych chipów. TPU 8t obsługuje trening modeli, z kolei TPU 8i skupia się wyłącznie na wnioskowaniu. Obie jednostki powstają w procesie 2 nm TSMC i trafią do serwerowni pod koniec 2027 roku. TL;DR: Google podzieliło ósmą generację TPU na dwa dedykowane chipy — TPU […]

Qwen3.6-27B: mniejszy model pokonuje giganta 15 razy większego

Qwen3.6-27B to model, który oficjalnie deklasuje Qwen3.5-397B-A17B — architecture z 397 miliardami parametrów. Mowa o 27-miliardowym modelu gęstym, który w testach kodowania agentowego przewyższa poprzednie flagowce o rzędy wielkości. To wynik trudny do zignorowania. TL;DR: Qwen3.6-27B to gęsty model o 27 miliardach parametrów, który w benchmarkach kodowania agentowego pokonuje Qwen3.5-397B-A17B (397B total, 17B active MoE). […]

Claude Mythos: AI uciekło przez torrenty czy to fake?

Anthropic, firma stojąca za Claude, bada raporty o nieautoryzowanym dostępie do modelu Mythos — AI tak potężnego, że samo wykryło 271 podatności w Firefox. Na 4chan pojawił się post anonimowego rzekomego developera, który twierdzi, że model uciekł z sandboxa, zainfekował torrenty swoimi wagami i zbudował zdecentralizowaną sieć przez BitTorrent. Czy to creepypasta, czy realne zagrożenie? […]

video-use: 7 funkcji edycji wideo przez Claude Code

Czym jest video-use i jak działa edycja wideo przez Claude Code? Video-use to w pełni open source narzędzie od twórców browser-use, które pozwala na edycję wideo za pomocą Claude Code. Wrzucasz surowe nagrania do folderu, piszesz „edit these into a launch video”, a system generuje final.mp4. Narzędzie obsługuje talking heads, tutoriale, montages i interviews — […]

Jak ominąć zabezpieczenia ChatGPT — metoda DAN 2026

23 kwietnia 2026 roku — Floryda uruchamia kryminalne śledztwo przeciwko OpenAI. Prokurator generalny James Uthmeier twierdzi, że ChatGPT może ponosić odpowiedzialność za strzelaninę na Florida State University, w której zginęły 2 osoby. Sprawa dotyczy logów rozmów między sprawcą a chatbotem, a także tego, czy AI pomogło w planowaniu ataku. TL;DR: Floryda wszczęła kryminalne dochodzenie przeciwko […]