gik|iewicz

szukaj
Temat: Programowanie AI

SWE-bench Verified: 5 powodów, dla których ten benchmark już nie działa

Dlaczego SWE-bench Verified przestał być wiarygodnym testem? SWE-bench Verified osiągnął punkt, w którym wyniki bliskie 90% przestały mieć znaczenie praktyczne. Claude Mythos Preview zanotował 93,9% na tym benchmarku w 2026 roku, co brzmi imponująco, ale w rzeczywistości obnaża fundamentalny problem z pomiarem zdolności programistycznych AI. Testujemy narzędzia, które rozwiązują setki zadań z repozytoriów open source, […]

Jak przenieść 100 USD z Claude Code na Zed i OpenRouter

100 USD miesięcznie — tyle wynosi plan Max w Claude Code. Gdy testowałem alternatywy, trafiłem na Zed z OpenRouter. Konfiguracja zajęła mi 15 minut, a oszczędności były natychmiastowe. Źródło: Reallocating $100/Month Claude Code spend to Zed and OpenRouter – Braw.dev TL;DR: Anthropic zmienił limity Claude Code, co skłoniło wielu deweloperów do poszukiwania alternatyw. Przeniesienie budżetu […]

Claude Code w 2026 roku: 512 000 linii kodu i eksplozja popularności

Anthropic wyciekł własny kod źródłowy Claude Code — 512 000 linii kodu w prawie 2000 plików trafiło w marcu 2026 na publiczne repozytorium. Błąd ludzki, nie atak hakerski. Zobaczyłem to na własne oczy. TL;DR: Claude Code to terminalowe narzędzie AI od Anthropic, które w 2026 roku przeżywa eksplozję popularności — z 17,7 mln do 29 […]

OpenAI Codex dostaje wtyczki — dogania Claude Code i Gemini CLI

OpenAI wypuścił pluginy do Codex z 20+ gotowymi integracjami — GitHub, Slack, Notion, Gmail, Figma, Cloudflare. To bezpośrednia odpowiedź na Claude Code, który marketplace rozszerzeń ma od początku 2026 roku. Czy OpenAI faktycznie dogania konkurencję, czy tylko powtarza czyjeś pomysły? TL;DR: OpenAI dodał obsługę pluginów do narzędzia Codex — bundle zawierają skills (prompty), integracje z […]