gik|iewicz

szukaj
Temat: AI

SANA-WM: model open source generuje minutowe wideo w 720p

NVIDIA wypuściła SANA-WM – model świata o 2,6 miliarda parametrów, który generuje 60-sekundowe wideo w rozdzielczości 720p na pojedynczym GPU. Projekt jest w pełni open-source i oferuje precyzyjną kontrolę kamery 6-DoF na podstawie jednego obrazu wejściowego oraz ścieżki kamery. Czym jest SANA-WM i jak działa ten model świata od NVIDII? Jakie są wymagania sprzętowe do […]

AI po raz pierwszy złamało otwarty format CTF – sensacja czy PR?

Systemy sztucznej inteligencji z powodzeniem rozwiązują otwarte formaty Capture The Flag. Zawody CTF, tradycyjnie domeną ekspertów cybersecurity, stają się areną rywalizacji algorytmów. Czy ludzcy gracze wciąż mają przewagę? TL;DR: Sztuczna inteligencja coraz skuteczniej łamie otwarte formaty CTF, analizując podatności w kodzie, odzyskując utracone dane, łamiąc zabezpieczenia kryptograficzne. Modele AI radzą sobie z zadaniami, które jeszcze […]

ChatGPT dostaje Codex na telefon – 5 faktów o nowym narzędziu

OpenAI uruchomiło Codex w aplikacji mobilnej ChatGPT 14 maja 2026 roku. Narzędzie trafiło na iOS oraz Androida w trybie preview, dając dostęp do zarządzania zadaniami koderskimi z telefonu. Funkcja jest dostępna dla wszystkich planów ChatGPT, w tym darmowego. TL;DR: OpenAI zintegrowało Codex z aplikacją ChatGPT na iOS i Androida. Użytkownicy mogą monitorować zadania koderskie, zatwierdzać […]

Opera-browser-cli: sterowanie przeglądarką z konsoli

Opera udostępniła opera-browser-cli – narzędzie CLI pozwalające sterować przeglądarką Opera Neon bezpośrednio z terminala. Pakiet oferuje 38 komend, a jego głównym celem jest umożliwienie lokalnym agentom AI automatyzacji zadań przeglądarkowych bez interfejsu graficznego. TL;DR: Opera wprowadziła opera-browser-cli z 38 komendami do sterowania przeglądarką Opera Neon z wiersza poleceń. Narzędzie pozwala lokalnym agentom AI na automatyzację […]

Needle: model 26 mln parametrów przejmuje wywoływanie narzędzi z Gemini

Zespół Needle udowodnił, że wywoływanie narzędzi z Gemini można skompresować do modelu o rozmiarze 26 milionów parametrów. Projekt pokazuje, jak destylacja wiedzy z dużych modeli językowych pozwala tworzyć lekkie rozwiązania gotowe do uruchomienia bezpośrednio na urządzeniach mobilnych. TL;DR: Needle to skompresowany model o wielkości 26 milionów parametrów, który przejmuje funkcję wywoływania narzędzi z Gemini. Zespół […]

Claude Code na autopilocie: 5 faktów o nowym trybie

Anthropic uruchomiło Agent View dla Claude Code – interfejs, który pozwala zarządzać tysiącami sub-agentów AI z jednego dashboardu. Boris Cherny, twórca Claude Code, przyznał, że każdej nocy uruchamia tysiące agentów wykonujących „głębszą pracę” nad kodem. To podejście zmienia sposób, w jaki programiści myślą o automatyzacji. TL;DR: Claude Code Agent View to nowa funkcja pozwalająca monitorować […]

WiFi widzi przez ściany: darmowe narzędzie open source

RuView to system inteligencji przestrzennej opracowany przez badaczy z UC Santa Barbara, który pozwala „widzieć” przez ściany przy użyciu zwykłych sygnałów WiFi. Projekt został udostępniony jako open-source na platformie GitHub, co umożliwia replikację i rozwój rozwiązania przez społeczność akademicką oraz programistów z całego świata. TL;DR: RuView wykorzystuje analizę zniekształceń sygnałów WiFi do mapowania obiektów w […]

DeerFlow od ByteDance: 7 faktów o systemie agentów AI

ByteDance, twórca TikToka, udostępnił DeerFlow jako projekt open-source na GitHub. System łączy wiele modeli językowych w architekturę SuperAgentów, która autonomcznie prowadzi badania i generuje kod. Projekt zyskał tysiące gwiazdek w ciągu kilku tygodni od premiery, co potwierdza zainteresowanie deweloperów rozwiązaniami tego typu. TL;DR: DeerFlow to open-sourceowy framework od ByteDance do autonomicznego researchu i kodowania. Architektura […]

5 różnic między /goal w Codex i Claude Code

OpenAI dodało funkcję /goal do Codex w maju 2026 roku. System pozwala agentowi AI samodzielnie realizować wieloetapowe zadania programistyczne bez ciągłego nadzoru człowieka. Anthropic rozwija podobne mechanizmy w Claude Code, co tworzy bezpośrednią rywalizację na rynku narzędzi agentskich. TL;DR: Funkcja /goal w OpenAI Codex pozwala agentowi AI działać autonomicznie – przyjmuje cel, dekomponuje go na […]

Needle wywołuje funkcje z Gemini w modelu 26M parametrów

Projekt Needle udowadnia, że wywoływanie funkcji z Gemini można skompresować do modelu o rozmiarze zaledwie 26 milionów parametrów. To wynik destylacji wiedzy z dużego modelu językowego do sieci neuronowej, która mieści się w pamięci podręcznej przeglądarki. Wymaga to precyzyjnego treningu. TL;DR: Needle to eksperymentalny projekt destylujący zdolność wywoływania funkcji (function calling) z modelu Gemini do […]

Dlaczego anulowałem ChatGPT Plus i przeszedłem na lokalny LLM

TL;DR: ChatGPT Plus kosztuje 20 USD (ok. 960 zł rocznie), co stanowi istotny wydatek. Przeszedłem na darmowe modele LLM uruchamiane lokalnie na laptopie. Wymaga to odpowiedniego sprzętu i konfiguracji, ale daje pełną prywatność oraz brak limitów zapytań. Dlaczego zrezygnowałem z ChatGPT Plus? Subskrypcja ChatGPT Plus kosztuje 20 USD miesięcznie, co daje 240 USD (ok. 960 […]