gik|iewicz

szukaj
Temat: GPT-5.5

Testuję bezpieczeństwo aplikacji za 1500 dolarów z pomocą LLM

title: „Aplikacja za 1500 dolarów złamana przez sztuczną inteligencję” description: „Test hakowania podatnej aplikacji przez modele LLM za 1500 dolarów. GPT-4 skutecznie exploitował luki, Claude odmawiał ataku. Sprawdź wyniki eksperymentu bezpieczeństwa.” coverImage: „https://gikiewicz.eu/wp-content/uploads/2026/06/zbudowalem-podatna-aplikacje-i-wydalem-1500-dolarow-by-spraw-cover.jpg” date: „2026-06-04” author: „Grzegorz Kikiewicz” category: „bezpieczeństwo” tags: [...]

GPT-5.5 włamuje się za 1500 dolarów, Gemini odmawia udziału

Badacz bezpieczeństwa wydał 1500 USD (ok. 5900 zł) na przetestowanie 13 modeli LLM w atakach na aplikację pełną luk. GPT-5.5 wygrał z wynikiem 70% skuteczności, podczas gdy Gemini niemal całkowicie odmówił udziału w teście. Jak wypadło GPT-5.5 w teście hakowania za 1500 USD? Dlaczego Gemini odmówił udziału w próbach hakowania? Ile kosztowało pojedyncze próby ataku […]

3 modele OpenAI dostępne na Amazon Bedrock

Amazon Web Services ogłosił ogólną dostępność modeli frontier OpenAI oraz agenta kodującego Codex na platformie Amazon Bedrock. Trzy modele – GPT-5.5, GPT-5.4 i Codex – trafiły do oferty z pay-per-token pricing, wbudowanym bezpieczeństwem i governance. Przedsiębiorstwa zyskały nową ścieżkę wdrożeniową bez opuszczania ekosystemu AWS. TL;DR: OpenAI udostępniło 3 modele (GPT-5.5, GPT-5.4, Codex) w ogólnej dostępności […]

Claude Opus 4.8 vs GPT-5.5: nowe wyniki i porównanie

Anthropic wydał Claude Opus 4.8 z wynikiem 69.2% na SWE-bench Pro – o 4.9 punktu procentowego więcej niż Opus 4.7. Model wyprzedza GPT-5.5 w rankingach kodowania, choć OpenAI wciąż prowadzi w wybranych kategoriach. Gemini 3.1 Pro pozostaje w tyle w testach agentowych. TL;DR: Claude Opus 4.8 uzyskał 69.2% na SWE-bench Pro, 1890 Elo na GDPval-AA […]

ChatGPT 5.5 Pro: 5 wniosków z testów na poziomie doktoratu

Timothy Gowers opublikował test ChatGPT 5.5 Pro na poziomie doktoranckim – model wygenerował pracy badawczą w 60 minut Timothy Gowers, Fields medalista z 1998 roku, udostępnił szczegółowe podsumowanie swoich testów ChatGPT 5.5 Pro. Model wygenerował fragment pracy badawczej na poziomie PhD w ciągu około 60 minut. Gowers zaznaczył, że musiał zrewidować swoją ocenę możliwości matematycznych […]

GPT-4.5 w ChatGPT: nowy model z mniejszą halucynacją

GPT-5.5 Instant w ChatGPT: koniec z cringiem i halucynacjami? OpenAI zastępuje model GPT-5.3 Instant nową wersją GPT-5.5 Instant, która od teraz jest domyślna dla wszystkich użytkowników. Aktualizacja jest całkowicie darmowa i nie wymaga żadnej aktywacji – nowy model uruchamia się automatycznie po otwarciu nowego czatu. Nowość generuje o 20% krótsze odpowiedzi, rzadziej zmyśla fakty, lepiej […]

Kimi K2.6: Chiński model pokonuje Claude i GPT-5.5

Firma Moonshot AI z Chin wypuściła model Kimi K2.6, który w testach programistycznych pokonuje rozwiązania od Anthropic, OpenAI oraz Google. Ceny dostępu do API zaczynają się od ułamka kosztów konkurencji zachodniej. TL;DR: Kimi K2.6 to model językowy od chińskiej firmy Moonshot AI, który w benchmarkach programistycznych wyprzedza Claude, GPT-5.5 oraz Gemini. Model oferuje funkcjonalność na […]

Kimi K2.6 pokonuje Claude – 5 faktów, które musisz znać

Model Kimi K2.6 od chińskiej firmy Moonshot AI pokonał Claude, GPT-5.5 i Gemini w niezależnym wyzwaniu programistycznym. Testy obejmowały generowanie kodu, orkiestrację narzędzi i utrzymanie kontekstu w złożonych projektach. Wynik budzi dyskusję o konkurencyjności modeli open-source. TL;DR: Kimi K2.6 od Moonshot AI wygrał z Claude, GPT-5.5 i Gemini w teście programistycznym obejmującym kodowanie, orkiestrację narzędzi […]

Amator z ChatGPT rozwiazał problem Erdősa. Jak AI zmienia matematykę

Prawdziwy amator matematyki użył ChatGPT do rozwiązania problemu, nad którym profesjonaliści pracowali przez dekady. Ten przypadek pokazuje, jak modele językowe zmieniają dostęp do zaawansowanych badań naukowych. TL;DR: Użytkownik bez formalnego wykształcenia matematycznego wykorzystał ChatGPT do znalezienia rozwiązania wariacji problemu Erdősa. Model pomógł w sformułowaniu dowodu, wygenerowaniu kroków logicznych oraz weryfikacji obliczeń. Sprawa ta ilustruje, jak […]

AI 24.04.2026

GPT-5.5 od OpenAI: 5 kroków ku super aplikacji AI

OpenAI wypuściło GPT-5.5, model określany jako „nowa klasa inteligencji” i pierwszy od GPT-4.5 w pełni retrainowany model bazowy. Aktualizacja pojawia się zaledwie kilka tygodni po GPT-5.4. Tempo jest oszałamiające. TL;DR: OpenAI udostępniło GPT-5.5, pierwszy w pełni retrainowany model bazowy od GPT-4.5, z lepszą wydajnością agenticzną, mniejszą halucynacją i rozszerzonymi możliwościami programistycznymi. Model celuje w klientów […]