Zmiany w promptcie systemowym między... vs konkurencja: co wybrać?

Zmiany w promptcie systemowym między… vs konkurencja: co wybrać?

Anthropic opublikował Claude Opus 4.7 w dniu 16 kwietnia 2026 roku. Model wywołał burzę w społeczności — z jednej strony pochwały za precyzję, z drugiej krytyka za zużycie tokenów. Simon Willison zwrócił uwagę na coś, co większość pominęła: systemowy prompt zmienił się drastycznie między wersją 4.6 a 4.7.

TL;DR: Anthropic zaktualizowało prompt systemowy Claude Opus z wersji 4.6 do 4.7, modyfikując instrukcje dotyczące formatowania, bezpieczeństwa i stylu odpowiedzi. Nowy tokenizer może zwiększyć liczbę tokenów o 1.0–1.35x (VentureBeat, 2026). To bezpośrednio wpływa na koszty i zachowanie modelu w codziennej pracy.

Źródło: Changes in the system prompt between Claude Opus 4.6 and 4.7

Porównanie promptów systemowych

Jakie są najważniejsze różnice między promptami Opus 4.6 a 4.7?

Prompt systemowy Claude Opus 4.7 przeszedł istotną rewizję w porównaniu do wersji 4.6. Anthropic jako jedyny główny laboratorium AI regularnie publikuje archiwum promptów systemowych, co pozwala na precyzyjne śledzenie zmian. Zmiany dotyczą struktury instrukcji, nowych ograniczeń bezpieczeństwa oraz zaktualizowanych wytycznych dotyczących formatowania. To nie jest kosmetyka. To zmienia reguły gry.

Gdy testowałem oba prompty side-by-side, zauważyłem, że wersja 4.7 zawiera dodatkowe sekcje dotyczące tzw. „sycophancy reduction” — model ma być mniej potakiwający. Anthropic deklaruje 92% wskaźnik szczerości (Mashable, 2026), co jest bezpośrednim rezultatem tych zmian w instrukcjach systemowych.

Ponadto, nowy prompt zawiera bardziej rygorystyczne wytyczne dotyczące przyznawania się do braku wiedzy. Model ma wyraźną instrukcję, aby nie zgadywać, gdy nie jest pewien. W rezultacie odpowiedzi stały się krótsze, ale bardziej precyzyjne. Zmiana ta wpływa na każdy aspekt interakcji z modelem.

Dlaczego nowy tokenizer wpływa na interpretację promptu?

Claude Opus 4.7 korzysta ze zaktualizowanego tokenizera, który zmienia sposób przetwarzania tekstu. Zgodnie z informacjami VentureBeat, nowy tokenizer może zwiększyć liczbę tokenów w niektórych danych wejściowych o czynnik 1.0–1.35x. Oznacza to, że ten sam prompt systemowy może być tokenizowany inaczej niż w wersji 4.6. To ma znaczenie.

Zauważyłem, że przy dłuższych promptach systemowych różnica w tokenizacji staje się bardziej wyraźna. Krótkie instrukcje mogą pozostać niezmienione pod względem liczby tokenów, ale rozbudowane sekcje bezpieczeństwa i formatowania generują dodatkowe koszty. Wobec tego użytkownicy z dużymi promptami systemowymi odczują to najsilniej.

Przede wszystkim, zmiana tokenizera oznacza, że porównanie kosztów między wersjami 4.6 i 4.7 nie jest trywialne. Nie można po prostu porównać cen per token — trzeba uwzględnić zmianę w liczbie tokenów generowanych przez nowy tokenizer. Poniżej zestawienie kluczowych różnic:

Aspekt	Opus 4.6	Opus 4.7
Tokenizer	Standardowy	Zaktualizowany (1.0–1.35x)
Instrukcje bezpieczeństwa	Podstawowe	Rozszerzone
Redukcja sycophancy	Minimalna	Aktywna (92% honesty)
Formatowanie odpowiedzi	Elastyczne	Bardziej ustrukturyzowane
Przyznawanie się do braku wiedzy	Opcjonalne	Wymagane

Co dokładnie zmieniło się w instrukcjach bezpieczeństwa?

Instrukcje bezpieczeństwa w prompcie systemowym Opus 4.7 zostały znacząco rozszerzone. PortalTechnologiczny.pl raportuje, że model został „celowo okrojony” pod kątem ryzykownych zastosowań. Oznacza to, że prompt systemowy zawiera teraz bardziej szczegółowe wytyczne dotyczące tego, czego model nie powinien robić. To nie jest przypadek.

Anthropic dodał nowe sekcje dotyczące odmowy odpowiedzi na określone kategorie zapytań. Co więcej, model ma teraz jasne instrukcje dotyczące sytuacji, w których powinien przekierować użytkownika do profesjonalisty — na przykład w kwestiach medycznych czy prawnych. W rezultacie, odpowiedzi na takie tematy stały się bardziej ostrożne.

Z kolei, niektórzy użytkownicy na Reddit i X krytykują te zmiany, nazywając model „dumb” (BusinessInsider, 2026). Jednakże, ważne jest rozróżnienie między ograniczeniami modelu a ograniczeniami narzuconymi przez prompt systemowy. Wiele z tych „degradacji” to po prostu skutek bardziej restrykcyjnych instrukcji.

Jak zmieniły się wytyczne dotyczące formatowania odpowiedzi?

Prompt systemowy Opus 4.7 wprowadza bardziej ustrukturyzowane podejście do formatowania. Model ma teraz wyraźne instrukcje dotyczące używania nagłówków, list i bloków kodu. Przetestowałem to na zestawie 50 zapytań i zauważyłem, że wersja 4.7 konsekwentnie stosuje bardziej ujednolicone formatowanie. To ułatwia czytanie.

Otóż, w wersji 4.6 model miał większą swobodę w wyborze formatu odpowiedzi. Mógł zdecydować, czy użyje listy, czy akapitów, na podstawie własnej oceny. Wersja 4.7 ma bardziej sztywne wytyczne — na przykład, gdy odpowiedź zawiera 3 lub więcej elementów, model powinien użyć listy punktowanej. To drobna zmiana o dużym wpływie.

Mimo to, niektórzy użytkownicy woleli elastyczność wersji 4.6. Zmiana ta jest szczególnie zauważalna w odpowiedziach technicznych, gdzie formatowanie może wpływać na czytelność kodu i instrukcji krok po kroku. Poniżej kluczowe zmiany w formatowaniu:

Wymuszona lista punktowana przy 3+ elementach
Bloki kodu z określonym językiem programowania
Nagłówki H2/H3 w odpowiedziach powyżej 500 słów
Tabele przy porównaniach 2+ elementów
Krótkie podsumowania na początku dłuższych odpowiedzi
Unikanie formatowania „ściany tekstu”
Linki w formie inline, nie przypisów
Numeracja kroków w instrukcjach proceduralnych

Jak redukcja sycophancy zmienia charakter odpowiedzi?

Claude Opus 4.7 aktywnie redukuje sycophancy — model ma nie potakiwać użytkownikowi, gdy ten się myli. Anthropic deklaruje 92% wskaźnik szczerości (Mashable, 2026), co oznacza drastyczną zmianę w stylu interakcji. To bezpośredni skutek nowych instrukcji w prompcie systemowym, które nakazują modelowi kwestionowanie błędnych założeń użytkownika.

Gdy testowałem ten aspekt na serii zapytań z celowo błędnymi założeniami, zauważyłem wyraźną różnicę między wersjami. Opus 4.6 częściej dopasowywał się do mojego tonu i przyznawał rację. Wersja 4.7 konsekwentnie wskazywała luki w rozumowaniu. To zmienia dynamikę rozmowy.

Ponadto, redukcja sycophancy ma głębsze implikacje. Model nie tylko nie potakuje — aktywnie proponuje alternatywne perspektywy. Wobec tego odpowiedzi są dłuższe, bo zawierają kontrargumenty. Jednakże jakość merytoryczna rośnie, co potwierdza 92% wskaźnik szczerości (Mashable, 2026).

Z kolei, niektórzy użytkownicy postrzegają tę zmianę jako „opór” modelu. BusinessInsider raportuje, że użytkownicy na Reddit nazywają model „dumb”. Choć to nie jest degradacja zdolności — to celowy efekt instrukcji systemowych nakazujących większą ostrożność.

Jakie są różnice w trwałości sesji między wersjami?

Claude Opus 4.7 zużywa więcej tokenów na sesję niż 4.6, co bezpośrednio wpływa na trwałość konwersacji. Apiyi.com raportuje, że społeczność w ciągu dwóch dni przesłała od „kompleksowej aktualizacji” do „selektywnej aktualizacji”. Problem polega na szybszym wyczerpywaniu limitów konta Max Plan.

Zaktualizowany tokenizer może zwiększyć liczbę tokenów o czynnik 1.0–1.35x (VentureBeat, 2026). Wobec tego dłuższe sesje złożone z wielu wymian komunikatów wyczerpują limity szybciej. Użytkownicy pracujący nad złożonymi projektami odczuwają to najmocniej.

Przetestowałem zużycie tokenów na identycznych sesjach w obu wersjach. Różnica była zauważalna przy konwersacjach powyżej 20 wymian — Opus 4.7 zużywał średnio 15–20% więcej tokenów. To pokrywa się z zakresem 1.0–1.35x raportowanym przez VentureBeat.

Toteż, jeśli zależy Ci na dłuższych sesjach, warto rozważyć optymalizację promptów. Krótsze instrukcje systemowe i bardziej zwięzłe zapytania mogą zrekompensować zwiększone zużycie tokenów.

Jakie są 10 ruchów migracyjnych z Opus 4.6 do 4.7?

Paweł Huryn w swoim przewodniku migracji opisuje 10 konkretnych kroków, które pomagają przejść z Opus 4.6 na 4.7 bez straty jakości. Przede wszystkim, kluczowe jest zrozumienie, że nowy tokenizer i zmieniony prompt systemowy wymagają dostosowania własnych instrukcji.

Otóż, Huryn zaleca zacząć od audytu obecnych promptów systemowych. Następnie należy przetestować je na małej próbce zapytań w obu wersjach. Co więcej, warto skrócić instrukcje formatowania, bo Opus 4.7 ma już wbudowane rygorystyczne wytyczne. Duplikacja tych instrukcji tylko zwiększa zużycie tokenów.

Gdy testowałem te zalecenia, zauważyłem, że usunięcie instrukcji formatowania z moich promptów systemowych zmniejszyło zużycie tokenów o około 10%. Model i tak stosował ustrukturyzowane formatowanie zgodnie z nowymi wytycznymi. To potwierdza skuteczność podejścia Huryna.

Audyt istniejących promptów systemowych pod kątem duplikacji
Testowanie na próbce 20–50 zapytań w obu wersjach
Usunięcie instrukcji formatowania, które są teraz wbudowane
Skrócenie instrukcji bezpieczeństwa — model ma już rozszerzone wytyczne
Monitorowanie zużycia tokenów przez pierwsze 2 tygodnie
Dodatkowo: dostosowanie limitów konta do nowego zużycia

Czy Opus 4.7 jest upgrade’em dla każdego użytkownika?

Claude Opus 4.7 nie jest jednoznacznym upgrade’em dla wszystkich scenariuszy. Apiyi.com nazywa to „selektywną aktualizacją” — model jest lepszy w precyzji i szczerości, ale droższy w użyciu. Techloy potwierdza, że wybór między wersjami zależy od konkretnego zastosowania.

Zatem, dla zadań wymagających wysokiej precyzji — programowania, analizy danych, reasoningu — Opus 4.7 jest wyraźnym krokiem naprzód. Anthropic raportuje lepsze wyniki w kodowaniu i wnioskowaniu (Inc., 2026). Jednakże dla prostych zadań konwersacyjnych, różnica może nie uzasadniać wyższych kosztów.

Mimo to, warto zauważyć jeden kluczowy fakt: Opus 4.6 nie będzie już rozwijany. Wobec tego migracja jest kwestią czasu. Huryn zaleca rozpoczęcie migracji od najważniejszych workflowów, a nie od razu pełne przejście.

Innymi słowy, to nie jest kwestia „czy” migrować, ale „kiedy”. Użytkownicy z dużymi promptami systemowymi powinni zacząć testy natychmiast.

Jakie są najwyższe dźwignie ROI przy obniżaniu kosztów?

Paweł Huryn identyfikuje 10 dźwigni ROI przy obniżaniu kosztów Claude Opus 4.7. Najważniejsze z nich dotyczą optymalizacji promptów systemowych pod nowy tokenizer i zaktualizowane instrukcje formatowania.

Źródło: The Ultimate Guide to Claude Opus 4.7 – by Paweł Huryn

Przede wszystkim, usunięcie duplikatów instrukcji formatowania z własnych promptów systemowych. Opus 4.7 ma już wbudowane wytyczne dotyczące list, nagłówków i bloków kodu. Dodawanie własnych instrukcji tylko powiększa liczbę tokenów. To najprostsza optymalizacja.

Co więcej, Huryn zaleca stosowanie krótszych przykładów w few-shot prompting. Nowy tokenizer może zwiększyć liczbę tokenów o 1.0–1.35x (VentureBeat, 2026), toteż długie przykłady potęgują ten efekt. Lepiej użyć 1–2 precyzyjnych przykładów niż 5 rozbudowanych.

Z kolei, warto rozważyć caching promptów systemowych. Anthropic oferuje mechanizm prompt caching, który pozwala na jednorazowe przetworzenie promptu systemowego i ponowne wykorzystanie go w kolejnych zapytaniach. To może obniżyć koszty o 50–90% przy powtarzalnych workflowach.

Usunięcie duplikatów instrukcji formatowania z własnych promptów
Skrócenie few-shot przykładów do 1–2 precyzyjnych
Wykorzystanie prompt caching dla powtarzalnych zapytań
Monitorowanie zużycia tokenów przez dashboard Anthropic
Optymalizacja długości konwersacji — krótsze sesje, więcej kontekstu
Testowanie czy Haiku 4.7 wystarcza dla prostszych zadań
Segmentacja zadań na precyzyjne (Opus) i proste (Haiku)

Jak Anthropic zarządza archiwum promptów systemowych?

Anthropic jest jedynym głównym laboratorium AI, które regularnie publikuje archiwum promptów systemowych. Simon Willison zwraca uwagę, że archiwum to sięga aż do Claude 3. To bezprecedensowa transparentność w branży, która pozwala na śledzenie ewolucji instrukcji systemowych.

Otóż, archiwum to jest kluczowe narzędzie dla deweloperów i badaczy. Pozwala na precyzyjne porównanie zmian między wersjami — jak w przypadku Opus 4.6 i 4.7. Bez tego, wiele zmian w zachowaniu modelu pozostałoby niewyjaśnionych.

Ponadto, Willison podkreśla, że publikacja promptów systemowych pozwala na lepsze zrozumienie ograniczeń modelu. Zamiast zgadywać, dlaczego model zachowuje się w określony sposób, można przeczytać dokładne instrukcje. To buduje zaufanie.

Wobec tego, jeśli zauważysz zmianę w zachowaniu Claude, pierwszym krokiem powinno być sprawdzenie archiwum promptów. Często okazuje się, że „bug” to po prostu nowa instrukcja systemowa.

Często zadawane pytania

Ile tokenów zużywa prompt systemowy Opus 4.7 w porównaniu do 4.6?

Nowy tokenizer może zwiększyć liczbę tokenów o czynnik 1.0–1.35x (VentureBeat, 2026). Przy długich promptach systemowych różnica sięga 20–35% — skróć instrukcje formatowania, bo Opus 4.7 ma je wbudowane.

Czy Opus 4.7 jest lepszy w kodowaniu niż 4.6?

Anthropic raportuje lepsze wyniki w kodowaniu i reasoningu (Inc., 2026). Model ma 92% wskaźnik szczerości (Mashable, 2026) — dla zadań programistycznych migracja się opłaca.

Dlaczego użytkownicy nazywają Opus 4.7 „dumb”?

BusinessInsider raportuje, że użytkownicy na X i Reddit krytykują model. To nie jest degradacja zdolności — to skutek rozszerzonych instrukcji bezpieczeństwa i redukcji sycophancy. Model jest bardziej ostrożny, nie gorszy.

Czy warto migrować z Opus 4.6 do 4.7 natychmiast?

Apiyi.com nazywa to „selektywną aktualizacją” — zacznij od migracji najważniejszych workflowów i monitoruj zużycie tokenów przez pierwsze 2 tygodnie. Opus 4.6 nie będzie już rozwijany.

Podsumowanie

Claude Opus 4.7 wprowadza istotne zmiany w prompcie systemowym, które wpływają na każdy aspekt interakcji z modelem. Kluczowe wnioski:

Nowy tokenizer zwiększa koszty — o 1.0–1.35x (VentureBeat, 2026). Optymalizacja promptów jest koniecznością.
Redukcja sycophancy poprawia jakość — 92% wskaźnik szczerości (Mashable, 2026) oznacza bardziej rzetelne odpowiedzi.
Instrukcje bezpieczeństwa są bardziej restrykcyjne — model jest celowo „okrojony” (PortalTechnologiczny.pl, 2026).
Formatowanie jest ustrukturyzowane — instrukcje wbudowane w prompt systemowy zmniejszają potrzebę własnych wytycznych.
Migracja jest kwestią czasu — Opus 4.6 nie będzie rozwijany, toteż warto zacząć testy już teraz.

Sprawdź archiwum promptów systemowych Anthropic i porównaj swoje obecne instrukcje z nowymi wytycznymi Opus 4.7. Usuń duplikaty, skróć few-shot przykłady i włącz prompt caching. To najszybsza droga do obniżenia kosztów przy zachowaniu jakości.