
EY Canada wycofało raport – AI wygenerowało fałszywe źródła
Firma EY Canada opublikowała raport o cyberbezpieczeństwie, który miał stanowić kompendium wiedzy dla branży. Zamiast tego stał się dowodem na to, jak AI generuje fałszywe źródła. Większość przypisów w dokumencie po prostu nie istnieje.
TL;DR: EY Canada wycofało raport o cyberbezpieczeństwie po ujawnieniu, że większość cytowanych źródeł to halucynacje AI. Dokument zawierał dziesiątki przypisów do badań i artykułów, które nigdy nie powstały. Sprawa pokazuje, jak niebezpieczne jest bezkrytyczne wykorzystywanie narzędzi typu ChatGPT czy Claude w tworzeniu raportów analitycznych.
Jak wykryto zmyślone przypisy w raporcie EY Canada?
Kilka tygodni po publikacji raportu badacze niezależnie zweryfikowali losowe przypisy z dokumentu. Okazało się, że cytowane raporty organizacji branżowych nie istnieją w żadnej bazie. Co więcej, nazwiska autorów tych publikacji również były fikcyjne. EY Canada musiało wycofać cały dokument i wydać oświadczenie. Sprawa trafiła na łamy portali technologicznych, między innymi Radio ZET opisuje zjawisko fałszywych treści generowanych przez AI, podkreślając rosnący problem dezinformacji.
Halucynacje to znany problem modeli językowych. Systemy takie jak ChatGPT czy Gemini generują tekst, który brzmi wiarygodnie, ale nie ma pokrycia w faktach. W przypadku raportów analitycznych konsekwencje są poważne – decydenci podejmują działania na podstawie danych, które są po prostu zmyślone. Ponadto, sprawia to ogromne trudności w późniejszym audycie.
Kto stwierdził, że przypisy są fałszywe?
Weryfikację przeprowadzili badacze cyberbezpieczeństwa oraz dziennikarze specjalizujący się w technologii. Zauważyli oni, że część przypisów wskazuje na badania o tytułach, które brzmią prawdopodobnie, ale nie figurują w żadnym katalogu naukowym. Dokument wyglądał profesjonalnie, ale jego fundamenty były puste. Zatem, rygorystyczna kontrola okazała się kluczowa.
Na przykład jeden z przypisów cytował rzekomy raport organizacji branżowej z 2024 roku. Gdy badacze spróbowali odnaleźć oryginał, okazało się, że organizacja nigdy takiego raportu nie wydała. Podobnie było z kilkunastoma kolejnymi źródłami – tytuły istniały tylko w wyobraźni modelu językowego, który wygenerował tekst raportu.
Oto kilka typowych oznak zmyślonych przypisów wykrytych w dokumencie:
- Tytuły badań brzmią profesjonalnie, ale nie ma ich w żadnej bazie
- Nazwiska autorów są fikcyjne lub należą do osób niepowiązanych z tematem
- Numery DOI nie istnieją w systemach rejestracji publikacji naukowych
- Data wydania jest sprzeczna z treścią – na przykład cytuje dane z przyszłości
- Wydawca zaprzecza publikacji danego materiału
- Fragmenty rzekomo cytowanego tekstu nie pojawiają się w oryginale
- Adresy URL w przypisach prowadzą do stron błędów 404
- Bibliografia zawiera pozycje o identycznej strukturze, sugerującą generowanie automatyczne
Dlaczego narzędzia AI generują fałszywe źródła?
Modele językowe nie wyszukują informacji w bazach danych. Zamiast tego przewidują kolejne tokeny na podstawie wzorców z danych treningowych. Gdy model napotyka pytanie o źródło, generuje tekst, który statystycznie pasuje do formatu cytatu naukowego. Efekt to przypis, który wygląda prawdziwie, ale nie ma odzwierciedlenia w rzeczywistości. Choć, z perspektywy systemu to poprawne dopasowanie.
| Cecha | Prawdziwy przypis | Zmyślony przypis (halucynacja) |
|---|---|---|
| Autor | Istnieje, ma publikacje | Brak wyników w wyszukiwarce |
| Tytuł | Znajduje się w bazach (Google Scholar) | Brak w jakimkolwiek katalogu |
| Wydawca | Potwierdza publikację | Zaprzecza wydaniu |
| URL | Działa, prowadzi do treści | Błąd 404 lub brak domeny |
| Rok | Logiczny, spójny z treścią | Często sprzeczny z danymi |
Problem ten dotyczy wszystkich modeli – ChatGPT, Claude, Gemini. Żaden z nich nie jest odporny na halucynacje w kontekście cytowań. Jak podkreśla TECHNOSenior w analizie cyberzagrożeń, cyberprzestępcy również wykorzystują AI do generowania fałszywych treści, co dodatkowo komplikuje krajobraz bezpieczeństwa.
Czym różni się ta sytuacja od zwykłego błędu redakcyjnego?
Klasyczny błąd redakcyjny to literówka, zły rok czy nieaktualna statystyka. W przypadku raportu EY Canada mamy do czynienia z systematycznym generowaniem fikcyjnych źródeł na skalę obejmującą większość bibliografii. To nie jest pojedyncza pomyłka. To strukturalny problem procesu tworzenia dokumentu.
Normalnie proces redakcyjny obejmuje weryfikację faktograficzną. W tym przypadku najwyraźniej ten etap został pominięty lub wykonany powierzchownie. Narzędzie AI wygenerowało tekst z przypisami, a ktoś zaakceptował wynik bez sprawdzenia. Taka praktyka jest niebezpieczna, ponieważ raporty doradcze kształtują decyzje biznesowe na poziomie zarządów i rad nadzorczych.
Zjawisko to wpisuje się w szerszy trend opisywany przez RP.pl w kontekście cyfrowego bezpieczeństwa Polski – organizacje tracą kontrolę nad jakością treści, które produkują. Automatyzacja bez weryfikacji to prosta droga do utraty wiarygodności.
Jakie konsekwencje poniosło EY Canada?
Po ujawnieniu sprawy EY Canada wycofało raport z obiegu. Firma wydała oświadczenie przyznające, że dokument zawierał nieprawidłowe cytowania. Sprawa odbiła się szerokim echem w branży doradczej i technologicznej, podważając wiarygodność jednej z największych firm konsultingowych na świecie.
Reputacja w branży doradczej opiera się na zaufaniu. Klient płaci za rzetelną analizę, a nie za fikcję literacką z ramki naukowej. Warto sprawdzić każdy przypis, niezależnie od tego, kto jest autorem raportu. Incydent ten pokazuje, że nawet największe organizacje są podatne na błędy wynikające z bezrefleksyjnego korzystania z AI.
Konsekwencje wykraczają poza samą firmę. Cała branża doradcza musiała zmierzyć się z pytaniem o to, jak weryfikuje treści generowane z pomocą narzędzi AI. Podobnie jak w przypadku fałszywych alarmów opisywanych przez RP.pl, gdzie sprawne służby okazują się bezradne wobec zalewu dezinformacji, tutaj branża doradcza stanęła przed podobnym wyzwaniem weryfikacji.
Czego ta sprawa uczy organizacje korzystające z AI?
Organizacje muszą traktować AI jako narzędzie wspomagające, a nie zastępcze. Każdy wygenerowany tekst wymaga weryfikacji, szczególnie w obszarze cytowań i źródeł. Proces redakcyjny nie może być pomijany, nawet gdy deadline jest blisko.
Najważniejsze jest budowanie procesów, w których człowiek weryfikuje każdy fakt wygenerowany przez model. Na przykład, jeśli ChatGPT podaje źródło, analityk musi je odnaleźć w oryginalnej bazie. Dopiero wtedy informacja trafia do raportu. To kosztuje czas, ale chroni przed wpadkami na skalę tej, jaką zanotowało EY Canada.
Jakie techniki weryfikacji przypisów stosują redakcje?
Redakcje i zespoły analityczne wprowadzają procedury sprawdzania każdego źródła przed publikacją. Wymaga to ręcznego potwierdzenia, czy cytowany autor istnieje, czy tytuł publikacji znajduje się w katalogach oraz czy linki prowadzą do aktywnych stron. Ponad 80 proc. dochodów ze sprzedaży usług cyfrowych w krajach Unii Europejskiej trafia do firm z USA (RP.pl, 2025), co pokazuje skalę zależności od cyfrowych procesów, które często nie mają odpowiednich procedur kontroli jakości.
Proces weryfikacji bywa żmudny. Wymaga dostępu do baz naukowych i czasem kontaktu z autorami. Zwykłe sprawdzenie w wyszukiwarce to za mało, ponieważ wygenerowane przez AI tytuły potrafią wyglądać bardzo wiarygodnie. Dlatego redakcje muszą inwestować w narzędzia do fact-checkingu i szkolić zespoły z rozpoznawania halucynacji.
Oto podstawowe techniki stosowane podczas weryfikacji:
- Sprawdzenie istnienia cytowanego autora w bazach takich jak Google Scholar
- Weryfikacja numeru DOI w rejestrach publikacji naukowych
- Kopiowanie fragmentów tytułu do wyszukiwarki z dopiskiem „PDF” lub „abstract”
- Kontakt bezpośredni z wydawcą w celu potwierdzenia wydania publikacji
- Sprawdzenie domeny URL pod kątem rejestracji i historii
- Analiza treści pod kątem sprzeczności dat i danych
- Porównanie cytowanego fragmentu z dostępnymi bazami tekstowymi
- Ustalenie autentyczności wydania oryginalnego dokumentu
Czy halucynacje AI można całkowicie wyeliminować?
Nie da się całkowicie wyeliminować halucynacji z modeli językowych, ponieważ generowanie tekstu opiera się na prawdopodobieństwie, a nie na bazie danych. Co piąty badany deklaruje, że padł ofiarą cyberataku lub oszustwa internetowego (Radio ZET, 2025), co oznacza, że fałszywe treści generowane przez AI stanowią realne zagrożenie. Zmniejszenie ryzyka wymaga jednak odpowiednich procedur.
Modele takie jak ChatGPT czy Claude nie rozumieją pojęcia prawdy. Wygenerowane cytaty zawsze będą wymagały ludzkiej weryfikacji. Nawet najlepsze prompty nie gwarantują poprawności. System może podać prawdziwe źródło z błędnym rokiem albo zniekształcić tytuł. W rezultacie jedyną obroną pozostaje faktografia wykonywana przez człowieka przed każdą publikacją.
Jak branża doradcza reaguje na incydent EY Canada?
Po incydencie EY Canada firmy doradcze zaczęły wprowadzać dodatkowe warstwy weryfikacji dokumentów tworzonych z pomocą AI. W okresie Q4 2025 – Q1 2026 wzrosła aktywność grup cyberprzestępczych (TECHNOSenior, 2026), co sprawia, że branża musi jednocześnie walczyć z fałszywymi treściami wewnętrznymi i zewnętrznymi zagrożeniami.
Wiele firm wprowadziło zakaz bezpośredniego kopiowania treści z modeli językowych do raportów końcowych. Analitycy muszą korzystać z AI wyłącznie jako narzędzia do burzy mózgów i tworzenia szkiców. Źródła muszą być dodawane ręcznie. To powolny proces, jednakże chroni firmę przed powtórzeniem błędu EY Canada.
Często zadawane pytania
Ile przypisów w raporcie EY Canada okazało się zmyślonych?
Większość przypisów zweryfikowanych przez badaczy okazała się fikcyjna – cytowane raporty nie istniały w żadnej bazie, a nazwiska autorów były wygenerowane. Co piąty badany deklaruje, że padł ofiarą cyberataku lub oszustwa internetowego (Radio ZET, 2025), co pokazuje skalę zagrożenia związanego z fałszywymi treściami w sieci.
Jak szybko wykryto fałszywe źródła w raporcie?
Badacze i dziennikarze wykryli problem w ciągu kilku tygodni od publikacji poprzez losową weryfikację przypisów w bazach naukowych. Ponad 80 proc. dochodów ze sprzedaży usług cyfrowych w krajach Unii Europejskiej trafia do firm z USA (RP.pl, 2025), co dowodzi, jak ważna jest rzetelna weryfikacja w procesach opartych na danych.
Czy ChatGPT, Claude i Gemini równie często halucynują przypisy?
Wszystkie modele językowe generują fałszywe cytaty, ponieważ nie wyszukują danych w bazach, lecz przewidują tokeny na podstawie wzorców. Żaden model nie jest odporny na halucynacje cytowań, niezależnie od producenta rozwiązania.
Jakie narzędzia pomagają w wykrywaniu zmyślonych źródeł?
Narzędzia takie jak Google Scholar, CrossRef DOI Checker oraz wyszukiwarki akademickie pozwalają szybko zweryfikować istnienie publikacji. W okresie Q4 2025 – Q1 2026 wzrosła aktywność grup cyberprzestępczych (TECHNOSenior, 2026), co oznacza konieczność stosowania rygorystycznych procedur sprawdzania autentyczności źródeł.
Podsumowanie
Sprawa EY Canada to przypomnienie, że narzędzia AI wymagają nadzoru człowieka. Każdy wygenerowany przypis może być fikcją. Każda statystyka może być zmyślona.
- Modele językowe halucynują cytaty – to ich strukturalna cecha, nie błąd do naprawienia
- Weryfikacja faktograficzna musi być etapem obowiązkowym w każdym procesie redakcyjnym
- Branża doradcza wprowadza nowe procedury kontroli jakości po incydencie EY Canada
- Cyberprzestępcy również wykorzystują AI do generowania fałszywych treści, co podwaja zagrożenie
- Zaufanie buduje się latami, a traci jednym raportem z fikcyjnymi źródłami
Więcej o tym, jak organizacje mogą lepiej zarządzać procesami analitycznymi, przeczytasz w artykule o ekonomice zespołów programistycznych i dlaczego większość organizacji inżynieryjnych działa w ciemno. Sprawdź go, zanim Twój zespół powtórzy błąd EY Canada.