gik|iewicz

szukaj
Temat: machine learning

VibeThinker: mały model 3B, który pokonuje Opus w reasoningu

Grupa badawcza Weibo AI udostępniła model VibeThinker-3B posiadający zaledwie 3 miliardy parametrów, który osiąga wyniki na poziomie Claude Opus 4.5 w testach kodowania. To niewielkie rozwiązanie oparte na starszej architekturze Qwen2.5 pokonuje systemy klasy DeepSeek V3.2 o rozmiarze 671 miliardów parametrów. TL;DR: VibeThinker-3B to model od Weibo AI bazujący na Qwen2.5-Coder-3B, który wykorzystuje proces douczania […]

Apple Foundation Models 3: Jak Apple trenuje sztuczną inteligencję na iPhonie

Apple zaprezentowało trzecią generację Foundation Models podczas WWDC 2026, wprowadzając model posiadający 20 miliardów parametrów, który uruchamia się bezpośrednio na iPhonie bez konieczności korzystania z chmury. Ta architektura sztucznej inteligencji stanowi fundament dla kolejnej wersji systemu z Cupertino. Więcej szczegółów na ten temat można znaleźć na stronie MacRumors: Wiadomości i plotki o Apple. Czym są […]

Jak wytrenować własny model LLM od zera w 5 kroków

TL;DR: Wytrenowanie własnego LLM od zera to proces pięciu etapów: zrozumienia matematyki, przygotowania danych, konfiguracji infrastruktury, projektowania architektury oraz treningu z ewaluacją. Model Talkie-1930 pokazuje, że niezależne projekty są realne. Choć mniejsze architektury świetnie sprawdzają się w wielu zastosowaniach i można je trenować bardzo tanio, trening potężnego modelu językowego od zera wymaga odpowiedniej infrastruktury GPU […]