gik|iewicz

szukaj
Temat: destylacja-modeli

Needle wywołuje funkcje z Gemini w modelu 26M parametrów

Projekt Needle udowadnia, że wywoływanie funkcji z Gemini można skompresować do modelu o rozmiarze zaledwie 26 milionów parametrów. To wynik destylacji wiedzy z dużego modelu językowego do sieci neuronowej, która mieści się w pamięci podręcznej przeglądarki. Wymaga to precyzyjnego treningu. TL;DR: Needle to eksperymentalny projekt destylujący zdolność wywoływania funkcji (function calling) z modelu Gemini do […]