AI stanie się bezużyteczne? Na czym polega "zapaść modelu"?
Dostępne AI generatory tekstu i obrazu są tak dobre, ponieważ uczą się na danych stworzonych przez ludzi. Co stanie się, jeśli będą trenować na wytworach AI?
Generatory tekstu i obrazu, takie jak ChatGPT i Midjourney często zaskakują jakością swoich wytworów. Uczą się na zawartości internetu, w której mają do dyspozycji teksty i obrazy tworzone przez ludzi od tysięcy lat. Obecnie sieć jest zalewana ogromną liczbą obrazów i treści stworzonych przez AI. Co stanie się, gdy zostaną włączone do baz, z których uczą się generatory?
Nawet mając do dyspozycji niezliczone ilości zdjęć i obrazów Midjourney nadal kiepsko radzi sobie z odwzorowywaniem ludzkich rąk. Jak napisał portal futurism.com, dłonie w wykonaniu tego generatora to często świetna pożywka dla koszmarów. Za dużo palców, za dużo dziwnych dłoni pojawiających się w dziwnych miejscach.
Futurism.com wyjaśnia, że jest tak dlatego, że na obrazach i zdjęciach, z których uczy się Midjourney, dłonie są mniejsze, gorzej widoczne i oświetlone niż twarze. Widać je pod najróżniejszymi kątami, często coś trzymające. AI nie "rozumie" anatomicznej budowy i znaczenia dłoni, "widzi" zbiory pikseli, na podstawie których generuje ich najbardziej prawdopodobne ułożenie na swoim obrazku.
Na czym polega "zapaść modelu" generatorów opartych na AI?
Co stanie się, jeśli te koszmarki trafią do zbiorów danych, na podstawie których AI się uczy? Nastąpi proces, którzy naukowcy nazywają "zapaścią modelu". To zanieczyszczenie danych powodujące coraz większe oddalanie się wytworów AI od rzeczywistości, aż po całkowitą bezużyteczność generatorów. Można porównać ten proces do biednych mopsów, u których tak długo powielano wady genetyczne wilczych przodków, aż otrzymano ledwo żyjące karykatury pierwowzoru.
Portal venturebeat.com napisał, że sposobem na zapobieganie zapaści modeli może być "utrzymywanie czystości" oryginalnych baz danych. Już teraz twórcy nowych generatorów sięgają do archiwów internetu sprzed ChatGPT i Midjourney.
To jednak rozwiązanie nieidealne, ponieważ pozbawia bazy najaktualniejszych danych, co również z biegiem czasu doprowadzi do bezużyteczności generatorów. Najbardziej pomogłoby tagowanie treści tworzonych przez AI i wykluczanie ich z baz generatorów, ale nie jest ono obecnie stosowane.
Popularne
- Polka zmarła na egzotycznej wyspie. Miała 27 lat i żywiła się wyłącznie owocami
- Ekipa otworzy sklep stacjonarny. Znamy lokalizację i datę otwarcia
- Wege burgery na celowniku UE. "Zakaz byłby krokiem wstecz"
- "POLSKA GUROM" - Przemek Kucyk zgłasza się na Eurowizję. To jego topka polskiej (pop)kultury
- Nudna reklama Friza i Wersow. Recenzja "Friz & Wersow. Miłość w czasach online"
- Streamerka urodziła dziecko podczas transmisji. CEO Twitcha gratuluje
- Billie Eilish zaatakowana przez fana na własnym koncercie. "Obrzydliwe"
- Żabka sprzedaje spalone nuggetsy? Test halloweenowej nowości
- Pokazał mieszkanie 11 m2 w Warszawie. Serio, to nie jest żart