AI stanie się bezużyteczne? Na czym polega "zapaść modelu"?
Dostępne AI generatory tekstu i obrazu są tak dobre, ponieważ uczą się na danych stworzonych przez ludzi. Co stanie się, jeśli będą trenować na wytworach AI?
Generatory tekstu i obrazu, takie jak ChatGPT i Midjourney często zaskakują jakością swoich wytworów. Uczą się na zawartości internetu, w której mają do dyspozycji teksty i obrazy tworzone przez ludzi od tysięcy lat. Obecnie sieć jest zalewana ogromną liczbą obrazów i treści stworzonych przez AI. Co stanie się, gdy zostaną włączone do baz, z których uczą się generatory?
Nawet mając do dyspozycji niezliczone ilości zdjęć i obrazów Midjourney nadal kiepsko radzi sobie z odwzorowywaniem ludzkich rąk. Jak napisał portal futurism.com, dłonie w wykonaniu tego generatora to często świetna pożywka dla koszmarów. Za dużo palców, za dużo dziwnych dłoni pojawiających się w dziwnych miejscach.
Futurism.com wyjaśnia, że jest tak dlatego, że na obrazach i zdjęciach, z których uczy się Midjourney, dłonie są mniejsze, gorzej widoczne i oświetlone niż twarze. Widać je pod najróżniejszymi kątami, często coś trzymające. AI nie "rozumie" anatomicznej budowy i znaczenia dłoni, "widzi" zbiory pikseli, na podstawie których generuje ich najbardziej prawdopodobne ułożenie na swoim obrazku.
Na czym polega "zapaść modelu" generatorów opartych na AI?
Co stanie się, jeśli te koszmarki trafią do zbiorów danych, na podstawie których AI się uczy? Nastąpi proces, którzy naukowcy nazywają "zapaścią modelu". To zanieczyszczenie danych powodujące coraz większe oddalanie się wytworów AI od rzeczywistości, aż po całkowitą bezużyteczność generatorów. Można porównać ten proces do biednych mopsów, u których tak długo powielano wady genetyczne wilczych przodków, aż otrzymano ledwo żyjące karykatury pierwowzoru.
Portal venturebeat.com napisał, że sposobem na zapobieganie zapaści modeli może być "utrzymywanie czystości" oryginalnych baz danych. Już teraz twórcy nowych generatorów sięgają do archiwów internetu sprzed ChatGPT i Midjourney.
To jednak rozwiązanie nieidealne, ponieważ pozbawia bazy najaktualniejszych danych, co również z biegiem czasu doprowadzi do bezużyteczności generatorów. Najbardziej pomogłoby tagowanie treści tworzonych przez AI i wykluczanie ich z baz generatorów, ale nie jest ono obecnie stosowane.
Popularne
- Turyści nie mogą wnieść jedzenia do ośrodka wczasowego? Internauci w szoku
- Nowa dziewczyna Marcina Dubiela ma już chłopaka? Influencer w szoku
- Wielkie jelito stanęło w Opolu. Mieszkańcy łapią się za głowę?
- Kto wygrał "Twoje 5 Minut 3"? Szalony finał talent show Friza
- Gosia Andrzejewicz zaczepiła Quebonafide. Ma kilka dni namysłu
- Nakrętki przyczepione do butelek frustrują Szwedów? Mieszkańcy walczą z dyrektywą
- Afera o dom FAZY. Friz załatwił dziewczynom łazienkę bez rolet
- Szokująca zabawa dzieci na stacji paliw. "Biedni pracownicy"
- Ignacy Łukasiewicz w Lego Ideas? Potrzebna mobilizacja Polski