AI stanie się bezużyteczne? Na czym polega "zapaść modelu"?
Dostępne AI generatory tekstu i obrazu są tak dobre, ponieważ uczą się na danych stworzonych przez ludzi. Co stanie się, jeśli będą trenować na wytworach AI?
Generatory tekstu i obrazu, takie jak ChatGPT i Midjourney często zaskakują jakością swoich wytworów. Uczą się na zawartości internetu, w której mają do dyspozycji teksty i obrazy tworzone przez ludzi od tysięcy lat. Obecnie sieć jest zalewana ogromną liczbą obrazów i treści stworzonych przez AI. Co stanie się, gdy zostaną włączone do baz, z których uczą się generatory?
Nawet mając do dyspozycji niezliczone ilości zdjęć i obrazów Midjourney nadal kiepsko radzi sobie z odwzorowywaniem ludzkich rąk. Jak napisał portal futurism.com, dłonie w wykonaniu tego generatora to często świetna pożywka dla koszmarów. Za dużo palców, za dużo dziwnych dłoni pojawiających się w dziwnych miejscach.
Futurism.com wyjaśnia, że jest tak dlatego, że na obrazach i zdjęciach, z których uczy się Midjourney, dłonie są mniejsze, gorzej widoczne i oświetlone niż twarze. Widać je pod najróżniejszymi kątami, często coś trzymające. AI nie "rozumie" anatomicznej budowy i znaczenia dłoni, "widzi" zbiory pikseli, na podstawie których generuje ich najbardziej prawdopodobne ułożenie na swoim obrazku.
Na czym polega "zapaść modelu" generatorów opartych na AI?
Co stanie się, jeśli te koszmarki trafią do zbiorów danych, na podstawie których AI się uczy? Nastąpi proces, którzy naukowcy nazywają "zapaścią modelu". To zanieczyszczenie danych powodujące coraz większe oddalanie się wytworów AI od rzeczywistości, aż po całkowitą bezużyteczność generatorów. Można porównać ten proces do biednych mopsów, u których tak długo powielano wady genetyczne wilczych przodków, aż otrzymano ledwo żyjące karykatury pierwowzoru.
Portal venturebeat.com napisał, że sposobem na zapobieganie zapaści modeli może być "utrzymywanie czystości" oryginalnych baz danych. Już teraz twórcy nowych generatorów sięgają do archiwów internetu sprzed ChatGPT i Midjourney.
To jednak rozwiązanie nieidealne, ponieważ pozbawia bazy najaktualniejszych danych, co również z biegiem czasu doprowadzi do bezużyteczności generatorów. Najbardziej pomogłoby tagowanie treści tworzonych przez AI i wykluczanie ich z baz generatorów, ale nie jest ono obecnie stosowane.
Popularne
- Natalia Magical założyła niebieską platformę. Ile kosztuje miesięczny dostęp?
- Zbanowali ją z niebieskiej platformy. "Dwa tysiące obcych. Bez żadnych limitów"
- Cameraboy oburzony niebieską platformą Natalii? "Magical jest hipokrytą"
- Daniel Magical dostał bana na kicku. Już nie wróci na platformę?
- Jak smakuje nowy zestaw w KFC "Squid Game"? "Cena jest mega wysoka"
- Edzio Rap drugi raz wbił na O'Block. Nawinął z lokalsami (i przeżył)
- Julii Żugaj pichci ze swoim chłopakiem. Miał być sernik, wyszedł piernik
- Straszna metamorfoza za kratami. Rosyjski youtuber ukarany za żarty
- Żenujący wpis Amadeusza Ferrariego o Natsu. Przekroczył granicę?