AI stanie się bezużyteczne? Na czym polega "zapaść modelu"?
Dostępne AI generatory tekstu i obrazu są tak dobre, ponieważ uczą się na danych stworzonych przez ludzi. Co stanie się, jeśli będą trenować na wytworach AI?
Generatory tekstu i obrazu, takie jak ChatGPT i Midjourney często zaskakują jakością swoich wytworów. Uczą się na zawartości internetu, w której mają do dyspozycji teksty i obrazy tworzone przez ludzi od tysięcy lat. Obecnie sieć jest zalewana ogromną liczbą obrazów i treści stworzonych przez AI. Co stanie się, gdy zostaną włączone do baz, z których uczą się generatory?
Nawet mając do dyspozycji niezliczone ilości zdjęć i obrazów Midjourney nadal kiepsko radzi sobie z odwzorowywaniem ludzkich rąk. Jak napisał portal futurism.com, dłonie w wykonaniu tego generatora to często świetna pożywka dla koszmarów. Za dużo palców, za dużo dziwnych dłoni pojawiających się w dziwnych miejscach.
Futurism.com wyjaśnia, że jest tak dlatego, że na obrazach i zdjęciach, z których uczy się Midjourney, dłonie są mniejsze, gorzej widoczne i oświetlone niż twarze. Widać je pod najróżniejszymi kątami, często coś trzymające. AI nie "rozumie" anatomicznej budowy i znaczenia dłoni, "widzi" zbiory pikseli, na podstawie których generuje ich najbardziej prawdopodobne ułożenie na swoim obrazku.
Na czym polega "zapaść modelu" generatorów opartych na AI?
Co stanie się, jeśli te koszmarki trafią do zbiorów danych, na podstawie których AI się uczy? Nastąpi proces, którzy naukowcy nazywają "zapaścią modelu". To zanieczyszczenie danych powodujące coraz większe oddalanie się wytworów AI od rzeczywistości, aż po całkowitą bezużyteczność generatorów. Można porównać ten proces do biednych mopsów, u których tak długo powielano wady genetyczne wilczych przodków, aż otrzymano ledwo żyjące karykatury pierwowzoru.
Portal venturebeat.com napisał, że sposobem na zapobieganie zapaści modeli może być "utrzymywanie czystości" oryginalnych baz danych. Już teraz twórcy nowych generatorów sięgają do archiwów internetu sprzed ChatGPT i Midjourney.
To jednak rozwiązanie nieidealne, ponieważ pozbawia bazy najaktualniejszych danych, co również z biegiem czasu doprowadzi do bezużyteczności generatorów. Najbardziej pomogłoby tagowanie treści tworzonych przez AI i wykluczanie ich z baz generatorów, ale nie jest ono obecnie stosowane.
Popularne
- Lody Wojanek już wkrótce w Żabce? Podobno już są w niektórych sklepach
- Ola Jasianek zwolniona z pracy. Ekspertka ocenia sprawę
- Zestaw Happy Meal z BTS wkrótce w McDonald's. Tak, będzie dostępny w Polsce
- Nowe seriale 2025. Co obejrzeć jesienią? [LISTA PREMIER]
- Przmek Pro i Kartonii są zaręczeni. Nie wszystko poszło z planem
- "Czy są tu jakieś sexy c*pki". Ile kosztuje merch Fagaty?
- "Pij Wojanka" to prawdziwy hit. Internauci grzmią: "promowanie picia alkoholu"
- Automat z Labubu w warszawskiej galerii. Czy dojdzie do bitwy o viralowe zabawki?
- Nowy najlepszy festiwal w Polsce? TOP momenty BitterSweet Festival