AI stanie się bezużyteczne? Na czym polega "zapaść modelu"?
Dostępne AI generatory tekstu i obrazu są tak dobre, ponieważ uczą się na danych stworzonych przez ludzi. Co stanie się, jeśli będą trenować na wytworach AI?
Generatory tekstu i obrazu, takie jak ChatGPT i Midjourney często zaskakują jakością swoich wytworów. Uczą się na zawartości internetu, w której mają do dyspozycji teksty i obrazy tworzone przez ludzi od tysięcy lat. Obecnie sieć jest zalewana ogromną liczbą obrazów i treści stworzonych przez AI. Co stanie się, gdy zostaną włączone do baz, z których uczą się generatory?
Nawet mając do dyspozycji niezliczone ilości zdjęć i obrazów Midjourney nadal kiepsko radzi sobie z odwzorowywaniem ludzkich rąk. Jak napisał portal futurism.com, dłonie w wykonaniu tego generatora to często świetna pożywka dla koszmarów. Za dużo palców, za dużo dziwnych dłoni pojawiających się w dziwnych miejscach.
Futurism.com wyjaśnia, że jest tak dlatego, że na obrazach i zdjęciach, z których uczy się Midjourney, dłonie są mniejsze, gorzej widoczne i oświetlone niż twarze. Widać je pod najróżniejszymi kątami, często coś trzymające. AI nie "rozumie" anatomicznej budowy i znaczenia dłoni, "widzi" zbiory pikseli, na podstawie których generuje ich najbardziej prawdopodobne ułożenie na swoim obrazku.
Na czym polega "zapaść modelu" generatorów opartych na AI?
Co stanie się, jeśli te koszmarki trafią do zbiorów danych, na podstawie których AI się uczy? Nastąpi proces, którzy naukowcy nazywają "zapaścią modelu". To zanieczyszczenie danych powodujące coraz większe oddalanie się wytworów AI od rzeczywistości, aż po całkowitą bezużyteczność generatorów. Można porównać ten proces do biednych mopsów, u których tak długo powielano wady genetyczne wilczych przodków, aż otrzymano ledwo żyjące karykatury pierwowzoru.
Portal venturebeat.com napisał, że sposobem na zapobieganie zapaści modeli może być "utrzymywanie czystości" oryginalnych baz danych. Już teraz twórcy nowych generatorów sięgają do archiwów internetu sprzed ChatGPT i Midjourney.
To jednak rozwiązanie nieidealne, ponieważ pozbawia bazy najaktualniejszych danych, co również z biegiem czasu doprowadzi do bezużyteczności generatorów. Najbardziej pomogłoby tagowanie treści tworzonych przez AI i wykluczanie ich z baz generatorów, ale nie jest ono obecnie stosowane.
Popularne
- Ile lat więzienia czeka Brainroty z TikToka? Bombardiro Crocodilo pocierpi najdłużej
- Julia Żugaj wzruszona sukcesem swojego chłopaka? "Jestem dumna"
- Zestawy Reziego w Pasibusie. Ile kosztuje zaskakująca nowość?
- Czy 100 ludzi pokona goryla? Absurdalne pytanie rozpala internet
- Viral Kebab już otwarty. Co wiadomo o nowym biznesie Ekipy?
- Łatwogang nagra collab z bbno$? Internauci muszą spełnić jeden warunek
- Lokal sushi sparodiował zmarłego kilka dni temu rapera. "Joka zszedł z nieba"
- Przez 18 lat kąsały go węże. Teraz jest niezniszczalny
- Kick ma beef z TVP 2. Telewizja Polska bierze się za nielegalne streamy