ChatGPT ma siostrę. Jej klipów nie odróżnisz od rzeczywistości
Sora to nowa siostra ChatGPT, która może namieszać w branży filmowej. Open AI, które odpowiada za jej opracowanie, zaprezentowało niezwykłe możliwości generatora tekstu na wideo. I trzeba przyznać, że trudno odróżnić jej dzieła od rzeczywistości.
OpenAI to laboratorium badawcze specjalizujące się w dziedzinie sztucznej inteligencji. Studio zaprezentowało nowy, imponujący model generatywnego przetwarzania tekstu na wideo o nazwie Sora. Model dyfuzyjny może przekształcać krótkie opisy tekstowe w klipy wideo o wysokiej rozdzielczości i długości do jednej minuty.
Podobne
- ChatGPT zamiast lekarza? Ekspert o nowym trendzie wśród Polaków [WYWIAD]
- Faceci płacą jej fortunę. Ta modelka nigdy się nie zestarzeje
- Kendrick Lamar wypuścił "Dumb Phone". To przeciwieństwo smartfona
- YouTube wprowadził dubbing. Czy skorzystają na nim polscy twórcy?
- OpenAI prezentuje GPT-4o. Sztuczna inteligencja jak prawdziwy człowiek
Przedstawiamy Sorę, nasz model zamiany tekstu na wideo. Sora może generować filmy trwające do minuty, zachowując przy tym jakość wizualną zgodność z podpowiedziami użytkownika
Sora zamieni tekst na film
Krótko mówiąc, Sora działa podobnie jak ChatGPT czy Dall-E z tą różnicą, że zamiast tekstu lub statycznych obrazów generuje ultrarealistyczne klipy wideo. Wystarczy, że użytkownik wpisze odpowiednie polecenie z instrukcją tekstową, a Sora po jego rozpoznaniu wygeneruje oczekiwany klip.
Sora jest w stanie generować złożone sceny z wieloma postaciami, określonymi rodzajami ruchu i dokładnymi szczegółami obiektu i tła. Model rozumie nie tylko to, o co poprosił użytkownik w podpowiedzi, ale także to, jak te rzeczy istnieją w świecie fizycznym
Trzeba jednak podkreślić, że Sora trafiła na razie do wąskiego grona wyspecjalizowanych odbiorców. Badacze i twórcy filmowi ocenią jej wydajność przed szerszym udostępnieniem publiczności. OpenAI nie podało jeszcze oficjalnej daty premiery.
Rewolucja w branży filmowej?
Niewątpliwie Sora może zrewolucjonizować branżę filmową. Dzięki niej ekipy nagraniowe nie będą musiały trudzić się, by złapać jak najlepszy kard w trudno dostępnych miejscach. Wszystko załatwi za nich Sora, która wygeneruje daną lokalizację, scenę i wydarzenie za pomocą mocy obliczeniowej.
Model ten dogłębnie rozumie język, co pozwala mu dokładnie interpretować podpowiedzi i generować zniewalające postacie, które wyrażają żywe emocje. Sora może również tworzyć wiele ujęć w ramach jednego wygenerowanego wideo, które dokładnie odzwierciedlają postacie i styl wizualny
Kwestie bezpieczeństwa
Z drugiej strony pojawiają się obawy o kwestie bezpieczeństwa. Takie narzędzie może być w końcu wykorzystane do generowania deepfejków. OpenAI chce temu zapobiec, dlatego współpracuje z ekipą ekspertów od cyberbezpieczeństwa, która kontradyktoryjnie testuje model.
Zespół przygotowuje również narzędzia pomagające wykrywać wprowadzające w błąd treści, takie jak klasyfikator wykrywania, który może stwierdzić, kiedy wideo zostało wygenerowane przez Sora. Opracowano również niezawodne klasyfikatory obrazu, które są używane do sprawdzania klatek każdego wygenerowanego wideo, aby upewnić się, że są one zgodne z zasadami użytkowania, zanim zostaną wyświetlone użytkownikowi.
Popularne
- Natalia Magical założyła niebieską platformę. Ile kosztuje miesięczny dostęp?
- Zbanowali ją z niebieskiej platformy. "Dwa tysiące obcych. Bez żadnych limitów"
- Cameraboy oburzony niebieską platformą Natalii? "Magical jest hipokrytą"
- Daniel Magical dostał bana na kicku. Już nie wróci na platformę?
- Jak smakuje nowy zestaw w KFC "Squid Game"? "Cena jest mega wysoka"
- Edzio Rap drugi raz wbił na O'Block. Nawinął z lokalsami (i przeżył)
- Julii Żugaj pichci ze swoim chłopakiem. Miał być sernik, wyszedł piernik
- Straszna metamorfoza za kratami. Rosyjski youtuber ukarany za żarty
- Żenujący wpis Amadeusza Ferrariego o Natsu. Przekroczył granicę?