ChatGPT ma siostrę. Jej klipów nie odróżnisz od rzeczywistości
Sora to nowa siostra ChatGPT, która może namieszać w branży filmowej. Open AI, które odpowiada za jej opracowanie, zaprezentowało niezwykłe możliwości generatora tekstu na wideo. I trzeba przyznać, że trudno odróżnić jej dzieła od rzeczywistości.
OpenAI to laboratorium badawcze specjalizujące się w dziedzinie sztucznej inteligencji. Studio zaprezentowało nowy, imponujący model generatywnego przetwarzania tekstu na wideo o nazwie Sora. Model dyfuzyjny może przekształcać krótkie opisy tekstowe w klipy wideo o wysokiej rozdzielczości i długości do jednej minuty.
Przedstawiamy Sorę, nasz model zamiany tekstu na wideo. Sora może generować filmy trwające do minuty, zachowując przy tym jakość wizualną zgodność z podpowiedziami użytkownika
Sora zamieni tekst na film
Krótko mówiąc, Sora działa podobnie jak ChatGPT czy Dall-E z tą różnicą, że zamiast tekstu lub statycznych obrazów generuje ultrarealistyczne klipy wideo. Wystarczy, że użytkownik wpisze odpowiednie polecenie z instrukcją tekstową, a Sora po jego rozpoznaniu wygeneruje oczekiwany klip.
Sora jest w stanie generować złożone sceny z wieloma postaciami, określonymi rodzajami ruchu i dokładnymi szczegółami obiektu i tła. Model rozumie nie tylko to, o co poprosił użytkownik w podpowiedzi, ale także to, jak te rzeczy istnieją w świecie fizycznym
Trzeba jednak podkreślić, że Sora trafiła na razie do wąskiego grona wyspecjalizowanych odbiorców. Badacze i twórcy filmowi ocenią jej wydajność przed szerszym udostępnieniem publiczności. OpenAI nie podało jeszcze oficjalnej daty premiery.
Rewolucja w branży filmowej?
Niewątpliwie Sora może zrewolucjonizować branżę filmową. Dzięki niej ekipy nagraniowe nie będą musiały trudzić się, by złapać jak najlepszy kard w trudno dostępnych miejscach. Wszystko załatwi za nich Sora, która wygeneruje daną lokalizację, scenę i wydarzenie za pomocą mocy obliczeniowej.
Model ten dogłębnie rozumie język, co pozwala mu dokładnie interpretować podpowiedzi i generować zniewalające postacie, które wyrażają żywe emocje. Sora może również tworzyć wiele ujęć w ramach jednego wygenerowanego wideo, które dokładnie odzwierciedlają postacie i styl wizualny
Kwestie bezpieczeństwa
Z drugiej strony pojawiają się obawy o kwestie bezpieczeństwa. Takie narzędzie może być w końcu wykorzystane do generowania deepfejków. OpenAI chce temu zapobiec, dlatego współpracuje z ekipą ekspertów od cyberbezpieczeństwa, która kontradyktoryjnie testuje model.
Zespół przygotowuje również narzędzia pomagające wykrywać wprowadzające w błąd treści, takie jak klasyfikator wykrywania, który może stwierdzić, kiedy wideo zostało wygenerowane przez Sora. Opracowano również niezawodne klasyfikatory obrazu, które są używane do sprawdzania klatek każdego wygenerowanego wideo, aby upewnić się, że są one zgodne z zasadami użytkowania, zanim zostaną wyświetlone użytkownikowi.
Popularne
- Znamy przyczynę śmierci sowy Duolingo. Dua Lipa opłakuje ptaka
- Sowa Duolingo nie żyje. Wszyscy możecie ją mieć na sumieniu
- Kotolga jest viralem na TikToku. Kim jest i co o niej wiadomo?
- Stuu został pobity? Szokujące nagranie obiegło internet
- "Diabeł morski" straszył u wybrzeży Teneryfy. Ryba skończyła marnie
- Powstał tłumacz z polskiego na deweloperski. "Zrozum groźne gatunki"
- Żugajki na tropie nowego partnera Julii. Kim jest tajemniczy mężczyzna?
- O co chodzi z "Montoya, por favor"? W sieci huczy o tej zdradzie
- Thermomiksiary popłynęły. Cała sala tańczyła do "Miłość rośnie wokół nas"