OpenAI zaprezentowało narzędzie Sora

ChatGPT ma siostrę. Jej klipów nie odróżnisz od rzeczywistości

Źródło zdjęć: © OpenAI
Konrad SiwikKonrad Siwik,16.02.2024 18:30

Sora to nowa siostra ChatGPT, która może namieszać w branży filmowej. Open AI, które odpowiada za jej opracowanie, zaprezentowało niezwykłe możliwości generatora tekstu na wideo. I trzeba przyznać, że trudno odróżnić jej dzieła od rzeczywistości.

OpenAI to laboratorium badawcze specjalizujące się w dziedzinie sztucznej inteligencji. Studio zaprezentowało nowy, imponujący model generatywnego przetwarzania tekstu na wideo o nazwie Sora. Model dyfuzyjny może przekształcać krótkie opisy tekstowe w klipy wideo o wysokiej rozdzielczości i długości do jednej minuty.

Przedstawiamy Sorę, nasz model zamiany tekstu na wideo. Sora może generować filmy trwające do minuty, zachowując przy tym jakość wizualną zgodność z podpowiedziami użytkownika

- czytamy na blogu OpenAI.
trwa ładowanie posta...

Sora zamieni tekst na film

Krótko mówiąc, Sora działa podobnie jak ChatGPT czy Dall-E z tą różnicą, że zamiast tekstu lub statycznych obrazów generuje ultrarealistyczne klipy wideo. Wystarczy, że użytkownik wpisze odpowiednie polecenie z instrukcją tekstową, a Sora po jego rozpoznaniu wygeneruje oczekiwany klip.

Sora jest w stanie generować złożone sceny z wieloma postaciami, określonymi rodzajami ruchu i dokładnymi szczegółami obiektu i tła. Model rozumie nie tylko to, o co poprosił użytkownik w podpowiedzi, ale także to, jak te rzeczy istnieją w świecie fizycznym

- wyjaśnia OpenAI.

Trzeba jednak podkreślić, że Sora trafiła na razie do wąskiego grona wyspecjalizowanych odbiorców. Badacze i twórcy filmowi ocenią jej wydajność przed szerszym udostępnieniem publiczności. OpenAI nie podało jeszcze oficjalnej daty premiery.

trwa ładowanie posta...

Rewolucja w branży filmowej?

Niewątpliwie Sora może zrewolucjonizować branżę filmową. Dzięki niej ekipy nagraniowe nie będą musiały trudzić się, by złapać jak najlepszy kard w trudno dostępnych miejscach. Wszystko załatwi za nich Sora, która wygeneruje daną lokalizację, scenę i wydarzenie za pomocą mocy obliczeniowej.

Model ten dogłębnie rozumie język, co pozwala mu dokładnie interpretować podpowiedzi i generować zniewalające postacie, które wyrażają żywe emocje. Sora może również tworzyć wiele ujęć w ramach jednego wygenerowanego wideo, które dokładnie odzwierciedlają postacie i styl wizualny

- wskazuje OpenAI.
trwa ładowanie posta...

Kwestie bezpieczeństwa

Z drugiej strony pojawiają się obawy o kwestie bezpieczeństwa. Takie narzędzie może być w końcu wykorzystane do generowania deepfejków. OpenAI chce temu zapobiec, dlatego współpracuje z ekipą ekspertów od cyberbezpieczeństwa, która kontradyktoryjnie testuje model.

Zespół przygotowuje również narzędzia pomagające wykrywać wprowadzające w błąd treści, takie jak klasyfikator wykrywania, który może stwierdzić, kiedy wideo zostało wygenerowane przez Sora. Opracowano również niezawodne klasyfikatory obrazu, które są używane do sprawdzania klatek każdego wygenerowanego wideo, aby upewnić się, że są one zgodne z zasadami użytkowania, zanim zostaną wyświetlone użytkownikowi.

trwa ładowanie posta...
Co o tym myślisz?
  • emoji serduszko - liczba głosów: 0
  • emoji ogień - liczba głosów: 0
  • emoji uśmiech - liczba głosów: 1
  • emoji smutek - liczba głosów: 0
  • emoji złość - liczba głosów: 0
  • emoji kupka - liczba głosów: 0