Шалені відео з тексту за секунди: що вміє нова нейромережа Sora і чому вона вже викликає суперечки

OpenAI запустила модель Sora, здатну перетворювати текстові запити на вражаючі відео, тривалістю до хвилини. Чи стане Sora новим трендом, чи приводом для конфліктів і масових діпфейків у ЗМІ

Sora генерує реалістичні відео зі звичайного тексту або фото
Sora генерує відео зі звичайного тексту аба фото

Розробники ChatGPT компанія OpenAI запустила Sora - нову модель штучного інтелекту, що перетворює текст на відео. Ця технологія являє собою значний крок у розвитку генеративного ШІ, пропонуючи користувачам інноваційні інструменти для створення мультимедійного контенту. Щоправда, нейромережа має обмеження щодо генерації контенту з авторськими правами та зображеннями реальних людей.

Це має обмежити її використання для створення дипфейків. Однак в Інтернеті вже побільшало фейків, які серед людей викликають безліч запитань та обурення. Частина відео йде без вказівки про створенні штучним інтелектом, що також може викликати певні складнощі у реалістичності сприйняття зображувальних об'єктів і явищ. Розбиралися, чим може загрожувати, на перший погляд, безневинний застосунок. 

Що таке Sora?

Sora - це ШІ-модель від OpenAI, яка дозволяє генерувати відео на основі текстових описів, анімувати статичні зображення та редагувати існуючі відеофайли. Її функціонал включає:

  • генерацію відео за текстовими запитами - користувач вводить опис сцени або дії, і Sora створює відповідне відео;
  • ремікси та змішування - можливість змінювати вже створений контент через текстові підказки та поєднувати елементи двох різних сцен.
  • розкадрування - створення складних відео через послідовність текстових запитів.
  • перетворення фото у відео - анімування зображень, щоб надати їм динамічності;
  • Sora може створювати реалістичні сцени з точними деталями, взаємодією персонажів, природними рухами та складними фонами. Тривалість відео варіюється залежно від тарифного плану користувача і може досягати 1 хвилини.

Так, німецький фотохудожник Борис Ельдагсен, який був одним із понад 300 художників, які тестували Sora до офіційного запуску 9 грудня, розказав, який функціонал йому більше до вподоби. Він також додав одне з відео, яке створив, за допомогою цих опцій: 

"Sora від OpenAI пропонує нові способи створення відео за допомогою штучного інтелекту. Моєю улюбленою функцією стали опції "Remix" і "Blend. Король вимірювання з моєї серії Professional development, яка є кафкіанською деконструкцією сучасного бізнес-жаргону", - описав він свій креатив.

Telegram oembed: https://t.me/informator_live/3647

Доступність Sora

Sora доступна для передплатників ChatGPT Plus і Pro через платформу sora.com. Проте існують географічні обмеження:

  • вона доступна у США та більшості країн світу, однак недоступна у ЄС, Великобританії та Китаї.
  • За словами генерального директора OpenAI Сема Альтмана, запуск у Європі потребує часу через регуляторні вимоги.

Тарифні плани та можливості

OpenAI пропонує декілька рівнів доступу до Sora. ChatGPT Plus - дозволяє генерацію до 50 відео в місяць (1000 кредитів) роздільною здатністю до 720p тв максимальною тривалістю відео - 5 секунд. ChatGPT Pro дозволить генерацію до 500 відео в місяць роздільною здатністю до 1080p і тривалістю відео — до 20 секунд. Також є можливість завантаження відео без водяного знака і паралельна генерація до п’яти відео одночасно.

Окрім Sora є ще функції моделі Sora Turbo - це оновлена версія моделі з розширеним функціоналом. Вона дозволяє збільшити швидкість обробки запитів, покращити деталізацію відео. Має доступ до функції "Explore" - стрічка відео, створених іншими користувачами, для натхнення або аналізу.

Обмеження та етичні виклики

OpenAI намагається запобігти зловживанню технологією, впроваджуючи певні  обмеження. Йдеться про заборону на створення контенту з авторськими правами або зображеннями реальних людей (акторів, політиків, визначних людей). 

Водночас OpenAI визнає, що система модерації буде вдосконалюватися. Віце-президент з досліджень Адітья Рамеш зазначив, що баланс між свободою творчості та безпекою є основним викликом для розробників. Компанія закликає користувачів надавати зворотний зв’язок для покращення модерації.

Telegram oembed: https://t.me/informator_live/3648

Втім, запуск Sora не обійшовся без критики. Група художників, які брали участь у тестуванні моделі, звинуватили OpenAI у використанні їхніх праць без дозволу на публікацію. Цей випадок порушив питання про авторські права та етику у використанні навчальних матеріалів для ШІ.

 

Ще Sora відкриває нові можливості для контентмейкерів, дизайнерів та креативної індустрії. Програма дозволяє швидко створювати відео без використання складного програмного забезпечення. Проте впровадження таких технологій ставить нові виклики перед регуляторами та суспільством, адже зростає ризик поширення фейкових матеріалів.

OpenAI продовжує роботу над розширенням доступності Sora та вдосконаленням її функціоналу. Це може зробити технологію революційною у сфері відеопродукції. І хто зна, може запуск Sora також несе загрозу звільнень у світі, як це було після запуску ChatGPT. Нагадаємо, що станом на квітень 2023 року всерйоз обговорювали, що Штучний інтелект зможе замінити 300 млн працівників у розвинених країнах.

Підписуйтесь на наш Telegram-канал, щоб не пропустити важливих новин. Підписатися на канал у Viber можна тут.

ЧИТАЙТЕ ТАКОЖ:

Головна Актуально Informator.ua Україна на часі Youtube