Тестирование видеогенераторов: какие результаты продемонстрировали нейросети в создании видео?

Тестирование видеогенераторов: какие результаты продемонстрировали нейросети в создании видео?
Тестирование видеогенераторов: какие результаты продемонстрировали нейросети в создании видео?
Сопоставление качества работы нейросетей, создающих видео. В течение прошлого года были разработаны нейросети, которые могут создавать полноценные видеоролики.

Калеб Уорд, блогер и основатель проекта Curious Refuge, представил в своём блоге интересный обзор видеогенерирующих нейросетей: он обратился к нескольким нейросетям с просьбой создать короткий видеоклип на основе трёх фотографий.

Нейросеть Veo 2 от Google, заслужившая 5 баллов из 6 возможных: сгенерированное видео отличалось наилучшим реализмом, адекватной физикой и динамикой кадра. Veo 2 в настоящий момент находится в ограниченном доступе, а для тех, кто всё-таки сумеет воспользоваться её услугами, функционал пока ограничен: разрешение видео не превышает 720p, а продолжительность – 8 секунд. Кроме того, Veo 2 не предоставляет возможности генерировать видео по загруженным изображениям, как бы оживляя их: вместо этого изображение, которое будет оживляться, можно только сгенерировать в самом Veo 2, что не позволяет использовать эту нейросеть для генерации сюжетов, отдельные фрагменты которых будут выдержаны в одной стилистике.

Примерно на одном уровне (снова-таки, по оценке Уорда, 4 балла из 6) справились с задачей Sora от компании OpenAI, и сервис Runway от бывшего сотрудника OpenAI Кристобаля Валенсуэлы, созданный при поддержке Nvidia.

Sora даёт хорошее качество картинки, адекватно передаёт физику и движения, позволяет генерировать видео продолжительностью до 20 секунд и в разрешении до 1080p.

Ключевым недостатком Sora является «слишком бурная фантазия» данной нейросети и некая своевольность в интерпретации данных ей инструкций: при анимировании картинки Sora иногда склонна добавлять туда объекты, которых там изначально не было, либо же наоборот, убирать те, которые там имелись. Метод борьбы с этим известен: просто повторять попытки генерации до получения нужного результата. Но это может быть довольно накладно в случае Sora: подписка на пакет, предусматривающий полноценную генерацию, стартует от $200 в месяц, при этом пакет предполагает возможность генерации всего лишь 500 видео.

Runway бюджетнее (полный пакет с возможностью генерации без ограничений стоит всего $76 в месяц) и аккуратнее выполняет инструкции пользователя, однако даёт на выходе более слабое качество картинки и менее реалистичную физику. Зато она работает существенно быстрее и позволяет генерировать существенно больше видео.

Видеогенератор Luma явно отстаёт от конкурентов по качеству генерации: картинка получается «мыльной» и «мультяшной», физика и движение объектов – нереалистичными. Калеб Уорд оценил качество работы сервиса в 2 балла из шести возможных. Стоит добавить, что при этом Luma ещё и дороже многих конкурентов: режим неограниченной генерации стоит $95 в месяц.

Китайская нейронка Minimax удостоилась от Уорда 4 из 6 баллов – на том же уровне, что и Sora или Runway. В плане генерации видео Minimax отстаёт от конкурентов, совмещая склонность к излишнему фантазированию (недостаток Sora) и не очень хорошее качество картинки (минус Runway). Вместе с тем, Уорд отмечает, что она куда проще в использовании и дешевле: начать работать с Minimax можно уже от $5 в месяц, а премиум-пакет стоит $50.

Наиболее интересной оказалась оценка Уордом ещё одной китайской нейросети – видеогенератора Kling. Уорд присудил ей 5 баллов из 6 возможных – на том же уровне, что и пока отсутствующей в общем доступе Veo 2.

Качество генерации, реализм и физику в Kling Уорд оценил в 8 баллов из 10 – лишь немногим хуже, чем у Sora. Вместе с тем, по гибкости Kling превосходит конкурентов благодаря таким фишкам, как возможность обучения нейронки на одном и том же лице, что удобно, если вам нужно использовать одного и того же персонажа в различных сценах.

Кроме того, авторы Kling догадались реализовать такую удобную опцию, как «негативный промпт» (описание того, чего НЕ должно быть на видео): среди генерирующих нейросетей такой опцией в полном виде до сих пор обладала только «рисовалка» Leonardo AI. При этом Kling стоит дешевле всех конкурентов: начальный пакет стоит всего $3,88 в месяц, а полный доступ – всего $28,88.


Распечатать
08 апреля 2025 Как Чубайс и его команда потерпели неудачу с проектом пластиковых планшетов
08 апреля 2025 Трамп подтвердил, что США будут сохранять дополнительные пошлины на импорт
07 апреля 2025 Блогера из России избили на Занзибаре после того, как он оставил негативный отзыв об отеле
07 апреля 2025 Украина добилась проведения срочного заседания Совета Безопасности ООН после атаки на Кривой Рог
07 апреля 2025 Тестирование видеогенераторов: какие результаты продемонстрировали нейросети в создании видео?
07 апреля 2025 Торговая политика Трампа ставит под угрозу международную репутацию США
07 апреля 2025 Офшоры Андрея Рябинского связывают с семьей бывшего губернатора Владимира Груздева
07 апреля 2025 Суд передал более половины акций Петербургского нефтяного терминала в собственность государства
07 апреля 2025 ФНС заморозила счета блогера Евгения Савина из-за задолженности в 11,7 миллиона рублей
07 апреля 2025 Гололед привел к серьезной аварии в Брянске: имеются пострадавшие
07 апреля 2025 Китай вводит новые ограничения на экспорт редкоземельных металлов в ответ на американские тарифы
07 апреля 2025 Выявлены серьезные нарушения в СИЗО-1 Томска: Генеральная прокуратура подключилась к расследованию
07 апреля 2025 Почему исчезают независимые Telegram-каналы с миллионом подписчиков?
07 апреля 2025 США введут дополнительные 50% пошлины на Китай, если тот не отменит повышение тарифов
07 апреля 2025 Вологодские власти пообещали бороться с "алкотаксистами" с помощью тайных покупателей
07 апреля 2025 Румынского принца задержали в Париже за махинации с недвижимостью
07 апреля 2025 Трамп требует от Европы значительных выплат: новые условия для переговоров
07 апреля 2025 В Иркутской области женщина случайно сожгла свой дом, пытаясь уничтожить аэролодку бывшего партнёра
07 апреля 2025 Генеральный директор BlackRock Ларри Финк прогнозирует дальнейшее снижение фондовых рынков и рецессию в США
07 апреля 2025 Бывшего акционера Соликамского магниевого завода Петра Кондрашева разыскивает МВД