Технологии
12 октября 2024
Автор: Анастасия Никонорова
Представлен ИИ-генератор качественных видео Pyramid Flow
Газета.Ru сообщает о том, что появилась информация о новой нейросети, которая открывает двери для создания видео.
Эта генеративная нейросеть позволяет создавать видео продолжительностью до 10 секунд. Она была разработана совместными усилиями Пекинского университета, Пекинского университета почты и телекоммуникаций и Kuaishou Technology. Важно отметить, что исходный код нейросети является открытым, что делает её доступной для всех желающих.
Процесс создания видео происходит в несколько этапов: сначала в низком разрешении, затем в полном. Модель доступна для загрузки на платформах Hugging Face и GitHub.
Инференс модели (вывод данных на основе обученной модели) занимает всего 56 секунд для создания 5-секундных видео в разрешении 384p. Качество видео высокое и реалистичное. Метод пирамидального сопоставления потоков снижает вычислительные затраты без потери качества.
Способность оптимизировать генерацию на разных этапах позволяет модели быстро адаптироваться к новым данным. Pyramid Flow обучается на разнообразных наборах данных с открытым исходным кодом, что делает его конкурентоспособным с проприетарными решениями, такими как Gen-3 Alpha и Dream Machine от Luma.
Модель доступна для коммерческого использования, но пока не поддерживает расширенные настройки. Согласно статистике, 43% московских предпринимателей используют искусственный интеллект в своей работе.
Ранее ITinfo сообщало, что компания Иннова запустила бета-теста PC-версии Gran Saga.