NVIDIA поделилась исходным кодом генеративной нейросети Audio2Face со всем миром
Обложка: кадр трейлера NVIDIA Audio2Face 3.0NVIDIA открыла исходный код генеративной нейросети Audio2Face. Вполне возможно, этот шаг окажет существенное влияние на развитие игровой индустрии. Технология позволяет создавать реалистичную лицевую анимацию и синхронизировать движение губ с речью из любого аудиофайла, от голоса актёра до сгенерированных реплик. Выглядит это так: ИИ анализирует звуковую дорожку, распознаёт фонемы, интонацию и эмоциональную окраску, а потом преобразует всё это в
