
22.12.2025.
Meta AI Open-Sourced Perception Encoder Audiovisual (PE-AV)
Meta istraživači su predstavili Perception Encoder Audiovisual, PEAV, kao novu porodicu enkodera za zajedničko razumijevanje audio i video sadržaja. Model uči poravnate audio, video i tekstualne reprezentacije u jednom ugrađenom prostoru koristeći kontrastivno učenje na velikoj skali od oko 100 milijuna audio-video parova s tekstualnim opisima.