CatégorieAnalyse Multimodale

Limites des DataSets basés sur les émotions universelles de Paul Ekman

La reconnaissance automatique des émotions via le Speech Emotion Recognition (SER = audio) et la Facial Emotion Recognition (FER = image) repose souvent sur des jeux de données labellisés avec les émotions dites « universelles » de Paul Ekman : joie, tristesse, colère, peur, surprise, et dégoût. Bien que ces émotions soient utiles pour des analyses générales (dans le marketing par exemple), leur...

DeepFace : Comparatif des modèles de détection faciale et des backends

1. La genèse de DeepFace et ses applications courantes DeepFace est un outil de reconnaissance faciale développé par Facebook en 2014, dont l’objectif initial était d’améliorer la précision de la reconnaissance faciale en ligne, en permettant aux utilisateurs de taguer des visages dans les photos afin d’encourager l’identification dans les photos. À l’époque de son...

Analyse des émotions avec DeepFace à partir de votre webcam

Le script vous permettra de réaliser une analyse des émotions via le flux de votre webcam (en temps réel) de votre Mac ou PC, en utilisant la bibliothèque DeepFace, développée par Meta. Cet article s’inscrit dans la continuité de mes (recherches) autour de l’analyse des émotions, initialement explorés avec le modèle FER. L’objectif est de faire un état des lieux de la question. À ma grande...

Vecteurs émotionnels avec FER, PCA et K-means

Le développement de ce script s’inscrit dans une approche exploratoire d’analyse multimodale, visant à combiner deux couches de données : la couche « image » avec la détection des émotions et la couche « texte ». Ces deux couches sont synchronisées, bien qu’à ce stade, aucune analyse automatique croisée entre elles ne soit proposée. Cependant, des pistes comme le calcul de...

Analyse des émotions dans les vidéos : Faut-il analyser toutes les frames ?

En développant un script d’analyse des émotions avec le modèle FER2013 (Facial Emotion Recognition), une question s’est posée dès le départ : est-il vraiment nécessaire d’extraire et d’analyser toutes les images constituant une seconde de vidéo (soit 25 frames), ou peut-on se contenter d’une image par seconde pour accélérer le processus ? Action ! Retour sur les...

Reconnaissance des émotions faciales avec le modèle FER

Dans le domaine des Sciences Humaines, le numérique offre de nouvelles opportunités en matière de collecte et d’analyse de données. En effet, au-delà des méthodes traditionnelles telles que l’entretien, le questionnaire, l’observation…, il est désormais possible d’exploiter des données issues de formats multimédias intégrant simultanément l’image, le son et le...