Les scripts Python pour les Sciences Humaines et la statistique

Analyse textuelle par similarité cosinus

4 mois ago

8 Min Read

Parmi les nombreuses approches utilisées dans le traitement du langage naturel (NLP – Natural Language Processing), la mesure de la similarité cosinus permet de comparer des mots en fonction de leur proximité dans un espace vectoriel. Le script ci-dessous a été conçu avec un corpus test, issu d’articles récupérés via Europresse et formaté pour être compatible avec le logiciel...

Lire

Retranscription textuelle avec Whisper

Par Stéphane Meurisse

5 mois ago

3 Min Read

Ajouter un commentaire

YouTubeTranscript vs Whisper Lorsqu’il s’agit d’extraire la retranscription textuelle d’une vidéo YouTube, trois solutions principales se démarquent : YouTubeTranscript , Google speech to texte et Whisper. YouTubeTranscript ne fait que récupérer le texte généré par YouTube. Ce texte est souvent structuré comme des sous-titres, découpé en segments avec des horodatages, mais...

Lire

Extraire des images d’une vidéo YouTube

Par Stéphane Meurisse

5 mois ago

2 Min Read

Ajouter un commentaire

Rien de révolutionnaire dans ce script, mais il vous permettra d’extraire simplement les images d’une vidéo YouTube tournée à 25 images par seconde (standard Europe). Ces images pourront ensuite être utilisées par exemple pour des analyses comme la détection des émotions faciales, (cf. article 1 – article 2 – article 3). Bon, c’est un petit retour en arrière, mais...

Lire

Extraction et correction des NER avec SpaCy et JSON

Par Stéphane Meurisse

5 mois ago

8 Min Read

Ajouter un commentaire

Puisque nous nous situons dans le champ des sciences humaines et sociales (SHS), voici une brève description du corpus utilisé : il est composé de 23 articles de presse portant sur la déclaration de Gérald Darmanin dénonçant « un ratage » dans le suivi psychiatrique d’un suspect. Ce corpus a été formaté pour répondre aux exigences du logiciel IRaMuTEQ, car il me sert également de test dans le...

Lire

Initiation au Deep Learning avec le Dataset MNIST

Par Stéphane Meurisse

7 mois ago

11 Min Read

Ajouter un commentaire

Introduction au Dataset MNIST Le dataset MNIST est une référence incontournable dans le domaine du machine learning et de la vision par ordinateur. Il contient des images manuscrites des chiffres de 0 à 9, chacune en niveaux de gris et de (très) petite taille (28×28 pixels). Les données sont réparties en 60 000 images d’entraînement et 10 000 images de test, et sont principalement...

Lire

Analyse des émotions dans la voix avec un modèle Speech Emotion Recognition (SER)

Par Stéphane Meurisse

7 mois ago

8 Min Read

2 Comments

En développant un modèle de reconnaissance des émotions par la voix (SER, pour Speech Emotion Recognition), je n’ai pas choisi la voie la plus simple pour me familiariser avec les modèles de deep learning et l’intégration de la couche de traitement “audio” dans une approche multimodale. Pourquoi ? Parce que, comparée à des domaines comme la reconnaissance faciale, la précision des...

Lire

Speech Emotion Recognition (SER) avec le dataset RAVDESS

Par Stéphane Meurisse

7 mois ago

13 Min Read

1 Commentaire

L’objectif de cet article est de construire un modèle pour réaliser une détection des émotions à partir de la voix (SER – Speech Emotion Recognition) afin d’analyser des segments audio spécifiques, comme par exemple un discours politique de Donald Trump. La première étape consiste à concevoir et entraîner un modèle pour réaliser cette analyse émotionnelle. Cette article...

Lire

DeepFace : Comparatif des modèles de détection faciale et des backends

Par Stéphane Meurisse

8 mois ago

7 Min Read

1 Commentaire

1. La genèse de DeepFace et ses applications courantes DeepFace est un outil de reconnaissance faciale développé par Facebook en 2014, dont l’objectif initial était d’améliorer la précision de la reconnaissance faciale en ligne, en permettant aux utilisateurs de taguer des visages dans les photos afin d’encourager l’identification dans les photos. À l’époque de son...

Lire

Astuces avec Google colab

Par Stéphane Meurisse

8 mois ago

5 Min Read

2 Comments

L’entraînement des modèles de Deep Learning exige une puissance de calcul importantes, qui parfois peuvent fonctionner en local mais “immobilise” votre Mac le temps des calculs… Imaginez que vous ayez besoin de la puissance de deux super Mac : l’un pour travailler sur vos tâches habituelles et l’autre équipé d’un processeur graphique (GPU), dédié uniquement à...

Lire

Analyse des émotions avec DeepFace à partir de votre webcam

Par Stéphane Meurisse

8 mois ago

9 Min Read

Ajouter un commentaire

Le script vous permettra de réaliser une analyse des émotions via le flux de votre webcam (en temps réel) de votre Mac ou PC, en utilisant la bibliothèque DeepFace, développée par Meta. Cet article s’inscrit dans la continuité de mes (recherches) autour de l’analyse des émotions, initialement explorés avec le modèle FER. L’objectif est de faire un état des lieux de la question. À ma grande...

Lire

CatégoriePython

Analyse textuelle par similarité cosinus

Retranscription textuelle avec Whisper

Extraire des images d’une vidéo YouTube

Extraction et correction des NER avec SpaCy et JSON

Initiation au Deep Learning avec le Dataset MNIST

Analyse des émotions dans la voix avec un modèle Speech Emotion Recognition (SER)

Speech Emotion Recognition (SER) avec le dataset RAVDESS

DeepFace : Comparatif des modèles de détection faciale et des backends

Astuces avec Google colab

Analyse des émotions avec DeepFace à partir de votre webcam

Stephane Admin