AuteurStéphane Meurisse

Extraction et correction des NER avec SpaCy et JSON

Puisque nous nous situons dans le champ des sciences humaines et sociales (SHS), voici une brève description du corpus utilisé : il est composé de 23 articles de presse portant sur la déclaration de Gérald Darmanin dénonçant « un ratage » dans le suivi psychiatrique d’un suspect. Ce corpus a été formaté pour répondre aux exigences du logiciel IRaMuTEQ, car il me sert également de test dans le...

Classification Hiérarchique Descendante avec Rainette

Julien Barnier est le créateur de la librairie Rainette, un outil conçu pour implémenter, dans le langage R, une Classification Hiérarchique Descendante (CHD). Cette approche statistique a été initialement développée par Max Reinert en 1983 et popularisée à travers le logiciel bien connu Alceste. La méthode de Reinert (CHD) est également accessible via le logiciel libre IRaMuTEQ. 1. La...

Modélisation et fonctionnement d’un neurone artificiel

Comment fonctionne un neurone artificiel ? Le neurone artificiel, s’inspire du fonctionnement des neurones biologiques. Dans cet article, nous allons présenter et modéliser un neurone artificiel en explorant ses paramètres de base et son processus de décision. Historique du Perceptron Le perceptron est l’un des premiers modèles de neurones artificiels. Il a été inventé en 1958 par Frank...

Europresse to IRaMuTeQ – v3 – appli en ligne

No code ! Cette application en ligne est l’aboutissement de plusieurs scripts Python conçus pour transformer vos données HTML du site Europresse au format IRaMuTeQ. Aujourd’hui, je vous présente la version 3.0.1, ne nécessitant aucune manipulation de code Python 😉 . Vous pouvez suivre la démarche qui a conduit à cette version du script à travers les différents articles : Test sur un article...

Transformer les fichiers texte Europresse en CSV

Ce script R permet de convertir un fichier texte d’articles, issu du site Europresse et déjà formaté pour le logiciel IRaMuTeQ, en un fichier CSV (txtTOcsv). On fait donc un petit retour en arrière : on délaisse le format texte brut avec ses variables étoilées pour revenir à un encodage (mieux) structuré, où chaque variable est encodée dans une une colonne. Lors de la création de mon script...

Initiation au Deep Learning avec le Dataset MNIST

Introduction au Dataset MNIST Le dataset MNIST est une référence incontournable dans le domaine du machine learning et de la vision par ordinateur. Il contient des images manuscrites des chiffres de 0 à 9, chacune en niveaux de gris et de (très) petite taille (28×28 pixels). Les données sont réparties en 60 000 images d’entraînement et 10 000 images de test, et sont principalement...

Analyse des émotions dans la voix avec un modèle Speech Emotion Recognition (SER)

En développant un modèle de reconnaissance des émotions par la voix (SER, pour Speech Emotion Recognition), je n’ai pas choisi la voie la plus simple pour me familiariser avec les modèles de deep learning et l’intégration de la couche de traitement « audio » dans une approche multimodale. Pourquoi ? Parce que, comparée à des domaines comme la reconnaissance faciale, la précision des modèles basés...

Speech Emotion Recognition (SER) avec le dataset RAVDESS

L’objectif de cet article est de construire un modèle pour réaliser une détection des émotions à partir de la voix (SER – Speech Emotion Recognition) afin d’analyser des segments audio spécifiques, comme par exemple un discours politique de Donald Trump. La première étape consiste à concevoir et entraîner un modèle pour réaliser cette analyse émotionnelle.   Cette article...

Limites des DataSets basés sur les émotions universelles de Paul Ekman

La reconnaissance automatique des émotions via le Speech Emotion Recognition (SER = audio) et la Facial Emotion Recognition (FER = image) repose souvent sur des jeux de données labellisés avec les émotions dites « universelles » de Paul Ekman : joie, tristesse, colère, peur, surprise, et dégoût. Bien que ces émotions soient utiles pour des analyses générales (dans le marketing par exemple), leur...

Synthetic Memories : La fabrique des souvenirs

Utiliser l’intelligence artificielle pour matérialiser et préserver des souvenirs oubliés ou en voie d’oubli. Telle est l’ambition de ce projet artistique et scientifique, situé à la croisée de la science, de la technologie et de la créativité. Il vise à sauvegarder les identités, mais également à préserver la mémoire collective, notamment à travers la conservation du patrimoine culturel...

Stéphane Meurisse