Reinert CHD whisper IRAMUTEQ avec Python

Exploration de la Divergence de Jensen-Shannon

2 mois ago

7 Min Read

Pour comprendre la notion d’entropie mobilisée dans le calcul de la Divergence de Jensen-Shannon (JSD), il faut se détacher de l’entropie de Boltzmann, qui renvoie à l’ordre et au désordre d’un système, notamment en thermodynamique, pour se concentrer sur l’entropie au sens informationnel. Dans ce cadre, l’incertitude ne décrit pas un désordre physique, mais le degré de prévisibilité d’une...

Lire

Prototype d’entretien en ligne multimodale

Par Stéphane Meurisse

2 mois ago

4 Min Read

Ajouter un commentaire

Voici un prototype d’application d’entretien à distance conçu pour les Sciences Humaines. L’objectif n’est pas de proposer une énième solution de visioconférence, mais de construire un dispositif de production de données multimodales (texte/audio/vidéo). Le lien github de l’appli : L’enquêteur pilote directement l’application sur son Mac ou son PC, sans recourir à une plateforme tierce. Il...

Lire

IRaMuTeQ-lite v0.2 bêta

Par Stéphane Meurisse

3 mois ago

1 Min Read

Ajouter un commentaire

IRaMuTeQ-lite v0.2 bêta est désormais disponible au téléchargement sous forme d’archive .app pour Mac (uniquement disponible pour Mac). Cette version s’installe sur votre Mac et fonctionne en local (plus rapide que la version précédente d’HuggingFace Space). Disponible en téléchargement en “Releases sur github” Cette version compilée intègre plusieurs nouveautés, dont : un...

Lire

IRaMuTeQ-lite : reproductibilité des résultats d’une CHD

Par Stéphane Meurisse

4 mois ago

6 Min Read

Ajouter un commentaire

Cette application s’inscrit dans une logique de reproductibilité des résultats d’une CHD à partir d’un même corpus texte, en comparaison avec ceux produits par le (vrai) logiciel IRaMuTeQ, (Pierre Ratinaud – Laboratoire d’Études et de Recherches Appliquées en Sciences Sociales (LERASS) – Université Toulouse Jean-Jaurès) – qui reste le logiciel de référence libre dans ce domaine...

Lire

CHD et AFC à partir d’un serveur HugginFace

Par Stéphane Meurisse

5 mois ago

9 Min Read

Ajouter un commentaire

L’enjeu ici est de développer, sur un serveur distant, un script permettant de réaliser une CHD, une AFC et d’autres tests, tels que l’analyse des entités nommées (NER) et l’analyse de cooccurrences. J’avais déjà développé, dans un article précédent, la mise en œuvre du package rainette développé par Julien Barnier. C’est à partir de cette base que j’ai transposé le script en application sur le...

Lire

Europresse to IRaMuTeQ v4

Par Stéphane Meurisse

6 mois ago

3 Min Read

Ajouter un commentaire

Je mets en ligne la version 4 de mon application Streamlit “Europresse to IRaMuTeQ” : . La version 3 reste accessible et je ne reviens pas ici sur les options déjà présentes. Je présente succinctement les nouveautés et j’y reviendrai plus en détail prochainement. Voici également l’historique des articles publiés sur le blog autour de l’application Europresse to IRaMuTeQ. Transformer...

Lire

Symbolic Connectors

Par Stéphane Meurisse

6 mois ago

10 Min Read

Ajouter un commentaire

Symbolic Connectors est une application d’exploration lexicométrique dédiée à l’exploration des “connecteurs” logiques dans les textes générés par des LLM. Le terme Symbolic renvoie au courant symbolique de l’IA (analogie avec la machine et la programmation), en contraste avec l’approche connexionniste (analogie avec le cerveau/neurones), tandis que Connectors désigne l’objectif...

Lire

Zero-Shot classification

Par Stéphane Meurisse

7 mois ago

7 Min Read

Ajouter un commentaire

1. Contexte Je travaille actuellement sur la problématique de la santé mentale et l’usage des LLM (Large Langage Modèles) par les étudiants, en analysant les réponses de LLM sous une approche lexicale. La genèse de cette micro-recherche se situe au croisement d’études sur la santé mentale des jeunes et d’articles montrant que les LLM sont devenus les confidents de nombreux étudiants. Cette...

Lire

Construire un chatbot avec RapidFuzz et un fichier JSON

Par Stéphane Meurisse

10 mois ago

8 Min Read

Ajouter un commentaire

RapidFuzz est une bibliothèque Python conçue pour effectuer de la correspondance de chaînes de caractères, ce qui signifie qu’elle compare des textes et évalue à quel point ils sont similaires, même si des fautes de frappe ou des différences existent. L’objectif de cet article est de simuler un chatbot utilisant la librairie RapidFuzz afin de tester la pertinence des réponses par rapport au...

Lire

Prétraitement – No code ! avec le logiciel Orange Data Mining

Par Stéphane Meurisse

10 mois ago

10 Min Read

Ajouter un commentaire

ORANGE DATA MINING est un logiciel libre et gratuit dédié à l’analyse de données et au text mining. Il se distingue par son interface simple et visuelle qui repose sur un système de widgets qu’il suffit de glisser / déposer et paramétrer pour construire un flux de traitement. Cette approche modulaire permet de construire un workflow/pipeline sans avoir à écrire du code Python. Chaque noeud...

Lire

CatégoriePython

Exploration de la Divergence de Jensen-Shannon

Prototype d’entretien en ligne multimodale

IRaMuTeQ-lite v0.2 bêta

IRaMuTeQ-lite : reproductibilité des résultats d’une CHD

CHD et AFC à partir d’un serveur HugginFace

Europresse to IRaMuTeQ v4

Symbolic Connectors

Zero-Shot classification

Construire un chatbot avec RapidFuzz et un fichier JSON

Prétraitement – No code ! avec le logiciel Orange Data Mining

Stephane Admin