Code and Cortex !

Comment l’IA répond à la crise suicidaire

2 semaines ago

33 Min Read

La crise suicidaire occasionne trois fois plus de décès que les accidents de la route. Et encore, j'oserais dire que c'est la partie visible de l’iceberg... En France, on compte environ 9 000 à 10 000 suicides par an contre environ 3 100 à 3 500 morts sur la route.

Lire

Zero-Shot classification

Par Stéphane Meurisse

4 semaines ago

7 Min Read

Ajouter un commentaire

1. Contexte Je travaille actuellement sur la problématique de la santé mentale et l’usage des LLM (Large Langage Modèles) par les étudiants, en analysant les réponses de LLM sous une approche lexicale. La genèse de cette micro-recherche se situe au croisement d’études sur la santé mentale des jeunes et d’articles montrant que les LLM sont devenus les confidents de nombreux étudiants. Cette...

Lire

Réaliser une AFCM avec Orange Data Mining

Par Stéphane Meurisse

1 mois ago

7 Min Read

Ajouter un commentaire

Ici, le but de cet article est de décrire le workflow d’une AFCM réalisée avec le logiciel Orange Data Mining (free, gratuit, gratos!) et de le comparer à un script R utilisant le package FactoMineR. Autant le dire tout de suite : l’AFCM dans Orange Data Mining est très facile à mettre en œuvre, mais le résultat est décevant en raison de la faible quantité d’informations que l’on peut exporter...

Lire

Vidéo réaction et fabrique du “moi numérique”

Par Stéphane Meurisse

2 mois ago

12 Min Read

Ajouter un commentaire

La vidéo de réaction (en anglais “reaction video” ou “video react”) est un format populaire sur YouTube, Twitch et TikTok.., car il semble favoriser l’engagement et la communauté. Une « vidéo reaction » est un format où un créateur se filme en train de regarder une autre vidéo et réagit en direct. L’écran est partagé entre la vidéo source et le visage du youtubeur. 1...

Lire

Évaluer le dataset spambase avec Orange Data Mining

Par Stéphane Meurisse

3 mois ago

11 Min Read

Ajouter un commentaire

L’objectif ici est d’utiliser le logiciel Orange Data Mining pour prédire si un mail doit être classé « spam » ou « non-spam » à partir du dataset Spambase, et pour mesurer/comparer la performance de trois modèles de classification supervisée : SVM, régression logistique, kNN. L’intérêt d’Orange Data mining est de permettre, par simple enchaînement de widgets de construire un workflow...

Lire

Construire un chatbot avec RapidFuzz et un fichier JSON

Par Stéphane Meurisse

3 mois ago

8 Min Read

Ajouter un commentaire

RapidFuzz est une bibliothèque Python conçue pour effectuer de la correspondance de chaînes de caractères, ce qui signifie qu’elle compare des textes et évalue à quel point ils sont similaires, même si des fautes de frappe ou des différences existent. L’objectif de cet article est de simuler un chatbot utilisant la librairie RapidFuzz afin de tester la pertinence des réponses par rapport au...

Lire

Prétraitement – No code ! avec le logiciel Orange Data Mining

Par Stéphane Meurisse

4 mois ago

10 Min Read

Ajouter un commentaire

ORANGE DATA MINING est un logiciel libre et gratuit dédié à l’analyse de données et au text mining. Il se distingue par son interface simple et visuelle qui repose sur un système de widgets qu’il suffit de glisser / déposer et paramétrer pour construire un flux de traitement. Cette approche modulaire permet de construire un workflow/pipeline sans avoir à écrire du code Python. Chaque noeud...

Lire

Prétraitement et normalisation du texte

Par Stéphane Meurisse

4 mois ago

13 Min Read

Ajouter un commentaire

Le prétraitement (preprocessing) est une étape incontournable avant de lancer vos tests et analyses. Prétraitement = normalisation du texte ! Plusieurs étapes de normalisation sont possibles (liste non exhaustive qui dépend de vos objectifs) : Supprimer les stopwords Normaliser les accents du texte (cette normalisation permet de supprimer des doublons liés à des fautes d’orthographe par...

Lire

Propriétés des données textuelles – La loi de Zipf

Par Stéphane Meurisse

4 mois ago

9 Min Read

Ajouter un commentaire

La loi de Zipf n’est pas à connaître dans le détail de ses formules, mais elle constitue la base de la compréhension de la structuration des données textuelles. De nombreux logiciels statistiques la calculent automatiquement comme première description d’un corpus. L’application no code pour tester : Quand on commence à analyser un corpus de texte (entretiens clinique, articles de presse...

Lire

Analyse globale des cooccurrences dans un corpus

Par Stéphane Meurisse

4 mois ago

6 Min Read

Ajouter un commentaire

Le script présenté ici diffère d’une analyse “classique” de cooccurrences centrée sur un mot pivot. No Code : Lorsque vous vous connectez à Streamlit Cloud, l’application est (souvent) en veille : il faut la réactiver, ce qui peut prendre une trentaine de secondes… Le code source : Github Au lieu de partir d’un terme choisi à l’avance et d’observer ses associations dans le...

Lire

Code and Cortex

Code and Cortex

Derniers articles

Comment l’IA répond à la crise suicidaire

Zero-Shot classification

Réaliser une AFCM avec Orange Data Mining

Vidéo réaction et fabrique du “moi numérique”

Évaluer le dataset spambase avec Orange Data Mining

Construire un chatbot avec RapidFuzz et un fichier JSON

Prétraitement – No code ! avec le logiciel Orange Data Mining

Prétraitement et normalisation du texte

Propriétés des données textuelles – La loi de Zipf

Analyse globale des cooccurrences dans un corpus

Stephane Admin