CatégorieNon classé

Comprendre TF-IDF : approche théorique

Le concept TF-IDF (Term Frequency – Inverse Document Frequency) a émergé dans les années 1970 dans le champ de la recherche d’information, notamment grâce aux travaux de Karen Spärck Jones, chercheuse britannique. Elle a posé les bases de l’idée que les termes rares à l’échelle d’un corpus ont plus de valeur discriminante que les termes fréquents, en particulier pour classer des documents...

Analyser les réseaux de vidéos YouTube

Mesurer l’impact des vidéos d’influenceurs (par exemple) sur YouTube reste un exercice complexe. Il est tentant d’imaginer qu’une vidéo qui accumule des vues, des likes et des commentaires puisse mécaniquement entraîner une hausse des réservations touristiques dans une destination. Mais établir une relation de cause à effet entre visibilité en ligne et comportements de consommation réels — comme...

Gérer les quotas de l’API YouTube Data v3

L’API YouTube Data v3 présente un certain intérêt, notamment parce qu’elle permet d’effectuer gratuitement un nombre limité de requêtes quotidiennes grâce à un quota journalier. Lors de mes tests de développement de scripts d’analyse de vidéos YouTube à l’aide de graphes, j’ai rapidement constaté les limites imposées par ce quota. Il est bien sûr possible de contourner cette...

Analyse quantitative d’une vidéo YouTube

Avant tout, ce script constitue une approche quantitative pour mesurer la popularité d’une vidéo ciblée sur une chaîne YouTube donnée. Il s’appuie sur trois indicateurs principaux : le nombre de vues, de likes et de commentaires. L’objectif n’est pas d’apporter une mesure définitive ou automatisée des anomalies, mais plutôt d’offrir un cadre d’observation, permettant par exemple de repérer...

Amplitude sonore et mouvements – version 2

J’apporte ici des modifications sur le script précédent portant surl’analyse de l’amplitude sonore et du flux optique. Rappelons le cette double approche permet non seulement d’identifier les instants forts du discours d’un locuteur (en se basant sur l’amplitude sonore), mais aussi de visualiser la “dynamique gestuelle” qui accompagne le propos, ouvrant la voie à une...

Extraction de données sur Reddit

Reddit est un réseau social d’origine américaine fondé en 2005, qui se distingue des plateformes comme Facebook, X ou Instagram… par son fonctionnement communautaire et thématique. Structuré autour de “subreddits” (forums dédiés à des sujets spécifiques), Reddit permet aux utilisateurs de publier, commenter et voter des contenus textuels, visuels. Si Reddit occupe une...

Extraction multimédia à partir de YouTube

Streamlit Cloud est une solution particulièrement intéressante pour héberger gratuitement des applications Python. Simple à utiliser, directement connecté à GitHub, il permet de mettre en production très rapidement des projets basés sur l’interface graphique de Streamlit. Les dépendances sont directement installée et indiquée depuis un fichier requirements.txt. Pour l’utilisateur...

Analyse amplitude sonore & mouvements

Ce script s’inscrit dans une approche multimodale, croisant les variations de l’amplitude sonore (les “pics sonores”) avec les mouvements détectés dans l’image grâce à l’analyse du flux optique. L’objectif est d’explorer les corrélations entre ce que l’on entend et ce que l’on voit, dans des unités temporelles extrêmement brèves — centrées autour de trois instants clés : t−1, t et t+1...

Tour d’horizon du concept de liminalité

Je m’intéresse ici à la notion de liminalité parce qu’elle permet de penser, de manière transversale, ce qui se joue dans les “moments de transition”, les “états instables”, les “seuils de passage” au sein des systèmes humains, sociaux ou cognitifs. Qu’il s’agisse de rites de passage (Van Gennep), de paradoxes relationnels (Bateson)...

Comprendre la CHD et la méthode Reinert

Cet article vise à « reproduire » la démarche statistique (simplifiée) expliquée par Julien Barnier autour de la CHD. Je reprends donc l’exemple et la démarche lors de son excellente intervention sur l’excellente chaîne YouTube Tuto Mate-SHS.L’objectif est de (re)construire un script R (sans utiliser le package “rainette”) qui, à partir des 5 phrases de...

Stephane Admin