Code and Cortex !

Comprendre TF-IDF : approche théorique

4 jours ago

7 Min Read

Le concept TF-IDF (Term Frequency – Inverse Document Frequency) a émergé dans les années 1970 dans le champ de la recherche d’information, notamment grâce aux travaux de Karen Spärck Jones, chercheuse britannique. Elle a posé les bases de l’idée que les termes rares à l’échelle d’un corpus ont plus de valeur discriminante que les termes fréquents, en particulier pour classer des documents...

Lire

Scraper les sites touristiques pour analyse TF-IDF

Par Stéphane Meurisse

7 jours ago

5 Min Read

Ajouter un commentaire

L’objectif de ce script est d’extraire automatiquement les textes présents sur les pages d’accueil (ce script se limite à la homepage) de sites web touristiques (ou autres), afin de constituer un corpus exploitable pour l’analyse textuelle. Une fois ces textes collectés et nettoyés, on pourra réaliser plusieurs types d’analyses, notamment : Analyse de fréquence des termes : bon, là je vous...

Lire

Analyser les réseaux de vidéos YouTube

Par Stéphane Meurisse

2 semaines ago

8 Min Read

Ajouter un commentaire

Mesurer l’impact des vidéos d’influenceurs (par exemple) sur YouTube reste un exercice complexe. Il est tentant d’imaginer qu’une vidéo qui accumule des vues, des likes et des commentaires puisse mécaniquement entraîner une hausse des réservations touristiques dans une destination. Mais établir une relation de cause à effet entre visibilité en ligne et comportements de consommation réels — comme...

Lire

Gérer les quotas de l’API YouTube Data v3

Par Stéphane Meurisse

3 semaines ago

2 Min Read

Ajouter un commentaire

L’API YouTube Data v3 présente un certain intérêt, notamment parce qu’elle permet d’effectuer gratuitement un nombre limité de requêtes quotidiennes grâce à un quota journalier. Lors de mes tests de développement de scripts d’analyse de vidéos YouTube à l’aide de graphes, j’ai rapidement constaté les limites imposées par ce quota. Il est bien sûr possible de contourner cette...

Lire

Analyse quantitative d’une vidéo YouTube

Par Stéphane Meurisse

2 mois ago

8 Min Read

Ajouter un commentaire

Avant tout, ce script constitue une approche quantitative pour mesurer la popularité d’une vidéo ciblée sur une chaîne YouTube donnée. Il s’appuie sur trois indicateurs principaux : le nombre de vues, de likes et de commentaires. L’objectif n’est pas d’apporter une mesure définitive ou automatisée des anomalies, mais plutôt d’offrir un cadre d’observation, permettant par exemple de repérer...

Lire

Extraction des métadonnées YouTube à partir d’un mot-clé

Par Stéphane Meurisse

2 mois ago

7 Min Read

Ajouter un commentaire

Ce script Python permet d’effectuer une recherche de vidéos sur YouTube à partir d’un mot-clé, tout en appliquant divers filtres tels que la langue, la région, l’année de publication, ainsi que le nombre de vues, de likes et de commentaires. Les métadonnées des vidéos récupérées sont ensuite exportées au format Excel.L’interface utilise Streamlit, accessible via le navigateur. 1. Clé API YouTube...

Lire

Transformer une vidéo en stop motion : un outil d’analyse visuelle

Par Stéphane Meurisse

2 mois ago

6 Min Read

Ajouter un commentaire

Dans le cadre de l’analyse multimodale en Sciences Humaines et Sociales, ce script Python propose une méthode pour transformer une vidéo (YouTube ou en local .mp4) en stop motion (animation image par image). Que ce soit depuis un lien YouTube ou un fichier vidéo local au format .mp4, l’utilisateur peut générer une nouvelle version de la vidéo où les images sont extraites à une fréquence...

Lire

Amplitude sonore et mouvements – version 2

Par Stéphane Meurisse

2 mois ago

15 Min Read

Ajouter un commentaire

J’apporte ici des modifications sur le script précédent portant surl’analyse de l’amplitude sonore et du flux optique. Rappelons le cette double approche permet non seulement d’identifier les instants forts du discours d’un locuteur (en se basant sur l’amplitude sonore), mais aussi de visualiser la “dynamique gestuelle” qui accompagne le propos, ouvrant la voie à une...

Lire

Extraction de données sur Reddit

Par Stéphane Meurisse

3 mois ago

6 Min Read

Ajouter un commentaire

Reddit est un réseau social d’origine américaine fondé en 2005, qui se distingue des plateformes comme Facebook, X ou Instagram… par son fonctionnement communautaire et thématique. Structuré autour de “subreddits” (forums dédiés à des sujets spécifiques), Reddit permet aux utilisateurs de publier, commenter et voter des contenus textuels, visuels. Si Reddit occupe une...

Lire

Extraction multimédia à partir de YouTube

Par Stéphane Meurisse

3 mois ago

8 Min Read

Ajouter un commentaire

Streamlit Cloud est une solution particulièrement intéressante pour héberger gratuitement des applications Python. Simple à utiliser, directement connecté à GitHub, il permet de mettre en production très rapidement des projets basés sur l’interface graphique de Streamlit. Les dépendances sont directement installée et indiquée depuis un fichier requirements.txt. Pour l’utilisateur...

Lire

Code and Cortex

Code and Cortex

Derniers articles

Comprendre TF-IDF : approche théorique

Scraper les sites touristiques pour analyse TF-IDF

Analyser les réseaux de vidéos YouTube

Gérer les quotas de l’API YouTube Data v3

Analyse quantitative d’une vidéo YouTube

Extraction des métadonnées YouTube à partir d’un mot-clé

Transformer une vidéo en stop motion : un outil d’analyse visuelle

Amplitude sonore et mouvements – version 2

Extraction de données sur Reddit

Extraction multimédia à partir de YouTube

Stephane Admin