Plugin : HugNews AI RSS
Le plugin HugNews AI RSS automatise la collecte, l’analyse et la publication d’articles issus de flux RSS sélectionnés selon une ligne éditoriale humaniste et positive. Il applique un double filtrage basé sur une détection de mots interdits et une analyse de sentiment via IA (BERT ou RoBERTa), le tout orchestré par un script Python interfacé avec WordPress.
Fonctionnalités principales
- Importation automatisée depuis des flux RSS
- Intégration directe avec une liste de flux RSS de sources fiables.
- Extraction des titres, résumés et contenus enrichis pour chaque entrée.
- Nettoyage du HTML et prétraitement du contenu avant analyse.
- Filtrage intelligent avec IA
- Analyse de sentiment configurable avec les modèles BERT ou RoBERTa via Hugging Face Transformers.
- Double système de seuils
- Pour BERT (
nlptown/bert-base-multilingual-uncased-sentiment
), les scores sont liés aux labels « 4 stars » et « 5 stars », avec des seuils personnalisables pour chaque niveau d’étoiles. - Pour RoBERTa (
cardiffnlp/twitter-roberta-base-sentiment
), les articles doivent obtenir le labelLABEL_2
(positif) et dépasser un seuil de score unique configurable.
- Pour BERT (
- Ajustement dynamique du score par modificateurs de fiabilité liés à la source (pondération personnalisée par média).
- Réduction du bruit : les articles neutres ou insuffisamment positifs sont exclus, même si leur tonalité n’est pas négative.
- Détection contextuelle de mots interdits
- Liste de mots à exclure (ex. violence, marketing, anxiogène).
- Vérification du contexte sémantique avec spaCy (moteur d’analyse linguistique en langage naturel) pour éviter les faux positifs.
- Si un mot interdit est confirmé dans un contexte négatif, l’article est écarté avant l’analyse de sentiment.
- Ajout automatique d’image à la une
- Si le flux ne fournit pas de visuel, le plugin effectue une recherche d’image :
- Pixabay (prioritaire) puis Unsplash.
- Extraction de mots-clés par spaCy + traduction automatique pour améliorer la pertinence.
- Gestion des quotas API et fallback intelligent.
- Si le flux ne fournit pas de visuel, le plugin effectue une recherche d’image :
- Publication automatisée sur WordPress
- Création d’un post complet : titre, contenu enrichi, image, lien source, catégorie.
- Vérification de doublon via l’URL source.
- Upload automatique d’image à la médiathèque WP avec nom de fichier et type MIME corrects.
- Suppression intelligente d’images si besoin.
Intégration WordPress
Intégration directe dans le menu d’administration.
Lancement manuel du script via un bouton dédié.
Affichage des logs en temps réel dans l’admin.
Lecture des logs du cron via AJAX.
Architecture technique
Backend en Python :
feedparser pour lecture des RSS.
transformers (Hugging Face) pour l’analyse de sentiment (BERT ou RoBERTa).
spaCy pour le traitement linguistique et l’extraction contextuelle.
Deep Translator pour la traduction automatique des mots-clés image.
API REST WordPress pour la publication.
Frontend WP (PHP + JS) :
Admin AJAX pour exécuter le script et consulter les logs.
Interface dédiée avec boutons d’exécution, visualisation et feedback en direct.
Configuration possible
Fichier
config.json
:Liste des flux RSS.
- Modèle de sentiment à utiliser (
bert
ouroberta
). Seuils d’acceptation des scores BERT / RoBERTa.
Liste des mots interdits.
- Catégorie WordPress cible.
Fichier de log.