Utilisation de NetworkX pour visualiser un graphe biparti à partir de données réelles [Python pour la recherche #30]

Utilisation de NetworkX pour visualiser un graphe biparti à partir de données réelles [Python pour la recherche #30]

April 6, 2024
Partager
Auteur: Big Y

📊 Visualisation des avis sur les aliments Amazon avec NetworkX

Êtes-vous intéressé par la visualisation de données à l'aide de graphes de réseau ? Dans cet article, nous explorerons comment créer un graphe biparti à l'aide de NetworkX pour visualiser les avis sur les aliments Amazon. Nous couvrirons le format de données, le processus de création de programme et comment calculer les indicateurs utilisés dans les réseaux.

Table des matières

- Introduction

- Format de données

- Processus de création de programme

- Calcul des indicateurs utilisés dans les réseaux

- Conclusion

Introduction

Amazon vend beaucoup de produits, et parmi eux, les utilisateurs peuvent noter le produit avec des étoiles, le noter plus tard, puis voir si le produit est bon ou mauvais avec des commentaires. Dans cet article, nous nous concentrerons sur les produits alimentaires et les notes données par les utilisateurs. Nous créerons un graphe biparti à l'aide de NetworkX pour visualiser les données.

Format de données

Les données que nous utiliserons sont un fichier texte contenant des informations sur les produits alimentaires, les utilisateurs et leurs notes. Nous extrairons l'ID du produit, le nom d'utilisateur et la valeur de notation des données. La valeur de notation sera utilisée pour représenter la couleur du lien entre le produit et l'utilisateur. Nous utiliserons 10 couleurs pour représenter les 10 valeurs de notation possibles.

Processus de création de programme

Nous utiliserons Python et NetworkX pour créer le graphe biparti. Tout d'abord, nous créerons un dictionnaire avec la gauche comme zéro et la droite comme ville. Nous créerons ensuite un dictionnaire à partir des données dans leur position d'événement. Nous utiliserons une fonction pour extraire l'élément d'index de chaque élément en même temps. Nous prendrons le nom de chaque aliment dans la liste des aliments et l'index de l'endroit où il se trouve. Nous l'étiquetterons ensuite avec 1. Nous ferons de même pour les données de l'utilisateur. Nous étiquetterons le nom de l'utilisateur avec 0 et l'ID du produit avec 1.

Ensuite, nous créerons un objet de graphe dirigé nommé g. Nous lirons les données du fichier texte et extrairons l'ID du produit, le nom d'utilisateur et la valeur de notation. Nous utiliserons la valeur de notation pour représenter la couleur du lien entre le produit et l'utilisateur. Nous ajouterons le lien au graphe en tant que lien. Nous créerons ensuite un graphe biparti divisé en gauche et droite.

Enfin, nous utiliserons NetworkX pour écrire le graphe. Nous spécifierons la disposition et la couleur des nœuds et des liens. Nous utiliserons la valeur d'évaluation exprimée en couleur et la valeur d'évaluation est exprimée en 10 couleurs. Nous tracerons le graphe et l'afficherons.

Calcul des indicateurs utilisés dans les réseaux

En plus de créer le graphe biparti, nous pouvons également calculer les indicateurs utilisés dans les réseaux. Par exemple, nous pouvons calculer la centralité de degré, la centralité d'intermédiarité et la centralité de proximité. Ces indicateurs peuvent nous aider à comprendre la structure du réseau et l'importance de chaque nœud.

Conclusion

Dans cet article, nous avons exploré comment créer un graphe biparti à l'aide de NetworkX pour visualiser les avis sur les aliments Amazon. Nous avons couvert le format de données, le processus de création de programme et comment calculer les indicateurs utilisés dans les réseaux. Nous espérons que cet article a été utile pour comprendre comment visualiser les données à l'aide de graphes de réseau.

Avantages

- Fournit une visualisation claire des données

- Aide à comprendre la structure du réseau

- Peut calculer les indicateurs utilisés dans les réseaux

Inconvénients

- Nécessite des connaissances en Python et NetworkX

- Peut être long à créer le graphe

Points forts

- Visualisation des avis sur les aliments Amazon à l'aide de NetworkX

- Création d'un graphe biparti pour représenter les données

- Utilisation de la valeur de notation pour représenter la couleur du lien entre le produit et l'utilisateur

- Calcul des indicateurs utilisés dans les réseaux pour comprendre la structure du réseau

FAQ

Q: Qu'est-ce que NetworkX ?

R: NetworkX est un package Python pour la création, la manipulation et l'étude de la structure, de la dynamique et des fonctions des réseaux complexes.

Q: Qu'est-ce qu'un graphe biparti ?

R: Un graphe biparti est un graphe dont les nœuds peuvent être divisés en deux ensembles disjoints de telle sorte que chaque arête relie un nœud d'un ensemble à un nœud de l'autre ensemble.

Q: Quelles sont les mesures de centralité ?

R: Les mesures de centralité sont utilisées pour identifier les nœuds les plus importants dans un réseau. La centralité de degré mesure le nombre d'arêtes connectées à un nœud. La centralité d'intermédiarité mesure le nombre de plus courts chemins qui passent par un nœud. La centralité de proximité mesure la distance moyenne d'un nœud à tous les autres nœuds du réseau.

Ressources :

- [Documentation NetworkX](https://networkx.github.io/documentation/stable/)

- [Ensemble de données d'avis sur les aliments Amazon](https://snap.stanford.edu/data/web-FineFoods.html)

- [VOC AI Chatbot](https://www.voc.ai/product/ai-chatbot)

- End -
VOC AI Inc. 8 The Green,Ste A, in the City of Dover County of Kent, Delaware Zip Code: 19901 Copyright © 2024 VOC AI Inc.All Rights Reserved. Termes et conditions Politique de confidentialité
Ce site web utilise des cookies
VOC AI utilise des cookies pour garantir le bon fonctionnement du site web et pour stocker des informations sur vos préférences, vos appareils et vos actions passées. Ces données sont agrégées ou statistiques, ce qui signifie que nous ne pourrons pas vous identifier individuellement. Vous trouverez plus de détails sur les cookies que nous utilisons et sur la manière de retirer votre consentement dans notre page Politique de confidentialité.
Nous utilisons Google Analytics pour améliorer l'expérience des utilisateurs de notre site web. En continuant à utiliser notre site, vous consentez à l'utilisation de cookies et à la collecte de données par Google Analytics.
Acceptez-vous ces cookies ?
Accepter tous les cookies
Refuser tous les cookies