📊 Visualisation des avis sur les aliments Amazon avec NetworkX
Êtes-vous intéressé par la visualisation de données à l'aide de graphes de réseau ? Dans cet article, nous explorerons comment créer un graphe biparti à l'aide de NetworkX pour visualiser les avis sur les aliments Amazon. Nous couvrirons le format de données, le processus de création de programme et comment calculer les indicateurs utilisés dans les réseaux.
Table des matières
- Introduction
- Format de données
- Processus de création de programme
- Calcul des indicateurs utilisés dans les réseaux
- Conclusion
Introduction
Amazon vend beaucoup de produits, et parmi eux, les utilisateurs peuvent noter le produit avec des étoiles, le noter plus tard, puis voir si le produit est bon ou mauvais avec des commentaires. Dans cet article, nous nous concentrerons sur les produits alimentaires et les notes données par les utilisateurs. Nous créerons un graphe biparti à l'aide de NetworkX pour visualiser les données.
Format de données
Les données que nous utiliserons sont un fichier texte contenant des informations sur les produits alimentaires, les utilisateurs et leurs notes. Nous extrairons l'ID du produit, le nom d'utilisateur et la valeur de notation des données. La valeur de notation sera utilisée pour représenter la couleur du lien entre le produit et l'utilisateur. Nous utiliserons 10 couleurs pour représenter les 10 valeurs de notation possibles.
Processus de création de programme
Nous utiliserons Python et NetworkX pour créer le graphe biparti. Tout d'abord, nous créerons un dictionnaire avec la gauche comme zéro et la droite comme ville. Nous créerons ensuite un dictionnaire à partir des données dans leur position d'événement. Nous utiliserons une fonction pour extraire l'élément d'index de chaque élément en même temps. Nous prendrons le nom de chaque aliment dans la liste des aliments et l'index de l'endroit où il se trouve. Nous l'étiquetterons ensuite avec 1. Nous ferons de même pour les données de l'utilisateur. Nous étiquetterons le nom de l'utilisateur avec 0 et l'ID du produit avec 1.
Ensuite, nous créerons un objet de graphe dirigé nommé g. Nous lirons les données du fichier texte et extrairons l'ID du produit, le nom d'utilisateur et la valeur de notation. Nous utiliserons la valeur de notation pour représenter la couleur du lien entre le produit et l'utilisateur. Nous ajouterons le lien au graphe en tant que lien. Nous créerons ensuite un graphe biparti divisé en gauche et droite.
Enfin, nous utiliserons NetworkX pour écrire le graphe. Nous spécifierons la disposition et la couleur des nœuds et des liens. Nous utiliserons la valeur d'évaluation exprimée en couleur et la valeur d'évaluation est exprimée en 10 couleurs. Nous tracerons le graphe et l'afficherons.
Calcul des indicateurs utilisés dans les réseaux
En plus de créer le graphe biparti, nous pouvons également calculer les indicateurs utilisés dans les réseaux. Par exemple, nous pouvons calculer la centralité de degré, la centralité d'intermédiarité et la centralité de proximité. Ces indicateurs peuvent nous aider à comprendre la structure du réseau et l'importance de chaque nœud.
Conclusion
Dans cet article, nous avons exploré comment créer un graphe biparti à l'aide de NetworkX pour visualiser les avis sur les aliments Amazon. Nous avons couvert le format de données, le processus de création de programme et comment calculer les indicateurs utilisés dans les réseaux. Nous espérons que cet article a été utile pour comprendre comment visualiser les données à l'aide de graphes de réseau.
Avantages
- Fournit une visualisation claire des données
- Aide à comprendre la structure du réseau
- Peut calculer les indicateurs utilisés dans les réseaux
Inconvénients
- Nécessite des connaissances en Python et NetworkX
- Peut être long à créer le graphe
Points forts
- Visualisation des avis sur les aliments Amazon à l'aide de NetworkX
- Création d'un graphe biparti pour représenter les données
- Utilisation de la valeur de notation pour représenter la couleur du lien entre le produit et l'utilisateur
- Calcul des indicateurs utilisés dans les réseaux pour comprendre la structure du réseau
FAQ
Q: Qu'est-ce que NetworkX ?
R: NetworkX est un package Python pour la création, la manipulation et l'étude de la structure, de la dynamique et des fonctions des réseaux complexes.
Q: Qu'est-ce qu'un graphe biparti ?
R: Un graphe biparti est un graphe dont les nœuds peuvent être divisés en deux ensembles disjoints de telle sorte que chaque arête relie un nœud d'un ensemble à un nœud de l'autre ensemble.
Q: Quelles sont les mesures de centralité ?
R: Les mesures de centralité sont utilisées pour identifier les nœuds les plus importants dans un réseau. La centralité de degré mesure le nombre d'arêtes connectées à un nœud. La centralité d'intermédiarité mesure le nombre de plus courts chemins qui passent par un nœud. La centralité de proximité mesure la distance moyenne d'un nœud à tous les autres nœuds du réseau.
Ressources :
- [Documentation NetworkX](https://networkx.github.io/documentation/stable/)
- [Ensemble de données d'avis sur les aliments Amazon](https://snap.stanford.edu/data/web-FineFoods.html)
- [VOC AI Chatbot](https://www.voc.ai/product/ai-chatbot)