📊 Visualizando las reseñas de Amazon Food como un grafo bipartito usando NetworkX
¿Estás interesado en visualizar datos de una manera única? En este artículo, exploraremos cómo crear un grafo bipartito utilizando NetworkX para visualizar las reseñas de alimentos de Amazon. Cubriremos el formato de los datos, el proceso de creación del programa y cómo calcular los indicadores utilizados en las redes.
Tabla de contenidos
- Introducción
- Formato de los datos
- Proceso de creación del programa
- Cálculo de los indicadores utilizados en las redes
- Conclusión
Introducción
Amazon vende muchos productos y, entre ellos, los usuarios pueden calificar el producto con estrellas, calificarlo más tarde y luego ver si el producto es bueno o malo con comentarios. En este artículo, nos centraremos en los productos alimenticios y las calificaciones dadas por los usuarios. Crearemos un grafo bipartito utilizando NetworkX para visualizar los datos.
Formato de los datos
Los datos que utilizaremos son un archivo de texto que contiene información sobre los productos alimenticios, los usuarios y sus calificaciones. El archivo contiene 568,000 líneas de datos, lo cual es demasiado para visualizar de manera efectiva. Por lo tanto, reduciremos el número de reseñas a 100 con fines de visualización.
Los datos están estructurados de tal manera que cada 9 líneas están llenas de datos sobre un solo producto alimenticio. Los datos incluyen el ID del producto, el nombre de usuario, el valor de evaluación y los comentarios. Solo utilizaremos el ID del producto, el nombre de usuario y el valor de evaluación para nuestra visualización.
Proceso de creación del programa
Para crear el grafo bipartito, utilizaremos NetworkX y Python. Primero crearemos un diccionario con la parte izquierda como cero y la parte derecha como ciudad. Luego crearemos un diccionario a partir de los datos en su posición de evento y usaremos melee y una función para extraer el elemento de índice de este elemento al mismo tiempo. Luego usaremos el comando y la función para obtener la concentración actual y usar el valor de evaluación expresado como un color.
Utilizaremos 10 colores para expresar el valor de evaluación, siendo los valores más bajos de color rojizo y los valores más altos de color verdoso. Luego trazaremos el grafo utilizando NetworkX, con el nombre de etiqueta en la parte superior de la densidad. El de la izquierda es el nombre de usuario y el de la derecha es el ID del producto.
Cálculo de los indicadores utilizados en las redes
Para calcular los indicadores utilizados en las redes, utilizaremos la biblioteca NetworkX. Crearemos una lista de reproducción que resuma cosas como cómo escribir varias redes, comenzando desde lo básico, y cómo calcular los indicadores utilizados en las redes.
Conclusión
En conclusión, hemos explorado cómo crear un grafo bipartito utilizando NetworkX para visualizar las reseñas de alimentos de Amazon. Hemos cubierto el formato de los datos, el proceso de creación del programa y cómo calcular los indicadores utilizados en las redes. Si estás interesado en visualizar datos de una manera única, ¡inténtalo!
Pros
- Forma única de visualizar datos
- Fácil de entender y seguir
- Se puede aplicar a otros conjuntos de datos
Contras
- Limitado a solo 100 reseñas con fines de visualización
- Requiere ciertos conocimientos de Python y NetworkX
Aspectos destacados
- Visualización de las reseñas de alimentos de Amazon como un grafo bipartito utilizando NetworkX
- Uso de 10 colores para expresar el valor de evaluación
- Creación de una lista de reproducción para resumir cómo escribir varias redes y calcular los indicadores utilizados en las redes
Preguntas frecuentes
P: ¿Qué es NetworkX?
R: NetworkX es un paquete de Python para la creación, manipulación y estudio de la estructura, dinámica y funciones de redes complejas.
P: ¿Se puede aplicar este método a otros conjuntos de datos?
R: Sí, este método se puede aplicar a otros conjuntos de datos con estructuras similares.
P: ¿Necesito tener conocimientos de Python y NetworkX para seguir el proceso de creación del programa?
R: Sí, se requiere cierto conocimiento de Python y NetworkX para seguir el proceso de creación del programa.