Pandas DataFrame es un formato de datos tabulares heterogéneos, bidimensionales y de tamaño variable con ejes con nombre. En operaciones matemáticas, las etiquetas de fila y columna siempre deben estar alineadas. La estructura de datos básica de pandas es similar a un dictado, ya que actúa como un contenedor para artículos en serie.
DataFrame se convierte en una matriz de registros NumPy utilizando la función DataFrame.to records() de Panda. El índice generalmente se proporciona como el campo inicial del registro. Discutiremos el método pandas to_records() con ejemplos en este artículo.
Tabla de Contenidos
¿Qué es un marco de datos?
Pandas es un paquete de ciencia de datos de Python popular por una buena razón: ofrece estructuras de datos potentes, expresivas y flexibles que facilitan la manipulación y el análisis de datos, entre otras cosas. El DataFrame es una de estas estructuras.
Un marco de datos es una estructura de datos bidimensional en la que los datos se representan mediante filas y columnas. Un DataFrame de Pandas consta de tres componentes principales: datos, filas y columnas.
Debido a que proporcionan una manera flexible y fácil de almacenar y trabajar con datos, los marcos de datos son una de las estructuras de datos más utilizadas en el análisis de datos moderno.
Para crear un marco de datos de pandas, se pueden usar listas, series, dictados, numpy ndarrays y otros marcos de datos para crear un marco de datos de pandas.
¿Cuál es la sintaxis de las funciones Pandas.DataFrame.to_records()?
El método to_records() se usa para convertir un DataFrame en una matriz de registros NumPy relevante. La función to_records() en pandas tiene la siguiente sintaxis.
# DataFrame.to_records(index=Verdadero, column_dtypes=Ninguno, index_dtypes=Ninguno)
Puede encontrar todos los detalles sobre los parámetros en la siguiente sección.
índice
Incluya el índice en la matriz de registros resultante, que se puede almacenar en el campo Índice o se puede acceder a través de la etiqueta Índice si se establece una.
tipos_d_columna
Si el tipo de datos es cadena o tipo, se utilizará para almacenar todas las columnas.
índice_tipos
Si el tipo de datos es una cadena o tal vez un tipo, se usará para contener todos los niveles de índice. Si se trata de un diccionario, la asignación de nombres a nivel de índice y los índices se utilizan para especificar los tipos de datos. Esta asignación solo se usa si index=True.
Profundicemos en el tema con diferentes ejemplos. Puede implementar y ver estos ejemplos para comprender mejor el concepto general.
Ejemplo 1:
La función DataFrame.to_records() de Python consiste en convertir el marco de datos dado en una matriz de registros NumPy. Considere el código dado a continuación como un ejemplo.
Creamos un marco de datos con valores para tres cualidades diferentes: «salario, nombre del empleado y edad»; 39000, 44000, 25000 y 55000 son los valores de la propiedad Salario. Alex, Andrew, Zack y Kim se encuentran entre los valores del atributo Nombre del empleado.
Asimismo, el atributo edad incluye los valores 39, 44, 25 y 55. El índice fue construido y tipografiado. A continuación, se imprime el marco de datos.
d_marco = pandasmarco de datos({‘Salario’:[39000, 44000, 25000, 55000],
‘Nombre de empleado’:[‘Alex’, ‘Andrew’, ‘Zack’, ‘Kim’],
‘Edad’:[39, 44, 25, 55]})
Índice_ = pandasrango de fechas(‘2020-08-05 07:30’, periodos = 4, frecuencia =‘H’)
d_marco.índice = Índice_
prensa(d_marco)
Los valores de salario, nombre y edad del empleado, fecha y hora se muestran en la siguiente captura de pantalla.
La siguiente captura de pantalla muestra el marco de datos dado a una representación de matriz de conjunto de datos numpy relevante.
d_marco = pandasmarco de datos({‘Salario’:[39000, 44000, 25000, 55000],
‘Nombre de empleado’:[‘Alex’, ‘Andrew’, ‘Zack’, ‘Kim’],
‘Edad’:[39, 44, 25, 55]})
Índice_ = pandasrango de fechas(‘2020-08-05 07:30’, periodos = 4, frecuencia =‘H’)
d_marco.índice = Índice_
prensa(d_marco)
resultado = d_marco.a_registros()
prensa(resultado)
La siguiente imagen adjunta explica que la función DataFrame.to_records() se usa para cambiar el marco de datos a una representación de matriz de registros NumPy relevante.
Ejemplo 2:
En el segundo ejemplo, veremos cómo usar la función DataFrame.to_records(). El código es similar al anterior. Esta vez primero importamos el módulo pandas y luego generamos el marco de datos.
Luego se formó el índice como se muestra en el código: index_ = [‘First Row’,’Second Row’,’Third Row’,’Fourth Row’, and ‘Fifth Row’]. Finalmente configuramos el índice e imprimimos los resultados del marco de datos. Mira la última línea de código.
marco de datos = pandasmarco de datos({«1»:[9, 3, 4, None, 6],
«2»:[8, 1, 22, 35, None],
«3»:[19, 9, 17, 6, 9],
«4»:[55, 2, None, 1, 9]})
Índice_ = [‘First_Row’, ‘Second_Row’, ‘Third_Row’, ‘Fourth_Row’, ‘Fifth_Row’]
marco de datos.índice = Índice_
prensa(marco de datos)
Puede ver el resultado aquí, que incluye el índice y el marco de datos.
Al usar la función DataFrame.to records(), convertimos el marco de datos dado. Puede verlo en la captura de pantalla adjunta a continuación.
marco de datos = pandasmarco de datos({«1»:[9, 3, 4, None, 6],
«2»:[8, 1, 22, 35, None],
«3»:[19, 9, 17, 6, 9],
«4»:[55, 2, None, 1, 9]})
Índice_ = [‘First_Row’, ‘Second_Row’, ‘Third_Row’, ‘Fourth_Row’, ‘Fifth_Row’]
marco de datos.índice = Índice_
prensa(marco de datos)
resultado = marco de datos.a_registros()
prensa(resultado)
Después de modificaciones mínimas al código de referencia anterior, este es el resultado. La función DataFrame.to_records() cambia un marco de datos dado en una representación de matriz de registros NumPy relevante.
Ejemplo 3:
En nuestro ejemplo final, veremos cómo convertir un marco de datos de pandas utilizando la técnica numpy: los pandas. El método to_numpy se puede usar para convertir esta estructura de datos en una matriz NumPy.
Puede ver en el código que importamos los pandas y los módulos numpy que son esenciales para que se ejecute el código. Creamos el marco de datos después de importar los módulos. Hay 5 filas y 3 columnas de datos en el marco de datos.
Después de eso, el marco de datos se convierte en una matriz numpy. Se muestran el marco de datos transformado y su tipo.
importar sordo
marco de datos = pandasmarco de datos(
Datos = sordo.casualmente.borde(
, 10, (5,3)),
columnas =[«a», «b», «c»])
cls_res = marco de datos.to_numpy()
prensa(cls_res)
prensa(Tipo(cls_res))
La salida está en la siguiente captura de pantalla. Los valores de datos dentro de las 5 filas y 3 columnas del marco de datos construido se pueden ver aquí. La clase también se muestra en la última línea de la salida. Como se muestra arriba, el método DataFrame to NumPy() de Panda convierte un DataFrame en una matriz NumPy.
Conclusión:
La función to_record() en Python se describe en este artículo. El marco de datos de pandas también se enseña bien con ejemplos. También se explican los pasos para convertir un marco de datos utilizando el método DataFrame to_records().