Tutoriales

Los pandas cuentan distintos

Este artículo explorará varias formas y métodos para determinar la cantidad de elementos únicos en un DataFrame de Pandas.

Data de muestra

Antes de discutir cómo determinar la cantidad de valores únicos en un DataFrame, necesitaremos datos de muestra.

A continuación se muestra un código de ejemplo:

# importar pandas
importar pandas como p.d.
d.f. = p.d.Marco de datos({
‘salario’: [120000, 100000, 90000, 110000, 120000, 100000, 56000],
‘Departamento’: [‘game developer’, ‘database developer’, ‘front-end developer’, ‘full-stack developer’, ‘database developer’, ‘security researcher’, ‘cloud-engineer’],
‘clasificación’: [4.3, 4.4, 4.3, 3.3, 4.3, 5.0, 4.4]},
índice=[‘Alice’, ‘Michael’, ‘Joshua’, ‘Patricia’, ‘Peter’, ‘Jeff’, ‘Ruth’])
d.f.

El código anterior debería crear un DataFrame de muestra que podemos usar en este tutorial. La forma tabular resultante de los datos es como se muestra:

#1 Método Único de Pandas

La función unique () es el primer método que podemos usar para determinar la cantidad de valores únicos en un DataFrame.

La función toma una serie como entrada y devuelve una lista de valores únicos.

Por ejemplo, para calcular los elementos únicos en la columna de salario, podemos hacer:

impresión(p.d.único(d.f.[‘salary’]))

El código anterior debería devolver los elementos únicos en la columna ‘salario’.

[120000 100000  90000 110000  56000]

Si desea la cantidad de valores únicos, puede obtener la longitud de la lista como se muestra:

impresión(F«Artículos únicos: {len(pd.unique(df[‘salary’]))}»)

El código anterior debería devolver:

#2 Función única de Pandas

La función nunique() le permite obtener la cantidad de valores únicos a lo largo de un eje específico.

Un ejemplo es como se muestra:

impresión(F«[number of unique items/column]\norte{df.nunico(eje=0)}»)

El código anterior debería devolver la cantidad de elementos únicos en cada columna. La salida resultante es como se muestra:

[number of unique items/column]
salario 5
Departamento 6
clasificación 4
tipo: int64

También puede obtener la cantidad de elementos únicos en una columna específica como se muestra:

impresión(d.f.salario.núnica())

Lo anterior debería devolver el número de elementos únicos en la columna de salario.

#3 Pandas value_counts()

Pandas también nos proporciona la función value_count(). Esta función devuelve el número de valores únicos en una columna especificada.

Un ejemplo es como se muestra:

resolución = lista(d.f.salario.value_counts())
impresión(F«artículos únicos: {len(res)}»)

La función value_counts() devuelve el recuento de cada valor de la columna. Luego convertimos el resultado en una lista y obtenemos la longitud.

Esto debería obtener el número de elementos únicos en la columna:

Conclusión

Este artículo discutió varios métodos y técnicas que podemos usar para determinar la cantidad de valores únicos en un DataFrame de Pandas.

LEER  Cómo restaurar los permisos de sudo para un usuario en Ubuntu Linux

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba