sql >> Base de Datos >  >> RDS >> Database

Columnas dinámicas, no dinámicas y divididas en el Editor de consultas de Power BI

Como referencia, Power BI es un software de análisis y visualización de datos desarrollado por Microsoft. Power BI se puede utilizar para la visualización de datos estáticos e interactivos. Antes de poder crear visualizaciones reales con Power BI, puede realizar el preprocesamiento de datos mediante el editor de consultas de Power BI.

Con el editor de consultas, puede realizar varias tareas de transformación de datos, como cambiar los tipos de columnas, manejar valores faltantes, eliminar filas y columnas, girar y deshacer columnas, dividir columnas, etc.

En este artículo, verá cómo girar, anular el giro y dividir columnas con el editor de consultas de Power BI.

Importación de un conjunto de datos en el Editor de consultas

El conjunto de datos que se usa como ejemplo en este artículo está en un formato de archivo CSV que se puede descargar usando este enlace de Kaggle. Descargue el archivo CSV en su sistema de archivos local.

A continuación, abra Power BI Desktop, haga clic en el botón "Obtener datos" en el menú superior. En la lista desplegable, seleccione "Texto/CSV" como se muestra a continuación.

Power BI tardará un tiempo en importar los datos. Una vez que se cargan los datos, debería ver la ventana a continuación.

El conjunto de datos contiene información sobre la población, el área, la tasa de natalidad, la tasa de mortalidad, la densidad de población, el PIB per cápita, los teléfonos por 1000, etc. para todos los países del mundo. Para cargar los datos en el editor de consultas, haga clic en el botón "Transformar datos".

El editor de consultas tiene este aspecto:

En el editor de consultas, puede realizar varios preprocesamientos, como pivotar, anular el pivote y dividir columnas.

Teoría pivotante y no pivotante

Antes de pasar a las columnas dinámicas y no dinámicas con el editor de consultas de Power BI. Consideremos un ejemplo muy básico de no pivotar.

Sin pivotar

Suponga que tiene un conjunto de datos que contiene la siguiente información. Las filas de la siguiente tabla corresponden a países, mientras que las columnas muestran información sobre el PIB per cápita y la tasa de alfabetización de los países correspondientes en filas. (Nota:estos son solo valores ficticios, no los valores reales)

País PIB per cápita Tasa de alfabetización
Francia 30.000 95 %
Alemania 25.000 96 %

Si elimina la dinámica de una sola columna, por ejemplo, el PIB per cápita, el conjunto de datos con una columna no dinámica se verá así.

País Atributo Valor Alfabetización
Francia PIB per cápita 30.000 95 %
Alemania PIB per cápita 25.000 96 %

Puede ver que la columna PIB per cápita ha sido reemplazada por dos columnas, es decir, Atributo y Valor. Los valores de la columna "Atributo" corresponden al nombre de la columna que no está pivotada, mientras que la columna "Valor" contiene los valores que existían anteriormente en la columna no pivotada. Dado que solo una columna no está pivotada, los valores en la columna "Atributo" siempre serán los mismos. Además, la cantidad de filas en el conjunto de datos con una columna sin pivotar seguirá siendo la misma.

Ahora intentemos ver qué sucede cuando quitamos el pivote de dos columnas. Desvincularemos las columnas PIB per cápita y Tasa de alfabetización en el conjunto de datos original. El conjunto de datos con dos columnas sin pivotar se ve así.

País Atributo Valor
Francia PIB per cápita 30.000
Francia Tasa de alfabetización 95 %
Alemania PIB per cápita 25.000
Alemania Tasa de alfabetización 96 %

En el conjunto de datos anterior, puede ver que para cada nombre de país, la columna "Atributo" ahora contiene dos valores únicos:PIB per cápita y tasa de alfabetización. La columna "Valor" contiene los valores correspondientes a los Atributos. Observe que el número de filas se ha duplicado. De manera similar, si quitas el pivote de tres columnas, la cantidad de filas en un conjunto de datos aumenta tres veces.

Pivotar

Pivotar, como sugiere el nombre, se refiere al proceso que se utiliza para revertir un conjunto de datos no pivotado a su forma original. Por ejemplo, al girar la tabla de entrada se ve así:

País Atributo Valor
Francia PIB per cápita 30.000
Francia Tasa de alfabetización 95 %
Alemania PIB per cápita 25.000
Alemania Tasa de alfabetización 96 %

Después de aplicar el pivote en las columnas "Atributo" y "Valor", el conjunto de datos toma la siguiente forma:

País PIB per cápita Tasa de alfabetización
Francia 30.000 95 %
Alemania 25.000 96 %

Ahora que sabemos qué es pivotar y no pivotar, veamos cómo implementarlos con Power BI.

Pivotar y no pivotar con Power BI

Primero veamos un ejemplo de cómo quitar el pivote de una sola columna con el editor de consultas de Power BI. Si observa el conjunto de datos, contiene una columna llamada "Población". Para quitar el pivote de la columna "Población", haga clic en el encabezado de la columna y luego seleccione la opción "Transformar" en el menú superior. Verá un nuevo menú con varias opciones que aparecen en la parte superior, haga clic en la opción "Unpivot Columns" del menú y luego haga clic en "Unpivot Columns" de la lista desplegable, como se muestra a continuación:

La columna "Población" será reemplazada por las columnas "Atributo" y "Valor", como se muestra a continuación:

Ahora, para pivotar una columna, tiene dos opciones. Puede hacer clic en la opción "x Columnas sin pivotar" en la ventana "Pasos aplicados", como se muestra en la siguiente captura de pantalla.

La otra opción es seleccionar una columna y luego seleccionar "Transformar -> Columna dinámica" en el menú superior, como se muestra a continuación.

Mientras gira una columna, debe especificar la columna que contiene los valores para la columna no girada. En nuestro caso, la columna "Valor" contiene valores para la columna "Atributo" sin pivotar. Mire la siguiente captura de pantalla como referencia.

La columna dinámica "Población" se ve así:

Mueva la columna "Población" justo al lado de "Pob. Densidad (por milla cuadrada)” haciendo clic en el encabezado de la columna “Población” y arrastrándolo, como se muestra en la siguiente captura de pantalla.

A continuación, quitaremos el pivote de dos columnas, es decir, "Población" y "Población". Densidad (por milla cuadrada)”. Seleccione ambos encabezados de columna y luego despírvelos, como se muestra a continuación:

Después de anular la rotación, debería ver las siguientes dos columnas creadas en el conjunto de datos. Puede ver que la columna "Atributo" ahora contiene información sobre "Población" y "Población". Densidad (por milla cuadrada)”.

Seleccione los encabezados de ambas columnas (CTRL + Clic) y luego arrastre las columnas justo al lado de la columna "País", como se muestra a continuación.

Ahora, puede ver los nombres de los "países", su población total y la densidad de población por milla cuadrada. Cambiemos el nombre de la columna "Atributo" a "Tipo de población" ya que la columna "Atributo" muestra dos tipos de población:la población total y la densidad de población por milla cuadrada. El conjunto de datos con un nombre de encabezado de columna actualizado se ve así:

Columnas divididas

Antes de dividir las columnas, reemplazaremos algunos valores en la columna "Tipo de población".

El valor “Población” en la columna “Tipo de población” se refiere a la población total. Reemplazaremos el valor “Población” por “Pob. Total” para que tenga el mismo patrón que “Pop. Densidad (por milla cuadrada)”. Para reemplazar valores en columnas, vaya a "Transformar -> Reemplazar valores", como se muestra en la siguiente captura de pantalla.

Después de reemplazar los valores, el conjunto de datos se ve así.

Ahora, dividiremos la columna "Tipo de población" en dos. Sus primeros cinco caracteres se agregarán a la primera columna, mientras que los caracteres restantes se agregarán a la otra columna. Para dividir una columna, vaya a "Transformar -> Columnas divididas". Dividiremos por los primeros cinco caracteres, por lo tanto, seleccione la opción "Dividir por número de caracteres" del menú desplegable. Dividiremos la columna por los primeros 5 caracteres más a la izquierda. Como referencia, mira la siguiente captura de pantalla.

Una vez que las columnas estén divididas, debería ver las siguientes dos columnas.

Solo necesitamos la columna "Tipo de población.2" ya que contiene información sobre el tipo o la escala de la población. Haga clic en la columna "Tipo de población.1" y luego seleccione "Eliminar".

Finalmente, puede cambiar el nombre de la columna "Tipo de población.2" a "Tipo de población" como se muestra a continuación.

En la siguiente figura, puede ver que hay dos tipos diferentes de valores de población para cada país. El valor “Total” en la columna “Tipo de población” se refiere a la población total del país. El valor real de la población total se almacena en la columna "Valor de la población". De manera similar, el valor "Densidad (por milla cuadrada)" muestra que este valor de población se refiere a la densidad de población.

Conclusión

En resumen, el artículo le muestra cómo realizar pivotar y no pivotar en el editor de consultas de Power BI. Además, cubre la teoría básica detrás de las columnas pivotantes y no pivotantes ilustradas con ejemplos claros. Finalmente, el artículo explica cómo se implementa el proceso de división de columnas en el editor de consultas de Power BI.