MVPs do Excel atacam o problema de limpeza de dados no Power Query - Dicas do Excel

Índice

Nota

Este é um de uma série de artigos detalhando soluções enviadas para o desafio Podcast 2316.

O MVP da Excel, Oz Du Soleil, do canal Excel on Fire no YouTube, mencionou o Brazilian Bull Rider Kaique Pachecho. Oz foi a primeira pessoa a notar que fui o caminho lento para adicionar os quatro quartos.

O vídeo de Oz é:
https://www.youtube.com/watch?v=OluZlF44PNI

Seu código é:

let Source = Excel.CurrentWorkbook()((Name="UglyData"))(Content), #"Removed Columns" = Table.RemoveColumns(Source,("Column2", "Column3", "Column4", "Column5", "Column6")), #"Transposed Table" = Table.Transpose(#"Removed Columns"), #"Promoted Headers" = Table.PromoteHeaders(#"Transposed Table", (PromoteAllScalars=true)), #"Changed Type" = Table.TransformColumnTypes(#"Promoted Headers",(("Category Description", type text), ("Administrative", type number), ("Holiday", Int64.Type), ("PTO/LOA/Jury Duty", Int64.Type), ("Project A", type number), ("Project B", type number), ("Project C", type number))), #"Added Conditional Column" = Table.AddColumn(#"Changed Type", "Custom", each if (Category Description) = "Q1" then null else if (Category Description) = "Q2" then null else if (Category Description) = "Q3" then null else if (Category Description) = "Q4" then null else (Category Description)), #"Filled Down" = Table.FillDown(#"Added Conditional Column",("Custom")), #"Renamed Columns" = Table.RenameColumns(#"Filled Down",(("Custom", "Names"))), #"Filtered Rows" = Table.SelectRows(#"Renamed Columns", each (Category Description) = "Q1" or (Category Description) = "Q2" or (Category Description) = "Q3" or (Category Description) = "Q4"), #"Reordered Columns" = Table.ReorderColumns(#"Filtered Rows",("Names", "Category Description", "Administrative", "Holiday", "PTO/LOA/Jury Duty", "Project A", "Project B", "Project C")), #"Unpivoted Other Columns" = Table.UnpivotOtherColumns(#"Reordered Columns", ("Names", "Category Description"), "Attribute", "Value"), #"Pivoted Column" = Table.Pivot(#"Unpivoted Other Columns", List.Distinct(#"Unpivoted Other Columns"(#"Category Description")), "Category Description", "Value", List.Sum), #"Inserted Sum" = Table.AddColumn(#"Pivoted Column", "Addition", each List.Sum(((Q1), (Q2), (Q3), (Q4))), type number), #"Renamed Columns1" = Table.RenameColumns(#"Inserted Sum",(("Addition", "TOTAL"))) in #"Renamed Columns1"

Outra solução, esta do Excel MVP John MacDougall.

  • John foi o primeiro a dizer que, ao excluir as duas etapas extras adicionadas ao Power Query, você elimina os sufixos ímpares nos cabeçalhos do Q1 Q2 Q3 Q4 duplicados.
  • John usou uma coluna de índice no início que seria usada no final para classificação. Mas - John concatenou sua coluna de índice após a descrição da categoria. Ele usou uma barra vertical | para que ele pudesse quebrar os dados mais tarde.
  • John digitou sua coluna condicional como uma coluna personalizada em vez de usar a interface de coluna condicional.
Coluna condicional como coluna personalizada

Assista ao vídeo de John aqui:
https://www.youtube.com/watch?v=Dqmb6SEJDXI

Excel MVP Ken Puls, co-autor do livro M is for (Data) Monkey, enviado em três soluções. Sua coluna condicional é provavelmente a mais curta.

Mas a solução preferida de Ken ignora a pergunta original. Em vez de criar a tabela no Power Query, ele cria um conjunto de dados dinâmicos no Power Query e termina com uma tabela dinâmica.

A visualização final de Ken no Power Query é assim:

Conjunto de dados dinâmicos

Aqui está o código de Ken:

let Source = Excel.CurrentWorkbook()((Name="UglyData"))(Content), #"Promoted Headers" = Table.PromoteHeaders(Source, (PromoteAllScalars=true)), #"Changed Type" = Table.TransformColumnTypes(#"Promoted Headers",(("Category Description", type text), ("Dept. Total", type number), ("Q1", type number), ("Q2", type number), ("Q3", type number), ("Q4", Int64.Type), ("Employee 1", type number), ("Q1_1", type number), ("Q2_2", type number), ("Q3_3", Int64.Type), ("Q4_4", Int64.Type), ("Employee 2", Int64.Type), ("Q1_5", Int64.Type), ("Q2_6", Int64.Type), ("Q3_7", Int64.Type), ("Q4_8", Int64.Type), ("Employee 3", Int64.Type), ("Q1_9", Int64.Type), ("Q2_10", Int64.Type), ("Q3_11", Int64.Type), ("Q4_12", Int64.Type), ("Employee 4", type number), ("Q1_13", type number), ("Q2_14", type number), ("Q3_15", type number), ("Q4_16", Int64.Type))), #"Removed Columns" = Table.RemoveColumns(#"Changed Type",("Dept. Total", "Q1", "Q2", "Q3", "Q4")), #"Unpivoted Other Columns" = Table.UnpivotOtherColumns(#"Removed Columns", ("Category Description"), "Attribute", "Value"), #"Added Conditional Column" = Table.AddColumn(#"Unpivoted Other Columns", "Employee", each if Text.Contains((Attribute), "_") then null else (Attribute)), #"Filled Down" = Table.FillDown(#"Added Conditional Column",("Employee")), #"Split Column by Delimiter" = Table.SplitColumn(#"Filled Down", "Attribute", Splitter.SplitTextByEachDelimiter(("_"), QuoteStyle.Csv, false), ("Attribute.1", "Attribute.2")), #"Changed Type1" = Table.TransformColumnTypes(#"Split Column by Delimiter",(("Attribute.1", type text), ("Attribute.2", Int64.Type))), #"Filtered Rows" = Table.SelectRows(#"Changed Type1", each ((Attribute.2) null)), #"Removed Columns1" = Table.RemoveColumns(#"Filtered Rows",("Attribute.2")), #"Renamed Columns" = Table.RenameColumns(#"Removed Columns1",(("Attribute.1", "Quarter"), ("Value", "Amount"))), #"Changed Type2" = Table.TransformColumnTypes(#"Renamed Columns",(("Category Description", type text), ("Quarter", type text), ("Amount", type number), ("Employee", type text))) in #"Changed Type2"

Depois de criar essa consulta apenas como uma conexão, ele usa uma tabela dinâmica para criar o relatório final.

Relatório final com Pivot Table

Soluções de outros MVPs:

  • O código de Wyn Hopkins está aqui: Power Query: Lidando com vários cabeçalhos idênticos.
  • O código de Mike Girvin está aqui: Power Query: Extraindo 2 caracteres à esquerda de uma coluna.
  • A solução da fórmula de Roger Govier está aqui: Soluções de fórmula.

Volte para a página principal do desafio Podcast 2316.

Leia o próximo artigo desta série: Power Query: além da interface do usuário: Table.Split e mais.

Artigos interessantes...