Arbeiten mit doppelten Werten

Sie können mit doppelten Gruppen von Werten durch Transformationen arbeiten, die Duplikate aus Ihren Daten entfernen können. Sie können Ihre Daten auch so filtern, dass nur Duplikate angezeigt werden, sodass Sie sich darauf konzentrieren können.

Warnung

Bei Power Query wird die Groß-/Kleinschreibung beachtet. ** Beim Arbeiten mit doppelten Werten berücksichtigt Power Query die Groß- und Kleinschreibung des Textes, was zu unerwünschten Ergebnissen führen kann. Als Problemumgehung können Sie vor dem Entfernen von Duplikaten eine Groß- oder Kleinbuchstabentransformation anwenden.

In diesem Artikel werden in den Beispielen die folgende Tabelle mit den Spalten "ID", " Kategorie" und " Summe " verwendet.

Screenshot der ersten Beispieltabelle mit den Spalten

Entfernen doppelter Zeilen in Power Query

Verwenden Sie "Duplikate entfernen" , um Zeilen zu löschen, in denen ausgewählte Spalten wiederholte Werte enthalten. Power Query unterscheidet beim Vergleichen von Werten zwischen Groß- und Kleinschreibung. Wandeln Sie die Werte daher zuerst in Groß- oder Kleinbuchstaben um, wenn die Groß-/Kleinschreibung den Vergleich nicht beeinflussen soll.

  1. Wählen Sie die Spalten aus, die doppelte Werte enthalten.

  2. Wechseln Sie zur Registerkarte " Start ".

  3. Wählen Sie in der Gruppe " Zeilen verkleinern " die Option "Zeilen entfernen" aus.

  4. Wählen Sie im Dropdownmenü "Duplikate entfernen" aus.

    Screenshot der Position der Option

Warnung

Power Query garantiert nicht, dass die erste Instanz in einer Reihe von Duplikaten beibehalten wird, wenn Duplikate entfernt werden. Weitere Informationen zum Beibehalten der Sortierung finden Sie unter "Beibehalten der Sortierung".

Entfernen von Duplikaten aus mehreren Spalten

In der Beispieltabelle mit den Spalten "ID", " Kategorie" und " Summe " werden in diesem Beispiel doppelte Zeilen basierend auf allen Spalten entfernt.

Screenshot der ersten Tabelle mit Duplikaten in mehreren Spalten hervorgehoben.

Sie haben vier Zeilen, die Duplikate sind. Ihr Ziel ist es, diese doppelten Zeilen zu entfernen, sodass nur eindeutige Zeilen in der Tabelle vorhanden sind. Wählen Sie alle Spalten aus der Tabelle aus, und wählen Sie dann "Duplikate entfernen" aus.

Die Ausgabetabelle enthält nur Zeilen mit eindeutigen Kombinationen in allen Spalten.

Screenshot der endgültigen Tabelle mit Duplikaten, die aus allen Spalten entfernt wurden.

Hinweis

Sie können diesen Vorgang auch mit einer Teilmenge von Spalten ausführen.

Entfernen von Duplikaten aus einer einzelnen Spalte

Bei Verwendung derselben Beispieltabelle werden in diesem Beispiel doppelte Zeilen entfernt, die nur auf der Spalte " Kategorie " basieren.

Screenshot der ersten Tabelle, die Duplikate in der Spalte

Sie möchten diese Duplikate entfernen und nur eindeutige Werte beibehalten. Wenn Sie Duplikate aus der Spalte "Kategorie " entfernen möchten, wählen Sie sie aus, und wählen Sie dann "Duplikate entfernen" aus.

Die Ausgabetabelle behält nur die erste Zeile für jeden eindeutigen Kategoriewert bei.

Screenshot der endgültigen Tabelle mit Duplikaten, die aus der Spalte

Doppelte Zeilen in Power Query beibehalten

Verwenden Sie "Duplikate beibehalten ", um die Tabelle zu filtern, sodass nur Zeilen mit wiederholten Werten in den ausgewählten Spalten angezeigt werden. Power Query unterscheidet beim Vergleichen von Werten zwischen Groß- und Kleinschreibung.

  1. Wählen Sie die Spalten aus, die doppelte Werte enthalten.

  2. Wechseln Sie zur Registerkarte " Start ".

  3. Wählen Sie in der Gruppe "Zeilen verkleinern " die Option "Zeilen beibehalten" aus.

  4. Wählen Sie im Dropdownmenü " Duplikate beibehalten" aus.

    Screenshot der Position der Option

Duplikate aus mehreren Spalten behalten

In der Beispieltabelle mit den Spalten "ID", " Kategorie" und " Summe " werden in diesem Beispiel nur Zeilen beibehalten, die mehr als einmal in allen Spalten angezeigt werden.

Screenshot der Anfangstabelle zum Beibehalten von Duplikaten aus mehreren Spalten.

Sie haben vier Zeilen, die Duplikate sind. Ihr Ziel in diesem Beispiel besteht darin, nur die Zeilen beizubehalten, die in der Tabelle dupliziert sind. Wählen Sie alle Spalten in der Tabelle aus, und wählen Sie dann "Duplikate beibehalten" aus.

Die Ausgabetabelle enthält nur die Zeilen mit übereinstimmenden Werten in einer anderen Zeile.

Screenshot der endgültigen Tabelle mit nur duplizierten Zeilen aus mehreren Spalten.

Beibehalten von Duplikaten aus einer einzelnen Spalte

Bei Verwendung derselben Beispieltabelle behält dieses Beispiel nur Zeilen bei, in denen der Wert der ID-Spalte mehrmals angezeigt wird.

Erste Tabelle zum Beibehalten von Duplikaten aus einer einzelnen Spalte.

In diesem Beispiel haben Sie mehrere Duplikate, die Sie in der Tabelle beibehalten möchten. Um Duplikate aus der ID-Spalte beizubehalten, wählen Sie die ID-Spalte aus, und wählen Sie dann "Duplikate beibehalten" aus.

Die Ausgabetabelle enthält alle Zeilen, in denen der ID-Wert mehrmals angezeigt wurde.

Letzte Tabelle mit nur duplizierten Zeilen aus einer einzelnen Spalte.

Tools zur Datenprofilerstellung