URL-Parameter in Google Data Studio entfernen

Lukas Becker, geschäftsführender Gesellschafter der Digitalagentur candyblue UG (haftungsbeschränkt) aus Kassel
Lukas Geschäftsführung

Wenn URLs in Google Data Studio dargestellt werden sollen, ist es ratsam, alle URL-Parameter und IDs zu entfernen, bevor die Daten genutzt werden. Das erhöht nicht nur die Lesbarkeit, sondern sorgt auch dafür, dass eure Daten sauber mit Daten aus anderen Quellen zusammengeführt werden können.

Angenommen ihr möchtet eure Google Search Console- mit euren Google Analytics-Daten zusammenführen und wollt als JOIN-Schlüssel die URL verwenden, müssen die Werte innerhalb der Felder, die zusammengeführt werden sollen, identisch sein, damit die Zusammenführung klappt.

Nun kann es allerdings vorkommen, dass in Google Analytics nicht einfach nur “normale” URLs erfasst sind, sondern zusätzlich URLs mit Parametern oder IDs, wie beispielweise https://eure-website.de/blog/artikel?utm_source=newsletter oder https://eure-website.de/blog/artikel#content.

Um die URLs zu bereinigen, erstellen wir in jeder Datenquelle, in der parametrierte URLs vorkommen, ein neues Feld, das die URLs entsprechend kürzt. Dieses Feld nutzt einen regulären Ausdruck, um Parameter und IDs zu identifizieren und zu entfernen. Dieser reguläre Ausdruck enthält zwei Regeln: Der Ausdruck links von | entfernt alle Parameter, der Ausdruck hinter | alle IDs. Folgende Felder nutzen wir für Google Analytics Daten.

URL-Parameter & IDs entfernen

REGEXP_REPLACE(Landingpage, “\?.+|\#.+“, “”)

Falls aus irgendeinem Grund nur URL-Parameter oder nur IDs entfernt werden sollen, kann der reguläre Ausdruck entsprechend angepasst werden:

Nur URL-Parameter entfernen

REGEXP_REPLACE(Landingpage, “\?.+“, “”)

Nur IDs entfernen

REGEXP_REPLACE(Landingpage, “\#.+“, “”)

Lukas Becker, geschäftsführender Gesellschafter der Digitalagentur candyblue UG (haftungsbeschränkt) aus Kassel
Lukas

Lukas ist Gründer und Geschäfsführer von candyblue, ihr findet ihn bei Instagram oder xing.