Know Your Customer – Segmentation mit Machine Learning

Je besser ein Unternehmen seine Kunden kennt, desto gezielter kann es seine Produkte und Dienstleistungen an den Mann/die Frau bringen. Heute sind Verkaufskanäle vielfältig und nicht selten digital, wodurch der persönliche Kontakt zu den Kunden, wie er früher stattgefunden hat, oft nicht mehr existiert. Die digitale Welt bietet aber andere Mittel und Wege, seine Kunden trotz Distanz und Onlinekanäle sehr genau zu kennen: Wir haben so viel Daten wie nie zuvor. Und genau diese Daten können wir nutzen, um uns ein Bild über unsere Kunden zu machen: Wer sind sie? Was mögen sie? Wann kaufen sie ein? Worauf reagieren sie?

Wozu Customer Segmentation?

Das Ziel bei der Customer Segmentation oder der Kundenanalyse ist es, den Kunden so gut zu kennen und einzuschätzen, dass ein gezieltes Marketing angewendet werden kann und Produkte somit noch direkter platziert werden können. Orientieren kann man sich am STP-Framework: Segmentation – Targeting – Positioning. Doch was bedeutet das genau?

Segmentation: Das ist die Unterteilung von Kunden in Gruppen, welche ähnliche Merkmale aufweisen. Dadurch kann man schliessen, dass sie ein ähnliches Kaufverhalten haben und entsprechend auf Marketing-Aktionen reagieren. Um die Merkmale zu vergleichen, stehen verschiedene Daten zur Verfügung. Einerseits können demographische und soziographisch Daten wie Alter, Geschlecht, Bildung, etc. analysiert werden. Die viel spannenderen Daten sind jedoch jene, die auf das Verhalten und die Psychologie hinweisen: Wie oft kauft jemand ein, in welchen Mengen, zu welchen Preisen, zu welcher Zeit, etc.

Targeting: In dieser Phase werden die identifizierten Gruppen/Segmente analysiert und beurteilt, welche Gruppen fokussiert werden soll. Dabei wird geprüft, welches Potential die jeweilige Gruppe ausweist. In der weiteren Phase können entweder alle Segmente (unterschiedlich) positioniert werden, oder aber man wählt einzelne Gruppen aus, die man gezielt bewerben möchte – generell oder innerhalb einer Kampagne.

Positioning: Nun werden konkrete Massnahmen definiert, wie die gewählte Gruppe angegangen werden kann. Die Erkenntnisse aus der Segmentierung (Eigenschaften, Verhalten, etc.) ermöglichen den gewünschten Wettbewerbsvorteil, da das Unternehmen nun genau weiss, wie die Personen im Segment auf Aktionen, Kampagnen und sogar Preiselastizitäten reagieren und auch wo es Sinn macht die Kampagne zu starten: Online/Offline, auf welchem Portal, an welchem Event, zu welchem Zeitpunkt, etc.

Ein Ansatz mit Machine Learning

Wie kann nun eine solche Segmentierung mit Machine Learning erreicht werden? Das ist eine klassische Aufgabe für das sogenannte Clustering. Das ist eine Disziplin im «Unsupervised» Machine Learning und bedeutet, dass Daten aufgrund ihrer Ähnlichkeit in Gruppen eingeteilt werden. Die wesentlichen Bestandteile beim Clustering sind folgende drei Punkte:

Die Daten

Wie immer steht und fällt ein Machine Learning Projekt mit der Verfügbarkeit und Qualität der Daten. Mit den heutigen Online-Shops haben Firmen die komplette Historie ihrer Kundenkäufe verfügbar und können diese inkl. den Profildaten für eine Segmentierung verwenden. Für das Clustering nehmen wir ein überschaubares Datenset von Kunden mit ein paar demografischen Felder und ihrer Kaufkraft:

Abbildung: Auszug aus dem Datenset mit Angaben zum Kunden

Die Features

Beim Pre-Processing werden die vorhandenen Felder (genannt Features) analysiert, ob sie sich für eine Einteilung eignen und ob sie vorgängig transformiert werden müssen. Unter anderem müssen nicht-nummerische Features konvertiert und sämtliche nummerische Features normalisiert werden. Normalisierung heisst, alle Features benutzen die gleiche Werte-Skala, damit der Algorithmus die Werte miteinander vergleichen und mit einer höheren Wahrscheinlichkeit ein gutes Resultat liefern kann.
Eine Analyse der einzelnen Features gibt zusätzliche Aussagen darüber, wie sehr sie miteinander korrelieren und sich für ein Clustering anbieten. Oftmals erkennt man bei einem simplen Scatter Plot bereits, ob sich ein Muster erkennen lässt.

Der Algorithmus

Der wohl bekannteste Clustering Algorithmus ist der K-Means Algorithmus, welche Segmente in einer flachen Struktur erstellt und die Datenpunkte zuordnet. Dabei wird pro Cluster der Mittelpunkt eruiert und die Distanz der einzelnen Werte zum Cluster-Mittelpunkt ergeben die Zugehörigkeit zu einem bestimmten Cluster – oder eben Segment. Wie viele Clusters gebildet werden sollen, wird entweder vorgängig definiert oder im Laufe der Analyse bestimmt.

Abbildung: Machine Learning mit Azure ML Studio links, das Clustering Ergebnis rechts

Das Beispiel hier zeigt eine einfache Berechnung und Darstellung mit zwei Dimensionen und fünf Cluster. In der Realität werden aber viel mehr Dimensionen benötigt, da mehr Features verwendet werden, was wiederum schwierig wird, die Cluster in einem einfachen Scatter Plot darzustellen.
Das Prinzip ist aber das Gleiche: Ein Cluster ist ein Kundensegment und aufgrund ihrer Eigenschaften werden Kunden jenem Segment zugeordnet, dem sie am nächsten sind.

Nach der Segmentierung


Mit der Segmentierung legen wir die Basis für die weiterführende Phasen des Targetings und Positionings. Das Beispiel hier gibt fünf Segmente zurück, die wir unterschiedlich einordnen und beurteilen können, wie hoch ihr Potential ist. Mit einem entsprechenden Marketing Mix pro Segment können nun Massnahmen und Kampagnen vorbereitet werden.
Bei der Customer Segmentation ist ein enges Zusammenspiel zwischen dem Analysten und dem Marketer gefragt. Die Segmente oben liefern nun Informationen, welche Kunden zum Beispiel viel verdienen, aber wenig kaufen. Diese Personen müssen anders beworben werden, als jene, die kein grosses Gehalt haben, davon aber schon sehr viel ausgeben. Die Marketing-Abteilung kann nun gezielt Strategien entwickeln, um die gewünschten Segmente direkt anzuwerben.
Je mehr Informationen über die Käufer und ihr Kaufverhalten verfügbar sind, desto genauer können die Segmentierungen vorgenommen werden. Viele Unternehmen, gerade jene die mit Online-Shops oder Kundenkarten arbeiten, haben grosses Potential und können ihre Daten für eine Segmentierung nutzen.

Dies ist ein Gastbeitrag von Andrea Gasser von lutra analytics GmbH.