Zeit sparen mit Python: Kampagnendaten vorbereiten
Dieser Beitrag folgt dem Blog von Willy Chang, veröffentlicht auf LinkedIn.
Im B2B-Marketing oder im Vertrieb kommt es häufig vor, dass Sie Kundendateien selbst bearbeiten müssen, bevor Sie sie in die Systeme Ihres Unternehmens einpflegen oder weitergeben können. Typischerweise besitzt eine Kundendatei mehrere Datenspalten mit uneinheitlichem Format, stellenweise leere Datenfelder oder fehlerhafte Werte. Doppelte Einträge, Dummy-Werte, Testdaten oder schlichtweg Kauderwelsch sind nicht unüblich.
Im folgenden Beispiel demonstrieren wir, wie Ihnen ein einfacher Schleifenbefehl in Python Stunden mühsamer und monotoner Arbeit ersparen kann, indem er diese automatisiert.
Kennen Sie Aufgaben wie diese: Eine Datei mit neuen Leads soll für den Import vorbereitet werden. Alle Kontaktinformationen für jedes Konto wurden in derselben Zeile angeordnet. So wie in diesem Beispiel:
Um diese Kontakte in ein CRM zu importieren, musste sich jeder Kontakt in einer eigenen Zeile befinden. In dieser Zeile müssen auch die Informationen des zugehörigen Unternehmens sein:
Die Herausforderung: Oftmals sind die Dateien riesig. Sie beinhalten eine grosse Anzahl von Konten und jedes Konto hatte zahlreiche Kontaktprofile. Sehen Sie sich an, wie es aussieht, wenn wir die Anzeigengrösse der Excel-Datei auf 10 % reduzieren:
Verschieben von Zeilen und Kontakten von Hand würde sowohl bei der Ausführung als auch bei der Verarbeitung einer Datei mit Hunderten, wenn nicht Tausenden von Kontakten viel Zeit in Anspruch nehmen.
Die Lösung? Python.
Die Python-Lösung:
In Python dreht sich der Kern unseres Programms um eine Schleife, die jeden eindeutigen Stapel von Kontaktattributen identifiziert und dann die Informationen sauber herausfischt.
Als erstes laden wir die Kundendatei in einen Pandas DataFrame und fordern eine Liste mit Spaltennamen an, um später bei der Navigation und Bearbeitung der Daten zu helfen:
Als nächstes schreiben wir die Schleifenlogik:
Für diejenigen unter Ihnen, die es nicht wissen, Schleifen sind einfach Strukturen, die es erlauben, ein gewünschtes Verhalten über einen Datensatz für jeden Eintrag in diesem Datensatz genau gleich anzuwenden.
In unserem Beispiel beauftragen wir Python, die folgenden Aktionen in einer Schleife auszuführen:
- Für jede Zeile in der Datei…
- Für jeden zuvor identifizierten eindeutigen Block von Kontaktattributen …
- Solange das Feld einen Wert enthält …
- … ziehe alle Kontaktattribute und die Kontotelefonnummer (als eindeutige Kennung) und platziere sie in einem neuen Container (df2).
Nach Abschluss schließen wir die Datei ab, indem wir eine Linksverknüpfung für Telefonnummern zwischen dem neuen Container (df2) und der ursprünglichen Datei (df) durchführen und die verbleibenden Informationen anhängen.
Die endgültige Ausgabedatei sieht also so aus:
Im Vergleich zu früher, als es so aussah:
Der Unterschied besteht darin, dass jetzt alle Kontakte und ihre zugehörigen Attribute korrekt aus der Originaldatei herausgefischt wurden. Sie wurden zusammen mit allen korrekten Informationen über zugehörige Unternehmen, die der Kunde ursprünglich bereitgestellt hat, in einer eigenen eindeutigen Zeile platziert. Am wichtigsten ist, dass diese Datei jetzt in einem Format vorliegt, das unsere Systeme verwenden können.
Hurra!
Obwohl dieser Code weder spektakulär ist, noch das Problem besonders sexy oder herausfordernd war, zeigt dieses praktische Beispiel deutlich den Wert von Python für Aufgaben im B2B-Marketing und Vertrieb.
Wir haben eine monotone Aufgabe, bei der viele gleichen Aktionen immer wieder in Excel ausgeführt werden mussten, automatisiert und möglicherweise viele Arbeitsstunden eingespart. Mit etwas Übung erfordert die Erstellung des Codes nur etwa 15 Minuten. Rechnen Sie selbst aus, wie effizient Sie geworden sind!