Die alte Instagram-API (Public API), die bis zu ihrer Einschränkung im Jahr 2018 umfassenden Zugriff auf öffentliche Daten ermöglichte, war ein mächtiges Werkzeug für Marktforschung. Besonders für spezifische Fragestellungen, wie den Vergleich von Schuhmarken in einer dynamischen Metropole wie Hongkong, bot sie vielfältige Möglichkeiten. In diesem Blogbeitrag zeige ich, wie man mit dieser API eine fundierte Analyse durchführen konnte – mit Fokus auf Locations in Hongkong, einem Abgleich der Postings von zwei Schuhmarken (nennen wir sie Schuhmarke 1 und Schuhmarke 2), sowie der Rolle von Influencern, deren „Bubbles“, der Verteilung über Locations und Events. Abschließend integrieren wir KNIME für die Visualisierung und einen Hauch von KI, um die Ergebnisse zu optimieren.
Schritt 1: Datensammlung mit der alten Instagram-API
Die Public API erlaubte es Entwicklern, Daten wie Postings, Hashtags, Location-Tags und Nutzerinformationen abzufragen – natürlich nur öffentlich zugängliche Inhalte. Für unsere Marktforschung in Hongkong konnte man folgende Endpoints nutzen:
- Location-Endpunkt: Mit GET /locations/search (Dokumentation, archiviert) konnte man nach Instagram-Locations in Hongkong suchen, z. B. durch Eingabe von Geokoordinaten (z. B. 22.3193° N, 114.1694° E für das Zentrum). Das lieferte eine Liste von Location-IDs für beliebte Orte wie Causeway Bay, Mong Kok oder Tsim Sha Tsui.
- Media-Endpunkt: Mit GET /locations/{location-id}/media/recent (Dokumentation, archiviert) konnte man die neuesten Posts für jede Location abrufen. Hier filterte man nach Hashtags wie #Schuhmarke1 und #Schuhmarke2, um relevante Inhalte zu finden.
- Hashtag-Endpunkt: GET /tags/{tag-name}/media/recent (Dokumentation, archiviert) lieferte alle Posts mit #Schuhmarke1HK oder #Schuhmarke2Hongkong, um Markenpräsenz unabhängig von Locations zu analysieren.
Durch diese Abfragen konnte man eine Datenbasis schaffen, die Postings, Zeitstempel, Nutzer und Location-Tags umfasste. Wichtig: Die API hatte Limits (z. B. 5.000 Aufrufe pro Stunde), was eine schrittweise Datensammlung mit Rate-Limiting erforderlich machte. Tools wie Postman (Postman) konnte man hierfür verwenden, um API-Calls zu testen und zu optimieren.
Schritt 2: Abgleich von Schuhmarke 1 und Schuhmarke 2
Mit den gesammelten Daten konnte man Schuhmarke 1 (z. B. eine lokale Marke) und Schuhmarke 2 (z. B. eine internationale Luxusmarke) vergleichen:
- Postings-Volumen: Wie viele Posts gab es pro Marke in Hongkong? Ein einfacher Zählmechanismus zeigte, welche Marke mehr Aufmerksamkeit erhielt.
- Engagement: Likes, Kommentare und Shares pro Post konnte man mit GET /media/{media-id} (Dokumentation, archiviert) abrufen. Das gab Hinweise darauf, welche Marke emotional stärker ansprach.
- Inhaltliche Analyse: Durch Textanalyse der Captions mit Python-Bibliotheken wie NLTK (NLTK) konnte man Themen wie „Qualität“, „Preis“ oder „Style“ identifizieren, die mit jeder Marke assoziiert wurden.
Schritt 3: Influencer und ihre „Bubbles“
Influencer spielten eine Schlüsselrolle in der Markenwahrnehmung. Mit der alten API konnte man:
- Influencer identifizieren: Über GET /users/search (Dokumentation, archiviert) konnte man Accounts mit hoher Follower-Zahl finden, die #Schuhmarke1 oder #Schuhmarke2 nutzten. Ein Schwellenwert (z. B. >10.000 Follower) definierte „Influencer“.
- Bubbles analysieren: Die „Bubble“ eines Influencers – also dessen Community – zeigte sich in den Kommentaren und getaggten Nutzern. Mit GET /media/{media-id}/comments (Dokumentation, archiviert) konnte man diese Interaktionen abrufen und Netzwerke mit Tools wie NetworkX (NetworkX) kartieren, z. B. ob sich die Bubbles der Marken überschnitten oder getrennt waren (lokale vs. globale Zielgruppen).
Schritt 4: Verteilung über Locations und Events
Hongkong ist eine Stadt der Vielfalt – von Einkaufsmeilen bis zu Pop-up-Events. Die API-Daten konnten zeigen:
- Location-Verteilung: Welche Stadtteile (z. B. Central vs. Kowloon) waren Hotspots für Schuhmarke 1 oder 2? Eine Heatmap konnte dies verdeutlichen.
- Events erkennen: Posts mit Hashtags wie #HKFashionWeek oder #Schuhmarke1Launch konnten auf Events hinweisen. Zeitliche Peaks im Posting-Volumen (via Zeitstempel-Analyse mit Pandas, Pandas) zeigten, wann und wo diese stattfanden.
Schritt 5: Visualisierung mit KNIME
KNIME, ein Open-Source-Tool für Datenanalyse (KNIME), eignete sich perfekt zur Visualisierung der Ergebnisse:
- Datenimport: Die API-Daten (z. B. als CSV exportiert) wurden mit dem „CSV Reader“-Node (Dokumentation) geladen.
- Verarbeitung: Mit dem „GroupBy“-Node (Dokumentation) konnte man Postings pro Location oder Marke aggregieren. Der „Joiner“-Node (Dokumentation) verband Influencer-Daten mit deren Postings.
- Visualisierung:
- Eine Heatmap wurde mit dem „Heatmap“-Node (Dokumentation) erstellt, um die Verteilung über Hongkong-Locations zu zeigen.
- Ein Balkendiagramm nutzte den „Bar Chart“-Node (Dokumentation), um das Engagement von Schuhmarke 1 und 2 zu vergleichen.
- Ein Netzwerkdiagramm wurde mit dem „Network Graph“-Node (Dokumentation) visualisiert, um Influencer-Bubbles darzustellen.
Schritt 6: KI für tiefere Einblicke
Ein Schuss KI konnte die Analyse verfeinern:
- Sentiment-Analyse: Mit einem Modell wie VADER (via KNIME’s „Python Script“-Node, Dokumentation) konnte man die Stimmung in Captions und Kommentaren bewerten – war Schuhmarke 1 „cool“ und Schuhmarke 2 „teuer“?
- Cluster-Analyse: Der „K-Means“-Node (Dokumentation) konnte Nutzergruppen basierend auf Posting-Verhalten oder Location-Präferenzen identifizieren, z. B. „Trendsetter in Causeway Bay“ vs. „Kaufkräftige in Central“.
Fazit
Die alte Instagram-API war ein Schatz für Marktforschung – flexibel, datenreich und kostenlos. Für unseren Fall in Hongkong konnte man Schuhmarke 1 und 2 hinsichtlich Präsenz, Engagement und Zielgruppen vergleichen, Influencer-Netzwerke aufdecken und Location-Trends erkennen. Mit KNIME als Visualisierungstool und KI zur Analyse wurde aus rohen Daten eine Geschichte: Welche Marke dominierte wo, wer beeinflusste wen, und welche Events trieben den Hype? Auch wenn die Public API heute eingeschränkt ist, zeigt dieser Ansatz, wie kreativ man mit solchen Tools arbeiten konnte – und inspiriert vielleicht für aktuelle Alternativen wie die Instagram Graph API (Graph API).
Hintergrund des Projekts
Dies war ein Marktforschungsprojekt für eine bekannte deutsche Schuhmarke in Zusammenarbeit mit einer renommierten Unternehmensberatungsgesellschaft. Die technische Umsetzung umfasste nicht nur die API-Integration, sondern auch die Entwicklung eines skalierbaren ETL-Prozesses (Extract, Transform, Load) mit Python und KNIME, um Datenflüsse zu automatisieren und Echtzeit-Analysen zu ermöglichen. Die Kombination aus datengetriebener Analyse und strategischer Beratung lieferte der Marke actionable Insights für ihre Expansionspläne in Asien.
Schreibe einen Kommentar