Die Übersetzung von Dokumenten ist in einer globalisierten Welt unverzichtbar – sei es für geschäftliche Korrespondenz, akademische Arbeiten oder persönliche Projekte. Während Online-Tools wie DeepL oder Google Translate weit verbreitet sind, haben sie einen Nachteil: Sie erfordern eine Internetverbindung und senden deine Daten an externe Server. Für sensible Inhalte ist das ein Risiko. Hier kommt…
In einer Zeit, in der digitale Kommunikation keine Sprachgrenzen mehr kennt, sind Übersetzungswerkzeuge essenziell. Doch viele Online-Dienste wie Google Translate oder DeepL werfen Fragen zum Datenschutz auf – insbesondere bei sensiblen Daten. Argos Translate bietet eine Alternative: eine Open-Source-Übersetzungssoftware, die offline auf deinem Windows-PC läuft. In diesem extrem detaillierten Blogbeitrag erkläre ich dir die Installation…
Dieses Tool scrapet RSS-Feeds, analysiert Artikelinhalte mit maschinellem Lernen und speichert die Ergebnisse in einer SQLite-Datenbank – mit Fokus auf Nachrichtenqualität, politische Einordnung, logische Konsistenz und inhaltliche Tiefe. Ergänzt wird es durch eine erweiterte grafische Benutzeroberfläche (GUI), die nicht nur die Datenbankauswertung ermöglicht, sondern auch aggregierte Analysen ausgewählter Artikel bietet. In diesem Beitrag erkläre ich…
In diesem Blogbeitrag stelle ich euch ein Python-Skript vor, das automatisch Fragen aus einem PDF-Dokument generiert. Es nutzt moderne NLP-Technologien wie spaCy, T5 von Hugging Face und Argos Translate, um Texte zu analysieren, Fragen zu erstellen und diese ins Deutsche zu übersetzen. Ob für Bildungszwecke, Content-Erstellung oder Forschung – dieses Tool bietet spannende Einsatzmöglichkeiten. Ich…
Dieses Tool nutzt moderne NLP-Technologien (Natural Language Processing) und eine benutzerfreundliche GUI basierend auf PyQt6. In diesem Blogbeitrag stelle ich Ihnen den Code vor, erkläre die Installation und zeige Ihnen, wie Sie das Tool in der Praxis einsetzen können. Was macht der Frage-Antwort-Extraktor? Der Frage-Antwort-Extraktor ist ein Python-Programm, das: Dieses Tool eignet sich perfekt für…
Influencermarketing ist seit Jahren ein heiß diskutiertes Thema – ein vermeintlicher Gamechanger im Marketingmix. Doch wie viel Substanz steckt wirklich dahinter? Inspiriert von einigen Diskussionen habe ich vor einiger Zeit die InstaLOC2.0-Datenbanken befragt, eine umfangreiche Sammlung von Instagram-Daten, die im Rahmen eines Beratungsprojekts für eine bekannte deutsche Sportartikelmarke entwickelt wurde. Dieser Artikel basiert auf einer…
In der heutigen digitalen Welt sind wir oft mit einer Flut von Dokumenten konfrontiert – sei es für die Arbeit, das Studium oder private Projekte. Aber wie behält man den Überblick über Metadaten, Inhalte und Strukturen dieser Dateien? Hier kommt der Document Folder Analyzer ins Spiel – ein Python-Tool mit einer modernen PyQt6-GUI, das Ordner…
Instagram war vor der Einschränkung seiner Public API im Jahr 2018 ein Datenparadies: Über 4 Millionen Locations weltweit konnten über die alte Instagram Public API (Archivierte Dokumentation) überwacht werden, um Postings zu Themen wie COVID-19 und Fridays for Future zu analysieren. In meinen 8 Projekten zwischen 2016 und 2020 habe ich diese Möglichkeiten genutzt, um…
Twitter (heute X) ist ein Mikrokosmos der digitalen Welt – ein Raum, in dem Ideen, Emotionen und Manipulationen aufeinandertreffen. Bots, Hassrede und Fake-Netzwerke stellen eine wachsende Bedrohung für die Integrität dieses Ökosystems dar, indem sie Desinformation verbreiten, Polarisierung schüren und öffentliche Diskurse beeinflussen. Bis Mitte 2023 bot `snscrape` eine leistungsstarke Methode, um Twitter-Daten ohne die…
Die Luftfahrtindustrie ist ein Paradebeispiel für Big Data: Millionen von Flugzeugpositionen, Flughöhen, Geschwindigkeiten, Fluglinieninformationen und Flughafendaten werden täglich generiert. Die Flightradar24-API ermöglicht den Zugriff auf diese Informationen in Echtzeit und historisch, doch die Verarbeitung von etwa 500.000 Datensätzen pro Fluglinie stellt eine Herausforderung dar – sowohl technisch als auch analytisch. Hier setzt KNIME (Konstanz Information…