Big Data: Covid-19 Epidemie mit Orange

Orange (Offizielle Webseite) ist ein Open-Source-Toolkit für Datenvisualisierung, maschinelles Lernen und Data Mining. Es verfügt über ein visuelles Programmier-Frontend für die explorative Datenanalyse und interaktive Datenvisualisierung.Es ist ein komponentenbasiertes Softwareprogramm. Orange Komponenten werden als Widgets bezeichnet und reichen von einfacher Datenvisualisierung, Auswahl von Teilmengen und Vorverarbeitung bis hin zur empirischen Bewertung von Lernalgorithmen und zur prädiktiven Modellierung.Die visuelle Programmierung wird über eine Schnittstelle implementiert, in der Workflows durch Verknüpfen vordefinierter oder benutzerdefinierter Widgets erstellt werden. Fortgeschrittene Benutzer können Orange als Python-Bibliothek für die Datenmanipulation und Widgetänderung verwenden (Quelle: Wikipedia - englisch, eigene Übersetzung).

Material für die Analyse der Covid-19 Daten

  • Orange Downloadbereich
  • Im Blog (englisch, Teil 1) wird das Verfahren aus dem Video (s.u.) in schriftlicher Form vorgestellt
  • Explore the Covid-19 Data with Orange (Video bei youtube - Englisch). Unter dem Video stehen weitere Informationen. Das erste in der Reihe von mehreren Videos, in denen die Orange Datenanalyse für Covid-19-Daten erklärt wird.
  • Data Set der Covid-19-Daten freundlicherweise zur Verfügung gestellt von der John Hopkins University. 
  • CSV-Daten von Covid-19 zum Einfügen als Datenlink in Orange.