Data Science I - Algorithmen und Prozesse
Teaching Staff: Steffen Herbold, Alexander Trautsch
Type:
Lecture
[Only provided in German, because the lecture will be German]
Daten, Module, etc.
- Vorlesung: Dienstags, 10:15-11:45 Uhr, Online, BBB über StudIP
- Übung: Freitags, 10:15-11:45 Uhr, Online, BBB über StudIP
- Prüfungstermin: folgt
- Modul: B.Inf.1131: Data Science I: Algorithmen und Prozesse
Registrierung
Informationen zur Anmeldung werden in der ersten Vorlesung am 3.11.2020 gegeben.
Beschreibung
In dieser Vorlesung werden die Grundlagen für Date Science Projekte
vermittelt. Hierzu werden zuerste grundsätzliche Begriffe wie Data
Science, Big Data und Business Inteligence eingeführt. Anschließend wird
der allgemeine Prozess, nach dem Data Science Projekte ablaufen,
vorgestellt. Der Hauptteil der Vorlesung behandelt einen Überblick über
Verfahren zur Datenanalyse, unter anderem:
- Assozationsanalyse (Apriori Algorithmus)
- Clustering (k-means, EM, DBSCAN, SLINK)
- Klassifikation
(k-nearest Neighbor, Decision Tree, Random Forest, Logistic Regression,
Naive Bayes, Support Vector Machines, Neural Networks) - Regression (Linear Regression, RIDGE, LASSO)
- Zeitserienanalyse (ARIMA)
- Text Mining (Bag of Words, Stemming/Lemmatization, TF-IDF)
In der Übung zur Vorlesung werden die Projekte mit Hilfe von Jupyter Notebooks und der Programmiersprache Python angewandt.
Materialen
Die Materialien für diesen Kurs werden via Stud.IP zur Verfügung gestellt.
2024 © Software Engineering For Distributed Systems Group