Zum Inhalt
Fakultät Statistik
Abschlussarbeiten

am Fachgebiet "Statistical Methods for Big Data"

Zu vergebende Abschlussarbeiten

The phenomenon of double descent in the loss function has been studied and undercovered in a variety of models. However, not sufficient studies have been performed about
- double descent in L2 boosting with linear learners
- double descent in L2 boosting / xgboost  flooding
Such a thesis is apt for both Bachelor and Master students (depending on the workload). You can program in Python, but preferably R. Datasets will be provided.

Some literature you can have a look at is attached:
- https://www.pnas.org/doi/10.1073/pnas.1903070116
- https://arxiv.org/pdf/2002.08709.pdf

Laufende Abschlussarbeiten

  • Ina-Marie Berendes (2023): A Comparison of Machine Learning Algorithms for Injury Prediction in Soccer (MA)
  • Muhammad Moaz Khan (2023): Predicting Invoice Default with Statistical Learning: A Comparative Analysis of Baseline vs. Aggregated Transactional Data Approach (MA)
  • Sarrah Awad Abdalla Alawad (2023): Modelling Techniques for Predicting Claim Amount in Vehicle Insurance Data: A Comparative Analysis of Supervised Learning Models and Clustering Techniques for Car Vehicle Groups (MA)
  • Alexander Bloch (2023): Statistische Analyse von Dribblings im Profifußball mit Fokus auf deren Innovation (BA)

Abgeschlossene Abschlussarbeiten

  • Moana Emde (2023): Statistische Modellierung und Vorhersage von Bundesligadaten im Fußball mittels generalisierten additiven Modellen (BA)
  • Aishwarya Ganta (2023): Learning from Implications - A comparison of different classification strategies (MA)
  • Tim Schmale (2023): An Introduction to Mixed Models and a Longitudinal Application on Cognitive Decline during Parkinson's Disease (BA)
  • Neele Malin Hormann (2023): Statistische Modellierung und Vorhersage der FIFA WM 2022 mittels Random Forest (BA)
  • Rik Amann (2022): Statistische Modellierung und Vorhersage von Mehrkampf-Leistungsdaten in der Leichtathletik auf Basis von generalisierten additiven Modellen (BA)
  • Jordi Walder (2022): Customer Churn Prediction in ERP Software Provider (BA)
  • Max Ullmann (2022): Pech oder Konsequenz? Statistische Modellierung der Verletzungsfehltage des BVB im Bundesligavergleich (BA)
  • Jan Lennartz (2022): Road Slope Estimation: A Machine Learning Aided Signal Correction Approach (MA)
  • Dominik Niedziela (2022): Evaluierung verschiedener Methoden zur Überwachung von chemischen Batchprozessen (BA)
  • Leon-Patrick Heuer (2022): Ist Startup-Erfolg modellier- und vorhersagbar? - Ein Vergleich von Logistischer Regression und Random Forest (BA)
  • Tim Westphal (2022): Eine statistische Analyse von Einflussfaktoren für den Ausgang des Eurovision Song Contests auf Grundlage des Zeitraums 2014 bis 2019 (BA)
  • Susanne Stock (2022): Zeitvariierende Effekte in generalisierten additiven Modellen am Beispiel von Vornamen in den USA zwischen 1880 und 2020 (BA)
  • Marie Punsmann (2022): Kundenschreiben in der Lebensversicherung - eine Analyse mit Methoden aus der Textdatenanalyse und Klassifikation (MA)
  • Stella Mathilda Ebbrecht (2022): Ein Plädoyer für Post- und Relaxed-LASSO Regularisierungen anhand einer Simulationsstudie (BA)
  • Jonas Glowinski (2022): Explainable Anomaly Detection in Property Insurance Claims Data (MA)
  • Franziska Popp (2021): Modellierung und Vorhersage der UEFA EURO 2020 mittels Verfahren des statistischen Lernens (MA)
  • Philipp Hülk (2021): Modellierung nicht-linearer Einflüsse mittels additiver Regression: Eine Analyse realer E-Scooter-Mobilitätsdaten (BA)
  • Jonas Heiner (2021): A statistical analysis of Bundesliga match event data (MA)
  • Jannes Rick (2021): Eine statistische Analyse der Auswirkungen der Covid19-Pandemie auf die sportliche Aktivität von Studierenden (BA)
  • Joshua Oehmen (2021): Anwendung statistischer Modelle zur Prognose von Headisergebnissen (BA)
  • Philip Buczak (2021): Einsatz sequentieller Verfahren im Hyperparameter-Tuning (MA)
  • Tim Grabo (2021): Modellselektion für die nicht-lineare Modellierung des Einflusses von Luftschadstoffen, Temperatur und deren Interaktion auf Lungenfunktionsparameter in der SALIA-Studie (BA)
  • Faysal Ntafh (2021): Erkennung von Anomalien in den Daten aus dem Beherbergungsgewerbe mit Hilfe von KI Methoden (MA)
  • Patrick Lorenz (2020): Modellierung von Strafyards im American Football im Rahmen von generalisierten linearen gemischten Modellen (BA)
  • Cartsen Wasserfuhr (2021): Analyse des Stornoverhaltens von Lebensversicherungsverträgen mit Hilfe verschiedener statistischer Modelle und Lernverfahren (MA)
  • Lars Lobers (2021): Modellierung von 100 Meter Sprintzeiten mithilfe von Generalisierten Additiven Gemischten Modellen (MA)
  • Tom Pflugbeil (2021): Regularisierungsverfahren zur Modellierung der deutschen Baseball-Bundesliga (BA)
  • Lionel Fotie (2020): Kategorisierung von Domänen mittels Clusterverfahren (BA)
  • Sven Teschke (2020): A Statistical Analysis of the Klopp-Effect (MA)
  • Ilona Maske (2020): Ein Vergleich herkömmlicher Regressionsverfahren mit modernen Machine Learning Techniken für binäre Zielvariablen in komplexen Datensituationen (MA)
  • Philip Buczak (2020): Einsatz sequenzieller Verfahren im Hyperparameter-Tuning (MA)
  • Eugene Edmond Nantchouang Tefong (2020): Eine Analyse der Post-LASSO Technik im Linearen Modell (BA)
  • Niklas Dombrink (2020): Untersuchung der Einflussfaktoren auf die Passgenauigkeit im professionellen Fußball mittels eines Generalisierten Additiven Gemischten Modells (MA)
  • Marc Schmieder (2020): Multilabel-Klassifizierung von Nachrichten Schlagzeilen. Vergleich zwischen neurolanen Netzen und baumbasierten Algorithmen auf verschiedenen Repräsentationen von Wörtern (MA)
  • Thi Ngoc Tien Tran (2020): Untersuchung von Random Forests bzgl. Overfitting (MA)
  • Jan Lennartz (2019): Ein Vergleich von verschiedenen Vorhersagemodellen im internationalen Tischtennis (BA)
  • Philipp Steinhauer (2019): Vergleich von Clusterverfahren auf Basis von Handball-Bundesliga Daten (BA)
  • Sujin Park (2019): Implementierung eines Kreuzvalidierungsverfahrens für die Funktion glmmLasso aus dem gleichnamigen R-Paket (BA)
  • Jonas Heiner (2019): Prediction of Handball World Cup results (BA)
  • Jacob Grytzka (2019): Vergleich verschiedener Optimierungsverfahren in generalisierten linearen Modellen (BA)
  • Philip Buczak (2019): Modellierung und Vorhersage von Fußballbundesligaspielen mittels Random Forest (BA)
  • Susanne Brunner (2019): Modellierung und Vorhersage von Tennisspielen bei Grand Slam Turnieren (BA)
  • Sheila Görz (2018): Vergleich verschiedener Verfahren zur Bestimmung des Glättungsparameters in Generalisierten Additiven Modellen (BA)
  • Maxime Faymonville (2018): Statistische Modellierung des Elfmeterschießens anhand des DFB-Pokals (BA)
  • Steffen Maletz (2018): Wahl von Knoten und Basisfunktionen in Generalisierten Additiven Modellen (BA)