Achtung:

Sie haben Javascript deaktiviert!
Sie haben versucht eine Funktion zu nutzen, die nur mit Javascript möglich ist. Um sämtliche Funktionalitäten unserer Internetseite zu nutzen, aktivieren Sie bitte Javascript in Ihrem Browser.

Show image information
|

Matthew Caron für herausragende Masterarbeit ausgezeichnet

Für seine Masterarbeit mit dem Titel „Identifying and Classifying Toxic Comments on Web 2.0 Platforms“ erhielt Matthew Caron am 20. Januar auf dem Neujahrsempfang der Universität Paderborn den Preis der Universitätsgesellschaft für herausragende Abschlussarbeiten aus dem Jahr 2017/2018.

In seiner englischsprachigen Arbeit verfolgte Caron das Ziel, anstößige und hasserfüllte Kommentare im deutschen Web 2.0 mithilfe moderner Methoden des maschinellen Lernens, insbesondere des Deep Learnings, zu identifizieren und zu klassifizieren.

Caron: „In meiner Arbeit wollte ich die für die deutsche Sprache und das vorliegende Problem optimale Methode identifizieren und auch optimieren.“

Mit seinen Forschungsschwerpunkten beschäftigte er sich insbesondere mit der Erstellung eines eigenen Datensatzes sowie mit der Analyse unterschiedlicher künstlicher neuronaler Netzarchitekturen, unter anderem Convolutional Neural Networks (CNN). Um einen Datensatz zu generieren, der für das heutige Social-Media-Ökosystem repräsentativ ist, hat Caron ca. 50.000 Dokumente aus verschiedenen Plattformen extrahiert, aufbereitet und annotiert. Diese Sammlung stellte zum Zeitpunkt der Abgabe den größten deutschen Datensatz dar.

Basierend auf diesem umfassenden Datensatz hat Caron durch Training und Evaluation von Deep Learning-Modellen auf Zeichen- und Wortebene bewiesen, dass moderne Convolutional Neural Network-Architekturen eine sehr hohe Klassifikationsleistung für benutzergenerierte Inhalte in deutscher Sprache erbringen können. Weitere Ergebnisse seiner Arbeit sind, dass künstliche neuronale Netze eine höhere Genauigkeit gegenüber klassischen Ansätzen des maschinellen Lernens bieten können.

Caron: „Die Ergebnisse meiner Forschungsarbeit haben gezeigt, dass ein Klassifikationsansatz auf Zeichenebene in Kombination mit dem richtigen CNN-Algorithmus uns ermöglicht, anstößige und hasserfüllte Dokumente präzise zu erkennen und zu klassifizieren. Damit wurde auch bewiesen, dass Plattformbetreiber dieses hoch aktuelle gesellschaftliche Problem mit modernen KI-Verfahren lösen können.“

Link zur Pressemitteilung der Universität Paderborn vom 21.01.2019:
https://www.uni-paderborn.de/nachricht/88993/

Contact

Matthew Caron

Matthew Caron, M.Sc.

Wirtschaftsinformatik, insb. Data Analytics

To contact page

The University for the Information Society