In dieser Blogreihe berichten Expert:innen über Lösungsansätze zu methodischen Herausforderungen, die bei der Analyse von Online-Stellenanzeigen (OJA – Online Job Advertisement) entstehen können. Die Vortragsvideos stammen vom OJV Forum, welches vom Bundesinstitut für Berufsbildung und der Bertelsmann Stiftung im November 2021 ausgerichtet wurde. Das Forum hat zum Ziel, Expert:innen für die Analyse von OJA miteinander zu vernetzen, über methodische Herausforderungen zu diskutieren und sich gegenseitig auf den aktuellen Forschungsstand zu bringen. Darüber hinaus soll es dazu beitragen, das Potential der OJA-Analyse weiter auszuschöpfen und den Weg für weitere Studienideen und Kooperationen zu bereiten.
Video: Machine Learning für die Extraktion von Berufen, Handlungsfeldern und Kompetenzen aus deutschen Online-Stellenausschreibungen
Welche Berufe werden im Wirtschaftszweig Luftfahrt gesucht? Werden im Hochbau noch die gleichen Kompetenzen gesucht wie vor fünf Jahren? Mit der Analyse von Online-Stellenanzeigen können ganz unterschiedliche Fragestellungen beantwortet werden.
Um das zu ermöglichen, müssen verschiedene Konzepte wie Berufe, berufsspezifische Kompetenzen, Handlungsfelder oder transversale Kompetenzen (Grundkompetenzen/Softskills) aus den Stellenanzeigen gefiltert bzw. extrahiert werden. Wie das funktioniert, zeigt Johannes Müller vom Unternehmen cause&effect im Video. Benötigt werden neben einer großen Anzahl an Online-Stellenanzeigen, Know-How im Machine Learning und einheitliche Klassifikationsschemata, auch Taxonomien genannt. Bei der Extraktionen werden je nach gesuchtem Konzept unterschiedliche Schritte angewendet. Dazu gehören die Identifikation der passenden Textstelle, die Generierung möglicher Kandidaten von beispielsweise Berufsbezeichnungen, die Disambiguation – also die Reduzierung der möglichen Kandidaten. Für die Generierung von Trainingsdaten für die Algorithmen ist unter Umständen eine manuelle Annotation von Dokumenten notwendig. Unter der Annotation ist dabei die Kodierung von Wortsequenzen im Anzeigentext und Einordnung in die passende Klasse der Taxonomie zu verstehen. Bei der Umsetzung der Schritte werden verschiedene Verfahren des Machine Learning, wie Named Entity Recognition, Ruled-based Matching oder das Entity Linking Verfahren angewendet. Zum Schluss seines Vortrages zeigt Herr Müller noch Herausforderungen, aber auch Chancen der Extraktion auf.
Weitere Beiträge aus der Reihe „Gewusst wie: Analyse von Online-Stellenanzeigen“:
Gewusst wie: Analyse von Online-Stellenanzeigen (1/11) – Aufbereitung eines Datenschatzes
Gewusst wie: Analyse von Online-Stellenanzeigen (2/11) – Erkennung von Dubletten
Gewusst wie: Analyse von Online-Stellenanzeigen (3/11) – Sicherung der Qualität
Gewusst wie: Analyse von Online-Stellenanzeigen (4/11) – Wie repräsentativ sind die Daten?
Gewusst wie: Analyse von Online-Stellenanzeigen (5/11) – Evaluation
Gewusst wie: Analyse von Online-Stellenanzeigen (6/11) – Aufdecken von versteckten Informationen
Gewusst wie: Analyse von Online-Stellenanzeigen (7/11) – Mit Machine Learning zur Antwort
Gewusst wie: Analyse von Online-Stellenanzeigen (8/11) – Zuordnung von Berufe
Gewusst wie: Analyse von Online-Stellenanzeigen (9/11) – Gewinnung von Taxonomien
Gewusst wie: Analyse von Online-Stellenanzeigen (11/11) – Werben mit Nachhaltigkeit in Azubistellen
Kommentar schreiben