Workshop: Swantje Westphal (IDS Mannheim): Erste Schritte einer Normalisierung, Lemmatisierung und eines POS-Taggings für ein Korpus historischer Lexikonartikel von Berufsbezeichnungen

Erster Workshop, Ort und Termin: 23. Oktober 2017, SR. 15, Emil-Abderhalden-Str. 25, 06108 Halle

Die Darstellung der Datenaufbereitung im Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) soll Einblicke in Verfahren der orthographischen Normalisierung, der Lemmatisierung und in das POS-Tagging von nicht-standardsprachlichen Daten ermöglichen. Anhand dieser Einblicke sollen die Möglichkeiten solcher sprachtechnologischen Verfahren für die Anwendung auf historische Korpora diskutiert werden. An einem Datenbeispiel sollen praktisch erste Schritte einer Normalisierung, Lemmatisierung und eines POS-Taggings für ein Korpus historischer Lexikonartikel von Berufsbezeichnungen aufgezeigt werden. Schritt für Schritt werden die Teilnehmer mit verschiedenen Tools (Weblicht, FOLKER, OrthoNormal) zur automatisierten Annotation von Korpora vertraut gemacht und die Ergebnisse der automatisierten Annotation in Hinblick auf Ihre Verwendbarkeit für den Aufbau einer Ontologie von Berufsbezeichnungen analysiert. Abschließend sollen Möglichkeiten zur Verbesserung der automatisierten Annotation des Korpus historischer Lexikonartikel von Berufsbezeichnungen aufgezeigt und diskutiert werden.

Über Katrin Moeller

Als wissenschaftliche Mitarbeiterin und Leiterin des Historischen Datenzentrums Sachsen-Anhalt bin ich an der Professur für Wirtschafts- und Sozialgeschichte am Insititut für Geschichte der Martin-Luther-Universität Halle-Wittenberg tätig. Nicht nur im Rahmen meiner wissenschaftlichen Tätigkeit sondern auch in Lehrveranstaltungen gibt es so viele Berührungspunkte rund um das Thema "Digital Humanities, Methoden in der Geschichtswissenschaften und Forschungsdatenmanagement". Mit Leidenschaft bin und bleibe ich aber vor allem Historikerin der Frühen Neuzeit!

35 Replies to “Workshop: Swantje Westphal (IDS Mannheim): Erste Schritte einer Normalisierung, Lemmatisierung und eines POS-Taggings für ein Korpus historischer Lexikonartikel von Berufsbezeichnungen”

  1. I did so many searches on this topic. As a result, this article is one of the top three articles I want to recommend to people. I have been in this field for years, so I know how accurate this article contains. If you are curious about the contents, please visit my blog anytime. 메이저토토Check out this

  2. Most people, including me, agree with you, but you shouldn’t forget that people who don’t. We need to persuade them. For a better world! I want to collaborate with you to overcome these hardships. Please come to my blog below and contact me.

  3. I read your article in an instant. You have no idea how hard I’ve been trying to find a good article on this topic for a week. I think that’s why your writing shines more. Thank you so much for sharing good information. I’ll look for more of your posts. And I think my writing on the topic you wrote will help you. I hope you come to my blog and read it. 메이저토토사이트

Schreibe einen Kommentar