Digital Humanities selbst gestrickt – Braucht Geschichtswissenschaft eine neue Methodenrevolution?

Methoden auf der Testbank. Drei Zugänge im Vergleich

Veröffentlicht am 9. März 2018 von Katrin Moeller — 29 Kommentare ↓

Ausschreibung des zweiten Workshops im Rahmen der Reihe „Digitale Lehrmethoden und digitale Methoden in der Geschichtswissenschaft: Neue Ansätze für die Lehre“ der AG Digitale Geschichtswissenschaft im VHD: Methoden auf der Testbank. Drei Zugänge zur Hexenforschung im Vergleich Ein Workshop von weiterlesen Methoden auf der Testbank. Drei Zugänge im Vergleich→

Ocropus-Infrastruktur: Ordnersystem und Stapelverarbeitung

Veröffentlicht am 5. März 2018 von — 20 Kommentare ↓

Im Normalfall möchte man mehrere Bildseiten erkennen. Für die Stapelverarbeitung ist es von Vorteil eine gewisse Infrastruktur einzurichten, damit möglichst viele Schritte automatisch abgearbeitet werden können. Am Beginn steht eine gleichbleibende Ordnerstruktur, durch die man sich leicht bewegen kann. Manche weiterlesen Ocropus-Infrastruktur: Ordnersystem und Stapelverarbeitung→

TRACER – Text Reuse Detection Machine

Veröffentlicht am 11. Dezember 2017 von — 23 Kommentare ↓

„Texte sind ein Mosaik aus Zitaten – sie bauen aufeinander auf und beziehen sich aufeinander.“ (Marco Büchler) Die freie Software TRACER ist ein Ergebnis des BMBF-geförderten eTrap-Projekts zur Erkennung von Text Reuse. Es handelt sich dabei um ein flexibel einsetzbares weiterlesen TRACER – Text Reuse Detection Machine→

Coffee Talks: Marco Büchler – Detection of Historical Text Reuse

Veröffentlicht am 1. Dezember 2017 von — 31 Kommentare ↓

Coffee Talks, Ort und Termin: 07. Dezember 2017, 18-20 Uhr, Veranstaltungsraum 311, August-Bebel-Straße 13, 06108 Halle (Saale) Der Vortrag führt in das automatisierte Erkennen von Historical Text Reuse in Form von Zitaten, Paraphrasen oder Allusionen ein. Es werden technische Möglichkeiten weiterlesen Coffee Talks: Marco Büchler – Detection of Historical Text Reuse→

Preprocessing mit Scantailor

Veröffentlicht am 24. November 2017 von — 23 Kommentare ↓

Im Folgenden Artikel erkläre ich die Vorbereitung (Preprocessing) eines PDF-Dokuments für die Texterkennung mit OCRopus. Dabei behandle ich die Konvertierung in die benötigten Formate (pdf2tif, tif2png) und die Bearbeitung mit der Software Scantailor. Das Ziel ist von den unbearbeiteten PDFs weiterlesen Preprocessing mit Scantailor→

Die Bedeutung des Preprocessing

Veröffentlicht am 23. November 2017 von — 27 Kommentare ↓

Einer der bedeutendsten Schritte bei der Texterkennung ist die Vorbereitung des Materials, das sogenannte Preprocessing. Ziel des Preprocessing ist es, möglichst viele Hürden für die Texterkennung zu entfernen. Die Texterkennung von unbereinigten Bilden liefert häufig schlechte Erkennungsraten aufgrund von kontrastarmen weiterlesen Die Bedeutung des Preprocessing→

Textkorpora durch Distant Reading analysieren mit Voyant Tools

Veröffentlicht am 13. November 2017 von — 21 Kommentare ↓

Voyant Tools ist ein von Stefan Sinclair und Geoffrey Rockwell an der University of Alberta entwickeltes freies Webtool zum Distant Reading. Es wurde speziell für die (sehr unterschiedlichen) Belange der Digital Humanities entwickelt und enthält zum Testen zwei Sammlungen: Die weiterlesen Textkorpora durch Distant Reading analysieren mit Voyant Tools→

Coffee Talks: Sabine Beckmann und Susanne Kretzer (Uni Bremen): Arbeit mit anonymisierten Interviewdaten/ Qualitative Data Archiving

Veröffentlicht am 9. November 2017 von — 47 Kommentare ↓

Coffee Talks, Ort und Termin: 16. November 2017, 18-20 Uhr, Veranstaltungsraum 311, August-Bebel-Straße 13, 06108 Halle (Saale) Während es in der quantitativen Sozialforschung eine schon länger währende Tradition der Sekundärnutzung von Forschungsdaten gibt, bleibt die Auseinandersetzung mit den Ergebnis-sen qualitativer weiterlesen Coffee Talks: Sabine Beckmann und Susanne Kretzer (Uni Bremen): Arbeit mit anonymisierten Interviewdaten/ Qualitative Data Archiving→

Workshop: Swantje Westphal (IDS Mannheim): Erste Schritte einer Normalisierung, Lemmatisierung und eines POS-Taggings für ein Korpus historischer Lexikonartikel von Berufsbezeichnungen

Veröffentlicht am 17. Oktober 2017 von Katrin Moeller — 35 Kommentare ↓

Erster Workshop, Ort und Termin: 23. Oktober 2017, SR. 15, Emil-Abderhalden-Str. 25, 06108 Halle Die Darstellung der Datenaufbereitung im Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK) soll Einblicke in Verfahren der orthographischen Normalisierung, der Lemmatisierung und in das POS-Tagging von nicht-standardsprachlichen weiterlesen Workshop: Swantje Westphal (IDS Mannheim): Erste Schritte einer Normalisierung, Lemmatisierung und eines POS-Taggings für ein Korpus historischer Lexikonartikel von Berufsbezeichnungen→

VirtualBox einrichten

Veröffentlicht am 26. Mai 2017 von — 77 Kommentare ↓

Mit der Virtualisierungssoftware VirtualBox können Betriebssysteme in einer geschützten Umgebung installiert werden. In diesem Artickel wird gezeigt, wie man die VirtualBox einrichtet. weiterlesen VirtualBox einrichten→