RSS-Feed abonnieren

Passwort vergessen?

v Anmelden

Allgemein

1. Apr 2025

ddpp | Ein Datensatz deutscher politischer Parteien

Verfasst von

Der hiermit vorgelegte Datensatz zur deutschen Parteiengeschichte dürfte – mit aktuell 840 gelisteten Parteien – im Moment der umfassendste seiner Art im Internet sein: Frei nutzbar, in beliebiger Konfiguration herunter zu laden, in Hintergrunddaten ausgreifend und zudem (mit einem frei erhältlichen FactGrid-Konto) unter beliebigen Forschungsinteressen auf die eigenen Bedürfnisse hin bearbeitbar.

Zum Vergleich: 59 aktive und 35 historische Parteien notiert der Datensatz des GBV zum Thema mit dem Angebot extrem unhandlicher Identifikatoren und ohne sehr viel tieferen Informationsgehalt. Wikidata überholte Projekte wie dieses in den letzten Jahren – allerdings auch immer wieder mit dem Nachteil, dass die dabei entstehenden Datensätze nicht so recht geplant waren und damit so einfach nicht zu handhaben sind. Die deutschen Parteien in Wikidata sind über keine einheitliche Recherche zu erfassen; es ging hier nicht darum, einen gleichmäßig ausgestatteten wie vollständigen Datensatz herzustellen. Einzelne, voneinander nicht informierte Eingaben akkumulierten sich hier eher planlos. Bewegt man sich in der Gegenwart, sollte man die Liste zu Rate ziehen, die die Bundeswahlleiterin 2024 vorlegte: Ausgewählte Daten politischer Vereinigungen, Stand 31.12.2023 (Wiesbaden, Juli 2024). Mit 637 Einträgen für die Jahre 1969 bis 2023 ist sie die dichteste Sammlung zur Parteienlandschaft der letzten 50 Jahre. Jede einzelne Partei ist hier mit Eckdaten aus der Buchführung der Wahlleitung versehen. Wikidata, in der quantitativen Erfassung wie in der Stringenz unterlegen, gewinnt an ganz anderen Stellen in der Vernetzung etwa mit Personen: Gut 15.000 Personen sind in Wikidata als Mitglieder mit der NSDAP verbunden, wohl weil die Informationen aus entsprechenden Wikipedia-Artikeln zur Verfügung standen. Wikidata bietet Serien von Mitgliederzahlen, externe Identifikatoren aus anderen Datenbanken oder Informationen zu Wahlen, in denen diese Parteien antraten.

Der vorliegende Datensatz ist genetisch ein Amalgam aus beiden Quellen und, gezielt als Partei-Datensatz angelegt, auf Homogenität hin gestaltet. Der Datensatz der Bundeswahlleiterin lässt sich dabei mit all seinen Eckdaten isolieren. Gleichzeitig reicht der vorliegende Datensatz dank Wikidata bis in die Frühphase des deutschen Parlamentarismus der vor der Reichseinigung stehenden Länder hinab.

Die gelisteten Parteien sind geschlossen mit einem Projekt-Item als zum „ddpp-Datensatz“ gehörige isolierbar, sie lassen sich gleichzeitig beliebig filtern (etwa um nur Parteien der BRD oder der DDR zu erfassen) oder ausdehnen: etwa im Blick auf historische Eckdaten, Organisationsbeziehungen, Parteiprogrammatiken oder involvierte Personen.

Statt einer einfachen Definition – Angebote, Definitionen selbst vorzunehmen

Der vorliegende Datensatz verfügt über kein klares Definitionskriterium und das sollte als Vorteil notiert sein. Man selbst kann ihn streng definieren oder öffnen, um etwa auch „Listen“, „Wahlgemeinschaften“ oder prominente „Orts-“ und „Landesverbände“ zu erfassen. Das ist sinnvoll schon allein, da sich aus all diesen auf Wahlzetteln auftauchenden Organisationsformen Parteien entfalten können, die am Ende bundesweit auftreten und sich im Parteiengefüge etablieren (wie dies etwa die Grünen taten). Die FactGrid-Datenbank hat kein Zentrum. Würde jemand NSDAP-Ortsverbände zu seinem Thema machen, wären diese das Zentrum seines Datensatzes und die Parteienlandschaft der Weimarer Republik nur der unüberschaubare Rand.

Die Problemlag wird mit der Frage nach dem Gründungsdatum der SPD im Detail greifbar: Der vorliegende Datensatz bietet tatsächlich vier Gründungsdaten mitsamt den Gründen, die sie im Einzelnen nahelegen. Es handelt sich bei drei der Datierungen um Gründungsdaten von Parteien, die die SPD als historische Wurzeln beansprucht. Wenn man diese Daten den einzelnen Vorgängern zuordnet, ist das Jahr 1890 mit dem Erfurter Gründungskonvent das allein der SPD zuzuordnende Gründungsdatum (und darum hier hochgewertet):

Der FactGrid „Datensatz zu deutschen politischen Parteien (ddpp)“ lebt in dieser Vielschichtigkeit der Möglichkeiten von seinem Angebot, ihn unterschiedlich zu fassen. Mit ihm sollte vor allem durchdacht werden, wie man sich dem Problem besser als mit einer Definition nähert. Die Antwort lautet: durch den beliebig umfassenden Datensatz, der jederzeit die Verlagerung und Verengung des Blickwinkels erlaubt.

Den ddpp-Datensatz praktisch nutzen

Der vorliegende Datensatz sollte es möglich machen, alle gelisteten Parteien eindeutig voneinander abzugrenzen und im komplizierten Fall direkt miteinander in Beziehung zu setzen: Es gibt in der Tat einen Unterschied zwischen WiR2020 (Q1182789) und Wir2020 (Q1211961); er liegt ostentativ im kleinen r, das Wir2020 als Erkennungsmerkmal beansprucht. Im spezifischen Datensatz wird klarer, dass die Partei mit dem kleinen r eine Abspaltung von und eine Kampfansage gegenüber der Mutter mit dem großen R ist. Die Q-Nummern erlauben es, die Unterschiede den Notizen in den Datensätzen zu überlassen. Im Datensatz sind im selben Moment Übersetzungen (aktuell englischer, französischer und spanischer Sprache) im Angebot sowie Verlinkungen zu Wikidata, zur GND, zur Publikation der Bundeswahlleiterin und zu Wikipedia-Artikeln, die mehr Informationen bieten.

In der praktischen Nutzung sollte jeweils der spröde „Basisdatensatz“ im Zentrum stehen, der es erlaubt, beliebig zu filtern wie beliebig zu erweitern. Im Basisdatensatz erscheint jede Partei nur einmal mit ihrer ID und kurzem Identifikationsangebot:

Die einzelnen Listen lassen sich nun beliebig erweitern, wobei Parteien in den dabei entstehenden Tabellen mitunter mehrere Zeilen erhalten, zum Beispiel, wenn mehrere GND-Nummern in der diesbezüglichen Spalte zu notieren sind.

  1. Datensatz: Die Parteien mit (soweit vorhanden) externen Identifikatoren: Wikidata, GND, Liste der Bundeswahlleiterin für die Jahre 1969 bis 2023 chronologisch nach Gründungsdatum sortiert.
  2. Datensatz: Die (Um-)Bennungen mit Datierungen. Diese Abfrage ist besonders nützlich in automatisierten Matching-Prozessen, da sie in ihnen Namensvarianten, die sich in Quellen finden, zur Verfügung stellt.
  3. Datensatz: Deutsche Parteien, die zwischen 1969 und 2023 bei der Bundeswahlleitung gelistet waren nach den Ausgewählten Daten politischer Vereinigungen, Stand 31.12.2023 herausgegeben von der Bundeswahlleiterin (Wiesbaden, Juli 2024), mit den dortigen Eckdaten und den Informationen zu respektiven Herausnahmen aus der Aktenführung.
  4. Datensatz: Von welchen Parteien spalteten sich welche Parteien ab?
  5. Datensatz: In welchen Parteien gingen die gelisteten auf?
  6. Datensatz: Ideologische Positionierung
  7. Datensatz: Politische Programmpunkte

Die letzten Suchen waren nurmehr punktuell mit Information bestückt; hier wartet der Datensatz im Moment auf Projekte, die in die Tiefe gehen. Eingehendere Suchen ließen sich zu Initiatoren, Gründungsmitgliedern, Parteivorsitzenden bieten, abermals jedoch im Moment nur punktuell.

Wahlergebnisse visualisieren

Seine zentrale Funktionalität entfaltet der Datensatz deutscher politischer Parteien, sobald man ihn im Rahmen des strukturell ganz anders gelagerten (und bis jetzt nur in punktuell vorliegenden) der Wahlergebnisse aller Reichstags- und Bundestagswahlen laufen lässt. Die Visualisierungen, die sich nun in SPARQL-Abfragen generiert werden, greifen direkt auf die Partei-Datensätze zu:

Reichstagswahl 1933, Bubble Chart der SPARQL-Abfrage

Das FactGrid Datenmodell weicht hier vom Wikidata-Datenmodell ab. Statt auf verschiedene Properties ist hier auf eine einzige gesetzt, die die diversen Zählergebnisse (Erststimmen, Zweitstimmen, Parlamentssitze und Prozentanteile) aufnimmt und unter den Einheiten notiert – das ist praktisch, da sich nun beliebig verschiedenartige Ergebnisse anbieten lassen:

Man kann bei dieser Modellierung an drei Stellschrauben im SPARQL-Skript drehen:

SPARQL-Code für Visualisierung von Wahlergebnissen. Zeile 1: Form der Visualisierung, Zeile 3: die Wahl, deren Ergebnis Visualisiert werden soll (z.B. Bundestagswahl 2025), Zeile 11: Ergebnisaspekt (was dabei gezählt werden soll) etwa Zweitstimmen.

Die FactGrid-Datenlage zu Wahlen ist im Moment noch sehr unvollständig. Wie weit sie gediehen ist, findet sich auf der Projektseite in FactGrid laufend aktuell notiert. Hier ging es erst einmal um eine Realisierung, die handwerkliche Probleme der unterschiedlichen Wikidata-Modellierungen in den Griff kriegt.

Der vernetzte Datensatz

Anders als konventionelle Datensätze sind Wikibase-Datensätze fast immer komplex vernetzt, und das durchaus unüberschaubar.

Die banalste Vernetzung des vorliegenden Datensatz geht von den FactGrid notierten Personen aus:

  • Datensatz: Alle FactGrid-notierten SPD-Mitglieder (283 mit Stand vom März 2024)
  • Datensatz: Alle FactGrid-notierten NSDAP-Mitglieder (1559 mit Stand vom März 2024)
  • Datensatz: Alle FactGrid-notierten Personen, die sowohl in der SPD wie in der NSDAP Mitglieder wurden (21 mit Stand vom März 2024)

Die drei Mustersuchen zeigen, dass wir hier theoretisch sehr komplexe Fragen stellen können, etwa nach der Ausbildung von erfassten Parteimitgliedern oder nach Personennetzwerken, die sich etwa über Mitgliedschaften in Logen oder Studentenverbindungen ergaben. Der Vorteil des FactGrid-Datensatzes ist hier erneut, dass er kein Zentrum aufweist. Es ist möglich, laufend neue Aspekte des jeweiligen Interesses zu formulieren und diese danach aus ganz unterschiedlichen Zusammenhängen heraus zu erfassen.

Extrem komplex sind erwartungsgemäß die organisatorischen Vernetzungen der NDSDAP, setzte hier doch eine Partei systematisch staatliche Organisationsstrukturen außer Kraft, um diese danach mit Parteistrukturen wie denen der SS zu ersetzen. Der ddpp-Datensatz bildet dies gerade im Ansatz ab.

Der für die Weiterverwendung offene Datensatz

Jede der im Vorangegangenen angebotenen Mustersuchen lässt sich modifizieren und alle Ergebnisse lassen sich jeweils in verschiedenen Datenformaten (JSON, CSV, TSV, HTML) herunterladen. Am rechten Rand der Tabellen und Visualisierungen bietet stets ein Mouseover-Menü die verschiedenen Formate wie Bearbeitungsoptionen an. Die Daten sind samt und sonders CC0-lizensiert und damit komplikationslos auch ohne Zitat der Quellen in Grafiken verwendbar.

Interessant sollte es sein, Bearbeitungen des Datensatzes auf der Plattform selbst vorzunehmen, so dass andere Nutzer vom Wissenszuwachs direkt profitieren – vor allem aber auch mit dem Vorteil, dass das eigene Projekt an dieser Stelle nicht von vorne anfangen muss und Fragen nach der eigenen Nachhaltigkeit der kollektiven Arbeitsumgebung überlassen kann.

Einige klar benennbare Desiderate seien neben dieser grundsätzlichen Einladung, sich den Datensatz auf der Plattform anzueignen, ausgesprochen: Die Aufstellung der Bundeswahlleiterin erwies sich als überaus nützlich im Angebot harter Klarheiten. Ein enormes Desiderat wären jedoch Verlinkungen zu Digitalisaten der Unterlagen, die die Parteien vorlegten, sowie Notate der Personen, die diese Parteien gründeten und der Adressen der Anmeldungen. Es ist dies ein Desiderat vor allem im Blick auf die kleinen Dateien, die oft nach wenigen Jahren der Inaktivität schon wieder aus den Akten verschwanden und heute nicht einmal über Internetseiten, die sie lancierten sichtbar sind.

Im Historischen Datenzentrum Sachsen-Anhalt, das das Projekt Rahmen des R:hovono-Projektes initiierte, werden wir eine GND-Situierung des Datensatzes anstreben.

Gut wäre es, die Datenbankobjekte mit Expertise zu Positionierungen, Zielsetzungen, statistischen Daten und vor allem mit Quellverweisen, angereichert anbieten zu können.


14. Mrz 2025

Workshop ‚Wer weiß schon wo? – Historische Ortsdaten‘ auf der DHd2025 in Bielefeld

Verfasst von

Unsere umfangreichen und vielfältigen Bemühungen haben sich gelohnt. Nach einem intensiven Januar konnte die „AG Historische Ortsdaten“ auf der DHd in Bielefeld in einem Workshop erstmals ihre Minimaldatensatz-Empfehlung präsentieren und einem Praxistest unterziehen.

Einführung und Vorstellung der Arbeitsgruppe

Nach einer allgemeinen Vorstellung der Arbeitsgruppe und der historischen Ortsdaten zugrundeliegenden Problematiken, folgte eine Einführung in den entwickelten Minimaldatensatz, der in Kurzform auf unserer Website verfügbar ist. Dieser ist stets nach dem gleichen Schema aufgebaut und bietet damit eine wertvolle Orientierungshilfe für den Umgang mit historischen Ortsdaten, nicht nur für die Teilnehmer:innen des Workshops.

Während der gemeinsamen Erarbeitung hat die AG verschiedene Fallstricke und mannigfaltige Probleme identifiziert, die sich durch den Minimaldatensatz zumindest systematisieren lassen. Der Minimaldatensatz soll als Orientierungspunkt dienen und Hilfestellungen für Projekte bieten, die sonst Schwierigkeiten mit ihrer Datenorganisation haben. Ebenfalls entwickelt wurde eine Checkliste, die das zugrundeliegende Konzept komprimiert.

Praxistest im Workshop

Im praktischen Teil des Workshops waren die Teilnehmer aufgefordert, an ausgewählten Beispielen (teilweise mit einem direkten Quellenbezug) die Minimaldatensatzempfehlung intuitiv zur Anwendung zu bringen. Dies stellte für unsere Empfehlung den ersten Härtetest dar.

Das Prinzip des „Kleinsten Gemeinsamen Nenners“ erwies sich dabei als durchaus praktikabel. Das Projekt wurde als hilfreich bewertet, und es besteht großes Interesse an seiner Weiterentwicklung.

Besonders hervorgehoben wurde die Absicht, einen Ortstypenthesaurus zu entwickeln, wenn auch die Frage nach der Vergleichbarkeit mit anderen deutschsprachigen Regionen, wie etwa Österreich und der Schweiz, noch nicht abschließend beantwortet werden kann.

D
DHd Bielefeld 2025 – Ergebnisse der Arbeitsgruppen (Foto: Tim Schubert)

Lob und Herausforderungen

Es gab Lob für die gute Vorbereitung und die anschaulichen Beispiele, die die Komplexität und die zugrundeliegenden Schwierigkeiten im Umgang mit historischen Ortsdaten verdeutlichten.

Zusammenfassend lässt sich sagen, dass der Workshop auf der DHd2025 in Bielefeld ein Erfolg war und wertvolle Erkenntnisse und Anregungen für die Weiterentwicklung der Minimaldatensatz-Empfehlung und des Ortstypenthesaurus liefern konnte. Die positiven Rückmeldungen der Teilnehmer und das große Interesse an der Thematik bestärken uns, seine Etablierung weiter voranzutreiben.

14. Jan 2025

Erste/r sein

Verfasst von

Das neue Jahr hat gerade erst begonnen, aber die ersten Höhepunkte stehen schon in den Startlöchern. Dazu zählt für unsere TA2 Gruppe am Historischen Datenzentrum Sachsen-Anhalt der Launch der R:hovono Website (Register historischer und objektbezogener Vokabulare und Normdaten), auf der Ende des ersten Quartals 2025 für die historische Forschung relevante Vokabulare in einer Tiefenerschließung präsentiert werden.

Im April 2024 gestartet haben mittlerweile fast 100 historische und objektbezogene Vokabulare und Normdaten den Weg zu uns gefunden.

Wer seine Register und Vokabulare beim ersten Launch dabei haben möchte, hat noch bis zum 31. Januar 2025 die Möglichkeit eine Erfassung via LimeSurvey oder direkt im FactGrid vorzunehmen. Die Registerpräsentation unseres Workshops vom 23.04. (https://zenodo.org/records/11073414), sowie das Codebuch (https://zenodo.org/records/11031743) und die Dokumentation (https://zenodo.org/records/11033367) des Registers sind auf Zenodo veröffentlicht. Auch auf Individuelle Anfragen gehen wir gerne ein.

18. Dez 2024

Wir wünschen schöne Feiertage!

Verfasst von

Liebe Follower dieses Blogs, ob regelmäßig hereinschauend oder gerade erst zufällig hier gelandet, wir wünschen Ihnen und Euch wunderbare, frohe, entspannte und erholsame Feiertage sowie einen guten Rutsch in das neue Jahr.

[ Weiterlesen … ]

21. Sep 2024

Feierliche Eröffnung des Biografieportals Sachsen-Anhalt

Verfasst von

Gestern wurde das Biografieportal Sachsen-Anhalt feierlich eröffnet. Der Festakt fand im Landesmuseum für Vorgeschichte statt und war Teil der Tagung Digital History & Citizen Science an der Universität Halle. Das Portal steht nun zur Nutzung und auch zur Mitarbeit bereit. Interessierte können sich an das Historische Datenzentrum Sachsen-Anhalt wenden.

[ Weiterlesen … ]

20. Sep 2024

Sonnenschein, ein großartiges Publikum und spannende Vorträge

Verfasst von

19. Jul 2024

Sonnenschein, Eis und Quartalsberichte

Verfasst von

Der Sommer ist angekommen, die Sonne scheint und es sind Ferien. Damit ist das zweite Quartal beendet und es ist erneut Zeit, es sich (je nach Vorliebe in der Sonne oder an einem schattigen Plätzchen) bequem zu machen und die vergangenen drei Monate Revue passieren zu lassen.

[ Weiterlesen … ]

3. Mai 2024

R:hovono – Neuigkeiten: Erarbeitung des Webformular/ Veröffentlichung von Registerpräsentation, Codebuch und Dokumentation

Verfasst von

Am Dienstag haben wir uns (wie hier zu sehen tatsächlich auch ganz analog) mit unserem Webformular beschäftigt und gemeinsam entschieden wie die Anzeige der Registereinträge auf unserer Homepage aussehen soll.
Wir werden also R:honovo schon bald auch auf unserer Webseite sichtbar machen und eine übersichtliche Anzeige der Registereinträge bereitstellen.

[ Weiterlesen … ]

26. Apr 2024

Register historischer und objektbezogener Vokabulare und Normdaten mit Workshop erfolgreich gestartet.

Verfasst von

Am Dienstag haben wir unser Register historischer und objektbezogener Vokabulare und Normdaten (R:hovono) im Rahmen eines Workshops vorgestellt und gleichzeitig der Fachcommunity zur Verfügung gestellt. Interessierte können nun ihre Vokabulare jeder Art – seien es einfache Wortlisten, Ontologien, Thesauri, Normdateien – eintragen und damit im Register verzeichnen lassen.

[ Weiterlesen … ]

22. Apr 2024

Das erste Quartal 2024 ist vorbei – ein kleiner Rück- und Ausblick

Verfasst von

Der April hat seine Mitte überschritten und das heißt es ist Zeit für den ersten Quartalsbericht für 2024. Dieser Anlass bietet die Gelegenheit zu schauen was wir in den vergangenen Monaten gemacht und geschafft haben.

[ Weiterlesen … ]