Der hiermit vorgelegte Datensatz zur deutschen Parteiengeschichte dürfte – mit aktuell 840 gelisteten Parteien – im Moment der umfassendste seiner Art im Internet sein: Frei nutzbar, in beliebiger Konfiguration herunter zu laden, in Hintergrunddaten ausgreifend und zudem (mit einem frei erhältlichen FactGrid-Konto) unter beliebigen Forschungsinteressen auf die eigenen Bedürfnisse hin bearbeitbar.
Zum Vergleich: 59 aktive und 35 historische Parteien notiert der Datensatz des GBV zum Thema mit dem Angebot extrem unhandlicher Identifikatoren und ohne sehr viel tieferen Informationsgehalt. Wikidata überholte Projekte wie dieses in den letzten Jahren – allerdings auch immer wieder mit dem Nachteil, dass die dabei entstehenden Datensätze nicht so recht geplant waren und damit so einfach nicht zu handhaben sind. Die deutschen Parteien in Wikidata sind über keine einheitliche Recherche zu erfassen; es ging hier nicht darum, einen gleichmäßig ausgestatteten wie vollständigen Datensatz herzustellen. Einzelne, voneinander nicht informierte Eingaben akkumulierten sich hier eher planlos. Bewegt man sich in der Gegenwart, sollte man die Liste zu Rate ziehen, die die Bundeswahlleiterin 2024 vorlegte: Ausgewählte Daten politischer Vereinigungen, Stand 31.12.2023 (Wiesbaden, Juli 2024). Mit 637 Einträgen für die Jahre 1969 bis 2023 ist sie die dichteste Sammlung zur Parteienlandschaft der letzten 50 Jahre. Jede einzelne Partei ist hier mit Eckdaten aus der Buchführung der Wahlleitung versehen. Wikidata, in der quantitativen Erfassung wie in der Stringenz unterlegen, gewinnt an ganz anderen Stellen in der Vernetzung etwa mit Personen: Gut 15.000 Personen sind in Wikidata als Mitglieder mit der NSDAP verbunden, wohl weil die Informationen aus entsprechenden Wikipedia-Artikeln zur Verfügung standen. Wikidata bietet Serien von Mitgliederzahlen, externe Identifikatoren aus anderen Datenbanken oder Informationen zu Wahlen, in denen diese Parteien antraten.
Der vorliegende Datensatz ist genetisch ein Amalgam aus beiden Quellen und, gezielt als Partei-Datensatz angelegt, auf Homogenität hin gestaltet. Der Datensatz der Bundeswahlleiterin lässt sich dabei mit all seinen Eckdaten isolieren. Gleichzeitig reicht der vorliegende Datensatz dank Wikidata bis in die Frühphase des deutschen Parlamentarismus der vor der Reichseinigung stehenden Länder hinab.
Die gelisteten Parteien sind geschlossen mit einem Projekt-Item als zum „ddpp-Datensatz“ gehörige isolierbar, sie lassen sich gleichzeitig beliebig filtern (etwa um nur Parteien der BRD oder der DDR zu erfassen) oder ausdehnen: etwa im Blick auf historische Eckdaten, Organisationsbeziehungen, Parteiprogrammatiken oder involvierte Personen.
Statt einer einfachen Definition – Angebote, Definitionen selbst vorzunehmen
Der vorliegende Datensatz verfügt über kein klares Definitionskriterium und das sollte als Vorteil notiert sein. Man selbst kann ihn streng definieren oder öffnen, um etwa auch „Listen“, „Wahlgemeinschaften“ oder prominente „Orts-“ und „Landesverbände“ zu erfassen. Das ist sinnvoll schon allein, da sich aus all diesen auf Wahlzetteln auftauchenden Organisationsformen Parteien entfalten können, die am Ende bundesweit auftreten und sich im Parteiengefüge etablieren (wie dies etwa die Grünen taten). Die FactGrid-Datenbank hat kein Zentrum. Würde jemand NSDAP-Ortsverbände zu seinem Thema machen, wären diese das Zentrum seines Datensatzes und die Parteienlandschaft der Weimarer Republik nur der unüberschaubare Rand.
Die Problemlag wird mit der Frage nach dem Gründungsdatum der SPD im Detail greifbar: Der vorliegende Datensatz bietet tatsächlich vier Gründungsdaten mitsamt den Gründen, die sie im Einzelnen nahelegen. Es handelt sich bei drei der Datierungen um Gründungsdaten von Parteien, die die SPD als historische Wurzeln beansprucht. Wenn man diese Daten den einzelnen Vorgängern zuordnet, ist das Jahr 1890 mit dem Erfurter Gründungskonvent das allein der SPD zuzuordnende Gründungsdatum (und darum hier hochgewertet):
Der FactGrid „Datensatz zu deutschen politischen Parteien (ddpp)“ lebt in dieser Vielschichtigkeit der Möglichkeiten von seinem Angebot, ihn unterschiedlich zu fassen. Mit ihm sollte vor allem durchdacht werden, wie man sich dem Problem besser als mit einer Definition nähert. Die Antwort lautet: durch den beliebig umfassenden Datensatz, der jederzeit die Verlagerung und Verengung des Blickwinkels erlaubt.
Den ddpp-Datensatz praktisch nutzen
Der vorliegende Datensatz sollte es möglich machen, alle gelisteten Parteien eindeutig voneinander abzugrenzen und im komplizierten Fall direkt miteinander in Beziehung zu setzen: Es gibt in der Tat einen Unterschied zwischen WiR2020 (Q1182789) und Wir2020 (Q1211961); er liegt ostentativ im kleinen r, das Wir2020 als Erkennungsmerkmal beansprucht. Im spezifischen Datensatz wird klarer, dass die Partei mit dem kleinen r eine Abspaltung von und eine Kampfansage gegenüber der Mutter mit dem großen R ist. Die Q-Nummern erlauben es, die Unterschiede den Notizen in den Datensätzen zu überlassen. Im Datensatz sind im selben Moment Übersetzungen (aktuell englischer, französischer und spanischer Sprache) im Angebot sowie Verlinkungen zu Wikidata, zur GND, zur Publikation der Bundeswahlleiterin und zu Wikipedia-Artikeln, die mehr Informationen bieten.
In der praktischen Nutzung sollte jeweils der spröde „Basisdatensatz“ im Zentrum stehen, der es erlaubt, beliebig zu filtern wie beliebig zu erweitern. Im Basisdatensatz erscheint jede Partei nur einmal mit ihrer ID und kurzem Identifikationsangebot:
- Minimalversion: ddpp-Basisdatensatz alphabetisch geordnet 840 Parteien von der Mitte des 19. Jahrhunderts bis in die Gegenwart
- Erweiterte Version des obigen Datensatzes, die auch Landes- und Kreisverbände, Listen und Wahlbündnisse erfasst
- Selektiv-Datensatz Parteien des deutschen Kaiserreich
- Selektiv-Datensatz Parteien der Weimarer Republik
- Selektiv-Datensatz Parteien der DDR
- Selektiv-Datensatz Parteien der BRD
Die einzelnen Listen lassen sich nun beliebig erweitern, wobei Parteien in den dabei entstehenden Tabellen mitunter mehrere Zeilen erhalten, zum Beispiel, wenn mehrere GND-Nummern in der diesbezüglichen Spalte zu notieren sind.
- Datensatz: Die Parteien mit (soweit vorhanden) externen Identifikatoren: Wikidata, GND, Liste der Bundeswahlleiterin für die Jahre 1969 bis 2023 chronologisch nach Gründungsdatum sortiert.
- Datensatz: Die (Um-)Bennungen mit Datierungen. Diese Abfrage ist besonders nützlich in automatisierten Matching-Prozessen, da sie in ihnen Namensvarianten, die sich in Quellen finden, zur Verfügung stellt.
- Datensatz: Deutsche Parteien, die zwischen 1969 und 2023 bei der Bundeswahlleitung gelistet waren nach den Ausgewählten Daten politischer Vereinigungen, Stand 31.12.2023 herausgegeben von der Bundeswahlleiterin (Wiesbaden, Juli 2024), mit den dortigen Eckdaten und den Informationen zu respektiven Herausnahmen aus der Aktenführung.
- Datensatz: Von welchen Parteien spalteten sich welche Parteien ab?
- Datensatz: In welchen Parteien gingen die gelisteten auf?
- Datensatz: Ideologische Positionierung
- Datensatz: Politische Programmpunkte
Die letzten Suchen waren nurmehr punktuell mit Information bestückt; hier wartet der Datensatz im Moment auf Projekte, die in die Tiefe gehen. Eingehendere Suchen ließen sich zu Initiatoren, Gründungsmitgliedern, Parteivorsitzenden bieten, abermals jedoch im Moment nur punktuell.
Wahlergebnisse visualisieren
Seine zentrale Funktionalität entfaltet der Datensatz deutscher politischer Parteien, sobald man ihn im Rahmen des strukturell ganz anders gelagerten (und bis jetzt nur in punktuell vorliegenden) der Wahlergebnisse aller Reichstags- und Bundestagswahlen laufen lässt. Die Visualisierungen, die sich nun in SPARQL-Abfragen generiert werden, greifen direkt auf die Partei-Datensätze zu:

Reichstagswahl 1933, Bubble Chart der SPARQL-Abfrage
Das FactGrid Datenmodell weicht hier vom Wikidata-Datenmodell ab. Statt auf verschiedene Properties ist hier auf eine einzige gesetzt, die die diversen Zählergebnisse (Erststimmen, Zweitstimmen, Parlamentssitze und Prozentanteile) aufnimmt und unter den Einheiten notiert – das ist praktisch, da sich nun beliebig verschiedenartige Ergebnisse anbieten lassen:
Man kann bei dieser Modellierung an drei Stellschrauben im SPARQL-Skript drehen:

SPARQL-Code für Visualisierung von Wahlergebnissen. Zeile 1: Form der Visualisierung, Zeile 3: die Wahl, deren Ergebnis Visualisiert werden soll (z.B. Bundestagswahl 2025), Zeile 11: Ergebnisaspekt (was dabei gezählt werden soll) etwa Zweitstimmen.
Die FactGrid-Datenlage zu Wahlen ist im Moment noch sehr unvollständig. Wie weit sie gediehen ist, findet sich auf der Projektseite in FactGrid laufend aktuell notiert. Hier ging es erst einmal um eine Realisierung, die handwerkliche Probleme der unterschiedlichen Wikidata-Modellierungen in den Griff kriegt.
Der vernetzte Datensatz
Anders als konventionelle Datensätze sind Wikibase-Datensätze fast immer komplex vernetzt, und das durchaus unüberschaubar.
Die banalste Vernetzung des vorliegenden Datensatz geht von den FactGrid notierten Personen aus:
- Datensatz: Alle FactGrid-notierten SPD-Mitglieder (283 mit Stand vom März 2024)
- Datensatz: Alle FactGrid-notierten NSDAP-Mitglieder (1559 mit Stand vom März 2024)
- Datensatz: Alle FactGrid-notierten Personen, die sowohl in der SPD wie in der NSDAP Mitglieder wurden (21 mit Stand vom März 2024)
Die drei Mustersuchen zeigen, dass wir hier theoretisch sehr komplexe Fragen stellen können, etwa nach der Ausbildung von erfassten Parteimitgliedern oder nach Personennetzwerken, die sich etwa über Mitgliedschaften in Logen oder Studentenverbindungen ergaben. Der Vorteil des FactGrid-Datensatzes ist hier erneut, dass er kein Zentrum aufweist. Es ist möglich, laufend neue Aspekte des jeweiligen Interesses zu formulieren und diese danach aus ganz unterschiedlichen Zusammenhängen heraus zu erfassen.
Extrem komplex sind erwartungsgemäß die organisatorischen Vernetzungen der NDSDAP, setzte hier doch eine Partei systematisch staatliche Organisationsstrukturen außer Kraft, um diese danach mit Parteistrukturen wie denen der SS zu ersetzen. Der ddpp-Datensatz bildet dies gerade im Ansatz ab.
Der für die Weiterverwendung offene Datensatz
Jede der im Vorangegangenen angebotenen Mustersuchen lässt sich modifizieren und alle Ergebnisse lassen sich jeweils in verschiedenen Datenformaten (JSON, CSV, TSV, HTML) herunterladen. Am rechten Rand der Tabellen und Visualisierungen bietet stets ein Mouseover-Menü die verschiedenen Formate wie Bearbeitungsoptionen an. Die Daten sind samt und sonders CC0-lizensiert und damit komplikationslos auch ohne Zitat der Quellen in Grafiken verwendbar.
Interessant sollte es sein, Bearbeitungen des Datensatzes auf der Plattform selbst vorzunehmen, so dass andere Nutzer vom Wissenszuwachs direkt profitieren – vor allem aber auch mit dem Vorteil, dass das eigene Projekt an dieser Stelle nicht von vorne anfangen muss und Fragen nach der eigenen Nachhaltigkeit der kollektiven Arbeitsumgebung überlassen kann.
Einige klar benennbare Desiderate seien neben dieser grundsätzlichen Einladung, sich den Datensatz auf der Plattform anzueignen, ausgesprochen: Die Aufstellung der Bundeswahlleiterin erwies sich als überaus nützlich im Angebot harter Klarheiten. Ein enormes Desiderat wären jedoch Verlinkungen zu Digitalisaten der Unterlagen, die die Parteien vorlegten, sowie Notate der Personen, die diese Parteien gründeten und der Adressen der Anmeldungen. Es ist dies ein Desiderat vor allem im Blick auf die kleinen Dateien, die oft nach wenigen Jahren der Inaktivität schon wieder aus den Akten verschwanden und heute nicht einmal über Internetseiten, die sie lancierten sichtbar sind.
Im Historischen Datenzentrum Sachsen-Anhalt, das das Projekt Rahmen des R:hovono-Projektes initiierte, werden wir eine GND-Situierung des Datensatzes anstreben.
Gut wäre es, die Datenbankobjekte mit Expertise zu Positionierungen, Zielsetzungen, statistischen Daten und vor allem mit Quellverweisen, angereichert anbieten zu können.
- Featured Image: Wahlwerbung der AIPD, die wohl eher zu den Kunstprojekten zu rechnen ist, und darum ein gesondertes FactGrid-Item hat. Screenshot der Website https://aipd-partei.de/