GENprofi Datenkonzepte
Einleitung
Jeder Bereich hat seine eigene Sprache und seine eigenen Notationen. So können Menschen, die sich nicht mit der Genealogie befassen, mit einem Ortsfamilienbuch oder einer Ahnenliste gemäß Ahnenlistenumlauf herzlich wenig anfangen. Diese eigenständige Sprachwelt erlaubt es den “Eingeweihten”, mit wenigen Begriffen selbst komplizierte Sachverhalte kurz und bündig darzustellen. Die Klärung von Fachbegriffen ist auch die Aufgabe dieser Informationsschrift. In der Computergenealogie (hierunter versteht man die Verwaltung genealogischer Sachverhalte mit Hilfe des Computers) werden in der letzten Zeit neue Fachbegriffe eingeführt, um neue Mechanismen und Konzepte darzustellen. So ist von “unscharfen Mengen”, “fuzzy logic”, “genealogischen Datenstrukturen” usw. die Rede, wobei allerdings bisher vernachlässigt wurde, diese Fachbegriffe dem Interessierten allgemeinverständlich zugänglich zu machen.
Worum geht es denn überhaupt?
Die Computergenealogie hat sich in den letzten Jahren immer weiter entwickelt. Seit einigen Jahren sind nun bei den Entwicklern Bestrebungen zu erkennen, von traditionellen Ansätzen abzugehen und als alleinigen Maßstab eines Genealogieprogramms die genealogischen Notwendigkeiten heranzuziehen. Hierbei entwickeln sich Familienforschungsprogramme u.a. zu exzellenten Werkzeugen zur Erfassung und Pflege genealogischer Quellen. Diese Entwicklung konnte nur durch die Verwendung neuer, leistungsfähiger Personalcomputer durchgeführt werden, die ja nun zu erschwinglichen Preisen verfügbar sind. Im Rahmen dieser Info-Schrift wird die Leistungsfähigkeit moderner Softwarekonzepte erarbeitet und die dazu notwendige Begriffswelt allgemeinverständlich erklärt.
Für wen ist diese Info-Schrift gedacht?
Zunächst ist diese Info-Schrift für alle Anwender und Interessenten unseres GENprofi Familienforschungsprogramms gedacht. Unsere Anwender können das Familienforschungsprogramm erheblich gezielter und vielfältiger einsetzen, wenn die zugrundeliegenden Konzepte verstanden worden sind. Zum anderen können sicherlich auch an der Computergenealogie Interessierte aus dieser Info-Schrift die grundlegenden Konzepte moderner Genealogieprogramme erfahren und sich somit auf den aktuellen Stand in der heutigen Diskussion bringen. Im Anhang dieser Info-Schrift sind zwei Artikel aus der Zeitschrift “Computergenealogie” enthalten, die nochmals ausführlich auf die einzelnen Konzepte eingehen. Ich hoffe, daß diese Artikel nach der Lektüre dieser Einführung besser zu verstehen sind.
Grundlage dieser Info-Schrift sind die von mir auf den verschiedenen GENprofi Veranstaltungen gehaltenen Vorträge zu diesem Thema. Weiterhin wurde ein Abschnitt aus dem früheren GENprofi Handbuch für diese Info-Schrift überarbeitet.
Computergenealogie
Das GENprofi Familienforschungsprogramm basiert seit vielen Jahren auf einem modernen Datenkonzept, das besonders auf genealogische Sachverhalte angepaßt wurde. Die langjährige Erfahrung in der Entwicklung von Genealogieprogrammen - das GENprofi Familienforschungsprogramm wird seit 1985 erfolgreich von vielen Familienforschern eingesetzt - führte schließlich dazu, den status quo der vorhandenen Softwarekonzepte zu analysieren und festzustellen, daß mit den vorhandenen Lösungen prima Ahnentafeln ausgedruckt werden konnten, aber daß die interessanten genealogischen Sachverhalte nur sehr rudimentär, wenn überhaupt, verwaltbar waren.
Wer sich heute für den Einsatz eines Genealogieprogramms interessiert, wird sich in der Regel mit genealogischen Problemstellungen dem Programm nähern. Die Verwaltung von weit über einhunderttausend Personen und der Druck der elementaren genealogischen Ausgabeformen gehören sicherlich zum Standard etablierter Genealogielösungen. Die Unterschiede liegen - neben dem angebotenen Service und dem Preis, die aber hier nicht zum Thema gehören - in der Möglichkeit, auch komplizierte genealogische Sachverhalte adäquat zu verwalten. Desweiteren ist es wichtig zu wissen, welche Freiheiten der Programmanbieter seinem Anwender innerhalb der Datenverwaltung ermöglicht.
Der Reiz der Genealogie besteht m. E. in der Veränderung und deren Dokumentation. Die Erforschung des eigenen Stammes oder die historische Bewertung seines Geburtsortes durch die Erstellung eines Ortsfamilienbuches ist eine faszinierende Tätigkeit. Je mehr man sich mit der Genealogie beschäftigt, desto mannigfaltiger werden Informationen und immer neue Facetten werden beleuchtet. Nur so ist es zu erklären, warum die Genealogie ein Hobby ist, das man - sofern einmal von dem Virus erfaßt - nicht mehr aufgibt.
Wenn man sich zum ersten Mal mit der Genealogie beschäftigt, wird die eigene Familie der Ausgangspunkt sein. Dies ist auch in der Regel sehr einfach. Die Daten liegen wohl dokumentiert vor (durch Familienbücher) oder ein naher Verwandter hilft bei der Sammlung der Grundwerte. Der erste Reiz ist die Ordnung und die Vielfalt der Information. Hier erscheint es so, daß jede Person in der Familienforschung nur einen Vater und nur eine Mutter haben kann; die Werte sind fest vorgegeben. Demzufolge wird dieser Ansatz im Rahmen der Genealogieprogramme ebenfalls fest vorgegeben (also eine deterministische Datenstruktur).
Sobald man sich weiter in die Vergangenheit begibt, läßt die Ordnung nach. Nicht mehr jede Person, die in Kirchenbüchern zu finden ist, kann direkt mit der eigenen Familie verbunden werden. Durch Kontakte zu anderen Familienforschern wird der Forschungsbestand schnell größer und die Ordnung gerät in Gefahr.
Dies war in den letzten Jahren der Zeitpunkt, sich mit der “Computer-Genealogie” zu beschäftigen. Der Tausendsassa Computer wurde mit den Daten gefüttert und die Ordnung kehrte wieder ein oder es standen zumindest Werkzeuge zur Verfügung, die den Überblick über den vorhandenen Datenbestand erleichterten.
Schon 1985 gab es einige Anwendungsprogramme für die Genealogie (neudeutsch: Genealogie-Software), die dies leisteten. Die Anfänge der Computer-Genealogie reichen sicherlich noch viel weiter zurück. Nur waren damals die Computer für den Hobby-Genealogen kaum erschwinglich und die Lösungen wurden von Informatikern auf Großrechnern realisiert, die großen Firmen oder Universitäten zur Verfügung standen.
Die ersten Genealogie-Anwendungen waren im wesentlichen auf die grundlegenden Aufgaben beschränkt. Dies lag zum einen an der aufwendigen Arbeit, die in der Entwicklung solcher Anwendungsprogramme steckt, aber auch in der beschränkten Leistungsfähigkeit der ersten Personal-Computer (mittlerweile hat sich die Abkürzung PC etabliert). Somit mußte ein Kompromiß gefunden werden, der sowohl dem Genealogen als auch dem Anwendungsentwickler mit den verfüg- und finanzierbaren Rechnern gerecht wurde. Es versteht sich von selbst, daß diese Programme eine einfache Darstellung der genealogischen Sachverhalte im Rechner aufbauten. Anders wären leistungsfähige und einsatzbereite Programme nicht realisierbar gewesen. Die Zeiten haben sich jedoch geändert. Wenn wir früher mit einer 10 MB Festplatte vollauf zufrieden waren, so ist heute die hundertfache Kapazität bei neuen Computersystemen die Regel. Aber nicht nur die Speicherkapazität, sondern auch die Verarbeitungsgeschwindigkeit hat sich enorm gesteigert.
Somit wurde der Grundstein gelegt, auch die genealogischen Anwendungen auf einen neuen Weg zu bringen. Daß das Beschreiten neuer Wege nicht immer sofort von Erfolg gekrönt und auch nicht immer der Weisheit letzter Schluß ist, kann sicherlich durch unsere langjährigen treuen Anwender bestätigt werden.
Mittlerweile hat sich aber das Prinzip genealogischer Datenstrukturen durchgesetzt, das im Laufe dieser Info-Schrift Ihnen näher gebracht werden soll. Wenn es auch erst wenige genealogische Programme gibt, die diese modernen Konzepte ihren Anwendern anbieten, so ist es doch einfach darstellbar, warum genealogische Datenstrukturen den teilweise sehr komplizierten Sachverhalten in der Genealogie gerecht werden.
Einfache Beispiele
Die hier aufgeführten Beispiele sind für Genealogen tägliches Brot. Dennoch sollten Sie vor dem Einsatz eines Genealogieprogramms prüfen, ob diese Problemstellungen mit der ins Auge gefaßten Anwendung realisierbar sind und wie das Programm diese Fälle handhabt. Diese Liste hat keinen Anspruch auf Vollständigkeit und erst Recht keinen Anspruch auf Allgemeingültigkeit. Jeder, der sich mit Genealogie beschäftigt, wird in seinem speziellen Forschungsgebiet ähnliche Sachverhalte finden.
Problembereich : Nachnamen
Welcher Name wird einer Person zugeordnet? Natürlich der Geburtsname. Was ist aber, wenn diese Person geheiratet hat und den Namen des Ehepartners angenommen hat? Ab diesem Zeitpunkt sind sämtliche Eintragungen in den Kirchenbüchern o.ä. Quellen unter dem angeheirateten Namen zu finden. Besonders interessant wird es dann, wenn z.B. durch Verwitwung mehrere Heiraten mit der Annahme des Namens sich anschließen. Wo soll ein Ende sein? Das Thema Nachnamen kann beliebig ausgebaut werden. Verleihung von Namen (z.B. durch Erhebung in Adelsstände), Anpassung der Schreibweisen (z.B. Schreibfehler, durch Auswanderung) oder auch wahrscheinliche Namen (z.B. durch schlecht lesbare oder zuzuordnende Quellen) können die Gestaltung der Nachnamen schon sehr kompliziert werden lassen. Hinzu kommen Varianten, die für adlige Vorfahren notwendig sind; oder für Personen, die neben dem Namen ein “genannt” in unseren Karteikarten mitschleppen.
Zusätzlich gibt es noch die patronymische Namensgebung. Hier wird der Name des Kindes aus dem Vornamen des Vaters gebildet : z. B. Petersen = Peters Sohn. Man erkennt leicht, wie vielfältig die Aufgabenstellung innerhalb der Genealogie schon bei so scheinbar einfachen Dingen wie den Nachnamen ist. Diesen Schwierigkeiten wird man mit konventionellen Anwenderprogrammen kaum gerecht, oder man muß erhebliche Abstriche machen bzw. hinnehmen.
Problembereich : Vornamen
Wieviele Vornamen hat eine Person? Drei, fünf? Besser ist es immer, den umfangreichsten Fall aus seiner Erfahrung, in diesem Fall eines Anwenders, zu nehmen : “Johann Peter Caspar David Friedrich”. Der letzte (!) Vorname kennzeichnete das Kind, alle anderen Vornamen wurden an jeden Sohn und auch auf nachfolgende Generationen weitergegeben.
So muß jede Person unter allen Vornamen, die diese Person trägt, im System auffindbar sein. Es gibt ja keine Gewähr dafür, daß immer der erste Vorname in den Quellen aufgeführt wird. Die Erfahrung zeigt, daß bei den Vornamen reichlich Platz zur Verfügung stehen muß. Zusätzlich muß die Möglichkeit bestehen, Kosenamen zu hinterlegen. Dies sind Vornamen, unter denen die Person bekannt ist, die allerdings nicht urkundlich belegt sind (ein Anwender hat z.B. den interessanten Fall, daß eine Tochter immer nach dem Namen der im Kindbett verstorbenen Mutter gerufen wurde, aber selber diesen Namen nicht getragen hat!). Desweiteren muß die Möglichkeit bestehen, fragwürdige Vornamen zu verwalten und entsprechend kenntlich zu machen. Daß eine Unterscheidung zwischen normalen Vornamen und Rufnamen möglich sein muß, versteht sich von selbst.
Problembereich : Personen
Nicht immer ist sofort erkennbar, welche Person zu welcher Familie gehört. Was für die heutige Zeit durch die Verfügbarkeit von Urkunden und Familienbüchern noch einfach ist, kann bei der Zusammenführung von Familien in früherer Zeit zu einer echten Detektivarbeit ausarten. Häufig ist es nicht sofort ermittelbar, welche Person denn nun der Vater einer bestimmten Familie ist. Somit ist die Verknüpfung von Personen nicht mehr fest vorgegeben. Dieser Sachverhalt führt dazu, daß man die Ahnen nicht mehr als fest vorgegeben, sondern als “unscharf” bezeichnen kann.
Problembereich : Informationen
Nicht immer sind für die Personen aus den vergangenen Jahrhunderten die Daten der Geburt oder des Todes bekannt. Häufig benötigt man zusätzliche Informationen, um die Person eindeutig zu identifizieren. Hierzu gehören z.B. Steuer- und Finanzlisten, Immatrikulationslisten, uvm. Somit muß also die Möglichkeit bestehen, diese zusätzlichen Informationen zu verwalten und bei Bedarf abzurufen.
Lösungen
Die Problemstellungen sind eigentlich seit Veröffentlichung der ersten Genealogieprogramme bekannt. Allerdings wurden Programme erstellt, die die grundlegenden Merkmale der Genealogie verwalten konnten. Diese Kompromißlösungen, von uns als konventioneller oder traditioneller Ansatz bezeichnet, ist auch heute noch die Grundlage der gängigen Genealogieprogramme. Das Prinzip dieser Programme basiert darauf, die wesentlichen Punkte zu realisieren und die Sonderfälle entweder unter den Tisch fallen zu lassen oder im Rahmen von Zusatz- oder Textfeldern zu verwalten. Dies war auch der Ansatz in unserem ersten Familienforschungsprogramm 1985.
Was passiert aber mit genealogischen Informationen, die z.B. in Textfeldern untergebracht wurden? Dies liegt auf der Hand: nur durch genaues Durchlesen der Textinformation erhalte ich die notwendigen genealogischen Hinweise. Angaben zu Paten oder Trauzeugen, weitere Namen oder Krankheiten werden hier zwar zusammengefaßt, aber es besteht i. d. R. keine Möglichkeit mehr, diese Information qualitativ auszuwerten. Man kann zwar durchaus nach den Inhalten dieser Textfelder suchen, aber eine automatische Zuordnung der Informationen ist nicht mehr möglich. Vielmehr ist alles ein einheitlicher Informationsbrei, in dem zwar Begriffe wiederauffindbar sind, aber man kann nicht mehr sagen, was das im Ursprung einmal war. Somit wären nur einfachste soziologische Auswertungen mit einem derartigen Datenbestand denkbar. Die Suche nach diesen Werten ist zwar theoretisch möglich, aber wie sieht den der Sucherfolg und vor allem die Suchzeit aus, wenn einmal Datenbestände von mehreren tausend Datensätzen durchsucht werden müssen?
Daher muß ein völlig neuer Ansatz zur Verwaltung genealogischer Daten verwendet werden, der die Qualität der Information berücksichtigt. Der Vorteil in der qualitativen Zuordnung liegt auch in der Zukunftsicherheit der erfaßten Daten. Je detaillierter das Genealogieprogramm in der Lage ist, die Information qualitativ zuzuordnen, desto hochwertiger kann eine spätere Auswertung oder Übertragung in andere Systeme erfolgen.
Wie dieses Datenkonzept im Laufe der Zeit entwickelt wurde und welche Möglichkeiten dahinter stecken, wird in den nachfolgenden Kapiteln beschrieben.
Datenkonzeptionen
Seit 1985 beschäftigen wir uns mit der Verwaltung genealogischer Daten auf dem IBM PC. Es versteht sich von selbst, daß die ersten Ansätze der Datenverwaltung sehr konventionell ausgerichtet waren und im wesentlichen die grundlegenden genealogischen Informationen verwaltet wurden. Dies ließ sich zur damaligen Zeit auf dem IBM PC wohl am besten in Dbase kompatiblen Datenstrukturen lösen. Diese “Datenbank” war in verschiedenen Preisklassen verfügbar und schon 1985 ein weltweit anerkannter, wenn auch nicht immer geliebter, Standard.
Die verschiedenen Datenkonzepte werden in diesem Teil ausführlich beschrieben und die Vor- und Nachteile herausgearbeitet. Auf diese Weise wird m. E. der Vorteil moderner Datenkonzepte besonders deutlich.
Begriffsklärung
In diesem Artikel werden viele Begriffe verwendet, die vielleicht nicht jedem Leser verständlich sind. Daher sollen einige der schwierigen Begriffe durch Analogien verdeutlicht werden :
Begriff │ Beschreibung ──────────┼────────────────────────────────────── Datei │ Karteikasten Datensatz │ Karteikarte Felder │ Feld auf einer Karteikarte
Der genealogische Datensatz
Die wohl einfachste Verwaltung genealogischer Daten, die denkbar ist, wird in einer Datenverwaltung realisiert, die ausschließlich aus Personendatensätzen besteht. Dies ist also eigentlich nichts anderes, als daß alle Informationen, die zu einer Person bekannt sind, auf eine Karteikarte geschrieben werden.
Dies ist auch in der Regel die Form, in der die genealogischen Informationen in einem manuellen Ablagesystem verwaltet werden.
Anmerkung : Alternativ gibt es einen Ansatz, der auf Familien aufbaut. Ich verwende in diesem Artikel den Personenkartei-Ansatz, da er etwas einfacher und leichter zugänglich ist. Dennoch unterscheiden sich beide Ansätze grundsätzlich nicht.
┌────────────────────────────────────────────────────────────────────┐
│ Personenkarte │
├────────────────────────────────────────────────────────────────────┤
│ Personennummer 1 │
├────────────────────────────────────────────────────────────────────┤
│ Name Hermann Müller │
│ │
│ * 15.12.1734 in Mülheim │
│ │
│ ~ 19.12.1734 in Broich │
│ │
│ + 22.10.1789 in Essen │
│ │
│ ± 26.10.1789 in Essen, Zentralfriedhof │
│ │
│ Vater 2 : Heinrich Rheinhard Müller │
│ Mutter 3 : Gerda Engel Elisabeth Maria Tugmann │
│ │
│ ∞ 5.1.1755 in Essen │
│ 10 : Katharina Gudrun Karl │
└────────────────────────────────────────────────────────────────────┘
Diese oder sehr ähnliche Karteikarten dürften sich bei vielen Genealogen finden lassen. Der Vorteil dieser Organisation liegt in der Überschaubarkeit auch bei manueller Pflege der Informationen.
Allerdings ist diese einfache Lösung mit sehr vielen Einschränkungen belastet. Desweiteren werden die verfügbaren Informationen äußerst ineffektiv verwaltet. Der Vorteil liegt in der recht einfachen Beauskunftung der vorhandenen Daten.
Eigentlich kann jeder interessierte Laie mit (z.B. dBase III, dBase IV oder Paradox) ein Genealogieprogramm entwerfen, das auf einem genealogischen Datensatz aufbaut. In unserem Beispiel halten wir die verwalteten Informationen in einem erträglichen Rahmen.
Verwaltbare Informationen
Personennummer Persönliche Daten : Geschlecht, Konfession Nachname, Vorname Geburtsdatum mit Ort, Taufdatum mit Ort Sterbedatum mit Ort, Begräbnisdatum mit Ort Verweis auf Eltern : Personennummer des Vaters Verweis auf Ehen : Personennummer Ehepartner Heiratsdatum und Ort
Die Verknüpfung der Datensätze erfolgt ausschließlich über die Personennummer. Dieser Zugriff ist sehr einfach und man kann sehr schnell alle möglichen Listen/Auswertungen generieren.
Kritik
Die Nachteile dieser Verwaltung liegen auf der Hand :
-
Mehrfachehen lassen sich in unserem Beispiel gar nicht verwalten. Man könnte jedoch den Satz dahingehend erweitern, daß man die Felder Personennummer des Ehepartners und Heiratsdatum/Ort mehrfach im Datensatz anbietet. Wenn man nun z.B. 3 Ehen zuläßt, kann es aber sehr platzaufwendig werden, wenn man zusätzlich zu den Heiratsdaten die Verlobungsdaten, die standesamtlichen Heiratsdaten und die Scheidungsdaten aufnehmen möchte.
-
Der vorgeschlagene Datensatz ist vaterorientiert. Falls der Vater unbekannt aber die Mutter bekannt ist, muß man einen leeren Personensatz generieren, um den Verweis auf die Mutter zu realisieren. Dies könnte dahingehend umgangen werden, indem man ein zusätzliches Feld Personennummer der Mutter aufnimmt.
-
Jede zusätzlich aufzunehmende Information läßt den Datensatz endgültig explodieren. Wie wäre es z.B. mit Krankheiten, Todesursache, Straßen bzw. Hausnummern, … Man erkennt, daß diese Verwaltungsart keine Lösung genealogischer Probleme ist. Allerdings reicht dieser Datensatz völlig aus für jemanden, der wenige hundert Datensätze zu verwalten hat.
Außerdem ist diese Lösung leicht überschaubar und als Übungsfeld zur Entwicklung eines Genealogieprogramms nicht ohne Reiz. Wenn man die grundlegende Verwaltung erstellt hat, so könnte man z.B. sehr einfach die Paten und Trauzeugen in den Datensatz integrieren.
Die einfache genealogische Datenstruktur
Dies war auch der Ausgangspunkt der ersten GENprofi Programme. Der wesentliche Unterschied liegt darin, daß die Personen- und Familiendaten getrennt werden, d.h. in verschiedenen Dateien organisiert. Hierdurch erreicht man eine effizientere Datenorganisation und die Beauskunftung der Daten erfolgt erheblich schneller.
Eigentlich ist die einfache genealogische Datenstruktur die Lösung, wenn man ad hoc die genealogischen Informationen auf Personen und Familien aufteilt. Man könnte diesen Ansatz als 0. Normalisierung ansehen. Hierbei bezieht sich der Begriff “Normalisierung” auf die Separierung von Informationen. In der Genealogie haben wir es nunmal mit Personen und Familien zu tun. Was liegt also näher, als diese beiden Datenbereiche zu trennen? Auf diese Weise hat man eine einfache Ordnung geschaffen und nicht unmittelbar zusammengehörende Informationen getrennt.
Auf diese Weise kann man jeden Bereich für sich erweitern und die Übersicht bleibt erhalten. Im Vergleich zum genealogischen Datensatz erreicht man hiermit auch eine effizientere Speicherung der genealogischen Information. Somit kann man also festhalten, daß mit einer Normalisierung eine Trennung in eigenständige Bereiche (Objekte) und damit auch zwangsläufig eine effektivere Speicherausnutzung erfolgt.
Verwaltbare Informationen
Personendatei :
Personennummer Persönliche Daten : Geschlecht, Konfession Nachname, Vorname Geburtsdatum mit Ort, Taufdatum mit Ort Sterbedatum mit Ort, Begräbnisdatum mit Ort
Familiendatei :
Familiennummer Personennummer des Vaters Personennummer der Mutter Familieninformationen Verlobungsdatum mit Ort, Heiratsdatum mit Ort Scheidungsinformationen Personennummer 1. Kind Personennummer 2. Kind … Personennummer 15. Kind
Diese Form (Dies entspricht natürlich nur in der Grundidee der damaligen GENprofi Struktur.) der Datenverwaltung wurde von GENprofi 1985 zur Verwaltung genealogischer Informationen verwendet. Auch heute gibt es viele Genealogieprogramme, die auf diesem Strukturansatz aufbauen.
Kritik
-
Die Erweiterung der Datensätze um weitere Informationen führt leider immer noch, wie schon in dem genealogischen Datensatz, zu sehr großen Datensätzen. Allerdings hat dieser Ansatz schon erhebliche Vorteile gegenüber dem Ansatz des genealogischen Datensatzes.
-
Die Organisation der Mehrfachehen und der Kinder ist nicht ideal. Dies kann aber durch einen kleinen Trick verbessert werden (Dieser Trick wurde ab 1986 in GENprofi Programmen verwendet. Man führte einfach weitere Felder in den Familiensatz ein. Diese Felder enthielten den Verweis auf die vorherige Ehe bzw. nächste Ehe des Ehemannes und der Ehefrau und auf das erste Kind dieser Familie. In der Personendatei wurden Felder für die erste Ehe, sowie für die älteren/jüngeren Geschwister eingeführt. Dies erhöhte zwar den Programmieraufwand erheblich, erlaubte aber, ohne große Änderungen in der Grundstruktur, Mehrfachehen und Kinder effizient zu lösen. Desweiteren war durch diese Zusatzinformationen der Zugriff auf die Familien erheblich schneller geworden.).
-
Paten und Trauzeugen können immer noch nicht verwaltet werden.
-
Adoptivkinder können nicht integriert werden.
Um Speicherplatz zu sparen, wurde bereits 1986 in den GENprofi Programmen ein Ortsregister integriert. Hierdurch wurde die einfache genealogische Datenstruktur erweitert, ohne jedoch an den Grundfesten dieser Struktur zu rütteln. Der Vorteil des Registers liegt einfach in der sicheren Eingabe der Orte und in den erheblichen Einsparungen im Platzbedarf auf dem Datenträger. Dies könnte man bereits, mit etwas Wohlwollen, als 1. Normalisierung verstehen, wenn auch der Ansatz des Ortsregisters nicht aus Normalisierungsgründen sondern aus Speicherplatzgründen erfolgte.
Dennoch soll dieser Ansatz mit der Trennung der Orte näher beleuchtet werden, da hierdurch die weitere Entwicklung leichter nachvollziehbar ist.
Zu Beginn dieses Abschnitts haben wir den genealogischen Datensatz aufgeteilt in Personen und Familien. Die Begründung für diesen Weg lag darin, daß diese beiden Bereiche unterschiedliche Daten aufnehmen müssen. Die Aufspaltung brachte also erhebliche Vorteile.
Wenn man die Ortsangabe nicht nur auf den Ortsnamen beschränkt, sondern auch noch das Länderkennzeichen, die Postleitzahl, geographische Ortskoordinaten, usw. mit berücksichtigt, so wäre eine Pflege der Ortswerte innerhalb der Personendaten unpraktisch. Insbesondere wenn man berücksichtigt, daß die Familienforschung in der Regel auf einige Orte beschränkt ist.
Somit liegt es also nahe, die Orte, genauso wie vorher schon die Familien und Personen, zu separieren. Wir haben also wieder eine Straffung der verwendeten Struktur und der Umfang der Ortsdefinition hat keinerlei Einfluß auf die restlichen genealogischen Bereiche.
┌───────────────────────────────────────────┐
│ Liste der Objekte der einfachen │
│ erweiterten genealogischen Datenstruktur │
├───────────────────────────────────────────┤
│ Personen │
├───────────────────────────────────────────┤
│ Familien │
├───────────────────────────────────────────┤
│ Orte │
└───────────────────────────────────────────┘
Dieses Verwaltungskonzept ist nun aber nicht mehr ohne Computer zu verwenden. An der Stelle, an der bisher der Ort eingetragen wurde, werden computerintern nur noch Verweisnummern hinterlegt. Der Anwender bemerkt von diesen Verweisen nichts.
Die genealogische Datenstruktur von GENprofi II
Das wesentliche Manko der einfachen genealogischen Datenstruktur liegt in großen Datensätzen, wenn man anfängt, zusätzliche Informationen den verschiedenen Personen und Familien zuzuordnen (Dies endet dann in unübersichtlichen Datenstrukturen. Siehe GENprofi II Version 1.0.).
Natürlich könnte man zusätzliche Informationen in sogenannten Textfeldern unterbringen (die werden wohl von jedem Genealogieprogramm angeboten), allerdings kann man diese Textfelder nur sehr schlecht auswerten. Daher wurde 1991 für GENprofi eine völlig neue Datenstruktur für die genealogische Datenverwaltung entwickelt (Dies betrifft das Familienforschungsprogramm ab Version GENprofi II 2.0.). Dies war natürlich nur sinnvoll, weil in den letzten Jahren die Rechnerleistung bei erschwinglichen Preisen enorm zugenommen hat. Die genealogischen Informationen wurden auf folgende Objekte reduziert (2. Normalisierung):
┌────────────────────────────────┐
│ Personen │
├────────────────────────────────┤
│ Familien │
├────────────────────────────────┤
│ Namen │
├────────────────────────────────┤
│ Vornamen │
├────────────────────────────────┤
│ Zeit- und Ortsinformationen │
├────────────────────────────────┤
│ Berufe │
├────────────────────────────────┤
│ Titel │
├────────────────────────────────┤
│ Orte │
└────────────────────────────────┘
Was wurde hier nun eigentlich gemacht? Im wesentlichen wurde der Gedanke der einfachen erweiterten genealogischen Datenstruktur aufgenommen und nochmals verbessert. Was für die Orte gilt, kann man teilweise auf die Namen und Vornamen übertragen. Der Ansatz, der bisher für die Orte angenommen wurde, wird dahingehend erweitert, daß man ein zusätzliches Objekt einführt. Grundlage hierfür ist die Überlegung, daß genealogische Sachverhalte aus einem Datum und einem Ort bestehen :
Geburtsdatum Geburtsort Konfessionsdatum Konfessionsort Zeitraum Wohnort Prüfungsdatum Prüfungsort erworbener Titel Todesdatum Ort Todesursache Begräbnisdatum Ort Friedhof usw.
Dieser Datenbereich wird nun “Zeit-Ort-Information” (= Sachgebiet) genannt und enthält im ersten Ansatz das Datum, den Ort (natürlich nur den Verweis auf den Ort) und ein Kennzeichen, um was für eine Information es sich handelt; also Geburts- oder Sterbeinformation, etc.
Wieder erhalten wir ein unabhängiges Objekt, das unabhängig von anderen Bereichen erweitert werden kann. Somit liegt es also nahe, die Grundlage für die Erfassung von genealogischen Quellen zu schaffen. Hierzu wird einfach die “Zeit-Ort-Information” um die Möglichkeit erweitert, die Originaltexte, Kommentare und Bemerkungen aufzunehmen.
Um es nochmals zu verdeutlichen : Ein Genealogieprogramm, das auf genealogischen Datenstrukturen aufbaut, gibt dem Anwender die Möglichkeit, die Zeit-Ort-Informationen selbständig zu erweitern und zu ergänzen. Somit ist es also möglich, auf die verschiedensten Ereignisse verschiedenster Religionen zu reagieren (als Beispiel diene die einfache Einbindung der Siegelungsinformationen der Mormonen in das GENprofi Familienforschungsprogramm). Diese Zeit-Ort-Informationen werden im GENprofi Familienforschungsprogramm als Sachgebiete bezeichnet.
Mit Hilfe dieser komplexen Struktur ist nun folgendes möglich :
-
jeder Person können beliebig viele Namen zugeordnet werden
-
jeder Person können beliebig viele Vornamen (Aus Einfachheitsgründen wurde dies programmintern auf 35 Vornamen beschränkt, allerdings können auch Doppelvornamen angelegt werden.) zugeordnet werden
-
jeder Person können beliebig viele Zeit-Ort-Informationen zugeordnet werden, hierzu gehören u.a. Geburtsdaten, Taufdaten, Sterbedaten, Krankheiten, Ausbildung, Laufbahn, Todesursache, Heimatorte, vererbte Heimatorte, militärische Auszeichnungen
-
Berufe und Titel können innerhalb der Zeit-Ort-Informationen zugeordnet werden, hierdurch wird eine Berufsbildforschung vereinfacht.
-
jede Person kann zu anderen Personen in Beziehung gesetzt werden (Dies gilt zur Zeit bei GENprofi nur für Paten.). Hiermit ist das Patenproblem, aber auch die Vormundschaft o.ä. gelöst.
-
jeder Familie können beliebig viele Zeit-Ort-Informationen zugeordnet werden, hierzu gehören u.a. Verlobungsdaten, Heiratsdaten, Scheidungsinformationen, Wohnorte, Siegelungen
-
jede Familie kann zu Personen in Beziehung gesetzt werden. Hiermit sind die Kinder, Eltern, Adoptivkinder, Trauzeugen etc. gemeint.
Zur besseren Verdeutlichung der Zusammenhänge sollen die einzelnen Objekte und ihr Zusammenhang graphisch dargestellt werden :
┌──────────┐
┌────<─────────────┤ Familien ├──────┐
│ └────┬─────┘ │
│ │ │
│ ┌────────>────────────┘ │
│ │ │
┌──┴─┴─────┐ ┌──────────┐ │
│ Personen ├────┬──>──┤ Namen │ │
└─┬────┬─┬─┘ │ └──────────┘ │
│ │ │ │ │
│ │ │ │ ┌──────────┐ │
└─>──┘ │ └──>──┤ Vornamen │ │
│ └──────────┘ │
│ │
│ ┌──────────┐ │
└─────────>──┤ Zeit/Ort ├───<──┘
└──┬┬┬─────┘
│││ ┌────────┐
││└──────>──────┤ Orte │
││ └────────┘
││ ┌────────┐
│└───────>──────┤ Berufe │
│ └────────┘
│ ┌────────┐
└────────>──────┤ Titel │
└────────┘
Die Leistungsfähigkeit der neuen Datenstruktur erwies sich bereits in einigen neuen genealogischen Problemstellungen. Mit zunehmenden Möglichkeiten der genealogischen Datenverwaltung wurde an uns das Problem der Verwaltung von Adelszusätzen herangetragen.
Das Problem der Adelszusätze liegt in der geschlechts- bzw. hierarchiespezifischen Zuordnung der Zusätze :
-
Geschlecht männlich Baron, Freiherr, Graf, Prinz, König,
-
Geschlecht weiblich Baronin, Baronesse, Freifrau, Freiin, Gräfin, Prinzessin, Königin, königliche Prinzessin,
-
Hierarchie Prinz -> Erbprinz Fürst -> regierender Fürst,
Das besondere an diesen Zusätzen ist die Zuordnung zu den Personen und nicht etwa zum Namen. Desweiteren handelt es sich hierbei nicht um Titel im GENprofi Sinn. In der GENprofi Struktur lassen sich diese besonderen Namenszusätze einwandfrei verwalten ohne widersprüchliche Datenkonstrukte zu erzeugen.
Wenn man die Entwicklung der genealogischen Datenstruktur aufmerksam verfolgt hat, so liegt der wesentliche Vorteil in der Normalisierung. Die Aufgabe bestand also darin, möglichst viele unabhängige Datenbereiche in der Genealogie zu entdecken. Auf diese Weise haben wir ein sehr flexibles und zukunftsicheres Konzept zur Verfügung. So können die Teilbereiche einfach erweitert werden, ohne am Gesamtsystem zu rütteln.
Fazit und Ausblick
Sie haben sicherlich erkannt, welche Möglichkeiten genealogische Datenstrukturen einem Genealogieprogramm bieten. Der freie Ansatz und die Aufteilung in Objekte erlaubt es uns, GENprofi zu erweitern, ohne alle Anwender mit diesen Erweiterungen zu belasten. Aber auch völlig neue Lösungen in der Datenverwaltung sind verfügbar und einzeln auswertbar.
Beispiel: Wieviele Personen im Datenbestand sind gefallen? Wieviele Personen im Datenbestand sind vermißt?
Beide Angaben sind in GENprofi separat zu verwalten. Trotzdem behandelt das Programm diese Informationen transparent, so daß in der Benutzung und Anzeige diese Einträge zu “normalen” Sterbeeinträgen gleichbehandelt werden.
Genealogische Quellenarbeit
Die bisherige Trennung von Kirchenbuchverkartungsprogrammen und Familienforschungsprogrammen hat mit der Einführung genealogischer Datenstrukturen ein Ende gefunden. Da für jeden Eintrag, z.B. Taufeintrag, Steuerlisteneintrag, die Möglichkeit besteht, den Originaltext und Kommentare zu hinterlegen, werden die wesentlichen Leistungen eines Verkartungsprogramms automatisch abgedeckt. Es besteht sogar die Möglichkeit, das Originalregister in der ursprünglichen Reihenfolge auszudrucken!
Graphik
Die Möglichkeit, Computergraphiken den Datenbeständen zuzuordnen, fällt im Rahmen der flexiblen genealogischen Datenstruturen besonders leicht. Hiermit kann man z.B. Fotos der Person hinterlegen oder im Rahmen der Quellenarbeit auch Originale hinterlegen. GENprofi kennt eigentlich keine Grenzen, wieviele Bilddokumente pro Person hinterlegt werden können.
Wahrscheinliche Verknüpfungen
Der Reiz der Genealogie liegt darin, daß man häufig mit detektivischer Kleinarbeit die tatsächlichen Familienangehörigen ermitteln muß. Hierbei kann es durchaus vorkommen, daß mehr als ein Kandidat z.B. für den Ehemann in Frage kommt. Es müßte also eine Möglichkeit geschaffen werden, daß mehrere Personen Verküpfungsstellen besetzen können. Diese Möglichkeit wird aber in der Realisierung noch etwas auf sich warten lassen, da die Konsequenzen sehr weitreichend sind. So kann man in diesen Fällen u. a. nicht mehr einfach eine Ahnentafel generieren, muß doch vorher gefragt werden, für welche der möglichen Väter die Ahnen weiter ermittelt werden sollen.
Denkbar wäre eine Lösung, Alternativ-Stammfolgen zu ermöglichen, bei denen die Fragwürdigkeit oder Wahrscheinlichkeit - eventuell in % - gekennzeichnet werden könnte.
Weiterführende Artikel
“Warum die Computergenealogie Ahnen als unscharfe Mengen behandeln sollte” Dr. Volkmar Weiss, Deutsche Zentralstelle für Genealogie, Leipzig erschienen in : Computergenealogie, Sonderheft II 1994, S. 4ff
“Datenkonzepte in der Genealogie” Heiko Thimm erschienen in : Computergenealogie, 10/1994, Heft 30/31, S. 82ff
Anmerkung: Das GENprofi Familienforschungsprogramm wurde mittlerweile überarbeitet, so daß einige von den in diesem Artikel angekündigten Funktionen bereits realisiert sind. So sind mittlerweile Kosenamen und wahrscheinliche Vornamen, sowie eine zusätzliche Anzahl von festen Aliasen verwaltbar.
Kopien der Artikel können bei uns angefordert werden. Bitte legen Sie einen an Sie adressierten und mit DM 3,– frankierten A5 Rückumschlag bei.
Die Ausgaben der Computergenealogie erhalten Sie bei :
Redaktion COMPUTERGENEALOGIE
Herrn
Dr. Günter Junkers
Bergische Landstr. 210
51375 Leverkusen Tel: 0214-502005
Beachten Sie auch die OnLine Dokumentation zu den “Leitwerten”. Dieses Suchkonzept ist ohne die Verwendung genealogischer Datenstrukturen undenkbar.