Aktuelle Arbeiten
Ich war einmal voreilig, was die Behauptung anbelangte, alle Akten wären erfasst. Bearbeitet (Metallteile entfernen) ja, aber nicht in meiner "Datenbank", i.e. Tabelle. Beim Korrekturlesen (Schreibfehler! Korrekturen von Ortsnamen !! und ich habe bestimmt noch etliche übersehen, ich bitte um Entschuldigung) ist mir das aufgefallen, und ich trage die vergessenen nach, weshalb ich aktuell ca. 1480 Antragsteller erfasst habe. Wahrscheinlich werden es noch mehr als 1500.
Zum Korrekturlesen:
Zu Beginn der Erfassung habe ich nicht die Entschädigungsämter mit aufgenommen (siehe auch den Beitrag vom 15.4.), weiß der Himmel, warum, und deshalb muss ich sie noch nachtragen. Bedeutet, das ich nochmal alle Akten durchblättern darf. Dabei habe ich festgestellt, dass ich doch auch andere Informationen nicht erfasst habe, wahrscheinlich, weil sie für die Erreichung der damaligen Ziele nicht notwendig waren, dazu gehören die genannten Entschädigungsämter. Oder ich dachte, die Inhalte wären nicht interessant genug für eine Auswertung und ich habe sie nicht näher beschrieben. Weshalb ich alle Akten noch einmal durchgehen darf, ein paar hundert habe ich schon. Aber jetzt mit einem anderen Blick, was interessant ist/sein könnte.
Weiter muss(te) ich die Angaben zu den Antragstellern standardisieren, um eine automatisierte Auswertung zu ermöglichen. Die wurden so ergänzt:
vorher:
Tenenbaum, Jakob | KZ | Gesundheit | 20.10.1921 Beuthen/Deutschland. | Krakau, 12/1939 Zwangsarbeit/Judenstern, 3/1941-12/1942 Ghetto Krakau, 12/1942-8/1944 Krakau/Plaszow, 8/1944 Mauthausen #87178, -5/1945 Linz (Herman-Göring-Werke), Stuttgart, Mannheim, 1947 USA | ITS 253720. Mandant hat falsche Angaben im KZ gemacht: Vorname Hirsch, Geb-datum 18./19./20.10.1923, um sich jünger zu machen. | Arolsen: Häftlingsunterlagen Mauthausen, Nachkriegsdatei. USHMM: Ghetto Krakau. Eidesstattliche Erklärung, Aktenauszug, Zeugen, Bescheide, Klagen | Stuttgart ES 28198 1965-1970
nachher
Tenenbaum, Jakob | KZ | 2Gesundheit | 20.10.1921 Beuthen/Deutschland. Krakau, 12/1939 Zwangsarbeit/Judenstern, 3/1941-12/1942 Ghetto Krakau, 12/1942-8/1944 ZAL/KZ Plaszow, 8/1944 KZ Mauthausen #87178, -5/1945 KZ Mauthausen/Linz (A: Herman-Göring-Werke), Stuttgart, Mannheim, 1947 USA |
ITS 253720. Mandant hat falsche Angaben im KZ gemacht: Vorname Hirsch, Geb-datum 18./19./20.10.1923, um sich jünger zu machen. |
Arolsen: Häftlingsunterlagen Mauthausen, Nachkriegsdatei. USHMM: Ghetto Krakau. EE, AA, Zeugen, Bescheide, Klagen | Stuttgart ES 28
198 1965-1970
lies: KZ Hauptlager/Nebenlager, KZ Hauptlager, A: Arbeiten laut Aussage, ZAL: Zwangsarbeitslager.
ermöglicht mir die Erstellung folgenden Datensatzes:
Buchenwald (93): Allendorf, Altenburg, Berga, Berga-Elster, Crawinkel, Elsnig, Halberstadt, Holzen, Langenstein, Laura, Laurahuette, Leipzig, Leipzig-Schoenefeld, Magdeburg, Markkleeberg, Meuselwitz, Neustadt, Niederorschel, Nordhausen, Ohrdruf, Rehmsdorf, Schlieben, Sonneberg-West, Zwiberge
lies: 93 Antragstellerinnen und Antragsteller waren im KZ Buchenwald bzw. einem der genannten Außenlager.
Außerdem kann ich jetzt die zu verrichtenden Zwangsarbeiten auflisten:
35 Munitionsfabrik HASAG, 15 Munitionsfabrik, 6 Flugplatz, 5 Steinbruch, 3 Strassenbau, 3 Schneiderressort, 3 Kohlegruben, 3 Flugzeugfabrik, 3 Aufraeumarbeiten.
allerdings ist hier die Standardisierung schwieriger.
Für technisch interessierte:
Ich habe keine Datenbank benutzt, es wäre wohl zu viel des Guten gewesen für die Handvoll von Datensätzen. Ich habe eine Standard-Tabellenkalkulation benutzt.
Ich speichere die Tabelle als Datei im csv-Format ab, und werte die Daten mit (Unix/Linux-) Shell-Skripts aus. Die bietet die wildesten Möglichkeiten zur Manipulationen von Daten im text-Format.
Das Beispiel für die Erstellung der Altersverteilung:
#!/bin/sh
# folgendes Datumsformat wird erwartet: d.m.yyyy, d.m.yyyy, dd.m.yyyy, d.mm.yyyy, dd.mm.yyyycd $HOME/Dokumente/ArbeiterArchiv/csv
case $# in
0) echo Aufruf $0 yyyymmdd 1>&2; exit ;;
1) VER=$1 ;;
esac
F=$HOME/Dokumente/ArbeiterArchiv/csv/listeAntragsteller_${VER}.csv
awk ' BEGIN { FS="\t"}; {print $4 }' $F | # Feld 4 ausgeben
sed 's/\([^ ]*[0-9]\).*/\1/' | # alles ab 1. blnk löschen
awk '
{count=count+1} # aufsummieren
$0 ~/188/ {c188++}
$0~/189/ {c189++}
$0~/190/ {c190++}
$0~/191/ {c191++}
$0~/192/ {c192++}
$0~/193/ {c193++}
END { print "<ul>"
{print "<li>1880-1889:", c188"</li>"}
{print "<li>1890-1899:", c189"</li>"}
{print "<li>1900-1909:", c190"</li>"}
{print "<li>1910-1919:", c191"</li>"}
{print "<li>1920-1929:", c192"</li>"}
{print "<li>1930-1939:", c193"</li>"}
{ print "</ul>"}
{print "Insgesamt: " count}
sum = c188 + c189 + c190 + c191 + c192 + c193
{print "gefundene Geburtstage: " sum }
}'
liefert folgende Ausgabe:
<ul>
<li>1880-1889: 17</li>
<li>1890-1899: 69</li>
<li>1900-1909: 166</li>
<li>1910-1919: 357</li>
<li>1920-1929: 501</li>
<li>1930-1939: 118</li>
</ul>
Insgesamt: 1483
gefundene Geburtstage: 1228
Es ginge wahrscheinlich auch ganz anders, ich habe nur meine Restkenntnisse zusammengekratzt.
Außerdem erleichtern die skripts bzw. deren Ausgabe die Suche nach Schreibfehlern, z.B. Darmstaft statt Darmstadt, oder Auschiwtz statt Auschwitz. Sind aber insgesamt noch genügend, denke ich. Leider.