Erstellung eines Scientific Use File "HIS-Absolventenpanel 1997"
HIS beabsichtigt, die Nutzung der von ihr erhobenen Daten durch die Wissenschaft systematisch und deutlich zu erleichtern. Dafür soll in einem Pilotprojekt ein sog. Scientific Use File erstellt werden.
Dieses Projekt verfolgt vier Ziele:
- Die Erstellung eines exemplarischen Scientific Use Files auf der Basis des Absolventenpanels 1997, das aufgrund der relativ aktuellen Daten (die zweite Befragung fand 2003 statt) und wegen der für 2007 angestrebten 3. Befragungswelle besonders geeignet erscheint.
- Die Vorbereitung aller Absolventenbefragungen für eine leichtere Vergleichbarkeit der Panels, die insbesondere Vereinheitlichungen (z. B. in den Variablenbezeichnungen) umfasst und Vorarbeiten für eine mögliche zukünftige Erstellung weiterer Scientific Use Files (z. B. der Absolventenpanels 1989, 1993, 2001) darstellt.
- Die Erarbeitung eines standardisierten Verfahrens zur Erstellung weiterer Scientific Use Files, um anhand von Richtlinien und Werkzeugen eine einfache, schnelle und kostengünstige Erstellung weiterer Scientific Use Files zu ermöglichen.
- Die (bessere) Einschätzung des mit der Erstellung von Scientific Use Files verbundenen personellen und zeitlichen Aufwands.
Die Arbeit in diesem Projekt gliedert sich in fünf Schwerpunkte:
- Die Anonymisierung der Datensätze, die insbesondere auf Anonymisierungsstrategien zielt, die eine Deanonymisierung einzelner Fälle unmöglich machen (z. B. durch Aggregation von Variablen oder Hinzufügen eines Zufallswertes zu einzelnen Variablen).
- Die Aufbereitung der Datendateien, damit sie ohne größere Schwierigkeiten von Dritten genutzt werden können.
- Die Dokumentation des Datensatzes anhand eines ausführlichen Codebuches, einer Beschreibung der Gewichtungsverfahren und einer kommentierten Literaturliste über die auf Basis des Datensatzes erstellten Veröffentlichungen.
- Die technische Erstellung der Datendateien im ASCII-Format, als Setup-Datei für STATA und in Formaten weiterer häufig verwendeter Statistikprogramme (SPSS, SAS).
- Die Anfertigung eines Handbuches zur Erstellung von Scientific Use Files aus HIS-Befragungsdaten, in dem Standards zur Dokumentation von HIS-Befragungen definiert und festgelegt sowie einzelne Arbeitsschritte und Verfahren im Detail beschrieben werden.
In dieses Projekt bezieht HIS verschiedene Instutionen, die bereits über Erfahrungen mit der Erstellung von Scientific Use Files verfügen, ein (ZUMA, Forschungsdatenzentrum des Statistichen Bundesamtes, Forschungsgruppe SOEP des DIW).
Das Projekt wurde im Sommer 2006 abgeschlossen. Das Scientific Use File wurde im Winter 2006/2007 an das Zentralarchiv für empirische Sozialforschung an der Universität Köln übergeben und ist dort nun verfügbar.
