Content

4 Daten und Methoden der Sekundäranalysen in:

Dirk Böpple

Berufseinmündung von Akademikern, page 145 - 184

Sequenzmuster der Übergänge zwischen Hochschule und Arbeitsmarkt

1. Edition 2017, ISBN print: 978-3-8288-3974-8, ISBN online: 978-3-8288-6839-7, https://doi.org/10.5771/9783828868397-145

Series: Wissenschaftliche Beiträge aus dem Tectum Verlag: Sozialwissenschaften, vol. 81

Tectum, Baden-Baden
Bibliographic information
4 Daten und Methoden der Sekundäranalysen Im nun folgenden Kapitel wird die verwendete Datengrundlage sowie deren Aufbereitung beschrieben. Hierzu werden zuerst allgemeine Informationen über die Daten und deren Erhebungs- und Aufbereitungsprozess dargestellt (Abschnitt 4.1). Auf die Beschreibung der Selektion der in dieser Arbeit fokussierten Akademiker aus der Gesamtstichprobe folgen die unterschiedlichen Aufbereitungsschritte der jeweils spezifischen Datenstrukturen zur Analyse der Prozess- und Ereignisstruktur des Übergangs von der Hochschule in die erste Erwerbstätigkeit. Dies geschieht vor allem in Hinblick auf die in Abschnitt 4.2 beschriebenen Methoden zur Durchführung der Sequenzmuster- und Ereignisanalysen. Diese Analyseverfahren korrespondieren mit den Charakteristika der Prozess- und Ereignisperspektive. Zudem werden die verwendeten Variablen beschrieben. 4.1 Datengrundlage Die Datengrundlage dieser Arbeit bilden die faktisch anonymisierten Daten der Erhebung ” Arbeiten und Lernen im Wandel“ (ALWA). Der Datenzugang erfolgte über ein Scientific Use File, das über das Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung zur Verfügung gestellt wurde.40 Die Grundgesamtheit für die Datenerhebung setzte sich aus allen in Deutschland lebenden Personen zusammen, die zwischen den Jahren 1956 und 1988 geboren wurden. Dabei war es unerheblich, welche Sprache diese sprechen, welcher Nationalität sie angehören oder welchen Erwerbsstatus sie besitzen. Die Stichprobenziehung erfolgte zweistufig, indem zuerst aus einer von den Statistischen Landesämtern bzw. dem Statistischen Bundesamt zur Verfü- 40 Projektnummer: 100683 145 gung gestellten Stichprobe 281 Sample Points (250 Gemeinden) gezogen wurden. Darauf basierend wurden die entsprechenden Einwohnermeldeämter gebeten, ” durch eine systematische Zufallsauswahl (Intervallziehung) aus den Einwohnermelderegistern eine Liste von Personenadressen der Geburtsjahrgänge 1956 bis 1988 zur Verfügung zu stellen“ (Antoni et al. 2010: 6). Aus diesem Adressbestand wurde wiederum anhand einer Zufallsauswahl eine Stichprobe von 152 Adressen pro Sample Point (das entspricht 42 712 Adressen) gezogen. Von diesen 42 172 Adressen konnten insgesamt 22 656 Telefonnummern recherchiert werden. Anhand dieser 22 656 Telefonnummern konnten im Zeitraum von August 2007 bis April 2008 mit 10 404 Personen Interviews durchgeführt werden, davon 10 177 Interviews in deutscher Sprache. Die Ausschöpfungsquote (bezogen auf die Adressstichprobe) liegt bei 24,4 Prozent und die Bruttostichprobe (bezogen auf die recherchierten Telefonnummern) bei 45,9 Prozent. Insgesamt liegen nach der Datenedition von 10 145 Befragten vollständige Längsschnittdatensätze vor (siehe Tabelle 4.1; vgl. zur Datenerhebung und -edition zusammenfassend Antoni et al. (2010)). Tabelle 4.1: Allgemeine Beschreibung der IAB/ALWA-Befragungsdaten Kategorie Beschreibung Untersuchungseinheit Personen der Wohnbevölkerung der BRD befragte Geburtsjahrgänge 1956 bis 1988 Erhebungszeitraum August 2007 bis April 2008 Fallzahlen 10 404 Interviews, davon 227 fremdsprachige Interviews und 10 177 deutschsprachige Interviews, davon 10 145 lückenlose Lebensverläufe Quelle: http://fdz.iab.de/de/FDZ Individual Data/ALWA/Outline/ALWA-Survey.aspx 146 4.1.1 Aufbereitung der Sekundärdaten Zur Eingrenzung der Untersuchungspopulation auf den gewählten Gegenstand des Übergangs zwischen Bildungs- und Beschäftigungssystem von Akademikern wurden in einem ersten Schritt jene Personen selektiert, die über einen Hochschulabschluss verfügen. Hierbei ist es unerheblich, ob der Abschluss an einer Fachhochschule oder einer Universität erlangt wurde. Jedoch werden Absolventen von Berufsakademien aus der Analyse ausgeschlossen, da die vergebenen Abschlüsse meist staatliche Abschlussbezeichnungen und damit keine akademischen Abschlüsse im engeren Sinn darstellen. Im Ausland erworbene akademische Abschlüsse werden berücksichtigt, sofern sie in Deutschland anerkannt wurden.41 In einem weiteren Schritt wurden für alle Personen monatsgenaue Bildungs-, Familien- und Erwerbsverläufe rekonstruiert, für die Informationen über einen Zeitraum von mindestens 72 Monaten (6 Jahren) nach dem ersten Hochschulabschluss vorliegen. Schlussendlich verbleiben nach dem Abgleich mit den gültigen Fällen der Bildungs- und Familienverläufe 1 566 Akademiker, davon 583 Personen mit Fachhochschulabschluss und 983 Personen mit Universitätsabschluss (siehe Tabelle 4.2; für eine eingehende Beschreibung des aufbereiteten Datensatzes siehe Tabelle A.1 im Anhang).42 4.1.2 Operationalisierung der Berufseinmündung als Prozess Um der Prozesshaftigkeit des Übergangs in die erste Erwerbstätigkeit Rechnung zu tragen, müssen nicht nur der Austrittszeitpunkt aus dem (Aus-) Bildungssystem und der Eintrittszeitpunkt in das Erwerbssystem bekannt 41 Es wurde zuerst geprüft, ob die Befragten die Anerkennung des ausländischen Abschlusses beantragt haben, und in einem zweiten Schritt, ob der Antrag bewilligt wurde. 42 Die erneute Reduktion der Fallzahl durch den Abgleich mit dem Bildungs- und Familienverlauf war notwendig, um die als unabhängige Variablen verwendeten Informationen zu Partnerschaftsverhältnissen und Kindern zum Zeitpunkt des Studienabschlusses zu erhalten (siehe Abschnitt 4.1.4). 147 Tabelle 4.2: Selektionsschritte der Untersuchungspopulation (Quelle: IAB/ALWA 2010; eigene Berechnung) Fallzahl nach Hochschulart Fachhochschule Universität Gesamt Gesamtstichprobe1 10 145 . . . davon besucht 1 172 2 287 . . . davon abgeschlossen 834 1 436 Akademiker gesamt2 2 196 . . . davon mind. 6 Jahren nach dem 1. Abschluss 671 1 134 Akademiker gesamt 1 805 . . . nach Abgleich mit Bildungsund Familienverläufen 583 983 Akademiker gesamt 1 566 1 Alle im Datensatz vorhandenen Personen. 2 74 Personen verfügen über einen Fachhochschul- und einen Universitätsabschluss. sein, sondern auch die Zustände und Episoden zwischen diesen Ereignissen (siehe auch Abschnitt 2.1.4). Dies stellt eigene Anforderungen an die Aufbereitung der Daten, die im folgenden Abschnitt kurz umschrieben werden. Um die gegebenen Daten mit Methoden der Sequenzmusteranalyse untersuchen zu können, müssen die relevanten Zustände der Übergangsphase überschneidungsfrei und inhaltlich trennscharf aufbereitet werden. Hierzu wurden die in den Daten kodierten 63 unterschiedlichen Zustände der Erwerbsdimension aus den jeweiligen Lebenslaufphasen (Schulbildung, Berufsvorbereitung, Berufsausbildung, Erwerbstätigkeit, Arbeitslosigkeit etc.) auf 21 Zustände reduziert. Dies ist zum einen aus rein pragmatischen Gründen sinnvoll und notwendig gewesen, da ein Zustandsraum mit 63 Zuständen kaum noch zu überblicken ist. Zum anderen sind einige der 63 Zustände aus verschiedenen Lebenslaufphasen nicht trennscharf bzw. in anderen Phasen genauer erfasst. Schlussendlich wurden die 15 in Tabelle 4.3 aufgeführten 148 Tabelle 4.3: Zustandsraum der Übergangsverläufe Zustand z Zustandsbeschreibung BA Berufliche Ausbildung M/T Meister/Techniker FH Fachhochschulstudium Uni Universitätsstudium Ref./A.i.P./Prom. Referendariat/Volontariat/Arzt im Praktikum/Promotion WB Berufliche Weiterbildung WD Wehrdienst/Zivildienst Praktikum Praktikum/Wissenschaftliche Hilfskraft Gering/ET Geringfügig Erwerbstätig Teil/ET Teilzeit Erwerbstätig Voll/ET Vollzeit Erwerbstätig BW Zeit-/Berufssoldat AL Arbeitslos/Arbeitsuchend EZ/Haus Erziehungszeit/Hausarbeit NE Nicht Erwerbstätig (Urlaub, Krank etc.) Zustände kodiert, da die restlichen 6 Zustände für den Übergang vom (Aus-) Bildungs- in das Erwerbssystem keine Rolle spielen (vor allem Zustände des schulischen Bildungsverlaufs, z. B. Grundschule oder Gymnasium). Die relevanten Zustände wurden monatsgenau erfasst und überschneidungsfrei aufbereitet, so dass lückenlose Informationen für 72 Monate nach dem ersten Hochschulabschluss vorliegen. Um die Verlaufsdaten in Sequenzdaten zu überführen, wurden diese mit Hilfe eines zweistufigen Verfahrens zum Splitten und anschließenden Kombinieren der Episoden überschneidungsfrei aufbereitet. Dabei wurden zuerst alle überschneidenden Episoden an ihren Schnittstellen getrennt und für die parallelen Teile der Episoden Mehrfachzustände vergeben. Daraufhin wurde für alle Episoden mit Mehrfachzuständen 149 entschieden, welche der überschneidenden Zustände entfernt werden sollen (siehe zur genauen Vorgehensweise und technischen Umsetzung Erhardt und Künster 2014). Bei der Auflösung der Überschneidungen mussten vor allem zwei Aspekte berücksichtigt werden: (1) die Relevanz der zu übernehmenden Zustände und (2) die Konsistenz der Verläufe. (1) Mit Relevanz ist gemeint, dass jenem Zustand der Vorzug gegeben wurde, der für die Untersuchung des Übergangs in die erste Erwerbstätigkeit von höherem Interesse ist. Ein erstes Entscheidungskriterium stellte dabei die Angabe dar, ob die entsprechende Tätigkeit hauptsächlich oder nebenher ausgeübt wurde. Sofern aufgrund dieser Angaben keine eindeutige Entscheidung getroffen werden konnte, wurde nach inhaltlichen Kriterien entschieden. So wurde bei einem gleichzeitigen auftreten der Zustände ” Universitätsstudium“ und ” geringfügige Beschäftigung“ das Studium kodiert, da eine geringfügige Beschäftigung während eines Studiums keine reguläre Beschäftigung darstellt und somit nicht als Ereignis einer ersten Erwerbstätigkeit nach dem ersten Studienabschluss gewertet wird. Ebenso wurde bei der Überschneidung eines Praktikums mit einer Teilzeiterwerbstätigkeit der Teilzeiterwerbstätigkeit der Vorzug gegeben. (2) Mit Konsistenz ist gemeint, dass durch das Auflösen der Überschneidungen keine ” Episoden-Artefakte“ entstehen dürfen. Ein Episoden-Artefakt kann entstehen, wenn die parallel verlaufenden Sequenzen nicht gleichzeitig beginnen und enden und durch die Entscheidung für oder gegen einen der überschneidenden Zustände der verworfene Zustand mit einer unrealistisch kurzen Episode daran anschließt, beispielsweise wenn eine hauptsächlich ausgeübte Teilzeiterwerbstätigkeit sowie ein nebenher absolviertes (Zweit-)Studium angegeben wurden. Dabei würde im Zeitraum der Überschneidung die Teilzeitbeschäftigung kodiert. Ist nun die Episode der Teilzeitbeschäftigung kürzer als die Studienepisode, kann es vorkommen, dass im Extremfall im Anschluss an die Teilzeitepisode eine einmonatige Studienepisode kodiert würde. Die Dauer dieses Zustands wäre jedoch nur aufgrund der Datenmodifikation entstanden; dies galt es zu vermeiden. 150 Folgende Entscheidungskriterien wurden angewendet: hauptsächlich/nebenher absolvierte Tätigkeit; bei mehreren Erwerbstätigkeiten wurde dem höheren Stellenumfang der Vorzug gegeben. Bei ungleichen Zuständen, die eine reguläre Erwerbstätigkeit und einen weiteren nicht regulären Erwerbstätigkeitszustand enthalten (geringfügige Beschäftigung, Praktikum, Erziehungszeiten, Studium etc.), wurde die reguläre Erwerbstätigkeit kodiert. 4.1.3 Operationalisierung der Berufseinmündung als Ereignis Für die Aufbereitung der Daten zur Analyse der Berufseinmündung als Ereignis wurden die nun lückenlosen und überschneidungsfreien Sequenzdaten in Spelldaten umgewandelt (vgl. Ritschard et al. 2009). Das relevante Ereignis stellt die erste reguläre Erwerbstätigkeit dar. Unter einer ” regulären“ Erwerbstätigkeit werden keine Ferienjobs, ehrenamtlichen Tätigkeiten oder Praktika verstanden. Hingegen wurden an ein erstes Staatsexamen anschließende Tätigkeiten wie Referendariate, Volontariate durchaus als ” reguläre“ Erwerbstätigkeiten angesehen, sofern sie mindestens den zeitlichen Umfang einer Teilzeit-Anstellung aufweisen. Auch wenn damit noch kein abschließendes Zertifikat zur Ausübung der mit diesem Berufsabschluss verbundenen Tätigkeit erreicht wurde, stehen diese Personen bereits in einem vergleichbaren Beschäftigungsverhältnis (z. B. angehende Lehrer als Beamte auf Zeit während des Referendariats, der Arzt während der Facharztausbildung). Auch qualitative Studien stützen die Annahme, dass die an eine erste akademische Ausbildung anschließenden Qualifikationsphasen von den ausübenden Personen bereits als Erwerbstätigkeit wahrgenommen werden (v. Felden und Schiener 2010). Ebenfalls als reguläre Erwerbstätigkeit wurde eine Promotion kodiert. Dies ist zum einen damit zu begründen, dass aus der Datenlage bzw. dem Antwortverhalten der Befragten nicht in allen Fällen eindeutig identifizierbar war, ob es sich bei der angegebenen Promotion um eine medizinische Promotion handelt oder um eine nicht-medizinische Promotion. Diese Unschärfe kommt zustande, da in den gemachten Angaben 151 stellenweise nicht zwischen einer Facharztausbildung und einer Promotion eindeutig unterschieden wurde. Daher wurden die Tätigkeitsfelder, die im Sinne einer Weiterqualifizierung nach einem ersten akademischen Abschluss folgen, zusammengefasst. Hierunter fallen vor allem Tätigkeiten, die zu zweiten und dritten Staatsexamina führen, eine Facharztausbildung und eine Promotion. Weiterhin wurden Teilzeit- und Vollzeitbeschäftigungen als erste Erwerbstätigkeit definiert; geringfügige Beschäftigungen und mithelfende Familienangehörige jedoch nicht. Zeit- und Berufssoldaten wurden als regulär Erwerbstätige kodiert. Somit werden folgende Zustände als Ereignis definiert: – Referendariat/Volontariat/A. i. P. bzw. Facharztausbildung/Promotion – Teilzeit Erwerbstätigkeit – Vollzeit Erwerbstätigkeit – Zeit-/Berufssoldat Da das interessierende Ereignis der folgenden Analysen der Antritt der ersten regulären Erwerbstätigkeit nach dem Studienabschluss ist, werden die Ereignisdaten als ” Single-Spell/Single-Event“ Daten aufbereitet (vgl. Blossfeld et al. 2007: 49–53). Nach Ausschluss der Personen, die nahtlos nach dem Studium in die erste Erwerbstätigkeit übergehen (1 062 Fälle), verbleiben noch 504 Personen mit einer Zeitspanne von mindestens einem Monat zwischen Abschluss des ersten Tabelle 4.4: Aufbereitung der Ereignisdaten (Quelle: IAB/ALWA 2010; eigene Berechnung) Fallzahl Akademiker gesamt1 1 566 . . . davon mit direktem Ereignis 1 062 . . . verbleibende Fälle mit Dauer > 0 Monate 504 . . . davon Fälle mit Ereignis im Beobachtungszeitraum2 465 . . . und Fälle ohne Ereignis im Beobachtungszeitraum2 39 1 Alle auf Akademiker reduzierten Fälle (vgl. Tabelle 4.2). 2 Der Beobachtungszeitraum umfasst 72 Monate nach dem ersten Studienabschluss. 152 Hochschulstudiums und Antritt der ersten Erwerbstätigkeit. Von diesen 504 Personen erleben innerhalb der ersten 6 Jahre nach Studienabschluss lediglich 39 Personen kein Ereignis (siehe Tabelle 4.4). 4.1.4 Aufbereitung der abhängigen Variablen Zur Überprüfung der im späteren Abschnitt 5.1 formulierten Hypothesen bzw. Problemstellungen werden die im Folgenden beschriebenen abhängigen Variablen benötigt (in Klammern sind die jeweils korrespondierenden Analyseverfahren genannt): – Turbulenz der Übergangsverläufe (OLS-Regression) – Cluster der Übergangsmuster (multinomiale logistische Regression) – Dauer zwischen Studienabschluss und erster Erwerbstätigkeit (Ereignisanalyse) – Nahtloser Übergang in die erste Erwerbstätigkeit (logistische Regression) Um die Hypothesen zum Grad der Individualisierung und (De-)Standardisierung von Übergängen zu untersuchen, wird auf die in Abschnitt 4.2.2 eingehender beschriebenen Konzepte der Komplexität bzw. Turbulenz hingewiesen. Diese Maßzahlen werden ebenfalls im Rahmen der Sequenzmusteranalysen berechnet und sind als normierte metrische Variablen operationalisiert. Für die Analyse des Übergangs in einer Prozessperspektive werden im Rahmen von Sequenzmusteranalysen unterschiedliche Typen von Übergangsverläufen erstellt, die anschließend als abhängige Variablen verwendet werden. Hierbei werden sowohl Cluster zum direkten Übergang als auch zum längerfristigen Verbleib erstellt (siehe ausführlich Abschnitt 4.2.1). Da es sich hierbei um ein exploratives Verfahren handelt, können noch keine Aussagen über die konkrete Ausgestaltung dieser Variable getroffen werden. Eine Einschätzung der erwarteten Übergangscluster erfolgt in Abschnitt 5.1. 153 Bei der Analyse der Berufseinmündung als Ereignis steht die Dauer bis zum Erhalt der ersten Anstellung im Fokus der Analysen. Hierbei wird ergänzend zur Prozessperspektive der Übergang als punktuelles Ereignis konzeptualisiert. Mutmaßliche Einflussfaktoren auf die Dauer des Übergangs in die erste Erwerbstätigkeit werden dabei mit Methoden der Ereignisanalyse untersucht. Da hierbei die ” abhängige Variable“ die Dauer bis zum Eintritt eines Ereignisses (hier die erste Erwerbstätigkeit) ist, welche nicht direkt in den Daten abbildbar ist, wird auf Abschnitt 4.1.3 und 4.2.3 verwiesen. Zusätzlich wird untersucht, wer das interessierende Ereignis des Übergangs in den Beruf direkt erlebt. Dabei wird ein direkter Übergang in der Ereignisperspektive als nahtloser Übergang verstanden, so dass der Antritt des ersten Beschäftigungsverhältnisses im selben Monat wie der Studienabschluss liegt. Diese Personen werden bei der Ereignisanalyse nicht berücksichtigt, da sie keine Wartezeit in der empirisch erhobenen Zeitmessung (Monate) aufweisen. Welche Faktoren dazu führen, dass ein Absolvent einen nahtlosen Übergang erlebt oder aber eine gewisse Wartezeit aufweist, wird im Rahmen einer binär logistischen Regression untersucht. 4.1.5 Aufbereitung der unabhängigen Variablen Die Beschreibung der unabhängigen Variablen erfolgt anhand der bereits im theoretischen Teil der Arbeit eingeführten Unterscheidung von institutionellen und individuellen Merkmalen.43 Dabei beschreiben die angeführten theoretischen Konzepte der horizontalen Differenzierung und des vertikalen Passungsverhältnisses die institutionellen Faktoren auf Seiten des Ausbildungs- und des Erwerbssystems. Da diese Faktoren nicht direkt zu messen sind, wird die Operationalisierung dieser Konzepte nachfolgend beschrieben. 43 Es wären durchaus andere Kategorisierungen denkbar, so z. B. in studienbezogene, berufsbezogene und soziodemographische Merkmale. 154 Unter institutionellen Merkmalen werden die Art der besuchten Hochschule als Indikator für ein eher wissenschaftsnahes oder anwendungsorientiertes Studium sowie der Grad der standardisierten Zertifizierung des Berufs für das Passungsverhältnis von Abschlusszertifikat und entsprechender beruflicher Tätigkeit subsumiert. Weiterhin wird der Wirtschaftssektor zur Unterscheidung, ob die erste Anstellung in der Privatwirtschaft oder im öffentlichen Dienst erfolgte, ob diese erste Beschäftigung als ausbildungsadäquat oder -inadäquat eingeschätzt wird und ob es sich dabei um eine beoder entfristete Anstellung handelt, berücksichtigt. Die Art der besuchten Hochschule bezieht sich auf die horizontale Differenzierung zwischen Universität und Fachhochschule. Hierbei repräsentiert ein Universitätsabschluss ein eher wissenschaftsnahes und ein Fachhochschulabschluss ein eher anwendungsbezogenes Studium. Diese Unterscheidung dient als Merkmal für die Stärke der Ausrichtung des Ausbildungssystem an den Handlungslogiken des Erwerbssystems und repräsentiert somit das horizontale Passungsverhältnis zwischen diesen angrenzenden Lebenslaufphasen auf Seiten des Ausbildungssystems. Dies spiegelt damit die Handlungsspielräume der Gatekeeper des Ausbildungssystems wider. Um das vertikale Passungsverhältnis zwischen (Aus-)Bildungssystem und Erwerbssystem zu operationalisieren, wird auf einen Indikator von Vicari (2014) zurückgegriffen, der den Grad der standardisierten Zertifizierung der Berufe abbildet. Dieser Indikator setzt sich aus folgenden Einzelindikatoren zusammen: 1. die formelle Standardisierung des Zugangszertifikats, 2. die Reglementierung des Berufszugangs. Ein Zugangszertifikat (oder auch Berufsabschlusszertifikat) ” ist standardisiert, wenn das Ausbildungszertifikat durch das Bestehen von bundesoder landesrechtlich einheitlichen oder vergleichbaren Abschlussprüfungen erlangt wurde“ (Vicari 2014: 5). Diese Standardisierung der Zertifikate bestimmter Berufsabschlüsse steht in enger Verbindung zur Reglementierung 155 der Berufszugänge. Dabei sind in hoch reglementierten Berufen sowohl der Berufszugang als auch damit einhergehend das Führen eines Berufstitels durch rechtliche Regelungen an den Nachweis eines standardisierten Berufsabschlusszertifikats gebunden. Im akademischen Feld sind hierunter Berufe zu fassen, die im weitesten Sinne als Professionen bezeichnet werden können oder in denen zumindest besondere Qualifikationsanforderungen an die Berufsausübung gestellt werden. Dies betrifft vor allem Studiengänge, die mit einem Staatsexamen abgeschlossen werden. Somit ist in stark reglementierten Berufen auch der Grad der Standardisierung der Zugangszertifikate hoch. Jedoch existieren auch im akademischen Ausbildungsbereich Berufe, die stark reglementiert sind, aber keine einheitlich standardisierten Abschlusszertifikate aufweisen. Hierunter fallen vor allem die Ingenieursberufe.44 Anhand der beiden Informationen zur Standardisierung der Ausbildungszertifikate und dem Grad der Reglementierung des Berufszugangs wird ein einheitlicher Indikator zum Grad der standardisierten Zertifizierung der Berufe erstellt. Ausgehend von den Einzelberufen wurden diese abschlie- ßend auf die Ebene der Berufsordnungen (Dreisteller) der Klassifikation der Berufe von 1988 (KldB 1988)45 aggregiert (Vicari 2014). Der Indikator weist dabei eine metrische Ausprägung von 0 ” unstandardisiert“ bis 1 ” hoch standardisiert“ auf und repräsentiert das vertikale Passungsverhältnis der mit Studienabschluss erreichten Ausbildung und der damit verbundenen Berufsebene. Dies steht ebenfalls stellvertretend für einen Indikator einer Profession bzw. eines professionellen Berufsbildes; je stärker standardisiert 44 So sind die Abschlüsse eines Architekturstudiums weder (verwaltungs-)rechtlich noch einheitlich geregelt. Die Reglementierung dieses Berufs bezieht sich daher lediglich auf das Tragen der Berufsbezeichnung ” Architekt“. Während das Abschlusszertifikat den Absolventen den Grad eines Diplom-Ingenieurs (Dipl.-Ing.) verleiht, darf die Bezeichnung ” Architekt“ nur führen, wer Mitglied in der Architektenkammer ist und mindestens 2 Jahre fachspezifische Berufserfahrung als Diplom-Ingenieur vorweisen kann (siehe MArchG). 45 Es wird auf die ältere Klassifikation der Berufe aus dem Jahr 1988 zurückgegriffen und nicht auf die aktuellere Version aus dem Jahr 2010, da der Untersuchungszeitraum von 1976 bis 2002 näher an dem historischen Zeitpunkt der Klassifikation aus dem Jahr 1988 angesiedelt ist. 156 die Zertifizierung des Berufs ausfällt, desto eher kann von einer Profession ausgegangen werden. Dieser Indikator steht stellvertretend für die institutionellen Gatekeeper des Erwerbssystems und rekurriert somit auch auf den gegebenen Handlungsspielraum auf Seiten des Erwerbssystems. Damit wird ermöglicht, den Aspekt der ” Standardisierung“ des Ausbildungssystems sowie der Regulierung des Arbeitsmarkts zu operationalisieren. Jedoch muss angemerkt werden, dass eine exakte Trennung zwischen den Konzepten der ” Standardisierung“ von Ausbildungsinhalten und der Regulierung der Berufszugänge, und damit eine eindeutige Zuordnung zu einer der beiden Lebenslaufphasen, anhand dieses Indikators nicht vorgenommen werden kann. Somit erweitert dieser Indikator die empirischen Möglichkeiten, die Verbindung zwischen Ausbildungs- und Erwerbssystem zu modellieren, dahingehend, dass nun die Aspekte der Standardisierung adäquat abgebildet werden können.46 Über eine Interaktion zwischen der Art der besuchten Hochschule und dem Grad der standardisierten Zertifizierung der Berufe wird eine Trennung der horizontalen Differenzierung (anwendungsbezogene Fachhochschulen und wissenschaftsnähere Universitäten) sowie der vertikalen Passung von Ausbildungsinhalten und Berufsebenen (hoch bzw. niedrig standardisierte Zertifizierung der Berufe) erreicht. Um eine feinere Unterscheidung bezüglich des Passungsverhältnisses zwischen dem Ausbildungssystem und dem Beschäftigungssystem abbilden zu können, werden auch die unterschiedlichen Abschlusszertifikate differenziert erfasst. Hierbei wird einerseits zwischen den eher anwendungsbezogenen Diplomabschlüssen der Fachhochschulen und den stärker forschungsorientierten Diplomabschlüssen der Universitäten unterschieden. Die wissenschaftsnäheren universitären Abschlüsse werden wiederum in Magister-, Diplom- 46 Leuze (2010b: 42) musste noch aufgrund mangelnder Datenlage auf eine Operationalisierung des Grads der Standardisierung des Ausbildungssystems verzichten. Dafür ist im Ländervergleich der Aspekt der ” Stratifizierung“ des Bildungssystems relevant, jedoch nicht in einer nationalen Binnensicht einer bezüglich der Bildungszugangsberechtigungen homogenen Gruppe an Akademikern. Eine Differenzierung zwischen Fachhochschul- und allgemeiner Hochschulreife kann mit den hier verwendeten Daten nicht vorgenommen werden und wird auch nicht als relevant erachtet. 157 und Staatsexamensabschlüsse untergliedert. Dabei wird davon ausgegangen, dass vor allem die staatlich regulierten Staatsexamina durch einen hohen Grad an Standardisierung gekennzeichnet sind und die Magisterabschlüsse das andere Ende des Kontinuums abbilden. Anhand der Berufsverläufe und der detaillierten Informationen zur Art des ersten Beschäftigungsverhältnisses wurden die dichotomen Variablen zur Befristung bzw. Entfristung der ersten Beschäftigung sowie zur Zuordnung derselben zum öffentlichen bzw. privatwirtschaftlichen Sektor vorgenommen. In Bezug auf die Befristung bzw. Entfristung der ersten Stelle wurde nur die Information berücksichtigt, ob die Stelle von Beginn an be- oder entfristet war, eine Entfristung im Laufe der Anstellung wurde nicht berücksichtigt. Ebenfalls wurde für das erste Beschäftigungsverhältnis die Information erhoben, ob die Befragten die Tätigkeit als adäquat zu ihrem Ausbildungsniveau einschätzen. Diese Information wurde über die subjektive Einschätzung des üblicherweise erforderlichen Ausbildungsniveaus ermittelt. Als ausbildungsadäquat wurde die Tätigkeit eingestuft, für die angegeben wurde, dass in der Regel ein abgeschlossenes Hochschulstudium erforderlich ist. Dabei wurde keine Unterscheidung zwischen vertikaler und horizontaler Adäquanz (Plicht et al. 1994) vorgenommen. Neben den institutionellen Merkmalen beziehen sich die individuellen Merkmale stärker auf die Zeit vor oder während des Studiums. Hierunter fallen Angaben darüber, ob die Absolventen vor dem Studium eine Berufsausbildung abgeschlossen haben, ob während des Studiums ein Auslandsaufenthalt absolviert wurde, ob die Absolventen zum Zeitpunkt des Studienabschlusses bereits in einer festen Partnerschaft in einem gemeinsamen Haushalt zusammen lebten und ob sie bereits Kinder hatten. Die Informationen zur Doppelqualifikation im Sinne einer zusätzlich abgeschlossenen beruflichen Ausbildung konnten aus den Berufsverläufen rekonstruiert werden. Um die Effekte einer vor dem Studienabschluss erfolgreich 158 absolvierten beruflichen Ausbildung abzubilden, wird diese Information als dichotome Variable mit in die Analysen aufgenommen. Die Information zu studienbezogenen Auslandsaufenthalten bezieht sich auf die Frage, ob mindestens ein Monat des Studiums im Ausland absolviert wurde. Dies wurde getrennt von der Information erhoben, ob sich die Ausbildungsstätte im Ausland befand. Ersteres bezieht sich auf die hier relevante Information eines studienbezogenen Auslandsaufenthalts, während Letzteres bereits bei der Frage nach ausländischen Abschlüssen und deren Anerkennung in Deutschland berücksichtigt wurde. Die Angaben zu Partnerschaftsverhältnissen und zu Kindern zum Zeitpunkt des Studienabschlusses wurden aus den Familienverläufen rekonstruiert. Im Falle der Partnerschaftsverhältnisse war ausschlaggebend, dass die Partner zusammen in einem Haushalt wohnten. Dem gemeinsamen Haushalt wurde im Hinblick auf die zu operationalisierende Gatekeeperfunktion ein höherer Stellenwert beigemessen als dem reinen Beziehungsstatus. Dies geschah vor dem Hintergrund, dass durch einen gemeinsamen Haushalt eine eingeschränktere räumliche Mobilität bei der Jobsuche erwartet wird. Eine weitere Operationalisierung nicht-institutioneller Gatekeeper erfolgt anhand der Variable, ob Kinder zum Zeitpunkt des ersten Studienabschlusses vorhanden waren. Dabei wurde unberücksichtigt gelassen, ob es sich um leibliche Kinder handelt oder nicht.47 Jedoch mussten die Kinder zum Zeitpunkt des Studienabschlusses im selben Haushalt wie die befragte Person wohnen. Um die kohortenspezifischen Veränderungen beim Übergang von der Hochschule in die erste Erwerbstätigkeit zu untersuchen, werden die Absolventen in Abschlusskohorten untergliedert. Eine relativ feine Einteilung in 5 Kohorten (1976–1980, 1981–1985, 1986–1990, 1991–1995, 1996–2002) erschien angemessen, um im Kohortenvergleich eine Veränderung relevanter Merkmale von (De-)Standardisierungsprozessen im Zeitverlauf abbilden zu können. 47 Von insgesamt 206 Kindern wurden vier Adoptivkinder und ein Pflegekind berichtet. 159 Die Auswahl der Kohortengrößen erfolgte dabei vor allem unter historischen Gesichtspunkten der entsprechenden Arbeitsmarktentwicklungen. So ist für die Abschlussjahrgänge 1976–1980 charakteristisch, dass in diesem Zeitraum vergleichsweise niedrige Absolventenzahlen bei gleichzeitig niedrigen qualifikationsspezifischen Arbeitslosenzahlen zu verzeichnen sind. Diese Situation änderte sich in der nachfolgenden Abschlusskohorte von 1981–1985 grundlegend (siehe Abschnitt 3.4). Im Zeitraum zwischen 1980 und 1985 erreichten die Arbeitslosenzahlen ihr Maximum (dies gilt für Akademiker für den gesamten Beobachtungszeitraum, bezogen auf die Gesamtarbeitslosenzahlen wird dieses Maximum erst nach der Wiedervereinigung im Jahre 1993 erneut erreicht und in der Folgezeit weit überschritten). Auf der Ebene der Abgänger aus den Hochschulen, also derjenigen Personen, die potenziell neu auf dem Arbeitsmarkt in Erscheinung treten, begann im Jahr 1981 ein moderater, aber dauerhafter Anstieg der Absolventenzahlen. Von der Mitte bis zum Ende der 1980er Jahre (1986–1990) blieb die Arbeitslosenquote von Akademikern auf einem konstanten, für diese Qualifikationsgruppe hohen Niveau, während die Absolventenzahlen unverändert anstiegen. Für die Abschlusskohorte der Jahre 1991–1995 beginnen die Arbeitslosenquoten erst wieder leicht zu sinken, um dann – nicht zuletzt durch die weiterhin steigenden Absolventenzahlen – einen erneuten Anstieg der Arbeitslosenquote bis zur Mitte 1990er Jahre zu erleben, welcher jedoch das Niveau von 1985 nicht übersteigt. In diesem Zeitraum steigen die Absolventenzahlen stark an, um Mitte der 1990er Jahre ein historisches Maximum zu erreichen. Die jüngste Kohorte der Untersuchungspopulation (1996–2002) verzeichnet zum ersten Mal sinkende Absolventenzahlen, wobei die absoluten Zahlen weiterhin die Werte bis Anfang der 1990er Jahre übertreffen. Diese Entwicklung geht ebenfalls mit einer leicht sinkenden Arbeitslosenquote einher, die erst wieder mit der Jahrtausendwende zu steigen beginnt. Schlussendlich wird kontrolliert, ob die Absolventen aus einem akademisch geprägten Elternhaus stammten und ob sie in West-, Ostdeutschland oder 160 dem Ausland geboren wurden. Ebenfalls wird das Geschlecht und das Alter bei Studienabschluss berücksichtigt. Um die soziale Herkunft der Absolventen abzubilden, wird auf das Bildungsniveau des Elternhauses zurückgegriffen. Den Absolventen wird ein akademischer Hintergrund ( ” akademisches Elternhaus“) zugeschrieben, wenn mindestens eines der beiden Elternteile über einen Hochschulabschluss verfügt. Mit dieser Information wird berücksichtigt, ob die Absolventen auf die Erfahrungen der Eltern beim Studium und auch beim Übergang in die erste Erwerbstätigkeit zurückgreifen können. Die Informationen zum Geburtsort werden zwischen der Geburt in West-, Ostdeutschland und dem Ausland unterschieden. Da sich die Geburtsjahrgänge der Befragten auf die Jahre zwischen 1956 und 1979 erstrecken, beschreibt der Geburtsort Ostdeutschland eine Sozialisation unter Bedingungen der ehemaligen DDR. Zusätzlich zur Information über eine ost- oder westdeutsche ” Vergangenheit“ wird über die dritte Kategorie ” Ausland“ ein Migrationshintergrund abgebildet. Das Alter zum Zeitpunkt des Studienabschlusses wird zudem für die Verwendung in den multivariaten Modellen am Mittelwert zentriert, um eine sinnvolle Interpretation zu ermöglichen (für eine zusammenfassende Beschreibung der verwendeten Variablen siehe Tabelle A.2 im Anhang). Abschließend sollen noch einige Hinweise zu relevanten Informationen gegeben werden, die in dieser Arbeit keine Berücksichtigung finden konnten. Dies betrifft vor allem die Angaben der Studienfächer sowie der Abschlussnote.48 Diese Informationen wurden aus zweierlei Gründen in dieser Arbeit nicht berücksichtigt. Erstens sind diese Informationen im hier verwendeten Scientific-Use-File nicht enthalten. Der zweite Grund ist jedoch wesentlich schwerwiegender. Die Verteilung der Absolventen auf unterschiedliche Fächer oder auch Fächergruppen würde zu einer zu feinen Aufteilung der 48 Während bei Böpple (2010) die Studienfächer bzw. Fächergruppen einen starken Einfluss auf die Übergänge von Akademikern in die erste Erwerbstätigkeit aufweisen, kommen die Analysen von Kühne (2009) zu wesentlich zurückhaltenderen Ergebnissen. 161 Fallzahlen führen, so dass die Zellbesetzungen für die Mehrheit der hier angewendeten Analysen zu gering ausfallen würden. Dies zeigte sich bereits bei den differenzierteren Analysen, die zwischen verschiedenen Arten an Studienabschlüssen unterschieden. Demnach wurde auch auf eine feinere Unterscheidung zwischen Diplom-, Magister- und Staatsexamensabschlüssen verzichtet. Zusätzlich konnten die Analysen von Kühne (2009) zum Berufseintritt und -erfolg von Akademikern zeigen, dass weder von dem studierten Fach noch der Abschlussnote ein signifikanter Effekt ausgeht. Ebenfalls wurde in den ereignisanalytischen Modellen auf die Verwendung zeitveränderlicher Kovariaten verzichtet. Dies zum einen, da die Relevanz der interessierenden Effekte im Zeitverlauf in den verwendeten statistischen Modellen auf andere Weise berücksichtigt wird (siehe Abschnitt 4.2.3), aber auch da diese Variablen in testweisen Berechnungen keinen Mehrwert an Erklärungskraft lieferten. 4.2 Methoden Die Berufseinmündungsphase wird in der vorliegenden Untersuchung auf einen Zeitraum von 6 Jahren festgelegt. Damit ergibt sich die Möglichkeit, monatsgenau zu verfolgen, wie sich die ersten 6 Jahre nach dem ersten akademischen Abschluss gestalten. Dabei werden in Bezug auf den Übergangsprozess zwei Perspektiven eingenommen: (1) der direkte Übergang von der Hochschule in den Arbeitsmarkt und (2) der längerfristige Verbleib. Unter dem direkten Übergang wird eine Perspektive verstanden, welche die Übergangssequenzen mit Blick auf die Zustände vergleicht, die direkt auf den Hochschulabschluss folgen. Der längerfristige Verbleib beschreibt eine Perspektive, welche die Zustände am Ende der 6 Jahre vergleichend in den Blick nimmt. So kann die theoretische Annahme der Such- und Matchingtheorien berücksichtigt werden, dass eine anfängliche Phase der Arbeitslosigkeit unter Umständen keinen diskontinuierlichen Übergang darstellt, sondern Ausdruck der Suche nach einer (adäquaten) Beschäftigung ist und in eine 162 bessere oder auch stabilere Erwerbstätigkeit mündet als ein direkter Einstieg ohne entsprechende Such- bzw. Übergangsphase. Um diese beiden Aspekte des Übergangs in die Erwerbstätigkeit zu analysieren, werden zwei unterschiedliche Konzepte der Sequenzmusteranalyse angewendet. Ebenfalls werden zur detaillierteren Betrachtung der Individualisierungs-, bzw. (De-) Standardisierungstendenzen der Übergänge in die erste Erwerbstätigkeit differenziertere Maßzahlen berechnet, die im Rahmen der (Weiter-)Entwicklung der Methoden der Sequenzmusteranalyse vorgeschlagen wurden. So können in Abgrenzung zu dem Konzept der Entropie differenzierte Unterscheidungen zwischen der Komplexität, der Turbulenz und der Diskrepanz einzelner Verläufe getroffen werden. Zur Untersuchung des Übergangsereignisses kommen klassische Verfahren der Ereignisanalyse zum Tragen. In diesem Zusammenhang wird der Übergang als ein punktuelles Ereignis konzipiert, wobei unberücksichtigt bleibt, wie die Absolventen die Zeit bis zum Antritt der ersten Erwerbstätigkeit verbracht haben. Im Rahmen dieser Methode steht lediglich die Dauer bis zum Antritt der ersten Beschäftigung im Fokus der Analysen. Im folgenden Abschnitt werden zuerst das allgemeine Verfahren der Sequenzmusteranalyse und die verwendeten Algorithmen zur Untersuchung des direkten Übergangs und des längerfristigen Verbleibs vorgestellt und erläutert. Daran anschließend werden die Konzepte der Komplexität, Turbulenz und Diskrepanz in Abgrenzung zur Entropie dargelegt. Das Kapitel schließt mit einer kurzen Beschreibung der angewandten Verfahren der Ereignisanalyse. 4.2.1 Sequenzmusteranalyse Zur Erläuterung der verwendeten Methoden der Sequenzmusteranalyse werden zuerst einige grundlegende Konzepte zur Beschreibung von Verläufen bzw. Sequenzen eingeführt, um daran anschließend die verwendeten Metriken zur Analyse der Übergangssequenzen (Berufseinstieg und Berufs- 163 verbleib) zu beschreiben.49 Um die Möglichkeiten der Sequenzmusteranalyse und deren Vorteile bei der Analyse von Übergängen zu verdeutlichen, werden einige technische bzw. mathematische Konzepte erörtert, wobei versucht wird, die rein mathematischen Aspekte immer auch auf eine inhaltlich gehaltvolle Interpretation zu beziehen. Die in Abschnitt 2.2 auf theoretischer Ebene gefassten Begrifflichkeiten der Übergangsforschung (Verlauf, Sequenz, Ereignis, Zustand etc.) sollen nachfolgend auf eine methodische Ebene übertragen werden. Dabei werden die in Tabelle 2.1 auf Seite 99 formulierten Begrifflichkeiten in eine mathematisch darstellbare Form übertragen und so den Methoden der Sequenzmusteranalyse zugänglich gemacht. So können die mathematischen Modelle der Sequenzmusteranalyse an die theoretischen Konzepte der Übergangsforschung rückgebunden werden. Damit wird gleichsam dem Einwand entgegengewirkt, dass es sich bei den vielfältigen Metriken der Sequenzmusteranalyse um eine willkürliche Ansammlung von mathematischen Modellen handelt. Vielmehr wird gezeigt, dass die unterschiedlichen Verfahren der Sequenzmusteranalyse die Möglichkeit eröffnen, vielfältige und umfassendere Aspekte der Lebenslauf- bzw. Übergangsforschung zu berücksichtigen, als es mit einer einzigen Metrik möglich wäre. Da die Lebensverläufe und die darin enthaltenen Übergänge in unterschiedlichen Dimensionen stattfinden, muss für den zu untersuchenden Prozess zuerst ein eindeutiger und überschneidungsfreier Zustandsraum definiert werden. Eindeutig und überschneidungsfrei ist der Zustandsraum dann, wenn keine parallelen Zustände definiert sind. Dies muss von der tatsächlichen Überschneidung von Zuständen, wie sie in Abschnitt 4.1.2 beschrieben wurde, unterschieden werden. Während die oben beschriebenen Überschneidungen auf das Vorkommen mehrerer paralleler Zustände innerhalb einer 49 Hier wird bewusst von Methoden im Plural gesprochen, da unter dem Begriff der Sequenzmusteranalyse eine Vielzahl methodischer Verfahren gefasst ist, welche das ursprünglich von Andrew Abbott (Abbott und Forrest 1986; Abbott 1995) als ” Optimal- Matching-Verfahren“ in die Sozialwissenschaften eingeführte Verfahren in vielfältiger Weise ergänzen und erweitern. 164 Lebenslaufdimension bezogen waren, meint die Überschneidungsfreiheit des Zustandsraums eine trennscharfe Abgrenzung der Zustände verschiedener Lebenslaufdimensionen. Die Zustände müssen also einer einzigen Dimension entspringen.50 Der in dieser Arbeit verwendete Zustandsraum beschränkt sich auf die Dimension des Erwerbssystems und ist in Tabelle 4.3 auf Seite 149 dargestellt. Die in Abschnitt 4.1.2 beschriebenen Sequenzdaten können als Sequenzen x = {x1, . . . , xn} mit einer Länge von n beobachteten Zuständen dargestellt werden. Jede Sequenz x setzt sich aus den Elementen des Zustandsraums51 Z = {z1, . . . , zs} zusammen. In der hier vorliegenden Stichprobe haben alle Sequenzen eine Länge von n = 72 (Monaten) und der Zustandsraum hat eine Größe von s = 15 (Zuständen). Da eine Darstellungsform nach dem Muster x = {x1 . . . x72} sehr unübersichtlich wird, kann stattdessen das wesentlich kompaktere SPS-Format ( ” State-Permanence-Sequence“) verwendet werden (Ritschard et al. 2009). Damit können sowohl die Abfolge wie auch die Dauer der Zustände in der Form x = (x, tx) dargestellt werden; mit tx als Dauer des Zustands x. Somit gibt die Sequenz x = (e, 3) eine Erwerbstätigkeitssequenz mit der Länge von 3 Zeiteinheiten (z. B. Monaten) an. Die ersten 10 Sequenzen der in dieser Arbeit analysierten Übergangsverläufe sind beispielhaft in Tabelle 4.5 dargestellt. Person [1] befindet sich nach dem Abschluss des ersten Hochschulstudiums für den Beobachtungszeitraum von 72 Monaten in einer Phase der akademischen Weiterbildung (darunter wird eine an das Studium anschließende und dieses voraussetzende Phase wie z. B. ein Volontariat, Referendariat, die Phase des ” Arztes im Praktikum“ oder auch eine Promotion verstanden). Person [2] verbleibt für 12 Monate nach dem ersten akademischen Abschluss an der Universität, um danach für 24 Monate in ein Referendariat oder Ähnliches überzugehen, im Anschluss an diese Phase kehrt die Person erneut 50 Mit Dimension ist z. B. der Erwerbsverlauf in Abgrenzung zum Familienverlauf gemeint. 51 Der Zustandsraum wird häufig auch als ” Alphabet“ bezeichnet. 165 Tabelle 4.5: Darstellung der ersten 10 Sequenzen im SPS-Format (Quelle: IAB/ALWA 2010; eigene Berechnung) Nr. Sequenz [1] (Ref./A.i.P./Prom.,72) [2] (Uni,12) – (Ref./A.i.P./Prom.,24) – (Uni,36) [3] (AL,5) – (Voll/ET,67) [4] (Teil/ET,40) – (Voll/ET,32) [5] (AL,2) – (Voll/ET,12) – (AL,2) – (BA,36) – (Gering/ET,3) – (Voll/ET,14) – (Gering/ET,3) [6] (AL,29) – (Voll/ET,43) [7] (Gering/ET,24) – (Teil/ET,48) [8] (NE,5) – (Ref./A.i.P./Prom.,48) – (Voll/ET,19) [9] (Voll/ET,72) [10] (Voll/ET,72) an die Universität zurück und verbleibt dort die restlichen 36 Monate des Beobachtungszeitraums. Aufgabe der Sequenzmusteranalyse ist es, die Übergangssequenzen miteinander zu vergleichen und aufgrund ihrer Ähnlichkeit bzw. Unähnlichkeit zu gruppieren. Das Verfahren der Sequenzmusteranalyse kann in folgenden Schritten zusammengefasst werden: Formatierung: Aufbereitung der Daten zu Sequenzen bzw. Verläufen (meist gleicher Länge), die zu jedem gemessenen Zeitpunkt einer gemeinsamen Zeiteinheit einen Zustand eines zuvor definierten Zustandsraums aufweisen. Deskription/Analyse: Deskriptive Beschreibung der Verläufe bzw. Sequenzen (z. B. ANOVA-Verfahren). Vergleich: Vergleich der einzelnen Sequenzen und Berechnung einer Ähnlichkeitsmatrix (z. B. mit Optimal-Matching-Verfahren). 166 Gruppierung/Typologisierung: Gruppierung der Sequenzen anhand ihrer Ähnlichkeit bzw. Unähnlichkeit (z. B. Clusteranalyse oder multidimensionale Skalierung). Den Kern der Sequenzmusteranalyse bildet der Schritt des Vergleichs der Sequenzen anhand der Distanzen zwischen ihnen und die darauf beruhende Berechnung einer Ähnlichkeits- bzw. Unähnlichkeitsmatrix.52 Diese Berechnungsverfahren können wiederum in Optimal-Matching-basierte und Subsequenz-basierte Metriken unterteilt werden. Ungeachtet dieser Unterscheidung der Metriken zur Berechnung der Unähnlichkeit von Sequenzen haben alle diese Verfahren gemeinsam, dass die Unähnlichkeit mathematisch als (geometrische) Distanzen dargestellt werden (Elzinga 2014). Das in den Sozialwissenschaften am weitesten verbreitete Verfahren hierzu stellt das von Andrew Abbott eingeführte ” Optimal-Matching-Verfahren“ dar. Dabei wird versucht, eine Sequenz in möglichst wenigen Schritten durch ” Einfügen“ und ” Löschen“ von Zeichen (Zuständen) in die jeweils andere Sequenz zu überführen. Je weniger Indel-Operationen53 benötigt werden, desto ähnlicher sind sich zwei Sequenzen. Zur Bestimmung der Distanz zwischen zwei Sequenzen werden die Operationen mit ” Kosten“ verbunden (siehe zur Diskussion über Transformationskosten beispielhaft Gauthier et al. 2009). Die andere Art zur Bestimmung der Distanzen zwischen Sequenzen stellen die auf dem Konzept der Subsequenzen basierenden Verfahren dar, welche im Rahmen dieser Arbeit angewendet und nachfolgend näher erläutert werden (Elzinga 2003, 2005, 2014; Studer und Ritschard 2014). 52 Seit Einführung der Sequenzmusteranalyse in die Sozialwissenschaften Mitte der 1980er Jahre wurde eine Vielzahl an Verfahren zu Berechnung der Ähnlichkeiten von Sequenzen vorgestellt. Gerade mit Blick auf die spezifischen Anwendungsbereiche in den Sozialwissenschaften erfuhr die Sequenzmusteranalyse in den vergangenen 30 Jahren eine enorme Weiterentwicklung. Eine aktuelle Übersicht über die Vielzahl an verfügbaren Verfahren bieten Studer und Ritschard (2014). 53 ” Indel“ bezieht sich dabei auf die Operationen ” Insertion“ und ” Deletion“ (also Einfügen und Löschen), die verwendet werden, um die Sequenzen ineinander zu überführen. 167 Das Konzept der Subsequenz Während das ” klassische“ Optimal-Matching-Verfahren die Unähnlichkeit zweier Sequenzen darüber bestimmt, wie viele Indel-Operationen notwendig sind, um eine Sequenz in eine andere zu überführen und mit welchen ” Kosten“ diese Operationen verbunden sind, bedienen sich die Verfahren auf Grundlage der Subsequenzen des direkten Vergleichs von gemeinsam geteilten ” Attributen“ von Sequenzen. Je mehr Attribute zwei Sequenzen miteinander teilen, desto ähnlicher sind sie sich. Mit einer Subsequenz wird die Abfolge gleicher Zustände unterschiedlicher Sequenzen beschrieben. Dabei müssen die Zustände jedoch nicht notwendigerweise direkt aufeinander folgen. Somit beschreibt das ” Attribut“ der Subsequenzen die Reihenfolge von Zuständen und fokussiert damit im Wesentlichen die Abfolge von Zustandswechseln54 (siehe für eine eingehende Beschreibung von Subsequenzen Elzinga 2007, 2014). Diese Definition von Subsequenzen als Verfahren zur Messung der Ähnlichkeiten oder Unähnlichkeiten von Verläufen ist hauptsächlich geeignet, Fragestellungen zu beantworten, die auf die Abfolge von Zuständen abzielen. Ein angemessenes Anwendungsgebiet ist beispielsweise die Frage nach dem Wandel von Familienverläufen im Sinne der Abfolge der Zustände bzw. der Ereignisse im Übergang in das Erwachsenenalter (z. B. Elzinga und Liefbroer 2007; Konietzka 2010; Shanahan 2000). LCP – The Length of the Longest Common Prefix Ein Verfahren zur Bestimmung der Ähnlichkeit bzw. Unähnlichkeit zweier Sequenzen, das gerade mit Blick auf Übergänge in das Berufsleben als besonders geeignet erscheint, ist ein Spezialfall einer Subsequenz und wurde von Elzinga (2007) unter dem Namen ” LCP (Longest Common Prefix)“ 54 Hier wird bewusst von ” Zustandswechseln“ und nicht von ” Ereignissen“ gesprochen, da als Ereignis bereits der Wechsel zwischen markanten Zuständen definiert wurde, die Start- und Endzeitpunkte eines Übergangs einleiten (siehe Seite 97). 168 entwickelt. Dabei wird zur Berechnung der Distanzen das Konzept der Subsequenz verwendet, jedoch in einigen Annahmen eingeschränkt. Zum einen wird die Restriktion eingeführt, dass die Subsequenzen zum gleichen Zeitpunkt beginnen müssen und zum anderen müssen die Zustände der Subsequenzen nun direkt aufeinander folgen. Somit wird gemessen, wie lange zwei Sequenzen von Beginn an gleich verlaufen. Diese ” erste gemeinsame Zeit“ wird als Präfix bezeichnet und wie folgt definiert: Bei einer Sequenz x der Länge n ist das Präfix k von x definiert als xk = x1, ..., xk mit 0 ≤ k ≤ n. Bei einer Sequenz x = abac ist das Präfix x3 = aba und x4 = x = abac. Die Länge einer Sequenz wird mit |x| = n beschrieben, wenn eine Sequenz x n Zustände lang ist. Somit ist die Sequenz |x| = n = 4, |x3| = 3 und |x4| = 4. Dabei ist |xk| ein Präfix von x mit der Länge k. Ein Spezialfall bildet eine leere Sequenz λ mit der Länge |λ| = 0, welches ein Präfix einer jeden Sequenz ist. Um das längste gemeinsame Präfix als Maß der Unterschiedlichkeit bzw. Ähnlichkeit zu verwenden, wird daher die Menge aller gemeinsamen Präfixe zweier Sequenzen ermittelt. Dabei beschreibt P (x, y) die Menge aller gemeinsamen nichtleeren Präfixe des Sequenzpaares (x, y), wobei u das gemeinsame k-lange Präfix von x und y bezeichnet: P (x, y) = {u = λ : x|u| = u = y|u|} (1) Da nun die Länge eines jeden Präfixes eindeutig ist, entspricht die Länge AP (x, y) des längsten gemeinsamen Präfixes von x und y der Größe der Menge von |P (x, y)|. Es werden also so lange gemeinsame Zustände gesucht, bis ein erstes Element von x an Position i nicht dem Element von y an Position i entspricht. Daraus berechnet sich nun die Distanz dP (x, y) zwischen den Sequenzen x und y aus der Summe der gesamten Länge dieser Sequenzen abzüglich der doppelten Länge des längsten gemeinsamen Präfixes: dP (x, y) = |x|+ |y| − 2AP (x, y) (2) 169 Da jedoch – wie Elzinga (2007: 10–11) anschaulich zeigen konnte – die Distanz zweier Sequenzen nicht zwingend ein guter und verlässlicher Indikator für die Ähnlichkeit zweier Sequenzen darstellt, werden die in Formel (2) dargestellten Distanzen in Ähnlichkeiten umgerechnet.55 Daraus resultiert: sP (x, y) = AP (x, y)√|x| · |y| (3) In vielen Anwendungsfällen führt das in Formel (3) dargestellte Ähnlichkeitsmaß zu verlässlichen Ergebnissen. Jedoch ist es angemessen, die Distanzen bzw. die Ähnlichkeiten zu normalisieren, da Formel (3) in bestimmten Fällen nicht nur zu schlecht bis gar nicht interpretierbaren, sondern zu fehlerhaften Ergebnissen führen kann (Elzinga 2007: 10–11). Daher werden die Distanzen und Ähnlichkeiten für die hier durchgeführten Analysen normalisiert. Die Normalisierung der Ähnlichkeiten und Distanzen ist jedoch nicht nur mathematisch geboten. Es gibt ebenfalls gute inhaltliche Gründe, die Ähnlichkeiten bzw. Distanzen zu normalisieren. Je nach Anwendungsbereich kann das gleiche Maß an Ähnlichkeit vollkommen unterschiedliche Implikationen haben. So ist eine Phase der Arbeitslosigkeit von insgesamt 2 Jahren bei einer Person, die auf ein gesamtes Arbeitsleben von 40 Jahren zurückblickt, weitaus weniger bedeutungsvoll, als dies in den ersten 6 Jahren eines Berufsanfängers der Fall ist. Wie bereits angedeutet ist eine Normalisierung nicht immer zwingend notwendig, sie ermöglicht jedoch, ein vergleichbares Maß der Ähnlichkeit zu berechnen, das weder an eine bestimmte Maßeinheit noch an Sequenzen gleicher Länge gebunden ist und gleichzeitig bestimmte obere und untere Grenzen aufweist. Damit ist gemeint, dass für die Dauer der Arbeitslosigkeit eines Arbeitslebens die ” natürliche“ Grenze der Lebensarbeitszeit gegeben ist. Durch die Normalisierung wird erreicht, dass die Maßzahl der Ähnlichkeit von einer bestimmten Maßeinheit befreit und an bestimmte Grenzen gebunden ist. Rechnerisch werden die Ähn- 55 Für eine umfassende Beschreibung der Berechnung von Ähnlichkeiten siehe (Elzinga 2007: 5–8, 2014: 58–71). 170 lichkeiten normalisiert, indem diese durch den geometrischen Mittelwert der zwei zu vergleichenden Sequenzen dividiert werden (Elzinga 2014). Die normalisierten Distanzen entsprechen dann: DP (x, y) = 1− sP (x, y) (4) und die normalisierten Ähnlichkeiten: SP (x, y) = 1−DP (x, y) (5) Das Attribut, welches die Ähnlichkeit zweier Sequenzen beschreibt, ist in diesem Fall das längste gemeinsame Präfix, also die längste gemeinsame Abfolge von Zuständen, beginnend bei einem gleichen Ausgangszustand. In den dieser Arbeit zugrunde liegenden Sequenzen ist der gemeinsame Ausgangszustand der erfolgreiche Abschluss des ersten Hochschulstudiums. Differieren die beiden zu vergleichenden Sequenzen direkt im ersten Element, sind sie maximal unähnlich. Jedoch ist gerade bei der Analyse des Übergangs in die erste Erwerbstätigkeit von besonderer Bedeutung, ob die Absolventen in eine dauerhafte oder zumindest anhaltende Phase der Erwerbstätigkeit einmünden, um von einem ” erfolgreichen“ Übergang sprechen zu können, oder ob ein diskontinuierlicher Übergang in das Erwerbsleben zu beobachten ist. Daher wird, wie eingangs bereits angedeutet, der direkte Übergang von der Hochschule in die Erwerbstätigkeit mit dem Verfahren des längsten gemeinsamen Präfixes (LCP) untersucht. Ob sich die Absolventen auch längerfristig auf dem Arbeitsmarkt behaupten können, wird wiederum mit der Methode des längsten gemeinsamen Suffixes (RLCP)56 untersucht. Die Metrik des längsten gemeinsamen Suffixes (RLCP) verfährt analog zum Verfahren des längsten gemeinsamen Präfixes (LCP), nimmt jedoch den gemeinsamen Endzustand als Ausgangspunkt der Berechnung der Ähnlichkeiten. Somit 56 Reversed Length of the Longest Common Prefix 171 kann aufgedeckt werden, ob unterschiedliche Übergangsmuster entdeckt werden, indem man zusätzlich zum direkten Einstieg in den Arbeitsmarkt den längerfristigen Verbleib berücksichtigt. 4.2.2 Entropie, Komplexität, Turbulenz, Diskrepanz Nachfolgend werden die Konzepte der Entropie, Komplexität, Turbulenz und Diskrepanz vorgestellt und voneinander abgegrenzt. Dabei fokussieren diese Konzepte jeweils unterschiedliche verdichtete Maßzahlen zur Beschreibung von Sequenzen und erweitern die üblicherweise verwendete Maßzahl der (Alters-)Varianz zur Beschreibung von (De-)Standardisierungstendenzen um eine Längsschnittperspektive. Die Entropie beschreibt dabei eine Art ” Unordnung“ (Stegmann et al. 2013: 36) bzw. ” Unsicherheit“ (Elzinga 2010: 466) von Zuständen und kann wiederum in eine Querschnitts-Entropie ( ” transversal entropy“) und eine Längsschnitt-Entropie ( ” longitudinal entropy“) unterteilt werden. Die Querschnitts-Entropie bezieht sich auf die ” Unordnung“ von Zuständen zu bestimmten Zeitpunkten und fokussiert damit auf einen Querschnitt aller Sequenzen. Die Längsschnitt-Entropie hingegen fokussiert auf die Entropie der Sequenzen im zeitlichen Verlauf. Ausgehend von den Eigenschaften der Entropie wird dieses Konzept nachfolgend durch die Eigenschaften der Komplexität sowie der Turbulenz erweitert. Während die drei zuerst genannten Konzepte unterschiedliche Beschreibungen der Variabilität der Zustände innerhalb von Sequenzen im Zeitverlauf darstellen, verfolgt das Konzept der Diskrepanz die Analyse der Variabilität gesamter Sequenzen untereinander auf Basis der Ähnlichkeiten bzw. Unähnlichkeiten. Entropie Die Entropie basiert auf der grundlegenden Arbeit von Shannon (1948) und ist ein Maß der Heterogenität der Zustände zu einem bestimmten Zeitpunkt (Querschnitt) bzw. einer Sequenz (Längsschnitt) (Elzinga 2010: 4; Gabad- 172 inho et al. 2011a: 19–23).57 Um die Längsschnitt-Entropie zu beschreiben, wird erneut eine Sequenz x = {x1, . . . , xn} mit einer Länge von n gemessenen Zuständen angeführt, in der Z = {z1, . . . , zs} verschiedene Zustände vorkommen können. Sei x = eeeawwan eine beispielhafte Sequenz der Länge n = 8 mit einem beispielhaften Zustandsraum Z = {e, w, a, n} (e = erwerbstätig, w = Weiterbildung, a = arbeitslos und n = nicht erwerbstätig) der Größe s = 4. Somit beschreibt die Sequenz x den Erwerbsverlauf einer Person, die zuerst erwerbstätig war, arbeitslos wurde, danach mehrmals an Weiterbildungen teilnahm und erneut arbeitslos wurde bis sie schließlich nicht mehr auf den Arbeitsmarkt zurückkehrte. Mit px(zi) soll die Wahrscheinlichkeit bezeichnet werden, dass in der Sequenz x der Zustand zi vorkommt; das ist gleichbedeutend mit px(zi = Prob(xj = zi)). Für die beispielhafte Sequenz x = eeeawwan gilt dann: px(e) = 3 8 und px(a) = 2 8 sowie px(w) = 2 8 und px(n) = 1 8 . Also beträgt die Wahrscheinlichkeit, dass die Person mit der Sequenz x erwerbstätig ist 38 . Allgemein formuliert ergibt sich daraus die Längsschnitt-Entropie H(x)58: H(x) = − ∑ zi∈Z px(zi) ln px(zi) (6) Formel (6) beschreibt die Längsschnitt-Entropie als die Summe aller Wahrscheinlichkeiten der vorkommenden Zustände einer Sequenz multipliziert mit den logarithmierten Wahrscheinlichkeiten der vorkommenden Zustände. Im oben genannten Beispiel beträgt die Entropie (vgl. Elzinga 2010) also: H(x) = −(38 ln 38︸ ︷︷ ︸ px(e) + 28 ln 2 8︸ ︷︷ ︸ px(a) + 28 ln 2 8︸ ︷︷ ︸ px(w) + 18 ln 1 8︸ ︷︷ ︸ px(n) ) = 1, 32 57 Ein anderes Maß der Heterogenität wird von Berger (1996: 115–119) verwendet, welches auf Blau (1977) zurückgeht. Dabei steht jedoch die Verteilung von Personen zu bestimmten Verläufen im Vordergrund. 58 Elzinga (2010) beschreibt die Entropie mit dem Logarithmus zur Basis 2 (log2). Dieser Unterschied wird jedoch durch die im Folgenden noch zu erläuternde Normierung der Entropie-Werte irrelevant. 173 Dabei ist jedoch der Wertebereich der Entropie von der Größe des Zustandsraums abhängig. Um diesen Umstand zu umgehen, wird die Entropie normiert und somit auf einen Wertebereich zwischen 0 und 1 beschränkt. Dadurch weist eine Sequenz bestehend aus nur einem einzigen Zustand eine Entropie von 0 auf, während eine Sequenz, die sich gleichmäßig aus allen möglichen Zuständen des Zustandsraums zusammensetzt, eine Entropie von 1 aufweist. Diese Normierung erhält man durch folgende Umformung der Formel (6): Hnorm(x) = H(x) Hmax = − ∑ zi∈Z px(zi) ln px(zi) − ∑ zs∈Z px(zs) ln px(zs) (7) Die Normierung der Entropie auf den unteren Wertebereich von 0 wird bereits durch die Logarithmierung erreicht, da bei einer Sequenz aus nur einem Zustand die Wahrscheinlichkeit, diesen Zustand zu beobachten, 1 beträgt und der natürliche Logarithmus von 1 (ln 1) den Wert 0 ergibt. Die Normierung des oberen Wertebereichs auf den Wert 1 erfolgt durch die Division der nicht normierten Entropie durch die theoretisch maximal mögliche Entropie, wie in Formel (7) beschrieben (in Anlehnung an Stegmann et al. 2013: 39 f.). Bei einem Zustandsraum Z der Größe s = 4 beträgt die theoretisch maximale Entropie Hmax = ln s = ln 4 = 1, 39. Die normierte Entropie unserer Beispielsequenz x = eeeawwan beträgt demnach H(x) Hmax = 1,321,39 = 0, 95. Man kann die Formeln (6) und (7) ebenfalls zur Berechnung der Querschnitts- Entropie verwenden, indem nun nicht mehr die einzelnen Zustände einer Sequenz summiert werden, sondern die einzelnen Zustände zi mehrerer Personen N zu einem bestimmten Zeitpunkt t. Dann beschreibt pt(zi) den Anteil der Personen Nt in Zustand zi (Rohwer und Pötter 2005). Somit ergibt sich die Querschnitts-Entropie analog zu Formel (6): H(t) = − ∑ zi∈Z pt(zi) ln pt(zi) (8) 174 Damit stellt die Querschnitts-Entropie einen Spezialfall der Maßzahlen zur Beschreibung der Sequenzen dar, da sich die Komplexität, Turbulenz und Längsschnitt-Entropie auf den zeitlichen Verlauf von Sequenzen beziehen, die Querschnitts-Entropie jedoch Zeitpunkte (also den Querschnitt durch alle Sequenzen zu einem bestimmten Zeitpunkt) abbildet. Die Entropie – unabhängig ob im Querschnitt oder Längsschnitt – beschreibt das Maß der Zufälligkeit der Zustände (im Sinne einer Unstrukturiertheit des reinen Vorkommens), erfasst jedoch nicht die Übergangshäufigkeiten oder die Reihenfolge bzw. Abfolge von Zuständen (Elzinga 2010: 466 f.). Dies wird deutlich, wenn man die beiden Sequenzen x = eaw und y = eaweaweaw betrachtet. Beide Sequenzen haben einen maximalen Entropie-Wert, beschreiben aber (den zeitlichen Aspekt vorerst außer Acht gelassen) inhaltlich unterschiedliche Sequenzen. Während die Sequenz x einen Verlauf beschreibt, der durch die Abfolge ” Erwerbstätigkeit“ → ” Arbeitslosigkeit“ → ” Weiterbildung“ charakterisiert werden kann, erscheint es wenig intuitiv, die Sequenz y als ebenso komplex oder turbulent zu bezeichnen (Elzinga 2010; Gabadinho et al. 2011a: 22). Da jedoch in der Betrachtung von Längsschnittdaten im Allgemeinen und bei Sequenzen im Speziellen die Häufigkeit von Zustandswechseln und die Abfolge von Zuständen eine wichtige Rolle spielen, werden im Folgenden die um diese Aspekte erweiterten Konzepte der Komplexität und Turbulenz vorgestellt. Wie bereits Elzinga (2010) zeigen konnte und im vorangegangenen Abschnitt ausgeführt wurde, entspricht die Entropie nicht unserem intuitiven Verständnis des Begriffs Komplexität. Komplexität Die von Gabadinho et al. (2010) vorgeschlagene Maßzahl zur Beschreibung der Komplexität berücksichtigt die Anzahl der Zustandswechsel innerhalb einer Sequenz. So wird – im Gegensatz zur Entropie – zum einen ermöglicht, die Abfolge der einzelnen Zustände zu berücksichtigen, zum anderen können sich wiederholende Zustände ebenfalls auf das Maß der Komplexität aus- 175 wirken. Dies ist besonders in der sozialwissenschaftlichen Anwendung von Interesse, da ohne Zweifel die Abfolge mehrerer Phasen der Erwerbstätigkeit, welche mehrfach durch Arbeitslosigkeitsphasen unterbrochen werden (x = eaeaeaea), eine andere Qualität aufweisen als ein Berufs- bzw. Lebensverlauf, der eine lange andauernde Phase der Erwerbstätigkeit, gefolgt von einer ebenso langen Phase der Arbeitslosigkeit (y = eeeeaaaa), aufweist. Die Entropie px(zi) = 1 2 = py(zi) ist für beide Sequenzen identisch. Um diesem Umstand Rechnung zu tragen, wurde von Gabadinho et al. (2010) das Konzept der Komplexität eingeführt. Die Berücksichtigung der Abfolge der einzelnen Zustände erfolgt dabei immer noch ohne eine explizite Beachtung der Dauer der Zustände. Die Sequenz x = eaeaeaea weist dabei 8 aufeinanderfolgende Zustände mit 7 Zustandswechseln auf, wohingegen in Sequenz y = eeeeaaaa nur 2 unterschiedliche, aufeinanderfolgende Zustände, durch einen Zustandswechsel verbunden, zu beobachten sind. Hierfür ist die Beschreibung von Sequenzen im SPS-Format – wie in Abschnitt 4.2.1 auf Seite 165 beschrieben – erneut hilfreich. Denn aus der Schreibweise des SPS-Formats lässt sich die Anzahl der ” unterschiedlichen, aufeinanderfolgenden Zustände“ (DSS)59 ermitteln. Die beiden beispielhaften Sequenzen x und y lassen sich im SPS-Format wie folgt notieren: x = (e, 1)− (a, 1)− (e, 1)− (a, 1)− (e, 1)− (a, 1)− (e, 1)− (a, 1) y = (e, 4)− (a, 4) Die Komplexität C(x) einer Sequenz wird dann wie in Formel (9) beschrieben: C(x) = √ nt(x) ( (x)− 1) H(x) Hmax (9) 59 DSS steht für ” Distinct Successive States“ und gibt die Abfolge der unterschiedlichen Zustände ohne Berücksichtigung der spezifischen Dauer der Zustände wieder. 176 mit: nt(x) = d(x)− 1 = Anzahl der Zustandswechsel in Sequenz x; d(x) = Länge der ” Distinct Successive States“ (DSS) der Sequenz x; x = Länge der Sequenz x; H(x) = Entropie der Sequenz x; Hmax = theoretisch maximale Entropie, i. e. Hmax = ln s. Damit wird mit dem Maß der Komplexität nicht nur die Anzahl unterschiedlicher Zustände, sondern auch die Abfolge der Zustände berücksichtigt. Demnach beschreibt die Entropie, wie viele unterschiedliche Zustände durchlaufen werden; die Komplexität beschreibt, wie viele unterschiedliche Zustände wie oft gewechselt werden. Demnach ist es von Relevanz, ob ein Zustand einen kurzen Zeitraum oder einen langen Zeitraum andauert. Gerade bei der Analyse von Lebensverläufen (und im Speziellen von Übergängen in die erste Erwerbstätigkeit) ist der Unterschied relevant, ob beispielsweise eine kurze Phase der (Such-)Arbeitslosigkeit an das Ende des Hochschulstudiums anknüpft oder ob diese Phase von längerer Dauer ist. Dem Aspekt der Dauer einer Episode wird mit dem nachfolgend beschriebenen Konzept der Turbulenz Rechnung getragen. Turbulenz Ebenso wie die Entropie und die Komplexität stellt die Turbulenz ein Maß für die ” Diversität“ der Abfolge von Zuständen dar. Gerade in der Lebenslaufforschung wird postuliert, dass die Lebensverläufe der jüngeren Kohorten nicht nur komplexer, sondern auch turbulenter und weniger geradlinig verlaufen (Buchmann 1989b; Shanahan 2000). Aber auch im Kontext von Absolventenstudien wird der Übergang von der Hochschule in den Beruf zunehmend als komplexer und langwieriger beschrieben (Burkhardt et al. 2000; Wissenschaftsrat 2000). Daher erscheint es sinnvoll, die Konzepte der Entropie und Komplexität um die Dauer der Episoden zu erweitern, 177 um nicht nur die Unterschiedlichkeit von Sequenzen anhand der Anzahl (Entropie) und der Abfolge (Komplexität) der Zustände zu beurteilen. In Anlehnung an Elzinga (2006: 11) und Stegmann et al. (2013: 42) soll daher die Turbulenz einer Sequenz mit Formel (10) beschrieben werden: T (x) = log2 ( φ(x) σ2t,max(x) + 1 σ2t (x) + 1 ) = log2 ( φ(x) ( d(x)− 1)(1− t̄(x))2 + 1 σ2t (x) + 1 ) (10) mit: φ(x) = Anzahl der unterschiedlichen Subsequenzen der DSS-Sequenz von x; σ2t = Varianz der in den DSS-Zuständen verbrachten Zeiten tj; σ2t,max(x) = Maximalwert von σ 2 t bei gegebener Gesamtlänge d(x) der Sequenz x; t̄ = (x) d(x) = Länge (Dauer) der gesamten Sequenz dividiert durch die Länge (Anzahl) der DSS. Dabei berechnet sich die Varianz der Zustandsdauern σ2t (x) einer Sequenz x aus: σ2t (x) = 1 s s∑ i=1 (ti(x)− t̄(x))2 (11) mit: ti(x) = Dauer des Zustands i in Sequenz x; t̄(x) = durchschnittliche Zeit, die in einem Zustand verbracht wird; s = Größe des Zustandsraums. Die maximale Varianz der Zustandsdauern σ2t,max(x) berechnet sich danach aus: 178 σ2t,max(x) = 1 s s∑ i=1 ( d(x)− 1)(1− t̄(x))2 (12) mit: d(x) = Länge (Anzahl) der ” Distinct Successive States“ (DSS); t̄(x) = durchschnittliche Zeit, die in einem Zustand verbracht wird; s = Größe des Zustandsraums. Mit dem Konzept der Subsequenzen (Elzinga 2007: 13–16, 2014: 56–58; Stegmann et al. 2013: 42–48; siehe auch Seite 168) wird ermöglicht, dass sowohl die Dauer der Episoden als auch die Anzahl und Abfolge der einzelnen Zustandswechsel berücksichtigt werden. Eine minimale Turbulenz von 0 liegt nur dann vor, wenn die Sequenz leer ist, andernfalls gibt es immer mindestens zwei Subsequenzen (die leere Sequenz und mindestens eine Subsequenz mit Zustand i). Diskrepanz Eine weitere Methode zur Analyse der (Un-)Ähnlichkeit von Verläufen bzw. Sequenzen stellt das ebenfalls im Rahmen der Sequenzmusteranalyse entwickelte Verfahren der Diskrepanzanalyse dar (Studer et al. 2010, 2011). Die Diskrepanzanalyse basiert grundlegend auf den Prinzipien der Varianzanalyse und untersucht dabei den Anteil an Varianz, der durch eine Kovariate erklärt werden kann.60 Der Unterschied zur klassischen Varianzanalyse besteht darin, dass hier die zu vergleichenden Objekte durch eine (Un-)Ähnlichkeitsmatrix abgebildet werden. Es geht zum einen darum, die Variabilität der Sequenzen im Zeitverlauf abzubilden, und ergänzend hierzu, wie gut eine kategoriale Variable die 60 Studer et al. (2011: 477) bevorzugen den Begriff der Diskrepanz gegenüber der Varianz, da der klassische Begriff der Varianz im Kontext der ANOVA auf euklidische Distanzen beschränkt ist, was bei der Anwendung auf Distanzmatrizen von Sequenzmusterverfahren nicht in allen Fällen zutreffend ist. 179 Varianz gesamter Sequenzen erklären kann. Damit steht die Unterschiedlichkeit von Verläufen bzw. Sequenzen im Mittelpunkt der Analysen, so dass auch mit diesem Verfahren dem Verlaufscharakter von Übergängen Rechnung getragen wird, indem die Entwicklung der Unterschiede im Zeitverlauf abgebildet werden kann. Mit der Variabilität der Sequenzen im Zeitverlauf ist gemeint, dass die Stärke des Einflusses einer kategorialen Variable zu jedem Zeitpunkt der in dieser Arbeit relevanten Übergangsphase angegeben werden kann. Im Gegensatz zu den oben beschriebenen Konzepten der Entropie, Komplexität und Turbulenz, welche die Diversität von Zuständen ” innerhalb“ von Sequenzen abbilden, bezieht sich das Maß der Diskrepanz auf die Diversität von Sequenzen untereinander. Eine hohe Diskrepanz bedeutet dabei eine stärkere Heterogenität und eine niedrige Diskrepanz eine stärkere Homogenität der Sequenzen untereinander. Bei der Untersuchung der Frage nach einer (De-)Standardisierung von Übergängen ist von besonderem Interesse, ob sich die Verläufe zwischen unterschiedlichen Gruppen signifikant voneinander unterscheiden. Wenn unterstellt wird, dass die Übergangssequenzen heterogener geworden sind, bietet sich die Analyse von intra-individuellen Gruppenunterschieden an (Studer et al. 2011: 482). Es wird also gefragt, ob sich die Diskrepanzen der Verläufe unterschiedlicher Gruppen signifikant aufgrund eines bestimmten Merkmals unterscheiden. Der Test auf Homogenität der Diskrepanzen erfolgt hierbei mit dem Levene-Test. Dieser hat gegenüber dem Bartlett-Test auf Homogenität den Vorteil, dass er relativ unempfindlich gegenüber einer verletzten Normalverteilung ist (Bortz 2005: 285–286). Der Levene-Test beschreibt dabei, wie stark die Diskrepanz zu einem bestimmten Zeitpunkt bzw. Zeitfenster ist. Die statistische Signifikanz des Zusammenhangs zwischen einer Kovariate und der Diskrepanz der Verläufe wird anhand eines Pseudo-R2-Tests ermittelt. Ein Rückgriff auf die in der klassischen Varianzanalyse übliche F-Statistik kann aufgrund der nicht (oder nur selten) gegebenen Normalverteilungsannahme nicht angewendet werden. Daher 180 wird auf ein Permutationsverfahren zurückgegriffen, das die Werte der Kovariate in mehreren Permutationen den einzelnen Sequenzen zufällig zuweist. Somit gibt der Wert des Pseudo-R2 den Anteil der erklärten Diskrepanz durch die Kovariaten wieder (Studer et al. 2011: 479–481). 4.2.3 Ereignisanalyse Die Untersuchung der Dauer des Übergangs zwischen dem ersten Studienabschluss und dem Erwerbseinstieg erfolgt mittels klassischer Verfahren der Ereignisanalyse. Hierbei wird auf parametrische Verfahren mit log-normaler Verteilungsfunktion zurückgegriffen. Obwohl parametrische Verfahren gerade in der sozialwissenschaftlichen Anwendung der Kritik ausgesetzt sind, starke theoretische Annahmen über die Verteilung der Ereignisse zu benötigen, um so eine gerechtfertigte Parametrisierung der Verteilungsfunktion vorzunehmen, was in vielen Fällen nicht gegeben ist (Box-Steffensmeier und Jones 2004: 47; Blossfeld et al. 2007: 216), soll diesem Verfahren hier dennoch der Vorzug gegeben werden. Dies wird zum einen mit ebenfalls problematischen Annahmen der weniger voraussetzungsreichen semi-parametrischen Modelle (vor allem der Cox-Regression) begründet. Diese setzen zwar keine Annahmen über die Verteilung der Ereignisse im Zeitverlauf voraus (die sogenannte ” baseline hazard“ wird beim Cox-Modell aus den Daten geschätzt), erfordern jedoch proportional verteilte Risiken (Blossfeld et al. 1986: 139; Windzio 2013: 153).61 Das bedeutet, dass sich die Effekte der unabhängigen Variablen über die gesamte Beobachtungszeit konstant verändern, also die Übergangsrate immer um den selben Faktor sinkt oder steigt (Windzio 2013: 144, 153). Eine log-normale Verteilungsfunktion ist hingegen nicht an die Proportionalitätsannahme gebunden (Box-Steffensmeier und Jones 2004: 31–35). Es wird angenommen, dass gerade die Absolventen der verschiede- 61 Auch einige parametrische Modelle sind an die Bedingung proportional verteilter Risiken gebunden; beispielsweise das Weibull-Modell. Vergleichsweise Berechnungen von semiparametrischen Modellen (Cox-Modell) ergaben nahezu identische Ergebnisse bezüglich Stärke und Richtung der Effekte. 181 nen Hochschularten in Verbindung mit dem Grad des Passungsverhältnisses zwischen Ausbildungs- und Erwerbssystem unterschiedliche (und damit nicht proportional verlaufende) Übergangsraten aufweisen. Zum anderen erscheint es bei dem Gegenstand dieser Arbeit plausibel, eine theoretische Verteilung der Ereignisse zu formulieren (siehe Abschnitt 5.1). Eine log-normale Verteilungsfunktion ist nicht-monoton und besitzt daher die Eigenschaft, zuerst ansteigen und dann abfallen zu können. Theoretisch wird davon ausgegangen, dass die Übergangsraten zu Beginn der Übergangsphase relativ schnell ansteigen, um im weiteren Zeitverlauf zu sinken. Die Annahme hierbei ist, dass die Übergangsereignisse (der Antritt des ersten Jobs) direkt nach Abschluss des Studiums zuerst relativ kurz ansteigen und daraufhin weniger werden, je länger die Suche dauert (vgl. eine ähnliche Argumentation zu beruflichen Aufstiegsprozessen bei Brüderl et al. 1989: 135–137). Dies zum einen, da jene Absolventen, deren Abschlüsse ein hohes Passungsverhältnis zwischen Ausbildungs- und Beschäftigungssystem aufweisen, auch schnell einen Job finden. Zum anderen kann eine steigende Dauer der Suchphase ab einem gewissen Zeitpunkt eine negative Signalwirkung ausstrahlen und so die Suchdauer verlängern. Die Regressionsgleichung des log-normalen Modells kann wie folgt formuliert werden (Cleves et al. 2010: 271): h(t|xj) = h0(t) exp(xjβx) (13) Die log-normale Verteilungsfunktion erscheint noch sinnvoller bei der Untersuchung der Übergangsdauer, da dieses Modell anstelle der proportionalen Risiken (PH-Metrik) die Koeffizienten in der AFT-Metrik ( ” accelerated failure time“) schätzt. Dies hat den Vorteil, dass die Effekte der Koeffizienten als Beschleunigung oder Verzögerung des Übergangsprozesses interpretiert werden können. Somit ist die ” abhängige Variable“ nicht mehr die Übergangsrate, sondern die logarithmierte Zeit bis zum Eintritt des Ereignisses (Windzio 2013: 130–131). Dabei können in einem log-normalen Modell die 182 Lage- und Formparameter separat geschätzt und interpretiert werden. Die Lageparameter geben dabei den Einfluss einer Variable zu Beginn der Prozesszeit wieder und die Koeffizienten der Formparameter die Relevanz im Verlauf des beobachteten Prozesses (Windzio 2013: 174–179). Dadurch werden die zeitlichen Effekte der Relevanz der Gatekeeper (siehe Abschnitt 2.2.3) modelliert und können so im Sinne der zu- oder abnehmenden Relevanz während des Übergangsprozesses interpretiert werden. Im Vergleich mit anderen parametrischen Modellen spricht der niedrigste Wert der Gütemaße AIC und BIC für das log-normale Modell (siehe Tabelle 4.6). Ein niedriger Wert von AIC und BIC zur Beurteilung der Modellgüte gibt an, dass das jeweilige parametrische Modell mit der entsprechenden Verteilungsfunktion den Verlauf der Rate in den empirischen Daten besser wiedergeben kann (Windzio 2013: 33, 164). Tabelle 4.6: Gütemaße der Anpassung unterschiedlicher parametrischer Modelle (Quelle: IAB/ALWA 2010; eigene Berechnung) Modell LL (Nullmodell) LL (Vollständig) FG AIC BIC Exponential −700,789 −636,618 16 1305 1371 Gompertz −668,689 −626,059 17 1290 1360 Weibull −694,116 −636,349 17 1306 1377 Log-logistisch −645,965 −607,271 17 1249 1319 Log-normal −642,833 −604,349 17 1243 1313 Fallzahl 453 Dargestellt sind die Berechnungen des vollständigen Modells. 183

Chapter Preview

References

Zusammenfassung

Wie verlaufen die Übergänge von Akademikern in die erste Erwerbstätigkeit?

Einerseits werden Akademikern nach wie vor sehr gute Beschäftigungschancen nachgesagt. Andererseits mehren sich die Stimmen, die auch für Akademiker zunehmend längere und turbulentere Übergänge in die erste Erwerbstätigkeit postulieren. Dirk Böpple geht aus einer stärker lebenslauftheoretischen Position einerseits der Frage nach, ob sich diese De-Standardisierungstendenzen sowohl auf die Übergangsdauer als auch auf die Ausgestaltung der Übergänge auswirken. Andererseits untersucht der Autor, welchen Einfluss strukturelle Merkmale des Bildungs- und Erwerbssystems auf die Übergänge in die erste Erwerbstätigkeit ausüben und welche Aspekte durch individuelle Eigenschaften der Absolventen beeinflusst werden. Zur Beantwortung dieser Fragen wendet er neuste Verfahren der quantitativen empirischen Sozialforschung an.