• No results found

1. Bakgrunn og datagrunnlag

1.3. Datagrunnlagene i straffesakskjeden 2010-2017

For å lage statistikken over straffesakskjeden har SSB brukt allerede innhentede datasett fra politiets straffesaksregistre (BL/STRASAK/PAL) og ferdig bear-beidede statistikkgrunnlag for andre offisielle kriminalstatistikker (del 1.2.1).

Disse datasettene er bearbeidet med samme verktøy (SAS) og med tilnærmet likt produksjonssystem som dagens offisielle kriminalstatistikker (del 1.2.2).

Grunnlagsfilen som brukes til å lage tabeller i statistikken over straffesakskjeden inneholder mange av de samme variablene med det samme kodeverk og standard klassifiseringer som ellers er brukt i de offisielle kriminalstatistikkene (del 1.2.3).

Bearbeidingen og statistikkfilen inneholder også mange elementer som er særegne for statistikkene over straffesakskjeden – og unike i denne statistikken over straffesakskjeden.

1.3.1. Data fra politiet og de offisielle kriminalstatistikkene

Vi har valgt anmeldelsene fra 2010 og straffesakskjeden i tidsperioden 2010-2017 som tidsperioden for denne nye statistikken (se senere om valg av årganger).

Følgende data er brukt for å utvikle, teste og lage statistikkgrunnlaget til statistik-ken over straffesakskjeden 2010-2017:

1 Opprinnelige og nyere versjoner av statistikken over anmeldte lovbrudd er tilgengelig i statistikk-banken her: https://www.ssb.no/statbank/list/lovbrudda, og for statistikken over etterforskede lovbrudd her: https://www.ssb.no/statbank/list/lovbrudde.

Rådatafiler (9), ikke SSBs bearbeidede grunnlagsdata mottatt, fra politiet før klargjøring til statistikkene over:

Anmeldte lovbrudd 2010 - 676 738 records Etterforskede lovbrudd 2010 - 697 811 records Etterforskede lovbrudd 2011 - 689 297 records Etterforskede lovbrudd 2012 - 673 787 records Etterforskede lovbrudd 2013 - 672 095 records Etterforskede lovbrudd 2014 - 669 292 records Etterforskede lovbrudd 2015 - 644 603 records Etterforskede lovbrudd 2016 - 646 738 records Etterforskede lovbrudd 2017 - 603 662 records Statistikkfiler (10), ferdig bearbeidede data klargjort av SSB for offisiell statistikk over:

Anmeldte lovbrudd 2010 - 394 137 records Ofre for lovbrudd anmeldt 2010 - 401 281 records Etterforskede lovbrudd 2010 - 381 323 records Etterforskede lovbrudd 2011 - 374 168 records Etterforskede lovbrudd 2012 - 369 939 records Etterforskede lovbrudd 2013 - 366 726 records Etterforskede lovbrudd 2014 - 358 508 records Etterforskede lovbrudd 2015 - 337 783 records Etterforskede lovbrudd 2016 - 326 910 records Etterforskede lovbrudd 2017 - 296 420 records

1.3.2. Den tekniske bearbeidingen av datagrunnlagene

Vi skal her si noe kort om de mer tekniske og metodiske løsningene som er brukt i bearbeidingen av de mange datasettene, records og variabler som inngår i grunn-lagsfilene. De mer definerende valg av utvalg og statistikkvariable, samt grupper-inger og beregngrupper-inger av verdier som brukes i selve statistikken over straffesaks-kjeden 2010-2017, blir nærmere beskrevet i kapittel 4.

SSB har foretatt en rekke koblinger mellom disse datasettene og flere utvalg av disse, samt seleksjoner, omkodinger og beregninger for flere variabler.

Utgangspunktet er alle sakene og fornærmede fra alle sakene som er registrert i utgangsåret, her 2010. De aller fleste av disse finnes i rådatafilen som er brukt til å lage statistikkene over anmeldte lovbrudd 2010 og ofre for lovbrudd anmeldt 2010, som ble hentet fra politiets straffesaksregister (STRASAK) den 14. januar 2011.

Etter dette er det imidlertid kommet til noen flere nye lovbrudd som i politiets straffesaksregister har sin registreringsdato for anmeldelsen i 2010. Når disse lovbruddene blir ferdig etterforsket og endelig avgjort kommer de med i grunnlags-dataene til statistikken over etterforskede lovbrudd. Om slike saker er identifisert i de 16 datasettene fra statistikken over etterforskede lovbrudd, legges den beste representanten av det etter-registrerte lovbruddet inn i grunnlagsdataene for statistikken over straffesakskjeden 2010 (2010-2017).

I de ferdig bearbeidede grunnlagsdataene til statistikken straffesakskjeden er det lovbrudd som utgjør hovedenheten i datagrunnlaget. Informasjonen om ofrene for disse lovbruddene er bearbeidet og klassifisert på en annen måte enn i data-grunnlagene for statistikken over ofre for lovbrudd anmeldt, hvor personer utgjør hovedenhetene i datagrunnlaget.

I bearbeidingen av grunnlagsdata til statistikken over straffesakskjeden er det til lovbruddet overført ulik informasjon som sier noe om kjennetegn ved ofrene. Det

er kun datagrunnlagene som begrenser omfanget av slike variable, men i dette prosjektet er lovbruddene tillagt verdier for antall ofre som er registrert i hvert lovbrudd, samt kjønn og aldersgrupper (avgrenset til 10, 14, 16 og 18 år) som er representert blant ofrene for lovbruddet. I dette prosjektet er det først og fremst kjønn og alder, særlig skillet mellom barn og voksne, som er ansett å være de mest relevante for den typen av statistikk som følger av oppdraget. Informasjon om for eksempel ofrenes bosted og statsborgerskap er ikke inkludert i oppdraget, og er derfor ikke strukturert på denne måten.

Alle de registrerte anmeldelsene i 2010 er deretter koblet til de samme sakene som er gjenfunnet i alle datasett fra etterforskede lovbrudd. Saker kan da finnes i flere årganger og versjoner, og det foretas en seleksjon hvor den siste og beste saken fra datagrunnlagene i etterforskede lovbrudd beholdes. Dette skiller seg fra hvordan valg av lovbrudd og avgjørelse gjøres i de årlige statistikkene over ferdig etter-forskede lovbrudd – hvor lovbruddet og straffesaken beholdes i den årgangen hvor denne først dukker opp, uavhengig av om den dukker opp i en senere årgang med en ny avgjørelse (denne nye avgjørelsen slettes der som en «historisk dublett»).

Tilsvarende som for overføringen av informasjonen om ofrene til beskrivelsen av lovbruddet, foretas det en egen utvelgelse av hvilken avgjørelse som det enkelte lovbruddet skal tillegges å ha fått. Et lovbrudd kan være begått av flere personer som kan ha fått ulike typer avgjørelser. For eksempel kan en gjernings-person være under 15 år på gjerningstidspunktet, og fått saken mot seg henlagt, mens en annen gjerningsperson er straffbar og har fått en dom på ubetinget fengsel.

I et slikt tilfelle vil lovbruddet bli tillagt dommen på ubetinget fengsel som avgjør-else, og måten dette er gjort på skiller seg fra metodene som er brukt i bearbeid-ingen av statistikkene over ferdig etterforskede lovbrudd og fordelbearbeid-ingene på politiets avgjørelser – samt hvordan straffereaksjoner blir tillagt hovedlovbrudd.

Informasjon om alle siktelser (slik disse er definert i SSBs statistikker) til alle gjerningspersoner, er også ivaretatt under bearbeidingsprosessene. Informasjonen om disse er imidlertid ikke beholdt i den endelige filen som er brukt til å lage statistikkene over straffesakskjeden.

Det er vurdert om andre kilder og statistikker kan tilføre datagrunnlagene mer informasjon om relasjonene mellom ofrene og gjerningspersonene. Basert på en gjennomgang av relevans og kvalitet på supplerende data som kan være til-gjengelig (jf. del 2.3), samt ressurskostnadene og oppdragets avgrensning, er det i dette prosjektet ikke utviklet nye bearbeidingsprosesser eller koblinger – eller innhentet nye data fra politiet – med målsetting å lage nye og bedre kriminal-statistikker om relasjoner mellom ofre og gjerningspersoner.

Bedre registerdata og en utvikling av kriminalstatistikkene, til bedre å klassifisere og beskrive lovbrudd på flere måter enn i dag, blant annet sosiale relasjoner, vil kunne utvide vår forståelse av lovbruddene i samfunnet – og imøtekomme en etterspørsel etter denne typen grupperinger, både nasjonalt (jf. tiltak 6c i JD 2018b) og internasjonalt (jf. «additional descriptions of criminal offences» i UNODC 2015 og Eurostat 2017). I dette prosjektet er det testet ut, og dels brukt, noen nye

metoder – som går i retning av å løse noen av de generelle utfordringene vi står overfor i å lage slike nye typer av kriminalstatistikker. Dette er gjort blant annet for lovbrudd og overgrep mot barn, hvor vi har kombinert opplysningene om offeret og lovbruddet og laget nye lovbruddstyper som ikke er brukt i tidligere

kriminalstatistikker.

Å lage en mer helhetlig løsning som imøtekommer mange av de generelle behov-ene for andre typer kriminalstatistikker enn det vi har i dag – eller, som her, et spesifisert behov for å identifisere relasjonene mellom personene som er involvert i

de enkelte lovbruddshendelsene, krever imidlertid større endringer – både i data fra politiets straffesaksregistre og i våre metoder for å bearbeide disse. Dette er opp-gaver som går utover dette prosjektets rammer, men bør utredes nærmere i egne mer spesialiserte prosjekt – som har siktemål om å videreutvikle de offisielle kriminalstatistikkene i retning av å kunne beskrive lovbrudd og kriminalitet på flere alternative måter i en helhetlig statistikk.

I bearbeidingen av datagrunnlagene til straffesakskjeden brukes også en del av bearbeidingsrutinene som ellers benyttes overfor flere av de offisielle kriminal-statistikkene. Dette gjelder for eksempel konverteringene og navnendringer fra politikoding til SSB koding, identifisering og definering av populasjonene for lovbrudd og personer, samt hvordan verdier for utvalgte statistikkvariable tillegges og beregnes – for eksempel type lovbrudd, alder og kjønn.

I dette prosjektet er det ikke laget et fullstendig produksjonsopplegg for publisering av offisiell statistikk. Det er blant annet ikke laget et produksjonssystem som lager tallgrunnlag for publisering i SSBs Statistikkbank. På grunn av de mange data-settene som er brukt, og de mange testene og trinnene som er laget fordi dette er et eksplorerende utviklingsprosjekt, er imidlertid bearbeidingen av datagrunnlagene mer omfattende enn i et etablert statistikksystem. For en mer teknisk beskrivelse av trinnene i bearbeidingsprosessen, se vedlegg B: Hovedprosesser, bearbeiding av data.2

1.3.3. Statistikkfilen

Statistikkfilen er den filen som brukes som grunnlagsdata når vi lager tabeller for straffesakskjeden 2010-2017. Datafilen inneholder egen records for hvert enkelt lovbrudd, med tilhørende opplysninger på individnivå som kan være aktuelle å bruke i aggregerte statistikktabeller – eller mer detaljerte eller alternative tabeller for videre analyser.

De fleste utvalg, kodinger, beregninger og grupperinger som til slutt fremgår i statistikkene er lagt inn i statistikkfilen. Det lages også nye utvalg, statistikk-variable og grupperinger av lovbrudd i noen av prosessene som lager tabellene, både i de som brukes til bakgrunnsanalyser og noen av de tabellene som er gjort offentlig tilgjengelig i rapporten.

Statistikkfilen for straffesakskjeden 2010-2017 inneholder i alt 411 078 observa-sjoner. I tillegg til de 394 137 observasjonene som representerer lovbruddene som var registrert anmeldt i 2010, inneholder statistikkfilen også alle andre lovbrudd og undersøkelsessaker som i ett eller flere av grunnlagsdatasettene har registrerings-dato i 2010. Dette gir en mulighet for å kunne følge alle sakene som politiet registrerte i dette året gjennom hele straffesakskjeden, uavhengig av hvordan saken var registrert i den opprinnelige anmeldelsen.

For en fullstendig variabelliste for statistikkfilen, se vedlegg C: Variabler i statistikkdata til straffesakskjeden 2010-2017.

2 De mer detaljerte beskrivelsene av datagrunnlagene og bearbeidingsprosessene er ikke offentlig tilgjengelig, men dokumentert i alle de SAS-programmene og katalogene som er brukt i data-behandlingen. For nærmere opplysninger om metodiske spørsmål som ikke er besvart i rapporten, ta kontakt med forfatter – eller andre oppgitte kontaktpersoner for SSBs kriminalstatistikk på

https://www.ssb.no, blant annet https://www.ssb.no/lovbrudda og https://www.ssb.no/lovbrudde.