• No results found

Forebygging av trafikkulykker ved bruk av avansert dataanalyse: Fokus på tofeltsveger med betydelig trafikk

N/A
N/A
Protected

Academic year: 2022

Share "Forebygging av trafikkulykker ved bruk av avansert dataanalyse: Fokus på tofeltsveger med betydelig trafikk"

Copied!
85
0
0

Laster.... (Se fulltekst nå)

Fulltekst

(1)

2018/06

Beate Sildnes, Vebjørn Axelsen

Forebygging av trafikkulykker ved bruk av avansert dataanalyse: Fokus på

tofeltsveger med betydelig trafikk

BearingPoint Norway AS Tjuvholmen allé 3 0252 Oslo

Norway

T + (47) 24 06 90 00 F + (47) 24 06 90 01 www.bearingpoint.com

(2)

Forord

På oppdrag fra Vegdirektoratet har BearingPoint analysert ulykkesrisiko på Europa-, riks- og fylkesveger i Norge. Avansert dataanalyse i form av maskinlæringmetoden HyperCube er benyttet for å identifisere egenskaper ved vegen og dens omgivelser som gir økt ulykkesrisiko.

Prosjektet er en videreføring av arbeidet beskrevet i (BearingPoint, 2017), og fokuserer på en avgrenset del av vegnettet framfor hele vegnettet.

Fra BearingPoints side har Vebjørn Axelsen vært prosjektleder, med Beate Sildnes som prosjektdeltaker.

Prosjektdeltakere fra Vegdirektoratet har vært Arild Engebretsen og Jan Kristian Jensen. Datagrunnlaget for analysen er skaffet til veie gjennom et samarbeid mellom Vegdirektoratet (ved Jan Kristian Jensen), Triona (ved Tomas Carlsson) og BearingPoint i 2017.

(3)

©2018 BearingPoint. All rights reserved. 3

Innholdsfortegnelse 1 Sammendrag ... 4

2 Summary in English ... 6

3 Bakgrunn ... 9

4 Datagrunnlag ... 10

4.1 Valg av subsett av vegnettet ... 10

4.2 Egenskaper og måltall for utvalgt subsett av vegnettet ... 12

4.3 Persentilgrense for høy risiko ... 12

5 Resultater ... 15

5.1 Enkeltvariabelanalyser... 15

5.1.1 Trafikkmengde ... 16

5.1.2 Belysning ... 17

5.1.3 Antall virksomheter ... 18

5.1.4 Antall kryss ... 19

5.1.5 Antall kurver ... 20

5.1.6 Vinterdriftsklasse ... 21

5.1.7 Dekkebredde ... 22

5.2 Regler ... 24

5.2.1 Tettbebygde strøk ... 25

5.2.2 Ubelyste veger ... 27

5.2.3 Kryss ... 30

5.2.4 Kurver ... 33

5.2.5 Lav til middels vinterdrift ... 35

5.2.6 Lav dekkebredde og høy trafikk ... 37

6 Diskusjon ... 40

7 Referanser ... 42

Appendiks A Enkeltvariabler ... 43

A.1 Vegenskaper og geometri ... 43

A.2 Klimadata ... 56

A.3 Demografi ... 62

A.4 Kryss og kurvatur ... 67

Appendiks B Regelsett ... 71

B.1 Regelsett 1: Regler med dekning større enn 69 ... 71

B.2 Regelsett 2: Regler med dekning større enn 200 ... 76

B.3 Regelsett 3: Regler med dekning større enn 400 ... 81

Appendiks C Variabellister ... 85

C.1 Kontinuerlige variabler som deles inn i ti kvantiler ... 85

C.2 Regler som inneholder disse variablene ble filtrert bort ... 85

(4)

©2018 BearingPoint. All rights reserved. 4

1 Sammendrag

Statens vegvesen inviterte i 2015 til Plan- og designkonkurranse gjennomført i regi av forsknings- og utviklingsprogrammet BEST - Bedre Sikkerhet i Trafikken. BearingPoint leverte løsningsideen «Forebygging av trafikkulykker ved bruk av avansert dataanalyse», og et prosjekt basert på forslaget ble levert våren 2017. Prosjektet gikk ut på å benytte avansert dataanalyse i form av maskinlæringsmetoden HyperCube, for å identifisere kombinasjoner av egenskaper ved vegen og dens omgivelser som henger sammen med økt ulykkesrisiko.

Analysen som beskrives i denne rapporten er en fortsettelse av dette prosjektet. Både datagrunnlag, metode og problemstilling har blitt gjenbrukt fra (BearingPoint, 2017). Forskjellen er at denne analysen ikke dekker hele det landsdekkende ERF-vegnettet, men kun en avgrenset del. Følgende krav stilles for at et vegsegment skal være inkludert i denne analysen:

- Har årsdøgntrafikk (ÅDT) mellom 1 000 og 25 000 - Har mindre enn fire kjørefelt

- Er ikke rampe

Med en slik avgrensning vil man analysere et mer homogent subsett av vegnettet, og målet med dette er å få bedre innsikt i detaljerte risikodrivere innunder dominerende trender identifisert i (BearingPoint, 2017). Siden ÅDT er en svært viktig faktor for dimensjoneringen av vegen, og også var del av en

dominerende risikotrend i analysen av hele vegnettet, har denne variabelen vært styrende for utvalget.

Analysen på det filtrerte datagrunnlaget har resultert i et stort antall uavhengige sammenhenger som kombinerer opptil fire forklaringsvariabler. Resultatene framkommer som lettforståelige regler. Blant reglene har man kunnet identifisere seks grupper av vegsegmenter med en relativt høyere andel høyrisikosegmenter:

- veger i tettbebygde strøk - veger uten belysning - veger med kryss

- veger med (horisontale) kurver - veger med middels eller lav vinterdrift - veger med smal dekkebredde

For hver av disse gruppene har man valgt å beskrive 2-3 regler i mer detalj. Til sammen ble det plukket ut 14 regler som er fremhevet i resultatkapittelet og oppsummert i Tabell 1:

Tabell 1: Arbeidets hovedresultater, i form av 14 utvalgte regler som beskriver ulykkesrisiko i det filtrerte vegnettet. En regel er et sett av vegegenskaper som beskriver en gruppe vegsegmenter. Regler kan være overlappende i form av at et vegsegment kan inngå i flere regler. Relativ risiko er et mål på overrepresentasjon av høyrisikosegmenter i regelen. Andel kjøretøy- kilometer angir hvor stor andel av trafikken i det analyserte vegnettet som ligger på vegsegmenter som inngår i regelen.

Regelgruppe Beskrivelse av regel

Relativ risiko*

Andel kjøretøy- kilometer†

Tettbebygd Veger med minst én kurve og uten side- eller midtrekkverk

i områder med mange virksomheter og hvor 1,72 9,55 %

(5)

©2018 BearingPoint. All rights reserved. 5

gjennomsnittlig areal på nærliggende boliger er lite til middels

Fylkesveger i befolkede områder der minst 10 % av trafikkmengden er lange kjøretøy og gjennomsnittlig middeltemperatur er middels til høy

1,33 5,29 %

Ubelyst

Ubelyste veger med minst én kurve, 1-2 stigninger og

middels ÅDT 1,41 2,78 %

Ubelyste veger med minst én kurve og middels ÅDT i

bebygde områder 1,41 6,64 %

Ubelyste veger med minst én kurve i områder med 1-4 skogeiendommer og middels gjennomsnittlig

middeltemperatur

1,31 6,58 %

Kryss

Veger med høy fartsgrense, minst ett T-kryss og middels

ÅDT 1,33 6,78 %

Fylkesveger med 1-8 vegkryss og høy ÅDT i områder med

høy gjennomsnittlig middeltemperatur. 1,71 5,76 %

Riksveger med minst ett vegkryss og fartsgrense mellom 60

og 80 i bebygde områder 1,30 6,09 %

Kurver

Veger med minst 3 kurver, siderekkverk, middels ÅDT og 80

i fartsgrense 1,97 0,86 %

Primære fylkesveger med minst én kurve, fartsgrense 80

eller høyere og middels ÅDT 1,54 2,98 %

Vinterdrift

Veger med vinterdriftklasse DkC, fartsgrense 70 eller 80 og

minst én kurve i befolket område 1,41 3,72 %

Veger med vinterdriftsstrategi «Mellomstrategi», fartsgrense 70 eller høyere og mint én kurve i områder med lav gjennomsnittlig middeltemperatur

1,82 0,94 %

Dekkebredde

Veger med dekkebredde mellom 6 og 8,5, 1-8 vegkryss og

høy ÅDT 1,44 17,12 %

Veger med dekkebredde mellom 6 og 8,5 og høy ÅDT i områder med høy gjennomsnittlig nedbørsmengde og mange bygninger

1,81 3,02 %

*Relativ risiko: Forekomst av høyrisikosegmenter innenfor regel delt på forekomst av høyrisikosegmenter i hele datasettet.

†Andel kjøretøykilometer på veger som inngår i regel.

Sammenlignet med (BearingPoint, 2017) gir resultatene i denne analysen mer presis innsikt i risikobildet innenfor den utvalgte delen av vegnettet. De store variasjonene i risikobildet på tvers av det totale vegnettet blir ikke lenger like fremtredende. Det anbefales å gjøre ytterligere spesialiserte analyser på utvalgte deler av vegnettet, for eksempel basert på om området rundt vegen er tettbebygd eller ikke. Slik kan datagrunnlaget bli enda mer homogent, og innsikten trolig bli enda mer presis. Også separate analyser for utvalgte ulykkestyper kan gi verdifull og mer presis innsikt i hvilke forhold ved vegen og dens omgivelser som har en sammenheng med økt ulykkesrisiko innad pr. ulykkestype.

(6)

©2018 BearingPoint. All rights reserved. 6

2 Summary in English

In 2015 the Norwegian Public Roads Administration (Statens vegvesen) launched an idea competition as part of the research and development program BEST – Better Safety in Traffic. BearingPoint entered the contest with the proposed solution «Preventing traffic accidents with advanced analytics». A project based on this proposal was delivered in April 2017. The idea was to use advanced analytics, more specifically the machine learning method HyperCube, to identify combinations of properties of the road and the road’s surroundings that represent an increased risk of traffic accidents.

The analysis covered in this report is a continuation of the project from 2017. Both the dataset, the methodology, and the problem statement from (BearingPoint, 2017) have been re-used. The difference is that this analysis does not focus on the entire network of Norwegian national roads, but only on a limited part. For a road segment to be included in this analysis, the following criteria must be met:

- Annual average daily traffic (AADT) between 1 000 and 25 000 - Less than four lanes

- Not classified as a ramp

With these restrictions one will analyze a more homogeneous subset of the road network, with the goal of getting better insight into detailed risk factors underneath dominating trends as identified in

(BearingPoint, 2017). Since AADT is a very important factor for the dimensioning of the roads, and also was part of a dominating risk trend in the analysis of the entire road network, this variable has also been the driving force for the selection.

The analysis on the filtered dataset has resulted in a large number of independent relations, that combine up to four explanatory variables. The relations are expressed as rules that are easy to understand. Within the set of rules, one has been able to identify 6 groups of road segments that have a relatively higher share of high risk road segments:

- roads in densely populated areas - roads without lighting

- roads with intersections - roads with (horizontal) curves

- roads with medium to low winter maintenance - narrow roads

For each of these groups, 2-3 rules have been chosen to be described in more detail. All together 14 rules are highlighted in the results chapter and summarized in Table 2:

Table 2: The main results of the analysis, here shown by 14 selected rules that describe the risk of traffic accidents in the filtered road network. A rule is a set of road properties that describe a group of road segments. Relative risk is a measure of the overrepresentation of high-risk segments in a rule. The percentage of vehicle-kilometers is a measure of the proportion of kilometers driven annually on the road segments that are included by the rule.

Group Rule description

Relative risk*

Percentage of vehicle- kilometers†

(7)

©2018 BearingPoint. All rights reserved. 7

Densely populated areas

Roads with at least one curve and no roadside or median barriers, in areas with a high density of businesses. The average floor area of nearby houses is small to medium.

1,72 9,55 %

County roads in populated areas where at least 10 % of the traffic is made up of long vehicles and the average

temperatures are medium to high.

1,33 5,29 %

No lighting

Roads without lighting, with at least one curve, 1-2 slopes,

and medium AADT 1,41 2,78 %

Roads without lighting, with at least one curve, and

medium AADT in populated areas. 1,41 6,64 %

Roads without lighting and with at least one curve, in areas

with 1-4 forest estates and medium average temperatures. 1,31 6,58 %

Intersections

Roads with high speed limits, at least one 3-way

intersection, and medium AADT. 1,33 6,78 %

County roads with 1-8 intersections and high AADT, in

areas with high average temperatures. 1,71 5,76 %

Highways with at least one intersection and speed limits

between 60 and 80 km/h in populated areas. 1,30 6,09 %

Curves

Roads with at least 3 curves, roadside barriers, medium

AADT and speed limit 80 km/h. 1,97 0,86 %

Primary county roads with at least one curve, speed limits

of 80 km/h or above and medium AADT. 1,54 2,98 %

Winter operation strategy

Roads in populated areas, with winter operating class

«DkC», speed limits of 70 or 80 km/h and at least one curve.

1,41 3,72 %

Roads with winter operating strategy «Medium», speed limits of 70 km/h or above and at least one curve in areas with low average temperatures.

1,82 0,94 %

Road width

Roads with a width between 6 and 8,5 meters, 1-8

intersections and high AADT. 1,44 17,12 %

Roads with a width between 6 and 8,5 meters and high AADT, in areas with high average rainfall and many buildings.

1,81 3,02 %

*Relative risk: Occurrence of high-risk segments within the rule divided by the occurrence of high-risk segments in the entire dataset.

†Percentage of vehicle-kilometers on roads that are included by the rule.

Compared to (BearingPoint, 2017), the results of this analysis provide more specific insights into the risk within the selected part of the road network. The largest variations in risk across the entire road network are no longer as prominent in the results. Further on, it is recommended to conduct even more

specialized analyses, for instance based on whether the area surrounding the road is densely populated or

(8)

©2018 BearingPoint. All rights reserved. 8

not. That way, the dataset would be even more homogeneous, and the insights one would find could be even more precise. In addition, separate analyses for selected types of accidents could provide valuable detailed insights into which properties of the road and its surroundings contribute to a higher risk pr.

accident type.

(9)

©2018 BearingPoint. All rights reserved. 9

3 Bakgrunn

Statens vegvesen inviterte i 2015 til «Plan- og designkonkurranse om ideer for å redusere antall drepte og hardt skadde i trafikken», i regi av forsknings- og utviklingsprogrammet BEST - Bedre Sikkerhet i Trafikken.

BEST-programmet har prioritert ett overordnet satsningsområde:

Hvor er potensialet størst for å redusere antall drepte og hardt skadde i vegtrafikken?

Som bidrag til dette programmet leverte BearingPoint våren 2017 prosjektet «Forebygging av trafikkulykker ved bruk av avansert dataanalyse» (BearingPoint, 2017) med problemstillingen:

Hvilke egenskaper ved vegen og dens omgivelser kjennetegner ulykkesutsatte vegstrekninger?

Analysen ble utført med maskinlæringsmetoden HyperCube på et datasett bestående av et landsdekkende ERF-vegnett. Resultatet av prosjektet var et sett med lettforståelige beskrivelser av sammenhenger ved vegen og dens omgivelser som er assosiert med høy ulykkesrisiko. I beregningen av ulykkesrisiko ble ulykker med drepte og hardt skadde vektet høyere enn ulykker med lett skadde.

I rapporten fra prosjektet ble det i tillegg til de konkrete resultatene presentert flere forslag til videre arbeid. Blant annet ble det anbefalt å gjøre flere analyser på det samme etablerte datasettet for det landsdekkende vegnettet, hvor hver analyse fokuserer på en avgrenset og mer homogen del av vegnettet.

Forventningen var at dette vil kunne gi mer presis innsikt i risikobildet innenfor hver slik avgrensede del av vegnettet, ettersom de store variasjonene i risikobildet på tvers av det totale vegnettet ikke lenger blir dominerende. Med bakgrunn i dette forslaget har man i denne analysen plukket ut et subsett av vegnettet der vegene er mer homogene.

Det er en kjent sak at det er store forskjeller mellom egenskapene ved lite trafikkerte veger og høyt trafikkerte veger. Det kan derfor være fornuftig å analysere disse gruppene hver for seg. Trafikkmengde (ÅDT) er også en av de faktorene som er mest styrende for vegens dimensjonering. I denne analysen har man valgt å fokusere på de relativt høyt trafikkerte vegene, med en ÅDT mellom 1 000 og 25 000. For å oppnå ytterligere homogenitet i vegnettet innenfor dette ÅDT-intervallet, er i tillegg segmenter med fire eller flere felt samt ramper filtrert bort. Kapittel 4 beskriver dette i mer detalj.

Målet med analysen er å finne mer presise beskrivelser av sammenhenger ved disse vegene og deres omgivelser som fører til økt risiko, enn det man kunne observere når man så hele vegnettet under ett.

Slike beskrivelser kan videre gjøre det enklere å utforme faktabaserte og spissede risikoreduserende tiltak.

Før man leser denne rapporten forutsettes det at leseren er kjent med datagrunnlaget og metodikken som ble benyttet i prosjektet «Forebygging av trafikkulykker ved bruk av avansert dataanalyse». Dette er beskrevet i detalj i kapittel 4 og 5 i (BearingPoint, 2017), og gjentas derfor ikke i denne rapporten.

(10)

©2018 BearingPoint. All rights reserved. 10

4 Datagrunnlag

Datagrunnlaget er det samme som ble benyttet i analysen av hele ERF-vegnettet (BearingPoint, 2017). For denne analysen har det ikke blitt gjort noen endringer på datasettet annet enn å filtrere vekk

vegsegmenter etter kriteriene som beskrives nedenfor. Se (BearingPoint, 2017) for en komplett liste over alle variablene, samt beskrivelse av datakilder og sammenstilling av datasettet.

4.1 Valg av subsett av vegnettet

På tvers av det landsdekkende vegnettet er det store variasjoner i risikobildet. Under inspeksjon av resultatene (BearingPoint, 2017) kunne man se at det fantes noen tydelige grupper av vegsegmenter med en betydelig høyere andel høyrisikosegmenter enn gjennomsnittet for hele vegnettet. Når slike grupper har et sterkt signal vil de fort kunne overskygge for eventuelle interessante sammenhenger innad i grupper av segmenter på samme risikonivå.

Et av de store skillene som gjorde seg gjeldende i analysen på hele vegnettet, var skillet mellom veger med «høy trafikk» og «lav trafikk». Fenomentet «høy trafikk» kan karakteriseres på mange ulike måter.

Mest åpenbart er å beskrive «høy trafikk» direkte gjennom tall på trafikkmengde (ÅDT). I grove trekk kunne man i (BearingPoint, 2017) observere en økende risiko med økende ÅDT. I tillegg, siden

trafikkmengde har stor innvirkning på hvordan vegen dimensjoneres, blir det også styrende for mye av vegens utforming. Med andre ord vil trafikkmengde, i kombinasjon med andre opplysninger (f.eks.

fartsgrense), la deg utlede en rekke andre vegegenskaper, som for eksempel dekkebredde.

Med dette i bakhodet var det tydelig at relativt mange regler fra det uttømmende regelsøket i HyperCube på ulike måter beskrev vegsegmenter med «høy trafikk». Disse vegsegmentene har riktignok en relativt høy andel høyrisikosegmenter, men som nevnt vil denne store trenden fort overskygge andre

interessante sammenhenger innenfor grupper med lik trafikkmengde.

Det er mulig å redusere dette problemet ved å se på mindre deler av vegnettet som har likere

egenskaper, for eksempel kun vegsegmenter med ÅDT over en viss grense. Dette vil gjøre at mange ulike regler, som egentlig beskriver den samme dimensjoneringen (veger med mye trafikk), ikke dukker opp like ofte.

Om man skal gjøre et utvalg av vegsegmenter basert på trafikkmengde må man vurdere hvor denne ÅDT- grensen skal settes for å få et subsett av veger med relativt like egenskaper. Figur 1 viser et eksempel på et plott av relativ risiko for variabelen «trafikk_ADT_total» på hele vegnettet. Her kan man observere en tydelig forskjell i risikonivå mellom de lavt trafikkerte vegene og de høyt trafikkerte. ÅDT-intervallene med ÅDT < 1 000 har stort sett en relativ risiko som er lavere enn gjennomsnittet, mens intervallene med ÅDT

> 1 000 har en høyere relativ risiko enn snittet. Det vil derfor være logisk å fokusere på vegsegmentene med ÅDT ≥ 1 000.

(11)

©2018 BearingPoint. All rights reserved. 11 Figur 1 Eksempel på plott av relativ risiko for variabelen «trafikk_ADT_total» som ble benyttet til å avgjøre hvilken øvre og nedre grense for ÅDT som skulle begrense utvalget av vegsegmenter til analysen.

I tillegg til en nedre grense vil det være naturlig å sette en øvre ÅDT-grense for å få mest mulig

sammenlignbare veger i utvalget. Vegene med høyest ÅDT holder normalt en annen standard enn resten av vegene, og har typisk også færre ulykker og lavere vurdert ulykkesrisiko. Basert på plott av relativ risiko som i Figur 1, men for ulike alternative intervallinndelinger og ÅDT-grenser, samt en kvalitativ vurdering fra Trafikksikkerhetsseksjonen, har vegsegmenter med en ÅDT mellom 1 000 og 25 000 blitt plukket ut til denne analysen.

Foruten å fjerne et dominerende skille mellom høy og lav risiko i datagrunnlaget, vil dette utvalget av vegsegmenter gjøre at resultatene knyttet til trafikkmengde kan bli mer detaljerte. Under regelsøket i HyperCube på hele vegnettet ble alle de kontinuerlige variablene inndelt i 5 intervaller, der det tilstrebes å ha omtrent like mange vegsegmenter i hver. For det landsdekkende ERF-vegnettet hadde over

halvparten av vegsegmentene ÅDT < 900. Konsekvensen av dette ble at intervallene for de høyeste ÅDT- verdiene ble svært brede. For eksempel havnet alle veger med ÅDT > 3 500 i samme intervall. Ved å kun velge veger med en ÅDT mellom 1 000 og 25 000 vil ikke oppdelingen av ÅDT-variabelen bli like grov i denne omgang.

Utover filteret på ÅDT, tas alle vegsegmenter med fire eller flere feltstrekninger ut av denne analysen. De fleste vegsegmenter med fire eller flere felt har ÅDT over 25 000 og forsvinner med den ovennevnte begrensningen på ÅDT, men dette gjelder ikke alle. Resterende veger med fire eller flere felt ansees å skille seg betydelig fra veger med færre felt med tanke på utforming og ulykkesstatistikk, og for å få mer sammenlignbare veger i utvalget som analyseres er derfor disse tatt ut.

Videre, når de mest trafikkerte motorvegene tas ut av datasettet, vurderes det samtidig som naturlig å ta ut alle ramper. En stor andel av rampene innenfor valgt ÅDT-intervall (1 000 – 25 000) tilhører de høyest trafikkerte vegene som allerede er filtrert bort (ÅDT > 25 000). De rampene som ikke tilhører de høyest trafikkerte vegene ansees uansett å ha vesentlig forskjellige egenskaper fra vegsegmentene som er inkludert i analysen. Som resultat av dette er alle ramper ekskludert fra datasettet.

For denne spissede vegsegmentanalysen gjør man dermed følgende filtrering av det originale datasettet fra (BearingPoint, 2017):

- ÅDT i intervallet [1 000, 25 000]

- Antall feltstrekninger < 4

(12)

©2018 BearingPoint. All rights reserved. 12

- Fjern alle segmenter som er merket som ‘Rampe’1

4.2 Egenskaper og måltall for utvalgt subsett av vegnettet

Etter filtreringen beskrevet i forrige avsnitt ender man opp med et datasett som inneholder 44 % av antall vegsegmenter og omtrent 35 % målt i antall kilometer, sammenlignet med det komplette ERF-vegnettet fra (BearingPoint, 2017). Tabell 3 gjengir utvalgte måltall, både for det utvalgte subsettet av

vegsegmenter og for det totale vegnettet.

Tabell 3: Statistikk for originalt datasett og datasettet etter filtrering. Subsettet resulterer i et vegnett bestående av noe kortere elementer.

Måltall Subsett Hele vegnettet

Antall kilometer veg 19 183 54 716

Antall vegsegmenter 50 779 115 017

Snittlengde vegsegment meter 378 475

Medianlengde vegsegment meter 178 191

Antall km veg med siderekkverk 5 654 12 128

Antall km veg med midtrekkverk 239 604

Antall km veg med belysning 7 300 11 712

Fra tallene i Tabell 3 kan man merke seg at vegsegmentene i subsettet er noe kortere enn de i hele vegnettet, både i gjennomsnitt og i medianlengde. Dette er som forventet, under antakelsen om at vegnettet med lav ÅDT (< 1 000) som nå er ekskludert fra datasettet jevnt over er mindre komplisert i utformingen, og dermed gir opphav til færre kapp (og i snitt lengre segmenter) når vegen segmenteres etter strategien beskrevet i (BearingPoint, 2017).

4.3 Persentilgrense for høy risiko

Innføringen av en binær utfallsvariabel for risiko i (BearingPoint, 2017) krevde at det ble satt en nedre grenseverdi for risikoscore for at vegsegmenter skal klassifiseres som høyrisikosegmenter. Etter vurdering fra Trafikksikkerhetsseksjonen ble denne persentilgrensen satt til 94 %. Dette medførte at 6 % av

vegsegmentene var høyrisikosegmenter når man betraktet hele vegnettet.

Dersom man viderefører utfallsvariabelen (og dermed persentilgrensen) som ble satt i analysen av hele vegnettet også for denne analysen, sitter man igjen med 8,9 % høyrisikosegmenter (4 538 stk). Det er altså en høyere andel høyrisikosegmenter i subsettet enn i datasettet for hele vegnettet.

Denne forskjellen i risikonivå mellom subsettet og hele vegnettet er også tydelig i plottet av relativ risiko for ÅDT-variabelen som ble vist i Figur 1. Uttrykt ved relativ risiko tilsvarer 8,9 % høyrisikosegmenter en 48 % høyere andel høyrisikosegmenter, altså en relativ risiko på 1,48.

1 Et vegsegment defineres som rampe dersom verdien av variabelen «er_rampe_vegarm» = ‘Rampe’. Se Tabell 4 i (BearingPoint, 2017) for en komplett variabelliste.

(13)

©2018 BearingPoint. All rights reserved. 13 Tabell 4: Antall høyrisikosegmenter og antall km veg i høyrisikoklassen for originalt datasett og det utvalgte subsettet

Måltall Subsett Hele vegnettet

Antall kilometer høyrisikoveg 2 131 4 626

Antall høyrisikovegsegmenter 4 538 6 901

Fra Tabell 4 kan man observere at også målt i antall km veg er andelen høyrisikosegmenter høyere i subsettet enn for hele vegnettet. I subsettet dekker høyrisikosegmentene til sammen 2 131 kilometer veg, hvilket tilsvarer 11 % av total veglengde i subsettet. I analysen for hele vegnettet dekket

høyrisikosegmentene 8 % av den totale veglengden.

At omtrent 9 % av vegsegmentene i subsettet er definert som høyrisikosegmenter ville tilsvart at man for denne analysen valgte å sette en persentilgrense for risikoscore til 91 %. Figur 2 viser to plott av andelen ulykker som hører til høyrisikoklassen for ulike valg av persentilgrenser. Plottet til venstre er generert fra datasettet for hele vegnettet mens plottet til høyre er laget fra det utvalgte subsettet for denne analysen.

Samme vekting av de ulike skadegradene er benyttet i begge plott. Fra figuren ser det ut til at en grense på 94 % i hele vegnettet gir en lignende fordeling av skadegrader innenfor høyrisikosegmentene som en grense på 91 % i subsettet. Dette, i kombinasjon med at resultatene blir mer sammenlignbare med analysen på hele vegnettet om utfallsvariabelen videreføres, gjør at man ikke ønsket å utarbeide en ny utfallsvariabel for denne analysen.

Figur 2: Andel ulykker pr. skadegrad innen høyrisikosegmenter for ulike persentilgrenser. Figuren til venstre viser fordelingen fra forrige analyse (hele vegnettet), mens figuren til høyre viser tilsvarende plott for det utvalgte subsettet av veger.

Fra Figur 2 kan man også merke seg at andelen vegsegmenter uten registrerte ulykker i hele vegnettet er 88 %. I det utvalgte subsettet er det 80 %.

Andelen ulykker pr. skadegrad i subsettet er nærmere beskrevet i Tabell 5. Av de 22 740 ulykkene som var inkludert i det originale datasettet (hele vegnettet) er det med 16 691 ulykker i datasettet for denne analysen (subsett av vegnettet).

(14)

©2018 BearingPoint. All rights reserved. 14 Tabell 5: Trafikkulykker som er stedfestet til det analyserte vegnettet. Ved beregning av risiko for et vegsegment er ulykker vektet etter alvorligste registrerte skadegrad. Flertallet av de alvorligste ulykkene inntreffer på vegsegmenter som er definert som høyrisikosegmenter.

Alvorligste skadegrad

Vekting av skadegrad

Antall ulykker Antall ulykker i høyrisikoveger

Andel ulykker i høyrisikoveger

Drept 10 605 526 86,94 %

Meget alvorlig skadd 5 192 140 72,92 %

Alvorlig skadd 5 1 739 1 329 76,42 %

Lett skadd 1 14 155 5 516 38,97 %

(15)

©2018 BearingPoint. All rights reserved. 15

5 Resultater

På samme måte som i (BearingPoint, 2017), har maskinlæringsmetoden HyperCube blitt benyttet til å gjøre søk i datasettet for å finne sammenhenger som beskriver områder med økt forekomst av høyrisikosegmenter.

Det har blitt gjort søk etter sammenhenger med forskjellig grad av kompleksitet. I samarbeid med

Trafikksikkerhetsseksjonen har vi i denne analysens resultater identifisert 6 «hovedtrender» eller grupper av sammenhenger:

- Tettbebygde strøk - Ubelyste veger - Veger med kryss - Kurvede veger

- Lav til middels vinterdrift - Lav dekkebredde og høy trafikk

I dette kapittelet fremheves derfor i hovedsak resultater tilknyttet disse 6 gruppene. Kapittelet er delt i to deler:

1) Innledende analyser: Enkeltvariabelanalyser gir et overordnet bilde over sammenhenger i datasettet, og fungerer som en kontroll av datagrunnlaget. Alle forklaringsvariabler er analysert enkeltvis, men kun et utvalg presenteres her. Appendiks A gir en komplett oversikt. For tilfeller hvor sammenhengen mellom to variabler har vært av spesiell interesse, er enkeltvariabelanalysen supplert med en manuell tovariabelanalyse.

2) Hovedanalyse - Uttømmende regelsøk i flere dimensjoner: Hovedresultatene stammer fra et uttømmende søk etter regler som kombinerer opptil fire forklaringsvariabler, med formål å oppdage intrikate sammenhenger hvor flere vegegenskaper inngår i risikobildet. I dette kapittelet presenteres et utvalg på 14 regler. Appendiks B gjengir et større utvalg.

5.1 Enkeltvariabelanalyser

Analyser av enkeltvariablers effekt på forekomst av høyrisikosegmenter er gjort for å få en oversikt over de store trendene i datasettet. Enkeltvariabelanalyser er gjennomført for alle forklaringsvariabler.

Analysen viser relativ risiko over hver enkeltvariabels verdiområde, i form av andel høyrisikosegmenter innenfor et avgrenset verdiområde sett opp mot snittet for analysen (hvor snittet her er 8,9 %). Måltallet omtales her som relativ risiko (også kjent som lift). En relativ risiko på eksempelvis 1,4 betyr 40 % høyere andel høyrisikosegmenter enn snittet («40 % høyere risiko»), mens en relativ risiko på 0,6 betyr 40 % lavere andel høyrisikosegmenter enn snittet («40 % lavere risiko»).

For kontinuerlige variabler deles verdiområdet opp i 10 deler, hvor det tilstrebes likt antall vegsegmenter i hver del. Alle grafer som viser relativ risiko for enkeltvariabler, angir verdiintervaller på X-aksen på

formatet [A, B). Dette skal forstås som verdiområdet «fra og med A, til men uten B». For kategoriske variabler er oppdelingen gitt av variabelens forekommende kategorier.

I dette kapittelet presenteres resultater fra enkeltvariabelanalysene for utvalgte forklaringsvariabler.

Resultater for alle analyserte variabler er gjengitt i Appendiks A.

(16)

©2018 BearingPoint. All rights reserved. 16

5.1.1 Trafikkmengde

Trafikkmengde i form av årsdøgntrafikk (ÅDT) er både normaliseringsvariabel for risikoscore og forklaringsvariabel. Verdiområdet for ÅDT er delt opp i intervaller som vist i Figur 3. Oppdelingen tilstreber likt antall vegsegmenter i hvert intervall og dette fører til forskjellig bredde i ÅDT for hvert intervall. Som beskrevet i kapittel 3, er dette en finere inndeling enn i (BearingPoint, 2017). Intervallet som dekker segmentene med høyest trafikk spenner i denne analysen over et intervall med ÅDT mellom 10 300 og 25 000.

Fra Tabell 6 og Figur 3 kan vi se at risikoen holder seg relativt stabil for de ulike trafikkmengde- intervallene. Dette til sammenligning med det man kunne observere i analysen av hele vegnettet, der risikoen i stor grad var økende med høyere trafikkmengde. Alle ÅDT-verdiene som er inkludert i denne analysen hadde en relativ risiko som var høyere enn gjennomsnittet for hele vegnettet. Denne gang, når man sammenligner med gjennomsnittlig risiko i det utvalgte subsettet, ser vi at ingen grupper har mer enn 16 % høyere risiko enn snittet.

Tabell 6: Deskriptiv statistikk for variabelen «trafikk_ADT_total»

ÅDT mindre enn

Relativ risiko

Antall segmenter

Andel segmenter

Lengde (km)

Andel veglengde

Snitt ÅDT

Kjt-km pr. år (Mill)

Andel kjt-km

pr. år

1 190 0,88 4 969 9,79 % 2 341 12,20 % 1 070 920 3,61 %

1 462 0,87 5 180 10,20 % 2 383 12,42 % 1 307 1 137 4,45 %

1 786 0,89 5 083 10,01 % 2 079 10,84 % 1 614 1 222 4,79 %

2 191 1,06 5 071 9,99 % 2 246 11,71 % 1 977 1 621 6,35 %

2 698 0,99 5 079 10,00 % 2 118 11,04 % 2 415 1 862 7,30 %

3450 1,05 5 036 9,92 % 1 896 9,88 % 2 996 2 073 8,12 %

4 583 1,07 5 114 10,07 % 1 731 9,02 % 3 940 2 487 9,74 %

6 500 1,13 5 087 10,02 % 1 608 8,38 % 5 421 3 171 12,42 %

10 300 1,16 5 080 10,00 % 1 532 7,98 % 8 227 4 563 17,87 %

25 000

(maks) 0,91 5 080 10,00 % 1 249 6,51 % 14 369 6 471 25,35 %

Total 50 779 19 183 25 528

(17)

©2018 BearingPoint. All rights reserved. 17 Figur 3: Relativ risiko for variabelen «trafikk_ADT_total»

5.1.2 Belysning

I det utvalgte subsettet med relativt trafikkerte veger har 50,6 % av segmentene belysning. I datasettet for hele vegnettet var andelen 21 %. Målt i kjøretøykilometer utgjør veger med belysning i subsettet 54,5%. Enkeltvariabelanalysen viser at andelen høyrisikosegmenter er relativt lik for de belyste og de ubelyste vegene. Til sammenligning hadde vegene med belysning en høyere relativ risiko da man

betraktet hele vegnettet. Dette kan skyldes at vegene med belysning der hadde en betydelig høyere ÅDT i snitt enn vegene uten belysning. I det utvalgte subsettet av vegsegmenter i denne analysen er ikke lenger risikoforskjellen mellom høy og lav ÅDT så fremtredende.

Tabell 7: Deskriptiv statistikk for variabelen «har_belysning»

Har Belysning

Relativ risiko

Antall segmenter

Andel segmenter

Lengde (km)

Andel veglengde

Snitt ÅDT

Kjt-km pr. år (Mill)

Andel kjt-km

pr. år

Ja 0,98 25 667 50,55 % 7 300 38,05 % 5 539 13 920 54,53 %

Nei 1,02 25 112 49,45 % 11 883 61,94 % 3 106 11 609 45,47 %

Total 50 779 19 183 25 528

(18)

©2018 BearingPoint. All rights reserved. 18 Figur 4: Relativ risiko for variabelen «har_belysning»

5.1.3 Antall virksomheter

Variabelen «ssb_est_tot_1000m» angir antall virksomheter innenfor en rute på 1000 x 1000 m2. Fra enkeltvariabelplottet av variabelen kan man se at blant vegsegmenter med mer enn 52 virksomheter i nærheten er det en høyere andel høyrisikosegmenter enn gjennomsnittlig. Er antallet virksomheter høyere enn 131 er det 50 % høyere forekomst av høyrisikosegmenter. Dette er et eksempel på den generelle trenden som kan observeres i resultatene om at det er høyere risiko forbundet med tettbebygde strøk.

Tabell 8: Deskriptiv statistikk for variabelen «ssb_est_tot_1000m»

2 Se kapittel 5.2.3 i (BearingPoint, 2017) for detaljer.

Antall virksom- heter

Relativ risiko

Antall segmenter

Andel segmenter

Lengde (km)

Andel veglengde

Snitt ÅDT

Kjt-km pr. år (Mill)

Andel kjt-km

pr. år

0 0,87 6 606 13,01 % 2 451 12,78 % 2 293 2 016 7,90 %

1-2 0,98 8 727 17,19 % 4 941 25,76 % 2 911 4 727 18,51 %

3-4 0,93 5 906 11,63 % 2 754 14,36 % 3 183 2 922 11,45 %

5-6 0,99 4 214 8,30 % 1 628 8,48 % 3 527 2 009 7,87 %

7-11 0,97 5 924 11,67 % 2 121 11,06 % 3 675 2 699 10,57 %

12-22 0,90 5 279 10,40 % 1 662 8,66 % 4 156 2 482 9,72 %

23-52 0,97 5 103 10,05 % 1 469 7,66 % 5 534 2 760 10,81 %

53-131 1,08 5 159 10,16 % 1 296 6,75 % 7 226 3 207 12,56 %

132-

6331 1,50 3 861 7,60 % 861 4,49 % 9 173 2 706 10,60 %

Total 50 779 19 183 25 528

(19)

©2018 BearingPoint. All rights reserved. 19 Figur 5: Relativ risiko for variabelen «ssb_est_tot_1000m»

5.1.4 Antall kryss

Omtrent 43 % av de analyserte vegsegmentene har 1 eller flere vegkryss. Enkeltvariabelanalysen på variabelen «antall_kryss» viser at andel høyrisikosegmenter øker med antall vegkryss på segmentet.

Samme trend kunne observeres i analysen på hele vegnettet.

Tabell 9: Deskriptiv statistikk for variabelen «antall_kryss»

Antall kryss

Relativ risiko

Antall segmenter

Andel segmenter

Lengde (km)

Andel veglengde

Snitt ÅDT

Kjt-km pr. år (Mill)

Andel kjt-km

pr. år

0 0,90 26 627 52,44 % 11 305 58,93 % 4 138 13 631 53,39 %

1 1,08 12 016 23,66 % 4 051 21,12 % 4 467 5 670 22,21 %

2 - 8 1,19 9 658 19,02 % 3 181 16,58 % 4 755 5 272 20,65 %

9 - 19

(maks) 1,61 215 0,42 % 110 0,57 % 5 636 211 0,83 %

mangler

data 0,89 2 263 4,46 % 535 2,79 % 4 052 745 2,92 %

Total 50 779 19 183 25 528

(20)

©2018 BearingPoint. All rights reserved. 20 Figur 6: Relativ risiko for variabelen «antall_kryss»

5.1.5 Antall kurver

Vegsegmenter med én eller flere kurver er (i likhet med vegkryss) forbundet med en høyere forekomst av høyrisikosegmenter enn vegsegmenter uten kurver. Fra enkeltvariabelanalysen på variabelen

«antall_kurver_r200» i Tabell 10 kan vi se at de vegsegmentene som har mer enn 4 kurver med radius under 200m har 23 % høyere andel høyrisikosegmenter enn gjennomsnittet i datasettet. Vegsegmentene uten noen slike kurver har til gjengjeld en 10 % lavere andel høyrisikosegmenter enn gjennomsnittet. I analysen på hele vegnettet (BearingPoint, 2017) kunne motsatt sammenheng observeres. Der viste enkeltvariabelanalysen på samme variabel at vegsegmentene med mer enn én horisontal kurve hadde lavere forekomst av høyrisikosegmenter.

Tabell 10: Deskriptiv statistikk for variabelen «antall_kurver_r200»

Antall kurver

Relativ risiko

Antall segmenter

Andel segmenter

Lengde (km)

Andel veglengde

Snitt ÅDT

Kjt-km pr. år (Mill)

Andel kjt-km

pr. år

0 0,90 21 401 42,15 % 8 258 43,05 % 5 371 13 296 52,08 %

1 1,08 8 639 17,01 % 3 120 16,26 % 4 151 3 929 15,39 %

2 0,99 6 267 12,34 % 2 314 12,06 % 3 958 2 745 10,75 %

3 - 4 1,07 6 718 13,23 % 2 709 14,12 % 3 119 2 785 10,91 %

5 - 18

(maks) 1,23 5 491 10,81 % 2 246 11,71 % 2 630 2 030 7,95 %

mangler

data 0,89 2 263 4,46 % 535 2,79 % 4 052 745 2,92 %

Total 50 779 19 183 25 528

(21)

©2018 BearingPoint. All rights reserved. 21 Figur 7: Relativ risiko for variabelen «antall_kurver_r200»

5.1.6 Vinterdriftsklasse

Det analyserte vegnettet er inndelt i vinterdriftklasse DkA – DkE, der DkA benyttes for veger med høyest trafikkmengde og strengest krav til snørydding. I analysen på hele vegnettet kunne vi se at veger med vinterdriftsklasse DkA – DkC hadde en forhøyet forekomst av høyrisikosegmenter. Dette var også de vegsegmentene med høyest gjennomsnittlig ÅDT. I det utvalgte subsettet av veger i denne analysen er det gjennomsnittlige risikonivået høyere, og vi kan se at det er kun klasse «DkB, middels» som har en betydelig høyere andel høyrisikosegmenter enn gjennomsnittet.

Tabell 11: Deskriptiv statistikk for variabelen «vinterdriftsklasse»

Vinter- drifts- klasse

Relativ risiko

Antall segmenter

Andel segmenter

Lengde (km)

Andel veglengde

Snitt ÅDT

Kjt-km pr. år (Mill)

Andel kjt-km

pr. år

DkA 1,00 3 220 6,34 % 862 4,49 % 11 447 3 509 13,74 %

DkB,

høy 1,00 7 195 14,17 % 2 114 11,02 % 7 712 5 638 11,09 %

DkB,

middels 1,17 9 654 19,01 % 1 744 9,09 % 3 035 1 888 7,40 %

DkB, lav 1,01 4 253 8,38 % 3 284 17,12 % 5 109 5 396 21,14 %

DkC 0,97 12 829 25,26 % 5 606 29,23 % 2 479 4 669 18,29 %

DkD 0,90 9 396 18,50 % 4 054 21,14 % 2 318 2 994 11,72 %

DkE 0,92 2 702 5,32 % 868 4,52 % 1 917 564 2,21 %

GsB 0 1 0,00 % 0 0,00 % 2 630 0 0,00 %

Mangler

data 1,01 1 529 3,01 % 651 3,39 % 4 472 870 3,41 %

Total 50 779 19 183 25 528

(22)

©2018 BearingPoint. All rights reserved. 22 Figur 8: Relativ risiko for variabelen «vinterdriftsklasse»

5.1.7 Dekkebredde

For variabelen «DER_vegbredde_dekkebredde» kan vi se at det er relativt lik andel høyrisikosegmenter i de fire kategoriene. I gruppe A (dekkebredde < 6 m) er andelen noe lavere enn gjennomsnittlig, mens i gruppe B (veger med dekkebredde mellom 6 og 8,5 m) er den er noe høyere. Mer enn 68 % av

vegsegmentene i datasettet tilhører gruppe B.

Tabell 12: Deskriptiv statistikk for variabelen «DER_vegbredde_dekkebredde»

Dekke- bredde

Relativ risiko

Antall segmenter

Andel segmenter

Lengde (km)

Andel veglengde

Snitt ÅDT

Kjt-km pr. år (Mill)

Andel kjt-km

pr. år A: < 6 0,94 5 671 11,17 % 2 231 11,63 % 1 957 1 478 5,79 % B: 6

tom 8,5 1,07 34 962 68,85 % 14 284 74,46 % 3 790 17 294 67,75 % C: 8,5

tom 12 0,99 4 727 9,30 % 1 455 7,59 % 8 318 4 217 16,52 %

D: > 12 0,97 921 1,81 % 178 0,93 % 11 054 735 2,88 %

Mangler

data 0,54 4 498 8,86 % 1 034 5,39 % 6 020 1 804 7,07 %

Total 50 779 19 183 25 528

(23)

©2018 BearingPoint. All rights reserved. 23 Figur 9: Relativ risiko for variabelen «DER_vegbredde_dekkebredde»

Tovariabelanalyse: Dekkebredde og ÅDT

Figur 10 viser at den relative risikoen for vegsegmenter med dekkebredden «B: 6 tom 8,5» varierer med trafikkmengden. I tovariabelplottet er den relative risikoen for vegsegmentene med dekkebredde mellom 6 og 8,5 meter vist pr. ÅDT-intervall. Innenfor alle intervallene med ÅDT >= 1786 er veger med

dekkebredde i gruppe B forbundet med høyere risiko, mens i intervallene med ÅDT < 1786 er den relative risikoen lavere enn gjennomsnittet.

Figur 10: Relativ risiko for kategorien «B: 6 tom 8,5» av variabelen DER_vegbredde_dekkebredde pr. ÅDT-intervall

(24)

©2018 BearingPoint. All rights reserved. 24

5.2 Regler

Dette kapittelet gjengir hovedresultatene fra analysen, i form av regler som beskriver egenskaper ved vegen og dens omgivelser som kjennetegner ulykkesutsatte vegstrekninger.

Det er gjort et uttømmende søk etter regler som kombinerer opptil fire forklaringsvariabler. Denne begrensningen er valgt for å unngå regler som dekker en for liten del av vegnettet (og dermed er ekstra utsatt for støy i analysen), samt for å begrense maskintid3. I (BearingPoint, 2017) ble alle kontinuerlige variabler delt inn i fem kvantiler (der man tilstreber et jevnt antall observasjoner pr. kvantil). For enkelte av variablene ble fem kvantiler ansett som en litt for grov inndeling, men ble likevel benyttet ettersom alle variabler måtte inndeles i samme antall kvantiler. En oppgradering av HyperCube har i ettertid muliggjort at antall kvantiler kan bestemmes pr. variabel. Derfor har man i denne analysen plukket ut 11 variabler der det ansees som fordelaktig med en oppdeling i ti kvantiler istedenfor fem. Disse variablene er listet opp i Appendiks C.1.

I denne analysen gir det uttømmende søket (med opptil fire variabler i kombinasjon) et regelsett på ca.

6,4 millioner regler4. Det gjøres en filtrering der interessante regler beholdes, slik at antall regler begrenses til neste steg. Tre kriterier er lagt til grunn for å identifisere interessante regler:

1. Signalstyrke: Det settes en minstegrense for relativ risiko pr. enkeltregel (dvs. hvor stor andel av segmentene i regelen som må være høyrisikosegmenter, sammenlignet med gjennomsnittlig andel høyrisikosegmenter i datasettet). Ulike grenseverdier er benyttet.

2. Størrelse: Det settes en minstegrense for dekning pr. enkeltregel (dvs. minste antall høyrisikosegmenter som regelen må omfatte). Ulike grenseverdier er benyttet.

3. Variabler:

a. Alle regler må inneholde minst én variabel som beskriver en egenskap ved selve vegen (datakilde NVDB), som det kan gjøres tiltak eller vegdesign basert på. Dette er gjort for å unngå regler som utelukkende beskriver vegens omgivelser i form av klima og demografi.

b. Underveis i analysen har man innsett at flere av variablene for klima og demografi er vanskelige å tolke, for eksempel standardavvik-variablene for vær. Dette gjør at reglene som inneholder denne typen variabler ansees som mindre interessante. For å unngå at disse reglene tar plassen til regler som vurderes som mer interessante, har man i denne analysen filtrert vekk alle regler som inneholdt slike variabler. En liste over variablene som førte til at en regel filtrert bort finnes i Appendiks C.2.

Det er produsert tre regelsett med ulike krav til minimumsgrense for dekning pr. regel, på 69, 200 og 400 høyrisikosegmenter5. Tanken bak dette er å produsere ett regelsett som prioriterer små og sterke sammenhenger, ett regelsett med store og mindre sterke sammenhenger, og ett balansert regelsett. De minimerte regelsettene som ligger til grunn for resultatene i denne analysen består av 36-55 regler hver,

3 Antallet regelkandidater som må undersøkes vokser eksponentielt med antall forklaringsvariabler en regel kan bestå av. Tester med søk etter regler som kombinerer fem forklaringsvariabler gir indikasjon på at det er lite å hente i regler med over fire forklaringsvariabler.

4 Det uttømmende regelsøket i (BearingPoint, 2017) resulterte i ca. 2.2 millioner regler. Den store økningen i antall regler skyldes trolig at man i denne analysen har valgt å dele inn utvalgte kontinuerlige variabler i ti kvantiler fremfor fem.

5 Kravet til antall høyrisikosegmenter i regelsettet med lavest dekning pr. regel ble satt til 1% av alle høyrisikosegmenter i hele vegnettet

(25)

©2018 BearingPoint. All rights reserved. 25

og beskriver (med ulike perspektiver og prioriteringer) essensen av de 6,4 millionene regler som det uttømmende regelsøket gir.

For hvert regelsett er det beregnet et måltall for dekning på regelsettnivå, som beskriver hvor mange høyrisikosegmenter som omfattes av minst én regel i regelsettet, eller sagt med andre ord: Hvor mange høyrisikosegmenter unionen av alle enkeltregler i regelsettet omfatter. De tre regelsettene kan med det oppsummeres som vist i Tabell 13:

Tabell 13: Oversikt over dekning på regelsettnivå. Prosentsatser angitt som andel av datasettet benyttet for den spissede vegsegmentanalysen, ikke for hele vegnettet.

Regelsettets prinsipp:

Søkte

sammenhenger

Antall regler

Min relativ risiko pr.

regel

Min dekning pr. regel (antall høyrisikosegmenter)

Total dekning (antall høyrisikosegmenter)

Små og sterke 55 1.8 69 (1,5 %) 2 457 (54,1 %)

Balanserte 51 1.3 200 (4,4 %) 3 916 (86,3 %)

Store og mindre

sterke 36 1.3 400 (8,8 %) 3 864 (85,1 %)

Blant de totalt 142 reglene er det noen mønster som går igjen flere ganger. Som nevnt i kapittelets innledning, har vi i samarbeid med Trafikksikkerhetsseksjonen identifisert 6 hovedtrender i de tre minimerte regelsettene:

- Tettbebygde strøk - Ubelyste veger - Veger med kryss - Kurvede veger

- Lav til middels vinterdrift - Lav dekkebredde og høy trafikk

Det har videre blitt gjort en manuell utvelgelse av 2-3 spesielt interessante regler pr. gruppe, som beskrives i mer detalj i dette avsnittet. Appendiks B gjengir alle regler i de tre regelsettene.

5.2.1 Tettbebygde strøk

Et relativt stort antall regler i de tre minimerte regelsettene identifiserer vegsegmenter som ligger ved tettbebygde strøk. Tett bebyggelse kan identifiseres på ulike måter, for eksempel ved et høyt

befolkningstall («ssb_pop_tot_250m»), et høyt antall virksomheter («ssb_est_tot_1000m») eller et høyt antall bygninger («ssb_bui0all_250m» eller «ssb_dwe_todw_250m»). Her gjengis tre av reglene som beskriver tettbebygde strøk, heretter kalt «Tettbebygd regel 1», «Tettbebygd regel 2» og «Tettbebygd regel 3».

5.2.1.1 Tettbebygd regel 1: Kurvede veger uten rekkverk i områder med mange virksomheter

Regelen beskriver veger med minst én horisontal kurve, men uten side- eller midtrekkverk, i områder med mange virksomheter og hvor gjennomsnittlig areal på nærliggende boliger er lite til middels. Denne typen veger har 1,72 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

(26)

©2018 BearingPoint. All rights reserved. 26

Relativ risiko (lift) 1,72 -

Antall høyrisikosegmenter i regel 483 10,64

Antall segmenter i regel 3 142 6,19

Veglengde 1 025 km 5,35

Kjørte kilometer pr. år 2 437 mill. km 9,55

Variabler som beskriver regel DER_rekkverk_side_eller_midt: Nei Har side- eller midtrekkverk (Ja/Nei).

antall_kryss: > 0

Antall vegkryss (T- og X-kryss).

ssb_dwe_area: < 147

Gjennomsnittlig bruksareal. Boligstatistikk fra 2014, 250 m rutenett.

ssb_est_tot_1000m: ≥ 37

Antall virksomheter totalt. Virksomhetsstatistikk fra 2016. 1 km rutenett.

Figur 11: Tettbebygd regel 1. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.1.2 Tettbebygd regel 2: Fylkesveger med en viss andel langtransport i befolket område

Regelen beskriver fylkesveger med minst 10 % andel langtransport som går gjennom befolkede områder («ssb_pop_tot_250m» ≥ 10) i middels varme til varme strøk («TAM_middeltemp_snitt» ≥ 4,75). Denne typen veger har 1,33 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,33 -

Antall høyrisikosegmenter i regel 439 9,67

(27)

©2018 BearingPoint. All rights reserved. 27

Antall segmenter i regel 3 692 7,27

Veglengde 1 142 km 5,96

Kjørte kilometer pr. år 1 411 mill. km 5,29

Variabler som beskriver regel vegkategori: Fylkesveg Vegkategori.

TAM_middeltemp_snitt: ≥ 4,75

Gjennomsnittlig middeltemperatur pr. døgn.

ssb_pop_tot_250m: ≥ 10

Personer i alt. Befolkningsdata fra 2016, 250 m rutenett.

trafikk_ADT_andel_lange_kjoretoy: ≥ 10 Andel lange kjøretøy av total ÅDT.

Figur 12: Tettbebygd regel 2. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.2 Ubelyste veger

Et annet mønster som går igjen i flere regler er manglende belysning. Dette kjennetegnes typisk ved at variabelen ‘har_belysning’ = «Nei».

5.2.2.1 Ubelyst regel 1: Ubelyste veger med kurver og stigning

Regelen beskriver kurvede, middels trafikkerte veger uten belysning og i tillegg noe stigning (én eller to 200m-strekninger med stigning på minst 4%). Denne typen veger har 1,41 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

(28)

©2018 BearingPoint. All rights reserved. 28

Relativ risiko (lift) 1,41 -

Antall høyrisikosegmenter i regel 192 4,23

Antall segmenter i regel 1 528 3,01

Veglengde 771 km 4,02

Kjørte kilometer pr. år 708 mill. km 2,78

Variabler som beskriver regel har_belysning: Nei

Har belysning (Ja/Nei).

antall_kurver_r200: > 0

Antall 50 m strekninger med kurveradius under 200 m.

antall_stigninger_4pst: 1 - 2

Antall 200 m strekninger med stigning på minst 4

%.

trafikk_ADT_total: 1 786 – 4 582 Årsdøgntrafikk (ÅDT).

Figur 13: Ubelyst regel 1. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.2.2 Ubelyst regel 2: Ubelyste veger med kurver i bebygde områder

Regelen beskriver kurvede, middels trafikkerte veger uten belysning som ligger ved bebygde områder (mellom 1 og 9 bygninger). Denne typen veger har 1,41 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,41 -

Antall høyrisikosegmenter i regel 394 8,68

Antall segmenter i regel 3 138 6,18

(29)

©2018 BearingPoint. All rights reserved. 29

Veglengde 1 793 km 9,35

Kjørte kilometer pr. år 1 695 mill. km 6,64

Variabler som beskriver regel har_belysning: Nei

Har belysning (Ja/Nei).

antall_kurver_r200: > 0

Antall 50 m strekninger med kurveradius under 200 m.

ssb_bui0all_250m: 1 - 9

Antall bygg i alt. Data fra 2016, 250 m rutenett.

trafikk_ADT_total: 1 786 – 4 582 Årsdøgntrafikk (ÅDT).

Figur 14: Ubelyst regel 2. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.2.3 Ubelyst regel 3: Ubelyste veger med kurver i områder med skogbruk

Regelen beskriver kurvede veger uten belysning som ligger ved områder med skogbruk og middels gjennomsnittlig middeltemperatur («TAM_middeltemp_snitt» mellom 4,75 og 7,47). Denne typen veger har 1,31 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,31 -

Antall høyrisikosegmenter i regel 418 9,21

Antall segmenter i regel 3 578 7,05

Veglengde 1 802 km 9,39

Kjørte kilometer pr. år 1 679 mill. km 6,58

(30)

©2018 BearingPoint. All rights reserved. 30

Variabler som beskriver regel har_belysning: Nei

Har belysning (Ja/Nei).

TAM_middeltemp_snitt: 4,75 – 7,47

Gjennomsnittlig middeltemperatur pr. døgn.

antall_kurver_r200: > 0

Antall 50 m strekninger med kurveradius under 200 m.

ssb_agp_for: 1 – 4

Antall skogeiendommer. Data fra 2014, 1 km rutenett.

Figur 15: Ubelyst regel 3. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.3 Kryss

Vegsegmenter med minst ett vegkryss er også noe som går igjen i de tre minimerte regelsettene.

5.2.3.1 Kryss regel 1: Trafikkerte veger med høy fartsgrense og T-kryss

Regelen beskriver trafikkerte veger (ÅDT mellom 1 786 og 6 499) med høy fartsgrense (70 eller 80 km/t) og minst ett T-kryss. Denne typen veger har 1,33 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,33 -

Antall høyrisikosegmenter i regel 403 8,88

Antall segmenter i regel 3 391 6,68

(31)

©2018 BearingPoint. All rights reserved. 31

Veglengde 1 430 km 7,45

Kjørte kilometer pr. år 1 731 mill. km 6,78

Variabler som beskriver regel antall_Tkryss: > 0

Antall T-kryss.

fartsgrense_hoyeste: 70 – 80

Fartsgrense. Høyeste fartsgrense dersom det er forskjellig fartsgrense for kjøreretning.

trafikk_ADT_total: 1 786 – 6 499 Årsdøgntrafikk (ÅDT).

Figur 16: Kryss regel 1. De tre figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.3.2 Kryss regel 2: Høyt trafikkerte fylkesveger med kryss i varmere områder

Regelen beskriver høyt trafikkerte fylkesveger (ÅDT ≥ 6500) med mellom 1 og 8 kryss som går gjennom varmere områder («TAM_middeltemp_snitt» ≥ 6,38). Denne typen veger har 1,71 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,71 -

Antall høyrisikosegmenter i regel 211 4,65

Antall segmenter i regel 1 381 2,72

Veglengde 403 km 2,10

Kjørte kilometer pr. år 1 471 mill. km 5,76

(32)

©2018 BearingPoint. All rights reserved. 32

Variabler som beskriver regel vegkategori: Fylkesveg Vegkategori.

TAM_middeltemp_snitt: ≥ 6,38

Gjennomsnittlig middeltemperatur pr. døgn.

antall_kryss: 1 - 8

Antall vegkryss (T- og X-kryss).

trafikk_ADT_total: 6 500 – 25 000 Årsdøgntrafikk (ÅDT).

Figur 17: Kryss regel 2. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.3.3 Kryss regel 3: Riksveger med kryss i bebygd område

Regelen beskriver riksveger («Ikke_fylkesveg») med fartsgrense mellom 60 og 80 km/t og minst ett kryss, som ligger ved bebygde områder (mellom 3 og 25 boliger). Denne typen veger har 1,30 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,30 -

Antall høyrisikosegmenter i regel 235 5,18

Antall segmenter i regel 2 018 3,97

Veglengde 767 km 4,00

Kjørte kilometer pr. år 1 556 mill. km 6,09

Variabler som beskriver regel

(33)

©2018 BearingPoint. All rights reserved. 33

vegkategori: Ikke_fylkesveg Vegkategori.

antall_kryss: > 0

Antall vegkryss (T- og X-kryss).

fartsgrense_hoyeste: 60 - 80 Årsdøgntrafikk (ÅDT).

ssb_dwe_todw_250m: 3 – 25

Boliger i alt. Boligstatistikk fra 2014, 250 m rutenett.

Figur 18: Kryss regel 3. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.4 Kurver

I enkeltvariabelanalysen tidligere i kapittelet så man at kurvede vegstrekninger er forbundet med høyere risiko for ulykker. At et vegsegment inneholder en kurve kjennetegnes av at «antall_kurver_r200» eller

«antall_kurver_r300» er større enn 0.

5.2.4.1 Kurver regel 1: Kurvede veger med høy fartsgrense og siderekkverk

Regelen beskriver kurvede veger (minst 3 kurver med radius under 200 m) med 80 i fartsgrense,

siderekkverk og middels trafikkmengde (ÅDT mellom 2 191 og 4 582). Denne typen veger har 1,97 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,97 -

Antall høyrisikosegmenter i regel 74 1,63

Antall segmenter i regel 421 0,83

Veglengde 207 km 1,08

(34)

©2018 BearingPoint. All rights reserved. 34

Kjørte kilometer pr. år 219 mill. km 0,86

Variabler som beskriver regel har_siderekkverk: Ja

Har siderekkverk (Ja/Nei).

antall_kurver_r200: ≥ 3

Antall 50 m strekninger med kurveradius under 200 m.

fartsgrense_hoyeste: 80

Fartsgrense. Høyeste fartsgrense dersom det er forskjellig fartsgrense for kjøreretning.

trafikk_ADT_total: 2 191 - 4582 Årsdøgntrafikk (ÅDT).

Figur 19: Kurver regel 1. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.4.2 Kurver regel 2: Kurvede primære fylkesveger med høy fartsgrense

Regelen beskriver kurvede (> 0 kurver med radius under 200 m) primære fylkesveger med høy fartsgrense (≥ 80) og middels trafikkmengde (ÅDT mellom 1 786 og 4 582). Denne typen veger har 1,54 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,54 -

Antall høyrisikosegmenter i regel 204 4,50

Antall segmenter i regel 1 482 2,92

Veglengde 802 km 4,18

Kjørte kilometer pr. år 760 mill. km 2,98

(35)

©2018 BearingPoint. All rights reserved. 35

Variabler som beskriver regel vegfunksjon: Primære fylkesveger Vegfunksjon.

antall_kurver_r200: > 0

Antall 50 m strekninger med kurveradius under 200 m.

fartsgrense_hoyeste: ≥ 80

Fartsgrense. Høyeste fartsgrense dersom det er forskjellig fartsgrense for kjøreretning.

trafikk_ADT_total: 1 786 - 4 582 Årsdøgntrafikk (ÅDT).

Figur 20: Kurver regel 2. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.5 Lav til middels vinterdrift

Flere regler involverer variabler knyttet til vinterdrift, enten vinterdriftsklasse eller vinterdriftsstrategi.

Reglene beskriver i hovedsak vegsegmenter der vinterdriften kan klassifiseres som lav eller middels.

5.2.5.1 Vinterdrift regel 1: Veger med vinterdriftklasse DkC, høy fartsgrense og kurver i befolket område Regelen beskriver veger med vinterdriftsklasse DkC, høy fartsgrense (70 eller 80 km/t) og minst én kurve som går gjennom et befolket område (ssb_pop_tot_250m > 0). Denne typen veger har 1,41 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,41 -

Antall høyrisikosegmenter i regel 220 4,85

Antall segmenter i regel 1 745 3,44

Veglengde 1 346 km 7,01

(36)

©2018 BearingPoint. All rights reserved. 36

Kjørte kilometer pr. år 951 mill. km 3,72

Variabler som beskriver regel vinterdriftsklasse: DkC

Inndeling av vegnettet for å beskrive ulik standard for vinterdrift.

antall_kurver_r200: > 0

Antall 50 m strekninger med kurveradius under 200 m.

fartsgrense_hoyeste: 70 - 80

Fartsgrense. Høyeste fartsgrense dersom det er forskjellig fartsgrense for kjøreretning.

ssb_pop_tot_250m: > 0

Personer i alt. Befolkningsdata fra 2016, 250 m rutenett.

Figur 10: Vinterdrift regel 1. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.5.2 Vinterdrift regel 2: Kalde steder med ‘Mellom’-vinterdriftsstrategi, høyere fartsgrense og kurver Regelen beskriver veger med vinterdriftsstrategi ‘Mellomstrategi’, høy fartsgrense (≥ 70 km/t) og minst én kurve som ligger i et kaldt område («TAM_middeltemp_snitt» < 4,75). Denne typen veger har 1,82 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,82 -

Antall høyrisikosegmenter i regel 70 1,54

Antall segmenter i regel 430 0,85

Veglengde 271 km 1,41

Kjørte kilometer pr. år 241 mill. km 0,94

(37)

©2018 BearingPoint. All rights reserved. 37

Variabler som beskriver regel vinterdriftsstrategi: Mellomstrategi Strategi for vinterdrift på strekningen.

TAM_middeltemp_snitt: < 4,75

Gjennomsnittlig middeltemperatur pr. døgn.

antall_kurver_r200: > 0

Antall 50 m strekninger med kurveradius under 200 m.

fartsgrense_hoyeste: ≥ 70

Fartsgrense. Høyeste fartsgrense dersom det er forskjellig fartsgrense for kjøreretning.

Figur 11: Vinterdrift regel 2. De fire figurene viser relativ risiko for hver av enkeltvariablene som inngår i regelen. Relativ risiko i figurene er beregnet basert på alle 50 779 segmenter som inngår i det analyserte vegnettet.

5.2.6 Lav dekkebredde og høy trafikk

Denne gruppen regler inneholder alle variablene «DER_vegbredde_dekkebredde» og

«trafikkmengde_ADT_total». Sammenhengene som går igjen peker typisk på vegsegmenter med lav til middels dekkebredde i kombinasjon med høy trafikkmengde.

5.2.6.1 Dekkebredde regel 1: Høyt trafikkerte veger med normalbredde og kryss

Regelen beskriver veger med dekkebredde mellom 6 og 8.5 meter med mye trafikk (ÅDT ≥ 4 583) og mellom 1 og 8 kryss. Denne typen veger har 1,44 ganger så høy forekomst av høyrisikosegmenter som gjennomsnittet. Vegene i regelen omfatter 17,1 % av total trafikk i det analyserte vegnettet.

Måltall Verdi for regel Andel av total (%)

Relativ risiko (lift) 1,44 -

Antall høyrisikosegmenter i regel 581 12,80

Antall segmenter i regel 4 530 8,92

Veglengde 1 469 km 7,66

Referanser

RELATERTE DOKUMENTER

Ser man på fallet man får for partialtrykkdifferansen når man går fra 40% relativ fuktighet til 80% relativ fuktighet, ligger vanndamptransporten for de tre aktuelle

Ikke uventet finner vi at det er en langt høyere andel barnløse 30-åringer blant dem som er født på slutten av 1960-tallet enn hva det var i eldre kohorter, men ved 40-års alderen

Midlertidig ansatte har en enda høyere andel som går over i fast jobb (rundt 40–50 prosent), og denne andelen er stigende over perioden.. Overgang ut av arbeidsstyrken synker

I denne analysen beskriver en regel en samling vegsegmenter som har en vesentlig høyere risiko enn snittet i vegnettet, der risiko forstås som andel høyrisikosegmenter innenfor

1. Signalstyrke: Det settes en minstegrense for relativ risiko pr. hvor stor andel av ulykkene i regelen som må ha alvorlig utfall, sammenlignet med gjennomsnittlig andel alvorlige

Broken lines Source: IMF (Fiscal Monitor November 2010).. USD per MMBTU. 2) Calculation of future gas prices for Norway based on assumptions in 2011 National Budget Sources:

Ved å benytte tall for risiko for å dø blant kvinner og menn som aldri har røykt og tallene for alle kvinner og menn kan vi beregne hvor stor andel av dødsfallene mellom 40 og 70 år

Relativ risiko var litt over 2 for både menn og kvinner, som betyr at sannsynligheten for å få utlevert minst ett legemiddel fra ATC-gruppe N07 var litt over dobbelt så stor