• No results found

Possibilities to use existing data sources to replace traditional travel survey methods

N/A
N/A
Protected

Academic year: 2022

Share "Possibilities to use existing data sources to replace traditional travel survey methods"

Copied!
105
0
0

Laster.... (Se fulltekst nå)

Fulltekst

(1)

Øystein Haug

Possibilities to Use Existing Data Sources to Replace Traditional Travel Survey Methods

Trondheim, July 2016

NTNU Norwegian University of Science and Technology Faculty of Engineering Science and Technology Department of Civil and Transport Engineering

Ma st e r’s th e si s

(2)
(3)

NTNU-Norges teknisk- naturvitenskapelige universitet

Forord

Denne masteroppgaven er skrevet v˚aren 2016 ved Institutt for bygg, anlegg og transport innenfor hovedprofil transport. Oppgaven best˚ar av en prosessrapport og en vitenskapelig ar- tikkel. De utgjør tilsammen en tradisjonell masteroppgave som tilsvarer 30 studiepoeng ved masterprogrammet bygg- og miljøteknikk ved Norges teknisk-naturvitenskapelige universitet.

Bakgrunnen for oppgaven er Statens vegvesens ønske om ˚a se p˚a mulige forbedringer med dagens reisevaneundersøkelse. De har ogs˚a vært oppdragsgiver og st˚att for finansieringen av prosjektet. Gjennom semesteret har form˚alet med prosjektet og oppgavens vinkling blitt formet og diskutert p˚a m˚anedlige møter. Det har vært svært spennende ˚a sette seg inn i et prosjekt som i realiteten kan p˚avirke fremiden for Reisevaneundersøkelsen.

Prosessrapporten er utarbeidet for ˚a kunne dokumentere arbeidet som har blitt utført, samtidig skal den ogs˚a stille seg kritisk til avgjørelser og metodevalg. Artikkelen er skrevet for

˚a kunne presenteres og eventuelt publiseres i tilknytning til Trafikdage p˚a Aalborg Universitet, høsten 2016.

Førsteamanuensis Trude Tørset har vært faglig veileder sammen med phd. stipendiat Mar´ıa D´ıez Guti´errez. I tillegg vil jeg takke følgende personer for faglig innspill og bidrag til oppgaven:

• Tomas Levin (NTNU/Statens vegvesen)

• Tom E. Nørbech (Statens vegvesen)

• Christian Berg Skjetne (Statens vegvesen)

• Erlend Dahl (SINTEF, SMiO-applikasjon)

Trondheim, 11. juli 2016

Øystein Haug

(4)
(5)

NTNU-Norges teknisk- naturvitenskapelige universitet

Sammendrag

Tradisjonelle reisevaneundersøkelser i Norge gjennomføres med en stadig synkende svar- prosent. I tillegg til synkende deltakelse, har undersøkelsene problember med under- og over- estimering av antall turer. Denne oppgaven ser p˚a alternative eksisterende datakilder som har til hensikt ˚a redusere disse problemene, enten ved ˚a supplementere eller erstatte tradisjonelle papirbaserte reisevaneundersøkelser i Norge.

Studiet begrenser seg til ˚a analysere hele turer fra start til sluttpunkt og ikke segmentering i etapper. Lange reiser over 100 km er utelatt i likhet med tradisjonell reisevaneundersøkelse.

Det ble heller ikke sendt ut dagbok for registrering av reiser. I utvelgelsen av respondenter ble det bevisst valgt telefoner med operativsystem Android eller iOS. Identifisering og analyse av etapper er utelatt selv om de er registrert i tradisjonell metode.

Et casestudie har blitt gjennomført for ˚a samle inn data til ˚a analysere og sammenlig- ne nye og tradisjonelle metoder. 13 frivillige deltakere har blitt sporet i 10 dager ved bruk av egen smart telefon. Reisedata fra applikasjonene Google NOW og SMiO er valgt som al- ternative datakilder. 121 telefonintervju ble utført etter mal fra dagens reisevaneundersøkelse.

Deltakerne har blitt delt inn i to grupper for ˚a kunne sammenligne tradisjonelt telefonintervju med assistert telefonintervju med informasjon fra Google. Data ble tolket ved bruk av enkel deskriptiv statistikk.

43% av registrerte turer i SMiO ble funnet igjen i telefon intervjuet. Applikasjonene re- gistrerte ca. 1,2 færre turer enn tradisjonell undersøkelse og det var lite forskjell p˚a aktiv og passiv metode n˚ar det gjaldt identifisering av turer. Reisemodi estimatet mellom de to applika- sjonene viser lav korrelasjon, bortsett fra reiser til fots. Applikasjonene har ogs˚a en større andel reiser med ukjent transportmiddel enn tradisjonell metode. Resultatene viser at applikasjonene presterer ulikt p˚a forskjellig operativsystem. iOS ser ikke ut til ˚a være egnet for bruk i reise- vaneundersøkelser p˚a grunn av redusert logge-frekvens. P˚a grunn av dette følger ogs˚a en større underestimering av starttidspunkt p˚a reiser foretatt med iOS. Generelt foretrekker deltakerne passiv sporing av reisene p˚a grunn av mindre involvering i undersøkelsen.

Det ser ut til at hver metode best˚ar av elementer som isolert sett har kvaliteter som bør tas i betraktning ved videre arbeid. Ved utarbeidelse av en eventuell ny metode for registrering av reisevaneundersøkelser, anbefales det en passiv tilnærming basert p˚a data fra SMiO.

(6)
(7)

NTNU-Norges teknisk- naturvitenskapelige universitet

Summary

In Norway, travel surveys are done with a declining response rate. In addition to decreased participation, the reported trips are likely to be over- and underreported. The purpose of this paper is to investigate if emerging methods could overcome these limitations, either with supplementing or replacing paper-based traditional travel surveys.

This study has limitations regarding trip segment analysis. As in the traditional survey, trips over 100 km are excluded. Travel registration diaries was not sent out. Only respondents with Android or iOS were selected to the study. Identification and analysis of trip segments is omitted, although they are collected in the traditional method.

A case study approach has been conducted for the collection and analysis of data with the purpose of comparing traditional methods with emerging ones. 13 volunteers have been tracked for 10 days by using their smart-phones. Travel data from the applications Google NOW and SMiO were selected as alternative data sources. 121 telephone interviews were done based on the traditional travel survey. The participants were divided into two groups in order to compare the traditional telephone interview to an assisted telephone interview with additional information from Google. Data were interpreted by using simple descriptive statistics.

43 % of registered trips in SMiO were found in the telephone interviews. The applica- tions identified approximately 1,2 fewer trips than the traditional method and there was little di↵erence between active and passive mode. Except for walking trips the estimate for travel modes between the two applications have a low correlation. The applications also have a higher proportion of unknown transport modes than the traditional method. The results show that the applications perform di↵erently on di↵erent operating systems. iOS does not seem to be suitable for use in travel surveys, due to reduced logging frequency. Because of this, there is also a major underestimation of the start time for trips taken with iOS. Generally the participants preferred passive tracking of trips, due to less burdensome investigation.

It appears that within all four methods there are elements, that when isolated, have qua- lities who should be considered in future work. If developing a new method for travel survey registrations, it is recommended that a passive approach based on data from SMiO are used.

(8)
(9)

Innhold

Forord . . . iii

Sammendrag . . . v

Summary . . . vii

Innhold . . . xi

Figurer . . . xiii

Tabeller . . . xv

Definisjoner og forkortelser . . . xvi

I Prosessrapport

1 Innledning 1 1.1 Bakgrunn for oppgaven . . . 1

1.2 Problemstilling og forskningsspørsm˚al . . . 1

1.3 Beskrivelse av metode . . . 2

1.4 Oppgavens omfang og begrensninger . . . 2

1.5 Oppbygging av rapporten . . . 3

2 Utfyllende teori 5 2.1 Reisevaneundersøkelser i Norge . . . 5

2.2 Erfaringer fra andre lignende prosjekter . . . 6

2.3 Teori knyttet til gjennomføring av undersøkelsen . . . 7

2.3.1 Villighet til ˚a delta i GPS-baserte undersøkelser . . . 7

2.3.2 Insentiver . . . 7

2.3.3 Applikasjoner . . . 8

2.3.4 Personvern GLH . . . 8

2.3.5 Prosessering av GPS-data . . . 8

3 Metode 11 3.1 Forskningsdesign . . . 11

3.2 Innsamling av litteratur . . . 12

3.3 Valg av metoder for datainnsamling . . . 12

3.3.1 Initiell spørreundersøkelse . . . 12

(10)

3.3.2 CATI . . . 13

3.3.3 SMiO . . . 13

3.3.4 Google NOW (GLH) . . . 14

3.3.5 End-survey . . . 14

3.4 Valg av prosesserings- og analysesmetoder . . . 14

4 Prosedyre og gjennomføring av egne undersøkelser 15 4.1 Innsamling av litteratur . . . 16

4.2 Rekruttering . . . 16

4.3 Initiell spørreundersøkelse . . . 17

4.4 Installasjon av software . . . 18

4.5 Gjennomføring av datainnsamling . . . 18

4.5.1 Strukturert telefonintervju - CATI . . . 18

4.5.2 SMiO . . . 19

4.5.3 Google NOW (GLH) . . . 19

4.5.4 End Survey . . . 19

4.6 Prosessering av innsamlet data . . . 19

4.6.1 Filtrering av GPS data . . . 20

4.6.2 Identifisering av turer . . . 21

4.6.3 Identifisering av reisemodi . . . 22

4.6.4 Sammensl˚aing av turer . . . 22

4.7 Analyse av reisedata . . . 24

4.8 Oppsummering . . . 24

5 Kritisk vurdering av gjennomføring 25 5.1 Metodekritikk . . . 25

5.2 Kritikk av resultat . . . 26

6 Andre funn og resultat 29

7 Konklusjon og anbefalinger om videre arbeid 31

II Vitenskapelig artikkel 37

Tillegg 23

A Oppgavetekst

B Informasjon om GPS-basert reisevaneundersøkelse C Guide til installasjon av software

D Initiell spørreundersøkelse

(11)

NTNU-Norges teknisk- naturvitenskapelige universitet

E Spørreguide CATI-intervju F End Survey

G Innsendt abstrakt til konferanse

(12)
(13)

Figurer

Prosessrapport 1

2.1 Oversikt over steg i dataprosessering . . . 9

4.1 Prosedyre for gjennomføring av undersøkelsen . . . 15

4.2 Eksempel p˚a gyldig JSON objekt fra SMiO . . . 20

4.3 Pseudokode fra filtreingsprosess . . . 21

4.4 Pseudokode fra turidentifisering . . . 21

4.5 Validering av identifiserte turer. . . 22

4.6 Objekt fra GLH som inneholder estimat p˚a reisemodi . . . 23

Vitenskapelig artikkel 1

7.1 Average number of identified trips per person per day . . . 11

7.2 Relation between identified trips . . . 11

7.3 Distribution of trips by mode . . . 12

7.4 Relation between cumulative distance and duration for Android and iOS . . . . 13

7.5 Start-location related to home . . . 14

7.6 Average interview duration per day . . . 15

(14)
(15)

Tabeller

Prosessrapport 1

4.1 Rekrutteringsprosess og endelig utvalg . . . 17 4.2 Fordeling av operativsystem p˚a type intervju . . . 18

Vitenskapelig artikkel 1

7.1 Identified SMiO trips in CATI and identified GLH trips in SMiO and CATI . . . 9 7.2 Overview of collected data, before and after the four data processing steps . . . 10 7.3 Correlation-matrix between di↵erent modes . . . 12 7.4 Relationship between di↵erences in average estimated departure times . . . 13

(16)
(17)

Definisjoner og forkortelser

• RVU: Den nasjonale reisevaneundersøkelsen (2013-14).

• Rundtur: Total reise mellom kilde og destinasjon, inkludert begge reiseretninger, for eksempel hjem-arbeid-hjem.

• Tur: Direkte reise mellom to destinasjoner med en eller flere transportmodi, for eksempel hjem-arbeid.

• Etappe:Et segment av en tur som er separert med endring i transportmodi eller et stopp med kort ”holdetid”.

• Transportmodi: Valgt fremkomstmiddel for en tur eller etappe.

• Nye metoder: SMiO, GLH, Assistert CATI (ved hjelp av data fra GLH).

• Aktiv applikasjon: Applikasjon som logger en tur ved aktiv hjelp fra bruker.

• Passiv applikasjon: Applikasjon som logger en tur automatisk, uten hjelp fra bruker.

• GLH: Google Location History

• CATI: Computer Assisted/Aided Telephone Interviews

• PAPI: Paper And Pencil Interviews

• CAWI: Computer Assisted Web Interviewing

• CASI: Computer Assisted/Aided Self Interviews

• PRS: Prompted Recall Survey

(18)
(19)

Del I

Prosessrapport

(20)
(21)

Kapittel 1

Innledning

1.1 Bakgrunn for oppgaven

Som grunnlag for transportplanlegging og beslutningsprosesser brukes reisevaneundersøkelser til ˚a bedre forst˚a individuelle reisevaner og bevegelsesmønstre. Derfor er presisjon og kvalitet p˚a data som er innhentet via reisevaneundersøkelser avgjørende for gode estimat. Tradisjonelle reisevaneundersøkelser best˚ar for det meste av papir og telefonintervjuer, enten data-assistert eller person assistert. Reisevaneundersøkelser i Norge gjennomføres ved telefonintervjuer med en stadig synkende svarprosent (77-20 prosent) siden oppstarten i 1985. Utviklingen av den syn- kende svarprosenten følger en generell reduksjon i oppslutning i slike undersøkelser (Hjorthol mfl., 2014). I tillegg til synkende deltakelse, over- og underestimeres antall turer og turattri- butter i undersøkelsene (Stopher og Greaves, 2007). Flere studier hevder at lokasjonsbaserte reisevaneundersøkelser med smarttelefon er et lovende alternativ til ˚a supplementere eller er- statte tradisjonelle metoder (Vij og Shankari, 2015; Wolf, 2004).

1.2 Problemstilling og forskningsspørsm˚ al

Hvis det legges til grunn at det brukes enorme tidsmessige og økonomiske ressurser for ˚a tilegne seg data av relativt lav kvalitet, er det derfor et ønske fra Statens vegesen ˚a kunne ta i bruk nye metoder som løser disse problemene. I denne oppgaven skal det ses p˚a muligheter for ˚a bruke eksisterende datakilder til ˚a erstatte de tradisjonelle metodene innen reisevaneun- dersøkelser i Norge. Problemstilling for oppgaven blir dermed:

(22)

”Kan vi bruke alternative metoder til ˚a supplementere eller erstatte eksisterende reisevane- undersøkelser i Norge?”

Overordnede problemstilling leder til følgende forskningsspørsm˚al (problemformuleringer) innenfor kategoriene teknologi, reisedata og adferd:

• Hvilke teknologiske utfordringer innføres ved bruk av smart telefon til innsamling av data i reisevaneundersøkelser?

• Gir bruk av smart telefon i reisevaneundersøkelser bedre og mer presise data sammenlignet med tradisjonelle metoder?

• P˚avirker nye registreringsmetoder respondentenes adferd?

Formuleringene skal belyses og besvares med resultater fra et casestudie som baserer seg p˚a teori fra aktuell litteratur.

1.3 Beskrivelse av metode

For ˚a besvare forskningsspørsm˚alene er det valgt ˚a benytte et eksplorativt casestudie.

Casestudiet baserer seg p˚a litteratur rundt temaene smarttelefon og reisedata-registreringer.

Observasjonene fra case-studiet danner grunnlag for videre analyse og tolkning der styrker og svakheter med de forskjellige metodene ogs˚a kommer frem. Mer om metodevalg i kapittel 3.

1.4 Oppgavens omfang og begrensninger

For ˚a kunne være presis i arbeidet med artikkelen ble det satt begrensninger, samtidig er oppgaven utforskende og vid. Begrensningene ble satt for blant annet ˚a redusere datamengden til p˚afølgende analysearbeid. For eventuelt fremtidig arbeid m˚a det tas hensyn til følgende punkter:

• I likhet med RVU er lange reiser over 100 km ikke tatt med (Hjorthol mfl., 2014).

• I motsetning til RVU er det ikke blitt sendt ut dagbok for registrering av reiser.

• Det er valgt ˚a kun analysere de to mest utbredte mobile operativsystemene i Norge; iOS og Android (TNS-Gallup, 2016).

(23)

NTNU-Norges teknisk- naturvitenskapelige universitet

• Utvalget av respondenter er satt lavt p˚a grunn av tidshensyn.

• Identifisering og analyse av etapper er utelatt selv om de er registrert i tradisjonell metode.

1.5 Oppbygging av rapporten

Kapittel to i prosessrapporten undersøker teori om reisevaneundersøkelser, gjennomføring av og utfordringer rundt reisevaneundersøkelser i Norge. Det ses ogs˚a p˚a erfaringer fra andre prosjekter og teori rundt gjennomføringen av oppgaven. P˚afølgende metodekapittel tar utgangs- punkt i eksisterende teorier for ˚a begrunne valg av metoder til undersøkelsen. Fjerde kapittel er oppgavens gjennomføringsdel og er en eksplisitt fremstilling av egne undersøkelser. I del fem vurderes gjennomføringen av undersøkelsen sett i lys av metode, i tillegg til en kritisk vurdering av utvalgte resultat. Resultat og funn som ikke er presentert i artikkelen, er tatt med i kapittel seks. Til slutt i rapporten følger en konklusjon med anbefalinger om videre arbeid. Deretter følger del 2 - Vitenskapelig artikkel, som best˚ar av utfyllende resultat og diskusjon. Til slutt følger oppgavetekst og vedlegg til gjennomføringen av egne undersøkelser.

Oppgaven henvender seg i første omgang til Statens vegvesen, men den vitenskapelige artikkelen er skrevet med hensikt ˚a bli presentert og publisert ved Trafikdage p˚a Aalborg Universitet høsten 2016. Det forutsettes at leser har noe kunnskap om reisevaneundersøkelser og datateknologi.

(24)
(25)

Kapittel 2

Utfyllende teori

2.1 Reisevaneundersøkelser i Norge

Form˚alet med ˚a gjennomføre reisevaneundersøkelser er ˚a samle inn data for hvor, hvordan, hvorfor og hvor mye folk reiser. Det er ogs˚a av interesse ˚a fange opp variasjoner innad i befolk- ningen. Data fra undersøkelsene brukes som grunnlag i utarbeidelsen av transportmodeller og prognoser samt til forskning (Hjorthol mfl., 2014).

Den sjuende reisevaneundersøkelsen i Norge ble gjennomført i 2013/2014 og rundt 61.400 intervjuobjekter ble intervjuet. Siden 1985, har responsraten falt dramatisk fra 77% oppslutning til rundt 20% (Hjorthol mfl., 2014). Samme trend er observert i en studie av Wilson (2004), der andre land har tilsvarende utfordringer i forhold til synkende responsrate og underestimering av turer. Utfordringer med lav respons rate skyldes i hovedsak at det har blitt vanskeligere

˚a komme i kontakt med folk, samtidig som telefonene automatisk blokkerer telefonnummer forbundet med markedsundersøkelser (Hjorthol mfl., 2014; Tuckel og O’Neill, 2002). Travle mennesker er for eksempel vanskeligere ˚a f˚a kontakt med, og utgjør dermed en underrapportert gruppe med mye reiseaktivitet (NCHRP, 2006). Hele 40% av oppringte respondenter i Norge faller fra før det oppn˚as kontakt (˚atte gjentatte forsøk) (Hjorthol mfl., 2014).

Tradisjonelt har det i Norge blitt gjennomført reisevaneundersøkelser med personlige te- lefonintervju (CATI). Deltakerne f˚ar tilsendt et varsel per post i forkant av undersøkelsen der registreringsdato st˚ar oppført og registreringsdagbok er vedlagt. I tillegg til varselet blir per- sonen oppringt for ˚a høre om alt er klart for registrering. Dagen etter registrering blir deltakeren igjen oppringt for ˚a gjennomføre selve intervjuet som best˚ar av 50 spørsm˚al. Svarer ikke delta-

(26)

keren blir det gjort gjentatte forsøk p˚a ˚a f˚a kontakt. Hvis dagbok er korrekt utfylt fra reisedagen spiller det ingen rolle hvor lenge det er i mellom registreingsdag og intervju. Underveis i inter- vjuet foreg˚ar stedfesting og registrering av reiser elektronisk i en elektronisk kartbasert løsning.

Dette for ˚a innhente s˚a eksakt informasjon som mulig (Hjorthol mfl., 2014).

Det gjennomsnittlige antall turer i Norge ligger i dag p˚a 3,26 per dag (Hjorthol mfl., 2014).

Wolf (2004) hevder at det er store mørketall n˚ar det gjelder manglende rapporterte turer i CATI.

Dette ser ut til ˚a spesielt gjelde for korte turer, som kan forklares med at respondenten ikke forst˚ar definisjonen av en tur. Underestimeringen kan ogs˚a forklares med at lange intervju fører til glemsomhet og et ønske om ˚a bli ferdig med undersøkelsen raskest mulig (Stopher og Greaves, 2007). I dag tar et gjennomsnittlig intervju i Norge ca. 23 minutter (Hjorthol mfl., 2014).

2.2 Erfaringer fra andre lignende prosjekter

S˚a hvordan kan man g˚a frem for ˚a prøve ˚a løse de nevnte problemene i forhold til CATI- undersøkelsen? I Danmark er CAWI brukt som et supplement til tradisjonelle CATI undersøkelser siden 2006. Dette har gitt en økning i rapporterte turer (Christensen, 2013). Metoden har ogs˚a vist seg ˚a være kostnadsbesparende i tillegg til at den har n˚add ut til underrapporterte grupper.

En rapport gjennomført av Transportøkonomisk institutt - Norge viser at ved bruk av CAWI i reisevaneundersøkelser, introduserer man nye utfordringer som foreksempel varierende grad av stedfesting og ytterligere forglemmelse av korte turer (Christiansen mfl., 2015).

Bruk av GPS som supplement til reisevaneundersøkelser har i lengre tid blitt gjennomført i flere pilotstudier og storskala undersøkelser. Stopher, Prasad mfl. (2013) gjennomførte en storskala undersøkelse i USA, kun basert p˚a informasjon fra GPS. Transportmodi og reisem˚al ble automatisk avledet ut fra algoritmer og linket til reisen. Etter endt undersøkelse ble deltakerne bedt om ˚a gjennomføre en Prompted Recall Survey (PRS) hvor korreksjoner i forhold til reisen kunne gjøres i en kartbasert løsning.

Smarttelefon har ogs˚a blitt brukt for ˚a samle inn data og kanskje det mest kjente prosjektet erTRAC-IT (Barbeau mfl., 2009). TRAC-IT er en aktiv applikasjon som er spesielt utviklet for innsamling av reisedata. Det vil si at applikasjonen m˚a aktiveres og innhente reiseinformasjon før en tur kan starte. 14 deltakere ble i 21 dager bedt om ˚a spore alle deres reiser. Prosjektet oppn˚adde forholdsvis lav andel registrerte reiser, noe som kunne forklares med at deltakerne i stor grad glemte ˚a starte applikasjonen.

(27)

NTNU-Norges teknisk- naturvitenskapelige universitet

I en sju dagers studie av Greene mfl. (2016) ble det gjort tester med rMove, en passiv applikasjon med umiddelbar PRS etter endt registreringsdag. De oppn˚adde en svarprosent p˚a 71%, fem timmer innen endt registrering. Samtidig synes deltakerne at gjennomføringen av denne undersøkelsen var mindre brysom enn en tradisjonell en-dags undersøkelse.

I en studie av Sadeghvaziri mfl. (2016) ble GLH-data samlet inn ved hjelp av smart- telefon fra 25 deltagere. Varigheten til pilot-undersøkelsen var ´en m˚aned og identifiseringen av transportmodi ble gjort ved klassifisering basert p˚a hastighet. Undersøkelsen konkluderte med at GLH leverer data av god nok kvalitet til ˚a kunne brukes i større undersøkelser - uten medvirkning fra deltagerne.

2.3 Teori knyttet til gjennomføring av undersøkelsen

Her følger en kort oversikt over teori som er benyttet til selve gjennomføringen av un- dersøkelsen.

2.3.1 Villighet til ˚ a delta i GPS-baserte undersøkelser

Bricka (2009) referert i Nordtømme og Bjerkan (2013, s. 7) forklarer at villigheten til ˚a delta i GPS-baserte reisevaneundersøkelser er avhengig av deres aksept til ny teknologi. Spesielt unge og menn med høy utdanning og lønn har større sannsynlighet for ˚a delta. Grupper som allerede er underrapporterte i dag (som for eksempel eldre), vil da kunne f˚a ytterligere lavere responsrate ved bruk av GPS i reisevaneundersøkelser.

2.3.2 Insentiver

Nitsche mfl. (2014) omtaler bruk av insentiv som en nødvendighet for at spesielt under- rapporterte grupper skal la seg spore i en lokasjonsbasert reisevaneundersøkelse over lengre tid. Flere ulike typer insentiver har blitt foresl˚att av Barbeau mfl. (2009): 1) Personlig reise- informasjon og sanntids trafikkmeldinger basert p˚a posisjon og estimert reise. 2) Fri bruk av mobildata i registreringsperioden for de som laster ned og bruker applikasjonen. 3) Personlig tilpasset reklame ut i fra hvor du befinner deg. 4) Tilleggstjenester i applikasjonen som for eksempel telling av forbrente kalorier og CO2-utslipp. I Norge har det blitt forsøkt med for eksempel uttrekning av gavekort blant respondentene og motivasjonssamtaler for ˚a unng˚a det

(28)

store frafallet i undersøkelsen, uten at det har hatt stor e↵ekt (Hjorthol mfl., 2014).

2.3.3 Applikasjoner

Gjennom prosjektet Smart Mobilitet i Oslo har SINTEF utviklet en sporingsapplikasjon for

˚a innhente informasjon om reismønster til kollektivtrafikanter i Oslo og Akershus. Applikasjonen er laget for ˚a aktivt samle inn data ved at brukerne legger inn reiseinformasjon før reisen starter.

I det reisen starter m˚a applikasjonen aktiveres manuelt for ˚a starte sporingen. Presisjonen til applikasjonen er god p˚a grunn av at den registrerer reisen kontinuerlig ved bruk av GPS-, Wi- Fi- og mobilsignal. Likevel er det blitt bevist at Android-operativsystemet gir noe d˚arligere kvalitet p˚a registrerte ture. Data lagres p˚a en kryptert server hos SINTEF (Dahl, 2016).

I motsetning til SMiO er Google NOW en applikasjon som passivt registrerer posisjoner ved bevegelse av telefonen. Applikasjonen bruker innbygde sensorer (som for eksempel akselero- meter) i tillegg til Wi-Fi, GPS og IP adresser for ˚a beregne posisjon og transportmodi (Google, 2016). I motsetning til SMiO lagres GLH-data p˚a brukerens private konto hos Google. Derfor er det nødvendig at alle brukere oppretter eller innehar en slik konto for ˚a kunne bruke applika- sjonen. Uttak av data m˚a ogs˚a gjøres med brukers hjelp og tillatelse, siden brukeren eier denne informasjonen som er ˚a betegne som personsensitiv informasjon.

2.3.4 Personvern GLH

Ved ˚a innføre passiv overv˚aking som en del av reisevaneundersøkelser innfører man sam- tidig et helt annet krav til h˚andtering av personsensitive opplysninger. I motsetning til CATI har ikke respondent like stor innsikt i hva som deles med hvem av digitale spor. Oppkobling mot basestasjoner, Wi-Fi eller GPS fører til at man legger igjen digitale spor som kan gi ver- difull innsikt i befolkningens forflytnignsmønster. Programleverandører m˚a derfor be om en samtykkeavtale før en sporings-applikasjon kan tas i bruk. Informasjon om hva som lagres, hvem som har tilgang til datamaterialet og hvordan dette skal benyttes, m˚a g˚a klart fram av samtykkeavtalen (Datatilsynet, 2012).

2.3.5 Prosessering av GPS-data

Prosedyren for behandling av GPS-data er stort sett den samme for studier relatert til transportanalyser. En generell framstilling av fremgangsm˚aten er vist i figur 2.1 og baserer seg

(29)

NTNU-Norges teknisk- naturvitenskapelige universitet

GPS/sensor feltarbeid

Filtrering av data

Tur identifisering

Reisemodi identifisering

Identifisering av reisehensikt

GIS-data Iterasjon

Avledet reisemønster

Validerings-prosess

Validerte reisemønstre

Figur 2.1: Oversikt over steg i dataprosessering.

p˚a metoden til Schuessler og Axhausen (2009) og den forbedrede tur identifiserings medoden (til Rasmussen mfl. (2015)). I denne oppgaven ser vi i hovedsak p˚a filtrering av data og tur identifisering. Algoritmene som utfører prosesseringen bruker ulike parametre ut fra hvor inn- henting av data er utført. Ulik topografi og GPS signal gjør at hvert datasett m˚a tilpasses ved bruk av lokale parametre. I filtreringsprosessen blir feil som kan gi forstyrrelser p˚a datasettet tatt bort. Wolf (2004) anbefaler en nøyaktighet mellom 5 og 10 meter for hver lokasjon, det vil si alt av punkter over 10 meter filtreres bort. For ˚a unng˚a punkter med umulige hopp i tid, setter Wolf (2004) et filter p˚a maks punkt akselerasjon p˚a 12 m/s2. For identifisering av turer bruker Rasmussen mfl. (2015) tre kriterier (som er tilpasset danske forold) til ˚a splitte GPS sporet i segmenter. 1) Hvis GPS-enheten ikke har flyttet posisjon de siste 60 sekundene. 2) Hvis hastigheten har vært under 0,01 m/s i minst 60 sekunder. 3) Hvis tiden mellom to p˚afølgende lokasjoner er over 120 sekunder. De fleste studier benytter 120 sekunder, men Stopher, Prasad mfl. (2013) argumenterer for at tidsgrensen heller bør ligge p˚a 60 sekunder. Parametrene brukt i denne oppgaven er basert p˚a denne litteraturen.

(30)
(31)

Kapittel 3

Metode

Hensikten med dette kapittelet er ˚a kvalitetssikre arbeidet med artikkelen og valg som er tatt underveis, slik at gjennomføringen av prosjektet kan vurderes. Kapittelet skal ogs˚a sette leseren i et perspektiv som gjør det mulig ˚a reprodusere arbeidet som er gjort. Dette styrker i følge Kvale og Brinkmann (2012) kvaliteten og reliabiliteten til studiet. Videre i kapittelet følger en oversikt over hvilke metoder som er benyttet i oppgaven, der styrker og svakheter blir gjort rede for.

3.1 Forskningsdesign

Et komparativt, eksplorativt, casestudie er valgt som forskningsdesign p˚a grunnlag av studiets karakter. Komparativ p˚a grunn av at to eller flere case (applikasjoner/metoder) skal sammenlignes og eksplorativt p˚a grunn av at det er et oppdagende studie som det er gjort lite forskning p˚a i Norge (Ringdal, 2001).

Form˚alet med ˚a gjennomføre et casestudie er i følge Olsson (2011) ”˚a f˚a dypere forst˚aelse og innsikt”. I dette tilfellet er casestudie godt egnet p˚a grunn av at det gir mulighet til ˚a utforske p˚avirkningsfaktorer og langtidskonsekvenser. Samtidig som dypere analyser kan utføres som grunnlag for nye hypoteser og analyser. P˚a grunn av dette egner casestudier seg som et pilotstudie i forkant av et større studie eller prosjekt. En styrke ved denne metoden er ˚a bruke flere informasjonskilder til ˚a belyse forskningsspørsm˚alene. En svakhet er at det kan være vanskelig ˚a bruke generaliserbar statistikk, slik at resultatet blir representativt for et større utvalg. En annen ulempe kan være at casestudier har en tendens til ˚a dra ut i tid og dermed bli kostnadskrevende ˚a utføre i visse tilfeller (Olsson, 2011; Ringdal, 2001).

(32)

De nye metodene sammenlignes med tradisjonell metode ved ˚a analysere relevante kompo- nenter (for eksempel reisemodi, distanse og avreisetidspunkt) innen reisevaner. I følge Rienecker og Jørgensen (2013) danner analysen et grunnlag for en helhetlig tolkning som kan brukes som svar p˚a problemformuleringen.

Tilnærmingen til oppgaven og forskningsspørsm˚alene er i hovedsak induktiv. Dette p˚a grunn av ønsket om ˚a tilenge seg ny kunnskap ved ˚a generalisere funn fra empiriske undersøkelser fra virkeligheten Ringdal (2001). Dessuten p˚apeker Ringdal (2001) at en ”induktiv strategi m˚a i sin natur være eksploderende”. B˚ade kvalitative data fra spørreundersøkelser og kvantitative talldata fra applikasjoner og intervju er benyttet i oppgaven. De er gitt likeverdig vekting i den samlede vurderingen.

3.2 Innsamling av litteratur

Et litteraturstudie har blitt benyttet som metode for ˚a tilegne seg kunnskap relatert til problemstillingen og da spesielt i forhold til prosessering av data. Fordelen med ˚a hente infor- masjon fra et litteraturstudie er i følge Yin (2002) at informasjonen er varig og presis i forhold til kilder over en lengre periode. Ulempen med et slikt studie kan være utfordringen med ˚a sor- tere ut hvilken informasjon som er relevant uten at utvelgelsen p˚avirkes av forfatteren i større grad. Et stort datamateriale gjør metoden uoversiktlig og det kan være vanskelig ˚a finne igjen informasjon (Yin, 2002).

3.3 Valg av metoder for datainnsamling

I dette avsnittet begrunnes hvorfor de forskjellige innsamlingsmetodene har blitt valgt.

3.3.1 Initiell spørreundersøkelse

Demografiske spørsm˚al i tr˚ad med RVU ble samlet inn gjennom en web basert forun- dersøkelse. Hensikten med undersøkelsen var ˚a redusere antall ukjente variabler i intervjuet slik at intervju-tiden kunne reduseres. Eksempelvis var det ønskelig ˚a aktivt benytte hjemsteds- og jobbadresser i forbindelse med intervjuet. Faren med ˚a hente sensitive data før hovedun- dersøkelsen kan være at sannsynligheten for ˚a stille irrelevante spørsm˚al øker. Dermed kan

(33)

NTNU-Norges teknisk- naturvitenskapelige universitet

respondentene unnvike ˚a svare p˚a spørsm˚al, eller til og med avbryte undersøkelsen. En web- basert løsning ble i hovedsak valgt av tidsmessige hensyn, i tilegg vil respondentene kunne være mer ˚apen og ærlig enn om sensitive spørsm˚al ble stilt gjennom et intervju (Ringdal, 2001). Et annet virkemiddel som ble benyttet for at respondentene skulle svare ærlig, var ˚a fortelle hva data skulle brukes til og hvor lenge informasjonen skulle lagres (Kvale og Brinkmann, 2012).

3.3.2 CATI

For ˚a samle data fra tradisjonell metode, ble det valgt ˚a benytte CATI etter tilnærmet samme fremgangsm˚ate som for RVU. Intervjuspørsm˚alene var basert p˚a Den nasjonale reise- vaneundersøkelsen 2016-2019 for ˚a mest mulig etterligne en reel situasjon, men kun spørsm˚al som var ansett som relevante i forhold til denne undersøkelsen ble valgt ut (se vedlegg E). Ved et CATI intervju, spør intervjuer spørsm˚al som blir registrert fortløpende p˚a en datamaskin.

Denne metoden lar intervjuer styre situasjonen i stor grad slik at intervjuer alltid vil kunne ha en p˚avirkning p˚a selve intervjuet (Ringdal, 2001). Kontakten mellom intervjuer og respondent blir direkte og personlig, derfor m˚a intervjuer forsøke ˚a være nøytral. Fordelen med direkte kontakt er at det kan bli vanskeligere ˚a unnlate ˚a svare p˚a spørsm˚al s˚a lenge oppmerksomheten hos respondent er fanget. Uklarheter og misforst˚aelser kan ogs˚a oppklares umiddelbart. For ˚a oppn˚a høy validitet og reliabilitet er det viktig at kvaliteten p˚a intervju og intervjuer er høy. I og med at studiet legger opp til flere repetitive intervju, kan det oppst˚a situasjoner der enten respondent eller intervjuer har tatt et valg basert p˚a tidligere intervju. Et eksempel p˚a dette kan være ˚a spørre eller svare taktisk for ˚a gjennomføre intervjuet raskere. For ˚a redusere denne faktoren ble detutarbeidet en spørreguide (Vedlegg E) for at intervjuene skal bli mest mulig valid og konsis (Kvale og Brinkmann, 2012).

3.3.3 SMiO

SMiO ble valgt som aktiv applikasjon p˚a grunn av at kvaliteten p˚a sporingen anses ˚a være høy (Dahl, 2016). En annen stor fordel var at det allerede før prosjektet startet var opprettet kontakt med utvikler av applikasjonen. Produserte data var dermed lett tilgjengelig for nedlas- ting fra server, samtidig som oppretting av brukere og eventuelle problemer kunne løses raskt.

En ulempe med applikasjonen er at den ikke summerer variabler for de ulike reisekomponentene, derfor m˚a data prosesseres før videre analyse i SPSS (Haugsbø og Ellis, 2014).

(34)

3.3.4 Google NOW (GLH)

Bakgrunnen for at GLH ble valgt til passiv logging av reisedata var antagelsen om at ap- plikasjonen, basert p˚a GPS, akselerometer og Wi-Fi teknologi, kunne gi data med høy presisjon uten at det skulle g˚a p˚a bekostning av batteri og interaksjon fra bruker. En annen fordel med data fra GLH var at nødvendig data var gratis. En forutsetning for ˚a kunne hente og analy- sere data fra denne applikasjonen, var at respondentene personlig m˚atte gi samtykke til ˚a dele personsensitiv informasjon (se avsnitt 2.3.4).

3.3.5 End-survey

Det er valgt ˚a benytte en evalueringsundersøkelse etter gjennomføringen av den ordinære undersøkelsen (se vedlegg F). Hensikten med undersøkelsen var ˚a innhente kvalitative erfaringer og meninger om de forskjellige registreringsmetodene. Undersøkelsen gav mulighet til ˚a stille

˚apne spørsm˚al, for s˚a ˚a f˚a subjektive og utdypende svar. For eksempel:”Hvilken metode likte du best og hvorfor?” Dette for ˚a f˚a et bilde av generell brukeraksept ved de forskjellige metodene (Ringdal, 2001).

3.4 Valg av prosesserings- og analysesmetoder

Prosesseringen av kvantitative data fra applikasjonene baserer seg p˚a metoden til Schuessler og Axhausen (2009). Metoden er valgt p˚a grunn av at den anses som internasjonalt anerkjent i fagmiljøet, noe som gjenspeiles i Rasmussen mfl. (2015) der metoden utvikles videre. En mulig ulempe med metoden er at den er ny og ukjent for forfatter og at resultatet dermed avhenger av utførelse (Kvale og Brinkmann, 2012; Ringdal, 2001). Metoden er stegvis beskrevet i figur 2.1. B˚ade kvantitative og kvalitative analyser er gjennomført i studien. Hensikten med begge metodene har vært ˚a redusere datamaterialet for fremstilling i oppgaven. For kvantitative data er deskriptiv statistikk (for eksempel snittverdier, standardavvik og korrelasjon) benyttet for ˚a beskrive datamaterialet. Dette for ˚a kunne undersøke hypotesene nærmere, samt for ˚a avsløre eventuelle feilkilder. Kvalitativ data har blitt samlet inn i evalueringsundersøkelsen. Analysene har blitt gjennomført p˚a individ- og gruppeniv˚a, samt ved geografisk avgrensning i SPSS og Excel.

(35)

Kapittel 4

Prosedyre og gjennomføring av egne undersøkelser

Dette kapittelet bekriver prosessen med arbeidet som er utført i forbindelse med planlegging og gjennomføring av casestudiet. Hele prosedyren for gjennomføring av undersøkelsen er vist i figur 4.1 og vil bli beskrevet steg for steg.

Innsamling av litteratur

Rekruttering

Initiell spørreundersøkelse

Installasjon av software

Registrering av turer

Intervju - CATI Samme tidspunkt?

.KML - GLH

Prosessering

Analyse End Survey

JSON - SMiO/GLH

Figur 4.1: Prosedyre for gjennomføring av undersøkelsen.

(36)

4.1 Innsamling av litteratur

Artikkelsøk er blitt gjennomført i litteraturdatabaseneGoogle Scholar via Bibdesk ogBIB- SYS ASK med søkeordene “travel survey”, “smartphone”, “sensors”, “mobility data”, “GPS”,

“mode detection”, “transport” “GLH” og “methods”. Det er ogs˚a søkt i konferanseartikler fra Trafikdage p˚a Aalborg som ligger tilgjengelig p˚a internett. Kildene er spesielt vurdert etter

˚arstall for publisering p˚a grunn av at dette er teknologi som utvikler seg raskt. Artikler publisert p˚a Transportation Research Board (TRB) i februar 2016 har derfor vært av særlig interesse.

Intervjuguiden er basert p˚a reisevaneundersøkelsen 2016. I tillegg er det søkt via Google etter litteratur og dokumentasjon knyttet til applikasjoner og telefoner, samt reisevaneundersøkelser i Norge.

4.2 Rekruttering

Rekruttering av respondenter startet umiddelbart etter at arbeidet med oppgaven ble p˚abegynt. Kriterier som ble brukt for utvelgelse av m˚algruppe var at respondenten m˚atte være en samtykkekompetent, teknologisk interessert og aktiv person. I tillegg m˚atte personen inneha en smart-telefon som hadde iOS eller Android som operativsystem. Respondentene ble i hoved- sak valgt etter ”bekvemmelighets-utvalg”, som betyr at de ble valgt via bekjente og var lett tilgjengelig for kommunikasjon.

Første runde bestod av ˚a finne aktuelle kandidater internt p˚a instituttet og i prosjektgrup- pa. Runde ´en gav 13 villige respondenter, hvor ˚atte hadde fri bruk av data p˚a mobiltelefonen.

Det var ønskelig ˚a ha ca. 20 respondenter til undersøkelsen p˚a grunn av tid og omfang for gjennomføring. Derfor ble det sendt ut en e-post til ytterligere 18 personer. Av disse var det seks som hadde mulighet til ˚a delta. I tillegg var det sju som meldte avbud den siste uka før undersøkelsen skulle starte. Det endelige utvalget er vist i tabell 4.1.

For ˚a rekruttere respondenter til studien ble det tidlig bestemt at en form for insentiv skulle foreligge. Flere alternativ ble vurdert ˚a sikre deltagelse i undersøkelsen: Et alternativ var øko- nomisk kompensasjon for mobildata-kostnader som respondenten hadde i registreringsperioden.

Dette alternativet ble ikke valgt da det kunne bli merarbeid ˚a hente inn faktisk bruk, samtidig som en slik løsning p˚a lang sikt ble vurdert som kostbar. Valget landet p˚a ˚a gi deltagerne en nødlader for mobil som de kunne bruke under sporingen. Dette for ˚a øke batterikapasiteten og

(37)

NTNU-Norges teknisk- naturvitenskapelige universitet

samtidig redusere sannsynligheten for at turer blir avbrutt p˚a grunn av tomt batteri. 18 stk.

2000 mAh nødladere ble kjøpt inn og delt ut under oppstartsmøtene som ble avholdt den 1.

april p˚a NTNU-Lerkendalsbygget og NRK-Tyholt. Hensikten med møtet var ˚a kunne svare p˚a eventuelle spørsm˚al ang˚aende applikasjonene eller undersøkelsen generelt.

Tabell 4.1: Rekrutteringsprosess og endelig utvalg.

Rekrutterings -metode

Sendt info

Ikke kontakt

Ikke fri bruk av data

Gjennomført initiell undersøkelse

Planlagte intervju

Gjennomført intervju

Personlig 13 2 5 8 70 -

E-post 18 10 0 6 60 -

Sum 31 12 5 14 130 128

4.3 Initiell spørreundersøkelse

Andre kontakt med respondentene var en e-post med informasjon om hvordan undersøkelsen skulle gjennomføres, samt en link til et online skjema for utfylling av personalia og demografiske data (se vedlegg D). Ved ˚a fullføre dette skjemaet bekreftet de deltagelse, og godtok samtidig at personsensitiv informasjon ble samlet inn. Kontaktinformasjon for henvendelser ble ogs˚a distribuert.

Sammensetningen av respondentene ble til slutt ˚atte menn og fem kvinner mellom 18 og 45 ˚ar. Fire studenter og ˚atte arbeidstakere i o↵entlig sektor. Vanligste fremkomstmiddel til og fra jobb var jevnt fordelt p˚a kategoriene ”til fots”, ”o↵entlig transport” og ”sykkel”. 12 personer har eller har hatt tilknytning til NTNU og teknologiske studier. Fem hadde iOS som operativsystem, mens ˚atte hadde Android.

Deltakerne ble inndelt i grupper etter type operativsystem for ˚a kunne oppdage eventuelle forskjeller mellom assistert og ikke assistert telefonintervju (se tabell 4.2). Dette ble holdt konfidensielt gjennom hele registreringsperioden, siden deltakerne fikk identisk informasjon.

Det ble ogs˚a spurt om ønsket tidspunkt for samtale. Basert p˚a dette ble det satt opp timelister for oppringing.

(38)

Tabell 4.2: Fordeling av operativsystem p˚a type intervju.

Operativsystem CATI (A) CATI (B) Total

Android 4 3 7

iOS 3 3 6

13

4.4 Installasjon av software

Respondentene fikk tilsendt informasjon om hvordan applikasjonene skulle installeres (se vedlegg B og C). Det ble det opprettet nye brukere og passord for innlogging i SMiO-applikasjonen.

Innloggingsinformasjon ble sendt ut i en separat mail før undersøkelsen startet slik at respon- dentene kunne forberede seg og teste at applikasjonen virket. Uka før registreringen skulle starte ble det oppdaget at Android-versjonen av SMiO ikke var identisk med iOS-versjonen. Android utgaven hadde ikke mulighet til ˚a registrere reisehensikt og reisemiddel. Ny versjon ble gjort tilgjengelig p˚a Google Play mandag ettermiddag, første registreringsdag. Deltakerne fikk derfor beskjed om ˚a laste ned den nye versjonen, slik at resten av turene kunne spores korrekt.

4.5 Gjennomføring av datainnsamling

Innsamling av data ble gjennomført i Trondheim fra 4. til 15. april, 2016. Mandag-fredag ble valgt for ˚a unng˚a helligdager og helger, siden de har færre reiser enn i hverdager (Hjorthol mfl., 2014). For ˚a kunne identifisere trender og variasjoner i reise- og rapporteringsmønster, ble varigheten av undersøkelsen satt til 10 dager.

4.5.1 Strukturert telefonintervju - CATI

Intervjuet ble gjennomført som følger: Faste svaralternativ (som for eksempel i reisehen- sikt) ble ikke lest opp, men respondent ble konferert hvis et svar ikke stemte overens med svaralternativene. Registreringen av svar ble gjort fortløpende i et prekodet Excel-ark for vide- re behandling i SPSS. Hver respondent ble i intervjuet spurt om oppgitt tidspunkt passet like bra neste dag. Dette ble gjort av to grunner: 1) For ˚a senke totalbelastningen for respondent og intervjuer. 2) For ˚a forsikre om at respondent var tilgjengelig for intervju p˚a dette tidspunktet (RVU bruker SMS for p˚aminning). Deltakere i gruppe B gjennomførte intervjuet mens inter-

(39)

NTNU-Norges teknisk- naturvitenskapelige universitet

vjuer fulgte med p˚a innsendte data. Oppdaget intervjuer feil eller mangler i registreringen av antall turer, ble respondent gjort oppmerksom p˚a dette. Etter intervjuet ble det ogs˚a svart p˚a andre spørsm˚al for ˚a oppklare eventuelle misforst˚aelser rundt registreringen. Tidtakingen ble da stoppet.

4.5.2 SMiO

Fremgangsm˚ate for bruk av applikasjonen ble oversendt deltakerne før undersøkelsen star- tet (se vedlegg C). Likevel ble det stilt spørsm˚al om applikasjonen underveis i registreringspe- rioden. Etter at registreringsperioden var over, ble ei fil som inneholdt alle turene lastet ned fra serveren.

4.5.3 Google NOW (GLH)

Hver respondent ble bedt om ˚a laste ned og oversende ei .KML fil fra deres Google-konto etter endt registreringsdag. Denne ble brukt til ˚a visuelt kontrollere antall turer i Google Earth under intervjuet p˚afølgende dag (gruppe B). Formatet ble valgt p˚a grunn av at det var raskt og enkelt ˚a visualisere for intervjuer, samtidig som det ble benyttet med suksess hos Sadeghvaziri mfl. (2016). I og med at dette formatet ikke hadde estimat p˚a transportmiddel, ble det derfor nødvendig ˚a hente ut JSON fra hele registreringsperioden etter at undersøkelsen var ferdig.

4.5.4 End Survey

En web-basert sluttundersøkelse ble sent ut etter at registreringsperioden var over (se vedlegg F). Her ble respondentene spurt om hvilken metode de foretrakk og hvilken metode de ikke likte. Begrunnelse for valget m˚atte ogs˚a fylles ut. I tillegg ble det spurt om lengden p˚a undersøkelsen var passende, hvor mange turer de trodde ikke var registrert i SMiO og hvor mange turer de ikke hadde med seg telefonen.

4.6 Prosessering av innsamlet data

For ˚a klargjøre datasettene til analyser ble det foretatt en bearbeiding av datasettet fra SMiO. I SMiO ble hver tur registrert i en separat sekvens best˚aende av et variabelt antall objekter (se figur 4.2). Før fila kunne leses inn som gyldig JSON objekt, m˚atte ”ObjectID” og

(40)

1 /* 11 */

2 {

3 "trips" : [

4 {

5 "_userId" : "1",

6 "purpose" : "ToOwnWorkplace",

7 "OS" : "Android 5.1.1",

8 "_id" : "xxxx",

9 "tripData" : [

10 {

11 "lat" : 63.4088911,

12 "lon" : 10.4061705,

13 "time" : "2016-04-04T11:50:44.942Z",

14 "mode" : "mode_car",

15 "connection" : "4g",

16 "altitude" : 44,

17 "accuracy" : 20,

18 "altitudeAccuracy" : null,

19 "heading" : 22,

20 "speed" : 12,

21 "_id" : "xxxx"

22 }

23 ],

24 "endTime" : "2016-04-04T11:50:44.942Z",

25 "startTime" : "2016-04-04T11:50:44.942Z",

26 "__v" : 0

27 }

28 ,

Figur 4.2: Eksempel p˚a gyldig JSON objekt fra SMiO.

”ISODate” fjernes manuelt i en teksteditor for hver tur. I tillegg m˚atte objektene separeres med et komma.

4.6.1 Filtrering av GPS data

Første steg var ˚a rense og luke ut feil i data-settet i henhold til kriteriene nevnt i teorikapit- telet. B˚ade data fra SMiO og GLH ble forsøkt filtrert med et spesialtilpasset script i MATLAB gjengitt med pseudokode i figur 4.3.

Data fra GLH var vanskeligere ˚a tolke enn data fra SMiO, derfor ble det brukt en kom- binasjon av flere fremgangsm˚ater. Sletting av registreringer med feil dato ble gjort manuelt

(41)

NTNU-Norges teknisk- naturvitenskapelige universitet

1 IF -10 > altitude > 2000 OR accuracy < 50/100

2 OR speed > 20 OR acceleration > 12 THEN

3 delete points

4 ELSE duration = 0 THEN

5 delete track

6 ENDIF

Figur 4.3: Pseudokode fra filtreingsprosess. Enheter er henholdsvis. [m], [m/s], [m/s2] og [min].

i tekstbehandlingsprogrammet Sublime ved ˚a slette objekter basert p˚a tidsstempel. Filter for nøyaktighet og hastighet ble satt p˚a i programmet Location History Visualizer PRO. Program- met filtrerte automatisk ut turer uten varighet.

4.6.2 Identifisering av turer

I SMiO identifiseres hver tur med et nummer basert p˚a n˚ar turen er avsluttet av brukeren (se figur 4.2). Hver lokasjon tilknyttet denne turen ble aggregert som et eget objekt i MATLAB.

Ser man p˚a GLH-data i Timeline History i en nettleser, ser man at turer blir identifisert og presentert. Denne koblingen g˚ar tapt i eksporteringen av GLH-fila og dermed m˚a hver tur identifiseres basert p˚a kriteriene gjengitt i figur 4.4 ettersom det ikke automatisk defineres start og stopp lokasjoneer fra Google. Dette ble først forsøkt gjennomført i et MATLAB-skript, men p˚a grunn av lang prosesseringsid ble det laget et nytt skript i Python basert p˚a de samme kriteriene. GPX-track formatet ble valgt som output for programmet p˚a grunn av at det enkelt lot seg visualisere i gratisprogrammet ”GPSvisualizer”.

1 IF speed < 20 at 60 OR deltaDistance = 0 at 60

2 OR deltaLocation > 120 THEN

3 split in segment

4 ENDIF

Figur 4.4: Pseudokode fra turidentifisering. Enheter er henholdsvis [m/s], [s], [m], [s], [s].

Figur 4.5 viser et utsnitt av validerings-prosessen der hver tur ble splittet og gitt forskjellig farge for enklere gjenkjenning. For ˚a f˚a enden av reisen til ogs˚a ˚a bli starten p˚a neste reise, ble parametrene justert. Ettersom parametrene m˚atte tilpasses hvert datasett, ble Location

(42)

History Visualizer PRO igjen valgt for ˚a identifisere turene manuelt med de samme kriteriene, i tillegg til at avreisepunktet ble satt til ˚a være første lokasjon med hastighet større enn 0,5km/h.

Figur 4.5: Fra validering av identifiserte turer. Hentet fra http://www.gpsvisualizer.com/

4.6.3 Identifisering av reisemodi

I SMiO ble reisemodi angitt i applikasjonen før hver tur og blir dermed en del av datasettet.

Brukeren kunne velge mellom ”Bil”, ”Buss”, ”Til fots”, ”Sykkel” og ”Annet”. Figur 4.6 viser en liste over estimerte reisemodi for en aktivitet kalkulert av Google. I og med at forekomstene av estimat ikke ser ut til ˚a følge et regelmessig mønster var det ikke mulig ˚a lese av reisemodi direkte fra fil. Derfor ble det utført en manuell opptelling og validering av reisemodi (basert p˚a tidsstempel) for de 152 turene som ble matchet med SMiO og CATI. Timeline history antas ˚a bruke estimatet med høyest ”confidence” foruten verdien ”unknown”. Dette ble ogs˚a kriteriet for opptellingen.

I figur 4.6 ser man at Google opererer med tre forskjellige typer reisemodi for forflytning til fots. Disse har blitt sl˚att sammen som”Til fots” i sammensl˚aingen av datasett. Transportmodi

”inVehicle” antas ogs˚a ˚a gjelde all form for kollektivtransport i og med at det ikke finnes en egen type for bil. Disse verdiene har blitt sl˚att sammen til ”Bil” i matchingen av datasett.

4.6.4 Sammensl˚ aing av turer

For ˚a kunne sammenligne de forskjellige datasettene var det hensiktsmessig ˚a f˚a laget et datasett som var lesbart og samtidig lett ˚a legge inn i analyseverktøyene. Dette forutsatte felles variabler som kunne brukes som nøkkel i matchingen. Spesielt vanskelig var sammensl˚aingen

(43)

NTNU-Norges teknisk- naturvitenskapelige universitet

1 {

2 "timestampMs" : "1460931303672",

3 "latitudeE7" : 634148007,

4 "longitudeE7" : 104250499,

5 "accuracy" : 25,

6 "activitys" : [ {

7 "timestampMs" : "1460931349814",

8 "activities" : [ {

9 "type" : "unknown",

10 "confidence" : 52

11 }, {

12 "type" : "inVehicle",

13 "confidence" : 29

14 }, {

15 "type" : "onFoot",

16 "confidence" : 10

17 }, {

18 "type" : "walking",

19 "confidence" : 8

20 }, {

21 "type" : "still",

22 "confidence" : 6

23 }, {

24 "type" : "onBicycle",

25 "confidence" : 4

26 }, {

27 "type" : "running",

28 "confidence" : 2

29 } ]

30 }

Figur 4.6: Eksempel p˚a JSON objekt fra GLH som inneholder estimat p˚a reisemodi.

(44)

mellom CATI og datagenerert informasjon i og med at forekomstene i CATI har store avvik.

Løsningen ble en manuell sammensl˚aing basert p˚a tre kriterier: registrert avreisetidspunkt (ho- vedkriterium), deretter reisehensikt og reisemodi. Det ble satt en selvbestemt øvre grense p˚a 10 minutters avvik før kriterium nummer to ble gjeldende. Stemte ikke reisehensikten overens, ble reisemodi benyttet som nøkkel.

4.7 Analyse av reisedata

Deskriptiv analyse for alle reisedata untatt avreisetidspunkt ble foretatt i EXCEL. Sam- menhengen mellom estimerte avreisetidspunkt ble utført i SPSS. PGFPlots for LATEXer brukt for ˚a visuelt fremstille punkter med koordinater.

4.8 Oppsummering

Kapittelet har tatt for seg hvordan undersøkelsen og analysen ble gjennomført. Avvik fra opprinnelig metode blir diskutert sammen med potensielle feilkilder i neste kapittel.

(45)

Kapittel 5

Kritisk vurdering av gjennomføring

5.1 Metodekritikk

Her vil kritiske forhold ved valgte metoder bli vurdert ut fra: metodens validitet (”med hvilken sikkerhet en metode m˚aler det den har til hensikt ˚a m˚ale”), reliabilitet (”gjentakelig- het, at metoden viser samme resultat hver gang”), begrensninger eller feilkilder (Rienecker og Jørgensen, 2013).

• I følge Ringdal (2001) kan et stort antall metoder gjøre det vanskeligere for en forsker ˚a bli god p˚a en metode. Dette kan ha f˚att konsekvenser i form av feil antakelser i metoden.

Likevel har antallet metoder belyst problemstillingen vidt.

• I og med at forskningsspørsm˚alene ble definert etter at litteraturstudiet var gjennomført, ble kildene valgt p˚a grunnlag av oppgavens tittel og tema. Dette kan ha p˚avirket den interne validiteten negativt ved at søket ikke ble presist nok fra starten av. Samtidig kan forskningsspørsm˚alene ha blitt mer presise av den grunn.

• Faren med ˚a innhente data tidlig i prosessen er at sannsynligheten for ˚a stille irrelevante spørsm˚al er større. Dette viste seg ˚a være tilfelle for b˚ade forundersøkelsen og hovedun- dersøkelsen. Datamaterialet ble større enn nødvendig, noe som sannsynligvis har p˚avirket reliabiliteten negativt.

• Et lite utvalg respondenter vil kunne p˚avirke den eksterne validiteten ved en eventuell generalisering av resultatene. Samtidig baserer analysen seg p˚a data fra 152 tilfeller, noe som anses ˚a styrke validiteten til resultatene.

(46)

• Etter noen dager utviklet telefonintervjuet seg fra et strukturert intervju til mer et semi- strukturert intervju, ved at spørsm˚alene ble stilt i en mer flytende samtaleform. Flere av respondentene var dessuten bekjente av intervjuer. Disse to faktorene kan ha svekket den interne validiteten til metoden. Direkte kontakt mellom intervjuer og respondent og fortløpende registrering i database styrker ellers den interne validiteten, ved at det er mindre rom for misforst˚aelser eller feilregistreringer.

• I og med at antall registreringer i SMiO ble p˚avirket av brukervennligheten til appli- kasjonen (avbrutt eller ikke startet pga. treghet), vil m˚aleresultatene variere selv om betingelsene er like. For eksempel vil den daglige jobbreisen ha forskjellig lengde og varig- het avhengig av n˚ar sporingen er aktiv. Dette indikerer lav konsistens og reliabilitet hos SMiO-metoden. Derimot gjør direkte nedlasting av data, uten ekstra mellomledd, at man har god kontroll p˚a feilkilder etter at registreringen er fullført. Dette øker trolig metodens interne validitet.

• Grad av interne validitet for registrering av data for GLH metoden anses som høy, etter- som registreringen g˚ar automatisk uten p˚avirking av respondent. I motsetning til SMiO har man her et ekstra ledd i overføringen av data. Respondenten kan i teorien fikse data før innsending og dermed p˚avirke resultatet.

5.2 Kritikk av resultat

• Presisjonen til de kvantitative resultatene er oppgitt i form av standardavvik og gjen- nomsnittlig avvik. Høye verdier indikerer mindre konsistente resultat og dermed lavere reliabilitet.

• Resultatene fra spørsm˚al seks og sju i sluttundersøkelsen bekrefter og delvis begrunner den lave registreringsraten i SMiO: En av tre glemte ˚a spore minst 10 turer og en av to glemte telefonen helt p˚a en til fem turer. Undersøkelsen er dermed med p˚a ˚a gi mer samsvar med realiteten og dermed styrke den intern validitet til SMiO.

• I utgangspunktet var det tenkt at informasjon fra GLH og .JSON formatet skulle danne grunnlaget for det assisterte intervjuet. .KML ble benyttet p˚a grunn av antatt enklere nedlasting av data og enklere fremstilling for intervjuer gjennom Google Earth. Problemer knyttet til manglende filtreringsmuligheter i programmet, gjorde at kvaliteten p˚a fremstil-

(47)

NTNU-Norges teknisk- naturvitenskapelige universitet

lingen ikke ble god nok for identifisering av turer. Derfor er det knyttet stor unøyaktighet - og dermed validitet, i tilknytning til antall turer i det assisterte intervjuet.

• I det innsendte abstraktet (se vedlegg G) ble det forventet at reisemodi skulle bli korrekt identifisert i ca. 75% av tilfellene for den passive registreringsmetoden. Samtidig var det ventet at den aktive metoden skulle være bedre enn den passive. Bruken av ordetkorrekt i dette tilfellet kan virke misvisende, da det er vanskelig ˚a vite om sann verdi kan oppn˚as ved bruk av disse metodene. Resultatet var noe uventet da de viste lav korrelasjon mellom applikasjonene og CATI. Manuell identifisering av transportmodi kan ha p˚avirket den interne validiteten til resultatet.

(48)
(49)

Kapittel 6

Andre funn og resultat

I den vitenskapelige artikkelen er de mest interessante resultatene presentert og diskutert.

Her følger en oversikt over andre funn som er gjort i arbeidet med oppgaven og som er utelatt i artikkelen.

• En tur i CATI (B) ble oppgitt som tur med barnevogn. I GLH ble turen identifisert som

”inVehicle”. Dette kan skyldes at telefonen fikk samme frekvens som et kjøretøy ved ˚a ligge i barnevogna og dermed blir betraktet som et kjøretøy. Uansett burde hastigheten tilsi at dette ikke var et kjøretøy. I artikkelen diskuteres funnet i forhold til lav korrelasjon mellom kjøretøy og sykkel i GLH.

• Enheter koblet opp mot samme Google-konto alternerer hyppig mellom enhetens lokasjon.

For visualisering i Google Earth ble dette ubrukelig for CATI (B), da programmet ikke filtrerer bort umulige hastigheter. Dette problemet er løst i Location History Visualizer PRO.

• Etter at analysen var gjennomført ble det oppdaget en ny parameter ved navn”exitingVe- hicle” i aktivitets-variablene til GLH. Sannsynligvis beskriver denne et skifte i reisemodi fra ”inVehicle” til ””til fots”. Den kan is˚afall brukes som knagg til ˚a identifisere et skifte av etappe. Det er ikke gjort funn av tilsvarende parameter ”enterVehicle”.

• Distanser og reisetid som oppgis i Timeline History blir ikke med i dataoverføringen fra Google. Variablene i SMiO blir heller ikke kalkulert p˚a et aggregert niv˚a og m˚a derfor beregnes.

(50)
(51)

Kapittel 7

Konklusjon og anbefalinger om videre arbeid

I studiet har det blitt sett p˚a muligheten for ˚a benytte eksisterende data fra to forskjellige kilder. Dette har blitt gjort ved ˚a sammenligne indikatorer innen transport og reisevaner. Resul- tatene fra de valgte analysemetodene viser at datakvaliteten fra begge applikasjonene begrenses av type operativsystem og applikasjonens tilnærming. Passiv sporing synes ˚a være den mest aktuelle tilnærmingen for datafangst, selv om kravet til beskyttet personvern øker. Artikkelen konkluderer med at smart-telefon kan være et lovende alternativ til ˚a erstatte tradisjonelle metoder for innsamling av reisevane data. P˚a bakgrunn av denne konklusjonen, anbefales det derfor ˚a g˚a videre med en passiv tilnærming basert p˚a data fra SMiO og med umiddelbar PRS validering etter endt registreringsdag.

P˚a grunnlag av denne anbefalingen bør videre arbeid fokusere p˚a følgende tema:

• Implementering av umiddelbar validering/PRS i en fremtidig applikasjon.

• Forbedre prosesserings-algoritmer ved passiv logging.

• Incentiver som gjør at respondentene enten føler at de tilfører undersøkelsen verdi, eller som gjør de mer entusiastisk.

• Søke kunnskap i andre prosjekter med lignende behov.

• Se p˚a tvers av landegrensene for felles utvikling i nordiske land.

Det foresl˚as at neste steg blir ˚a utføre en større undersøkelse med større utvalg og geografisk

(52)

utstrekning, der de overnevnte punktene tas i betraktning. Denne undersøkelsen kan for eksem- pel utføres som en selvstendig test eller parallelt med den ordinære reisevaneundersøkelsen.

(53)

Referanseliste

Barbeau, S, M Labrador, N Georggi, P Winters og R Perez (2009). TRAC-IT: A software architecture supporting simultaneous travel behavior data collection and real-time location- based services for gps-enabled mobile phones . I: Transportation Research Board 88th An- nual Meeting. 09-3175. Citeseer.

Bricka, Stacey (2009). What Is Di↵erent About Non-response in GPS-Aided Surveys? I:

Bingley: Emerald Group Publishing Limited.

Christensen, Linda (2013). The role of web interviews as part of a national travel survey . I:

Transport Survey Methods: Best Practice for Decision Making.

Christiansen, Petter, Øystein Engebretsen og Randi Hjorthol (2015). Nasjonal reisevaneun- dersøkelse p˚a telefon eller web? Tekn. rapp. 1426. Transportøkonomisk institutt.

Dahl, Erlend (2016). L4.1 Dokumentasjon av demonstratoren. Last accessed: 07.07.2016. url:

http://www.sintef.no/contentassets/f10edb0856604c00a6b5de7a280a1b4f/

rapporter/smio-l4.1-dokumentasjon-av-demonstrator-v1.pdf.

Datatilsynet (2012).Sporing og GPS. Last accessed: 12.05.2016.url:https://www.datatilsynet.

no/Teknologi/Sporing/.

Google, Inc (2016).Personvernregler. Last accessed: 07.07.2016.url:http://www.google.

com/intl/no_no/policies/privacy/.

Greene, Elizabeth, Leah Flake, Kevin Hathaway og Michael Geilich (2016). A SEVEN-DAY SMARTPHONE-BASED GPS HOUSEHOLD TRAVEL SURVEY IN INDIANA 2 . I:

Transportation Research Board 95th Annual Meeting. 16-6274.

Haugsbø, Miriam S. og Ingunn Ellis (2014). L5.1 Dokumentasjon av datagrunnlag og analyse- metode. Last accessed: 14.06.2016. url: http : / / www . sintef . no / prosjekter / smidig-mobilitet-i-oslo/.

(54)

Hjorthol, Randi, Øystein Engebretsen og Tanu Priya Uteng (2014). Den nasjonale reisevane- undersøkelsen 2013/14 - Nøkkelrapport. Tekn. rapp. 1383. TØI.

Kvale, Steinar og Svend Brinkmann (2012). Det kvalitative forskningsintervju. 2. utg. Student- litteratur AB.

NCHRP (2006).Standardization of Personal Travel Surveys. Report to the National Cooperative Highway Research Program on Project 08-37. Tekn. rapp. Transportation Research Board, Washington, DC.

Nitsche, Philippe, Peter Widhalm, Simon Breuss, Norbert Br¨andle og Peter Maurer (2014).

Supporting large-scale travel surveys with smartphones–A practical approach . I: Trans- portation Research Part C: Emerging Technologies 43, s. 212–221.

Nordtømme, Marianne Elvaas og Kristin Ystmark Bjerkan (2013).L6.1 Innledende undersøkelse om personvern og brukeraksept. Last accessed: 04.04.2016. url: http://www.sintef.

no/prosjekter/smidig-mobilitet-i-oslo/.

Olsson, N (2011). Praktisk rapportskriving. Tapir akademisk.

Rasmussen, Thomas Kjær, Jesper Bl´afoss Ingvardson, Katrın Halld´orsd´ottir og Otto Anker Nielsen (2015).Improved methods to deduct trip legs and mode from travel surveys using wearable GPS devices: A case study from the Greater Copenhagen area . I: Computers, Environment and Urban Systems 54, s. 301–313.

Rienecker, Lotte og Peter Stray Jørgensen (2013). Den gode oppgaven - h˚andbok i oppgaveskri- ving p˚a universitet og høyskole. 2. utg. Fagbokforlaget.

Ringdal, Kristen (2001). Enhet og mangfold: samfunnsvitenskapelig forskning og kvantitativ metode. Fagbokforlaget.

Sadeghvaziri, Rojas og Jin (2016). Exploring the Potential of Mobile Phone Data in Travel Pattern Analysis . I: Paper Submitted for Presentation and Publication at the Transporta- tion Research Board’s 95th Annual Meeting, Washington, D.C., 2016.

Schuessler, Nadine og Kay Axhausen (2009). Processing raw data from global positioning systems without additional information . I:Transportation Research Record: Journal of the Transportation Research Board 2105, s. 28–36.

Stopher, Peter R og Stephen P Greaves (2007). Household travel surveys: Where are we going? I: Transportation Research Part A: Policy and Practice 41.5, s. 367–381.

(55)

NTNU-Norges teknisk- naturvitenskapelige universitet

Stopher, Peter R, Christine Prasad, Laurie Wargelin og Jason Minser (2013). Conducting a GPS-only household travel survey . I:Transport Survey Methods: Best Practice for Decision Making, Bingley, UK: Emerald Group Publishing Limited, s. 91–113.

TNS-Gallup (2016). Telefonintervju CATI. Last accessed: 20.06.2016. url: http://www.

tns-gallup.no/metoder-og-verktoy/metoder/telefonintervju-cati.

Tuckel, Peter og Harry O’Neill (2002). The Vanishing Respondent In Telephone Surveys . I:

Journal of Advertising Research 42.5, s. 26–48.

Vij, Akshay og Kalyanaraman Shankari (2015).When is big data big enough? Implications of using GPS-based surveys for travel demand analysis . I: Transportation Research Part C:

Emerging Technologies 56, s. 446–462.

Wilson, Jill (2004).Measuring personal travel and goods movement . I:TR NEWS 234, s. 28.

Wolf, Jean mfl. (2004).Applications of new technologies in travel surveys . I:7th International Conference on Travel Survey Methods, Costa Rica.

Yin, Robert K (2002). Case study research: Design and methods. Sage publications.

(56)
(57)

Part II

Vitenskapelig artikkel

(58)

Referanser

RELATERTE DOKUMENTER

Based on official injury figures from Statistics Norway (SSB) and exposure data from the nationwide travel survey (RVU) in Norway in 2013/14, we have calculated traditional

I produced data during my relationships with the participants according to traditional qualitative methods: in depth interviews, focus groups, open answer survey

Through the use of existing digital forensics methods and data mining techniques, correlations between multiple machines are used to improve the efficiency and effectiveness

Low temperature district heating (LTDH) can substantially reduce total greenhouse gas emissions, increase reliability of the energy systems, enable transition to the renewable energy

The first depth to bedrock model for the 2020 survey areas was produced by training an ANN using existing 2013 AEM survey data, all existing 850+ boreholes, as well as a small number

Annual numbers of nights spent abroad were available for all countries and all years except for the Netherlands (only years 2012−15) and Norway (only years 2009−11). Between 2009

Data which are used as input data in research, but which have been collected, generated or processed by other researchers or research institutions than those conducting the

By exploring methods for conveying vectorial data using features derived from natural texture patterns, it is possible to profoundly expand the range of possibilities in texture-