• No results found

3 METODE

3.4 Validitet

Det er viktig å minimalisere det som kan true gyldigheten av konklusjoner i etterkant av en studie. Validitet deles gjerne inn i statistisk validitet, intern validitet, begrepsvaliditet og ekstern validitet (54).

3.4.1 Statistisk validitet

Statistisk validitet sier noe om det er en reell sammenheng mellom årsak (intervensjon) og virkning (effekt) eller mellom uavhengige og avhengige variabeler. En stor trussel mot statistisk validitet er at utvalget er for lite, at det er for få deltagere med i studien. I vår studie ble det regnet ut på forhånd hvor mange deltagere det måtte være i hver gruppe for å ha en ønsket statistiske styrke (se Statistics i artikkelen). Det er brukt annerkjente analysemetoder i studien og vi har fått veledning av statistikk-kyndige personer. Statistisk signifikansverdi (p-verdi) ble satt til 0.05 for at det skulle være under 5 % sannsynlighet for at resultatene skyldes tilfeldigheter.

I et tre-gruppe design der treningsintervensjonene skulle være så ensartet som mulig for to av gruppene, var det viktig å standarisere intervensjonen og kontrollere for at den virkelig fant

24

sted. Deltagerne i intervensjonsgruppene fikk et så identisk behandlingsopplegg som praktisk mulig og i vesentlig grad av samme terapeut. Dette gav et godt utgangspunkt for ensartet intervensjon. På et rehabiliteringspphold, der deltagerne bodde på stedet og fravær fra treningstimer ble notert og fulgt opp, hadde man god kontroll på at de fleste deltagerne virkelig fikk intervensjon. Hvilken intensitet den enkelte deltager la i treningen var noe mer individuelt og vanskeligere å kontrollere for. Under den daglige gangtreningen skulle pasientene gå så de ble lett varme og andpustne. Pulsklokke på alle pasientene hvor man kunne følge med at ønsket % av maximal puls ble oppnådd, kunne bedret kontrollen på intensiteten.

3.4.2 Begrepsvaliditet

Begrepsvaliditet handler om man virkelig måler det man har til hensikt å måle. Det er nødvendig å beskrive så nøyaktig som mulig deltagerne, intervensjonen, stedet for

intervensjonen og måleinstrumentene. Begrep må operasjonaliseres og hva vi kaller ting er viktig for å være sikker på at de gjenspeiler det vi ønsker å studere. Vi har beskrevet dette så utførlig som mulig i studiens protokoll, og vi har operasjonalisert viktige begrep som fysisk funksjon og smerte. I denne studien var det for eksempel eventuell bedring av smerte for pasienter med FM som skulle måles. Smerte er et komplekst begrep, og dersom TPC brukes som utfallsmål for generelt utbredt, kronisk smerte gir det ikke optimal begrepsvaliditet. Det må presiseres at TPC måler en palpasjonsutløst hyperalgesi.

3.4.3 Intern validitet

Den interne validiteten bestemmer den metodiske kvaliteten på studien og skal sikre at det virkelig er intervensjonen som gir effekt og ikke andre konfuderende faktorer. Det viktigste er at en studie har et sterkt design. RCT regnes ofte som gullstandard når man ønsker å se på på sammenhengen mellom årsak og virkning. Men selv et sterkt design som RCT kan trues av mulige skjevheter (54). Randomisering kontrollerer best for at eventuelle konfuderende faktorer blir likt fordelt og gruppene vi skal undersøke blir sammenlignbare. Det ville vært ideelt at alle deltagerene i vår studie hadde blitt randomisert i en operasjon med lik mulighet for å havne i alle tre gruppene.Grunnen til at deltagerne ble randomisert i to omganger er redegjort for i punkt 3.1.1. Klinisk forskning handler også om å ta valg. Det var ingen statistisk signifikante forskjeller ved baseline mellom dem som ble randomisert i første og

25 andre runde. Deltagerne i vår studie var også stratifiserte på alder og kjønn for at disse

variablene også skulle fordeles likt i gruppene.

Informasjonsskjevhet kunne også truet validiteten dersom deltagerne ønsket at

rehabiliteringsopphold i varmt klima skulle bli et tilbud til denne pasientgruppen og derfor bevisst eller ubevist svarte slik at rehabilitering i varmt klima kom best ut. For å forsøke å kontrollere for mulige skjevhet her, ble viktigheten av oppriktighet i rapporteringen tatt opp med deltagerne i forkant av testingen.

Det var relativt lavt frafall i denne studien. Tre pasienter ble ekskludert før intervensjon, alle de øvrige 129 gjennomførte intervensjonene. I løpet av det året vi fulgte pasientene, var det tolv pasienter som ikke møtte til tre og eller tolv måneders kontrollene. Dette gir et frafall på 9 % i oppfølgings perioden, som er relativt lavt. Hos dem som ikke møtte til kontroller, har vi satt inn baselineverdier da man forventet avtagende effekt over tid.

3.4.4 Ekstern validitet

Ekstern validitet omhandler generalisering av resultater fra et studieutvalg til en større populasjon. Denne type validitet kan trues av at utvalget ikke er representativt for

pasientgruppen vi ønsker å studere. Generalisering er en induksjon fra et mindre utvalg til et større. Inklusjonskriteriene er med å definere hvem konklusjonen kan generaliseres til (76).

Pasientene i vår studie var rekruttert fra en spesialistpoliklinikk på sykehus, og det var derfor mulig at disse pasienter var relativt mer plaget av sin sykdom enn om de hadde kommet fra primærhelsetjenesten. De kom fra poliklinikk for revmatologi, og det var derfor sannsynlig at muskel-skjelettplagene var mer fremtredende hos dem enn psykiske plager som angst og depresjon. Pasientene ble invitert til å være med i studien pr. brev, og de måtte selv ta initiativ for å melde sin interesse. De som meldte seg var sannsynligvis motivert for å gjøre noe med sin situasjon og tilstand. Man skal være varsomme med å generalisere eventuelle resultater av denne studien til andre enn pasienter med FM som er mye plaget av ledd og muskelsmerter, og som er så motivert for trening at de er villig til å reise bort i fire uker. Inklusjonskriteriene begrenser også populasjonen til å være mellom 18 og 60 år, ikke ha andre alvorlige

sykdommer, og at de kunne delta i lette treningsgrupper. Resultatene er for eksempel ikke overførbare på barn eller eldre med FM.

26