Innledning
Parenting Stress Index (PSI) ble utviklet av den amerikanske psykologen Richard R. Abidin for å avdekke foreldre-barn system under stress og med forhøyet risiko for utvikle lite hensiktsmessig (dysfunksjonell) foreldreadferd eller adferdsproblemer hos barnet. Den første versjonen av testen kom ut i 1983 (Abidin, 1983), mens tredjeutgaven, som den norske versjonen er basert på, kom ut i 1995 (Abidin, 1995). Den norske versjonen er oversatt fra engelsk av John A. Rønning (Kaaresen, Rønning, Ulvund, & Dahl, 2006). Det finnes også en kortversjon av PSI (PSI-SF). Man må ha lisens fra PAR, Inc. i USA for å kjøpe og bruke PSI. Det er uklart om den norske oversettelsen er tilgjengelig.
PSI er standardisert for foreldre med barn i alderen én måned til 12 år. Den kan anvendes både klinisk og til forskningsformål. Testen omfatter et foreldredomene og et barnedomene. For foreldredomenet finnes følgende syv delskalaer: kompetanse, sosial isolasjon, tilknytning til barnet, helse, rollebegrensninger, depresjon og partner. De seks delskalaene under barnedomenet er: distrahérbarhet/hyperaktivitet, tilpasningsdyktighet, forsterker forelderen, hvor krevende barnet oppfattes å være, stemningsleie og aksept. De to domenene sett under ett utgjør det totale stressnivået. I tillegg inneholder PSI en skala for livsstress, som først og fremst kartlegger stress utenfor foreldre-barn forholdet, som for eksempel dødsfall i familien eller tap av jobb.
PSI er et spørreskjema som det tar 20-25 minutter for den voksne å besvare. Den voksne vurderer både barnet og seg selv. De to domenene består av i alt 101 spørsmål. I tillegg kommer 19 spørsmål til livsstresskalaen. De aller fleste spørsmålene besvares på en 5-delt skala, fra «svært enig» til «svært uenig». Svarene på henholdsvis barne- og foreldredomenet summeres opp i en totalskåre for stress. Kortversjonen PSI-SF består av 36 spørsmål.
Den amerikanske testmanualen presenterer resultater fra en rekke psykometriske studier av PSI (Abidin, 1995). Normgrunnlaget i USA består av 2633 mødre og 200 fedre. Gjennomsnittlig total stresskåre for mødrene var 223 (SD = 37). På barnedomenet skåret de i gjennomsnitt 100 (SD = 19), mens gjennomsnittsskåren på foreldredomenet var 123 (SD = 24). Basert på undersøkelsen av de 2633 mødrene, har PSI vist en tilfredsstillende indre konsistens. Cronbachs alfa var 0,90 for barnedomenet, 0,93 for foreldredomenet og 0,95 for total stress. Test-retest reliabiliteten varierer på tvers av flere studier: 0,57-0,82 for barnedomenet, 0,70-0,91 for foreldredomenet og 0,65-0,96 for total stress. Koeffisientene varierer med lengden på re-testintervallene og utvalgene.
Resultater fra flere enn 250 internasjonale studier støtter validiteten knyttet til PSI-skalaene (Rush, First, & Blacker, 2008). PSI kan skille mellom forskjellige nivåer av foreldrebelastning og forutsi dysfunksjonell foreldrestil og avvik i utvikling og fungering på tvers av et bredt spekter av populasjoner.
Metode
Vi søkte etter dokumentasjon på testenes psykometriske egenskaper i databasene Norart, BIBSYS, SveMed+, Cochrane Library, PsycINFO, Medline og Embase. Søkedato: 25.11.2010. Søkestrategien er tilgjengelig på http://www.r-bup.no/CMS/ptb.nsf/pages/psi. Vi kontaktet også førsteforfattere av inkluderte artikler, samt oversetterne av PSI, for å identifisere dokumentasjon som eventuelt ikke ble fanget opp av det systematiske søket.
Vi inkluderte alle publikasjoner av studier som har undersøkt og rapportert minst ett av følgende i skandinaviske utvalg:
- normdata for testen
- reliabilitet: indre konsistens, test-retest, interrater og endringssensitivitet
- validitet: samsvar med liknende testskårer, samsvar med referansestandard eller annet kriterium, og/eller faktorstruktur
I tillegg, og kun for norske versjoner av PSI, inkluderte vi publikasjoner som rapporterte gjennomsnittsskårer og/eller forekomster for henholdsvis generelle populasjoner og kliniske undergrupper.
To forskere gikk gjennom sammendragene til alle identifiserte publikasjoner, uavhengig av hverandre, etter at dubletter var fjernet. Alle publikasjoner som kunne virke relevante ble bestilt inn i fulltekst, og prosessen over ble gjentatt for fulltekstrapportene.
To forskere vurderte normering, validitet og reliabilitet, uavhengig av hverandre, ved hjelp av en tilpasset versjon av Test review form and notes for reviewers (EFPA 2008).
Resultater
Litteratursøk
Søket etter dokumentasjon for de psykometriske egenskapene til PSI på norsk resulterte i 41 referanser, hvor av sju virket relevante og ble bestilt i fulltekst. Tre av de sju publikasjonene fylte inklusjonskriteriene (Glavin, Smith, Sørum, & Ellefsen, 2010; Kaaresen et al., 2006; Kaaresen et al., 2008). De resterende fire ble ekskludert på grunn av manglende data, kun konferanseabstract tilgjengelig (Drugli & Larsson, 2009), ikke-norsk PSI-versjon (Ponjaert-Kristoffersen et al., 2004), eller at en modifisert utgave av PSI var benyttet (Olafsen et al., 2007; Olafsen et al., 2008). I tillegg foreslo en ekspert fire publikasjoner, hvorav vi inkluderte to (Larsson et al., 2009; Fossum, Mørch, Handegard, Drugli, & Larsson, 2009). Dessuten kontaktet vi førsteforfatterne av de inkluderte publikasjonene, samt oversetter, uten at dette førte til at ytterligere publikasjoner ble identifisert.
De fem inkluderte publikasjonene rapporterte resultater fra tre intervensjonsstudier hvor PSI inngikk som måleinstrument. To av studiene var randomiserte kontrollerte forsøk (RCT), mens den siste var en kvasieksperimentell studie med ikke-ekvivalente grupper. Den ene RCTen inkluderte 121 barn i alderen 4-8 år med atferdsproblemer (Larsson et al., 2009; Fossum, Mørch, Handegard, Drugli, & Larsson, 2009) og sammenliknet effekten av foreldretrening alene med foreldretrening og barnegrupper mot en venteliste-kontrollgruppe. Den andre RCTen inkluderte 146 for tidlig fødte spedbarn og 75 fulltermin spedbarn med deres foreldre (Kaaresen et al., 2008; Kaaresen et al., 2006). De for tidlig fødte barna med sine foreldre ble fordelt tilfeldig i to grupper, en som mottok en intervensjon (Mother-Infant Transaction Program) mens den andre fikk vanlig oppfølging. Den kvasieksperimentelle studien inkluderte 2247 postpartum kvinner som enten fikk tilbud om støttesamtaler med helsesøster for å forebygge og behandle fødselsdepresjon, mens den andre gruppen fikk vanlig oppfølging fra helsestasjonen (Glavin et al., 2010). Til sammen 754 av de 2247 kvinnene fylte ut PSI ett år etter fødselen.
Svenske og danske versjoner av PSI
Databasesøket etter dokumentasjon for de psykometriske egenskapene til PSI på svensk og dansk resulterte i 32 referanser, hvorav 17 ble gjennomgått i fulltekst. Ingen av disse fylte inklusjonskriteriene våre. I alt 11 publikasjoner handlet om andre tester enn PSI eller sterkt modifiserte versjoner av PSI (Dellve, Samuelsson, Tallborn, Fasth, & Hallberg, 2006; Fabian, Radestad, Rodriguez, & Waldenstrom, 2008; Meurle-Hallberg & Armelius, 2006; Mothander & Moe, 2010; Nekkebroeck et al., 2010; Thorell, 2009; White-Koning et al., 2007; Östberg, Hagekull, & Wettergren, 1997; Östberg & Hagekull, 2000; Östberg, 1998; Östberg, Hagekull, Lindberg, & Dannaeus, 2005), fem handlet om andre språkversjoner enn skandinavisk (Janssens, Oldehinkel, & Rosmalen, 2009; Oburu, 2005; Oburu & Palmerus, 2005; Taylor & Kemper, 1998), og én var allerede inkludert gjennom det norske søket (Ponjaert-Kristoffersen et al., 2004).
Middelverdier i kliniske undergrupper
Uten å ha gjort statistiske sammenlikninger ser det ut til at stressnivået blant mødre til barn med problematferd var høyere enn både den amerikanske normen og stressnivået til andre norske mødre (Tabell 2). Artiklene til Kaaresen og kolleger om premature barn fant statistisk signifikante forskjeller mellom intervensjons- og kontrollgruppe for både total stress og begge domenene, men ikke ved alle måletidspunktene (Kaaresen et al., 2008; Kaaresen et al., 2006). Det var ingen statistiske forskjeller mellom mødrenes og fedrenes stressnivå.
Normer
Glavin og kollegers studie (Glavin et al., 2010) var i utgangspunktet ikke noen normeringsstudie. Utvalget kan heller ikke sies å representere den generelle populasjonen, da deltakerne bestod utelukkende av mødre med 12 måneder gamle barn. Likevel gjør utvalgsstørrelsen (N = 754) studien interessant nok til å sammenlikne gjennomsnittsskårene med de amerikanske normene. De norske kvinnene ser ut til å skåre betydelig lavere på samtlige skalaer. Videre forskning ville kunne svare på hvor reelle disse forskjellene er, og hvorvidt de skyldes kulturelle forskjeller i svarstil eller faktiske forskjeller i stressnivå mellom amerikanske og norske mødre.
Validitet
Ingen av studiene undersøkte validitet per se, men de inneholdt gruppesammenlikninger som forsøksvis kan brukes til å belyse begrepsvaliditeten. Forskjellene mellom gruppene i total stress-skåre kan uttrykkes i form av en effektstørrelse (Cohen's d) som er en standardisert forskjell mellom to gruppegjennomsnitt). Studien med barn med problematferd rapporterte mindre foreldrestress etter foreldretrening for både mødre og fedre (hhv. d = 0,67 og d = 0,86) (Larsson et al., 2009). Mødre til premature barn i intervensjonsgruppa hadde lavere stressnivå enn i kontrollgruppa når barna var 2 år (d = 0,62) (Kaaresen et al., 2008). Begge disse gruppeforskjellene kan beskrives som middels til store. Mødre som aldri hadde vært deprimert var mindre stresset enn mødre som hadde vært deprimert 12 måneder etter fødselen (d = 1,02), (Glavin et al., 2010) en forskjell som kan beskrives som stor.
Reliabilitet
Den indre konsistensen til hovedskalaene i PSI (total skåre, barnedomenet og foreldredomenet) var svært god, med Cronbachs alfa på over 0,9 i to studier (Glavin et al., 2010; Larsson et al., 2009). Ingen av studiene beregnet test-retest reliabilitet.
Diskusjon og konklusjon
Den tilgjengelige dokumentasjonen gir et inntrykk av at den norske versjonen av PSI oppfyller visse forventninger, som f eks lavere stress hos dem som har fått en intervensjon, og lavere stress hos dem som ikke har opplevd depresjon. Testen har svært god indre konsistens for de største skalaene/domenene, mens data for subskalaenes indre konsistens mangler. Én studie med 754 deltakere kunne tenkes å gi normdata, men populasjonen i studien var trolig for homogen (kvinner målt 12 måneder etter fødselen).
Samlet sett er dokumentasjonen utilstrekkelig til å kunne vurdere testens anvendelighet. Usikkerheten rundt den norske versjonens måleegenskaper reduseres noe av den gode dokumentasjonen for den amerikanske originalutgaven. Vi vil likevel oppfordre norske forskere som planlegger å bruke PSI som måleinstrument å inkludere psykometri blant problemstillingene.