Innledning
Strengths and Difficulties Questionnaire (SDQ) (http://www.sdqinfo.org/) er utviklet av Robert Goodman (Goodman, 1997). SDQ ble oversatt til norsk av Einar Heiervang, Irene Elgen og Sonja Heyerdahl, og tilbakeoversatt av Melanie Young i 1999. På norsk heter instrumentet Sterke og svake sider, men vi vil i denne sammenhengen referere til det som SDQ.
SDQ er et kortfattet spørreskjema, laget for å kartlegge psykisk helse, vennerelasjoner og prososial atferd hos barn og unge. Det tar noen få minutter å fylle ut. Hovedskjemaet har 25 ledd (5 delskalaer med 5 ledd i hver). Det er fire problemskalaer: Atferdsproblemer, Hyperaktivitet – oppmerksomhetsproblemer, Emosjonelle symptomer og Venneproblemer. I tillegg er det en skala som kartlegger prososial atferd. Man angir om utsagnene i skjema stemmer for barnet (0-stemmer ikke, 1-stemmer delvis eller 2-stemmer helt). Skårene summeres for hver delskala (etter at enkelte ledd er reversert), og de fire problemskalaene summeres til en skåre for totale vansker. Man kan også summere skala for emosjonelle symptomer og venneproblemer til en internaliserende skåre og skala for atferdsproblemer og hyperaktivitet-oppmerksomhetsproblemer til en eksternaliserende skåre (Goodman, Lamping & Ploubidis, 2010). Dette er særlig relevant i utvalg med relativt lite problemer. I et tilleggsskjema («impact supplement») spør man om barnet/ungdommen synes han/hun har problemer. I så fall spørres om varighet av problemene og hvordan vanskene virker inn på ungdommens og familiens liv (7 spørsmål), Fem av spørsmålene som angir vanskenes innvirkning på barnets/ungdommens liv (0-ikke i det hele tatt, 0-bare litt, 1-en god del, 2-mye) kan summeres til en skåre for vanskenes innvirkning («Impact»).
Selvrapportversjonen (SDQ-S) er beregnet for barn/ungdom i alderen 11-16 år (Goodman, Meltzer & Bailey, 1998). Spørreskjema foreligger også i foreldre- og lærerversjon for barn og unge i alderen 4-16 år (SDQ-P og SDQ-T) (Goodman, 1997), og for barn 3-4 år.
Det foreligger en egen versjon for oppfølging etter behandling. Denne har med to spørsmål om behandlingen (Ford, Hutchings, Bywater, Goodman & Goodman, 2009).
Oversettelser
SDQ er brukt i svært mange studier, både internasjonalt og i Norge. Pr 2013 er SDQ oversatt til mer enn 70 språk. Spørreskjema på norsk kan lastes ned fra http://www.sdqinfo.org/. SDQ foreligger også som internettversjon www.youthinmind.info, men foreløpig ikke på norsk. Papirversjonen kan brukes fritt for ikke-kommersielle formål, men man må ha tillatelse fra Robert Goodman for å benytte skjema elektronisk og betale en avgift pr respondent.
Skåring
På http://www.sdqinfo.org/ er det informasjon om både håndskåring og elektronisk skåring (skåringsyntaks og internettbasert skåring). Det er angitt grenseverdier for antatt avvikende skårer, basert på britisk normalmateriale. Skårer over ca 90-persentilen angitt som «antatt klinisk område» (på engelsk: «abnormal»), og skårer mellom ca 80- og 90-persentilen er kategorisert som «grenseområde» («borderline range»). For Totale vansker er de britiske grenseverdiene 20 og 16 for henholdsvis antatt klinisk område og grenseområdet. Robert Goodman har utviklet en PC-basert algoritme for å sammenfatte resultater fra ulike informanter, med prediksjon av om barnepsykiatrisk diagnose er sannsynlig på grunnlag av resultatene (Goodman, Ford, Simmons, Gatward & Meltzer, 2000). Det er også utviklet en «added value»-skåre til bruk i spesialisttjenester hvis man ønsker å vurdere effekt av behandling (Ford et al., 2009). Denne er basert på epidemiologiske data slik at endringen i behandlingsperioden justeres for endring for et utvalg barn som ikke har vært i behandling, og «added value» ved behandling estimeres. Dette er særlig relevant for å vurdere behandlingseffekt på gruppenivå.
Måleegenskaper internasjonalt
Mange internasjonale studier har studert reliabilitet og validitet ved SDQ-S. Goodman (2001) fant at femfaktorstrukturen ble bekreftet i data fra et britisk epidemiologisk utvalg. Han vurderte den interne konsistens som generelt tilfredsstillende (Cronbachs alfa 0,80 for Totale vansker). SDQ-S-skårer over 90-persentilen predikerte klart økt sannsynlighet for uavhengig diagnostisert psykiatrisk lidelse (gjennomsnittlig odds ratio 6,2). Spesifisitet og negativ prediktiv verdi for prediksjon av psykiatrisk lidelse var høye, mens sensitivitet og positiv prediktiv verdi var lavere. Generelt var selvrapport SDQ svakere assosiert med psykiatrisk lidelse, enn skårer ved foreldre og lærere. I en valideringsstudie hvor også skåren for vanskenes betydning («impact»-skåren) var inkludert, fant Goodman (1999) at skåren for vanskenes betydning diskriminerte bedre enn symptom-skårer mellom kliniske utvalg og befolkningsutvalg.
Achenbach og kolleger (2008) har oppsummert funn på psykometriske egenskaper for både SDQ og tilsvarende skjemaer i Achenbach System of Empirically Based Assessment (ASEBA) i en oversiktsartikkel.
Metode
Vi søkte etter dokumentasjon på testens psykometriske egenskaper i databasene Norart, BIBSYS, SveMed+, CRIStin.no, Cochrane Library, PsycINFO, Medline, Embase og PubMed. Det første søket ble gjort 25.11.2010, og for å få et så oppdatert bilde som mulig av litteraturen søkte vi igjen 23.04.2013. Søkestrategiene er tilgjengelig på http://www.r-bup.no/CMS/ptb.nsf/pages/sdq-s. Vi kontaktet også førsteforfattere av inkluderte artikler, samt oversetterne av SDQ, for å identifisere dokumentasjon som eventuelt ikke ble fanget opp av det systematiske søket.
Vi inkluderte alle publikasjoner av studier som har undersøkt og rapportert minst ett av følgende i norske utvalg:
- normdata for testen
- reliabilitet: indre konsistens, test-retest eller endringssensitivitet
- validitet: samsvar med liknende testskårer, samsvar med referansestandard eller annet kriterium, og/eller faktorstruktur
I tillegg inkluderte vi publikasjoner som rapporterte gjennomsnittsskårer for henholdsvis generelle populasjoner og for kliniske og andre undergrupper.
To forskere gikk gjennom sammendragene til alle identifiserte publikasjoner, uavhengig av hverandre, etter at dubletter var fjernet. Alle publikasjoner som kunne virke relevante ble bestilt inn i fulltekst, og prosessen over ble gjentatt for fulltekstrapportene.
To forskere vurderte normering, validitet og reliabilitet, uavhengig av hverandre, ved hjelp av en tilpasset versjon av Test review form and notes for reviewers (European Federation of Pscyhologist Association (EFPA), 2008).
Resultater
Litteratursøk
De to systematiske litteratursøkene etter dokumentasjon for den norske versjonen av SDQ-S identifiserte til sammen 252 unike publikasjoner. Av disse virket 92 relevante og ble gjennomgått i fulltekst. Totalt 27 publikasjoner oppfylte inklusjonskriteriene våre, og ble inkludert (Tabell 1). Vi ekskluderte de resterende 37 publikasjonene fordi de ikke rapporterte relevante data, rapporterte data fra ikke-norske utvalg, kun rapporterte data fra andre SDQ-versjoner enn selvrapporteringsversjonen, eller ikke hadde brukt SDQ i det hele tatt (Vedlegg 1).
Vi kontaktet også forskere knyttet til de største inkluderte studiene for å identifisere ytterligere relevant dokumentasjon, uten at dette tilførte noe til den allerede inkluderte dokumentasjonen. Vi søkte ikke etter dokumentasjon for svenske og danske versjoner av SDQ.
Inkluderte studier
De totalt 27 inkluderte publikasjonene rapporterte data fra til sammen 15 studier (Tabell 1). Der hvor det fantes flere publikasjoner med data fra én og samme studie, har vi valgt å gjengi data fra de publikasjonene som hadde størst utvalg, og flest skalaer og psykometriske verdier. Fra kohortstudier med to eller flere datainnsamlinger angir vi resultater fra de ulike bølgene, med anmerkning om at dette er en longitudinell studie med samme populasjon.
Helseprofil for barn og ungdom i Akershus
Den største inkluderte studien var den befolkningsbaserte tverrsnittsundersøkelsen Helseprofil for barn og ungdom i Akershus, med seks artikler og en doktorgradsavhandling (Alfstad et al., 2011; Lossius, Clench-Aas, Roy, Mowinckel & Gjerstad, 2006; Van Roy, 2010; Van Roy, Groholt, Heyerdahl & Clench-Aas, 2006, 2010; Van Roy, Kristensen, Groholt & Clench-Aas, 2009; Van Roy, Veenstra & Clench-Aas, 2008). Studiepopulasjonen var 43 248 skoleelever i alderen 8-19 år, hvorav 36 456 (84 %) ble inkludert. SDQ-S inngikk i datainnsamlingen i aldersgruppen 10-19 år, som inkluderte 29 631 deltakere. Av disse fikk forskerne inn 26 269 (88 %) komplette SDQ-S-skjemaer. De ulike artiklene rapporterte gjennomsnittsskårer fordelt på aldergrupper og kjønn, indre konsistens, faktoranalyser og sammenlikninger mellom den generelle populasjonen og undergrupper (ungdom med henholdsvis epilepsi og sosial angst). Alle SDQ-S-skalaene ble brukt i dokumentasjonen.
Barn i Bergen
En annen stor studie var den longitudinelle befolkningsbaserte studien Barn i Bergen, som har samlet inn data i fire runder, fra 2002/2003. Den første runden av studien inkluderte 7007 av 9430 (74 %) barn i alderen 7-9 år, men omfattet ikke SDQ-S. Den andre runden innhentet SDQ-S-data for i alt 5781 (83 %) av deltakerne fra runde 1, som nå var i alderen 11-13 år (Bøe, Hysing, Stormark, Lundervold & Sivertsen, 2012; Hysing, Sivertsen, Stormark, Elgen & Lundervold, 2009; Iversen, Jakobsen, Havik, Hysing & Stormark, 2007). SDQ-S resultater fra runde 3 (14 og 16 år) og runde 4 (16-18 år) foreligger ennå ikke. Artiklene fra runde 2 rapporterte gjennomsnittsskårer, indre konsistens, forhold mellom SDQ-S-skårer og andre faktorer, samt sammenlikninger mellom den generelle populasjonen og undergrupper (barn med henholdsvis kronisk sykdom og barneverntiltak). Dataene omfattet alle SDQ-S-skalaene.
Helseundersøkelsen i Oslo
Ungdomsdelen av Helseundersøkelsen i Oslo (UNGHUBRO) var en stor tverrsnittsundersøkelse rettet mot ungdom i 10. klasse. Utvalget med SDQ-S-data inkluderte 6752 av 8316 (81 %) 10. klassinger i Oslo skoleårene 1999/2000 og 2000/2001 (Lien et al., 2006; Lien, Tambs, Oppedal, Heyerdahl & Bjertness, 2005; Oppedal, Røysamb & Heyerdahl, 2005; Richter, Sagatun, Heyerdahl, Oppedal & Røysamb, 2011). Sagatun og kolleger har også gjort en oppfølgingsundersøkelse av ungdommer fra 2000/2001-kullet i UNGHUBRO) (Ungdom 2004). (2007, 2008) (Sagatun, Lien, Søgaard, Bjertness & Heyerdahl, 2008; Sagatun, Søgaard, Bjertness, Selmer & Heyerdahl, 2007). Det var her SDQ-S-data for 2489 av 3811 (65 %). Blant de rapporterte dataene fra UNGHUBRO og Ungdom 2004 fant vi gjennomsnittsskårer fordelt på kjønn, indre konsistens, faktorstruktur og sammenlikninger mellom ungdommer med etnisk norsk bakgrunn og etniske minoriteter.
Nord-Norge
En befolkningsbasert tverrsnittstudie fra Nord-Norge inkluderte 4167 av 5225 (80 %) 11-16-åringer (Rønning, Handegaard & Sourander, 2004; Rønning, Handegård, Sourander & Mørch, 2004). Artiklene rapporterer gjennomsnittsskårer, indre konsistens, faktorstruktur, korrelasjoner innen og på tvers av skalaer, og regresjonsmodeller for opplevd trakassering.
Nord-Trøndelag
Blant de større studiene var også en tverrsnittstudie fra to videregående skoler i Nord-Trøndelag med data for 865 av 1025 elever i alderen 16-20 år (Ingul, Klockner, Silverman & Nordahl, 2012). Forskerne i denne studien rapporterte indre konsistens og gruppeforskjeller mellom ungdom med og uten skolefravær.
Mindre studier
Videre inkluderte vi åtte mindre studier med forskjellige kliniske og etniske utvalg (Diseth, Tangeraas, Reinfjell & Bjerre, 2011; Eilertsen, Rannestad, Indredavik & Vik, 2011; Hanssen-Bauer, Heyerdahl & Eriksson, 2007; Indredavik, Vik, Heyerdahl, Kulseng & Brubakk, 2005; Nygaard, Jensen & Dyb, 2012; Oppedal, 2011; Ramstad, Jahnsen, Skjeldal & Diseth, 2012; Vaage et al., 2009). Fra disse studiene har vi valgt å kun inkludere data fra studier med «normale» kontroller i denne oversikten. Studiene til henholdsvis Hanssen-Bauer og kolleger (2007) og Oppedal (2011) rapporterte kun subgruppedata som dermed ikke ble inkludert.
I to av de inkluderte studiene hadde forskerne laget en eksternaliserende skåre ved å summere resultater fra skalaene Atferdsproblemer og Hyperaktivitet/oppmerksomhetsproblemer (Ingul et al., 2012; Lien et al., 2006).
Normer
Ingen av de inkluderte studiene rapporterte nasjonale normer, men fire befolkningsbaserte undersøkelser rapporterte representative gjennomsnittsskårer for henholdsvis 10-19-åringer i Akershus, 15-16-åringer og 18-19-åringer i Oslo, 11-13-åringer i Bergen og 11-16-åringer i Nord-Norge (Tabell 2). Se subskalaskårer i Vedlegg 2. Van Roy og kolleger (2006) sammenlignet funnene fra Akershus med funn fra Nord-Norge og britiske normer, og fant små, men signifikante forskjeller mellom barn og unge fra Akershus og Nord-Norge og også mellom barn og unge fra Akershus og det britiske normmaterialet.
Kjønn og alder
I Akershus var det en liten, men statistisk signifikant kjønnsforskjell i Totale vansker for ungdom i videregående skole (Tabell 2) (Van Roy et al., 2006). Variansanalyser avdekket dessuten interaksjonseffekter mellom kjønn og alder. Kjønnsforskjellene i Oslo var markante både ved 15-16 år og 18-19 år. I det nordnorske utvalget var kjønnsforskjellene også statistisk signifikante for alle problemskalaene, men ikke for totale problemer. Det nordnorske utvalget hadde også signifikante aldersforskjeller og kjønn-aldersinteraksjoner.
Impact-skårer
Helseprofil Akershus (Van Roy et al., 2006) og studien fra Nord-Norge (Rønning, Handegård, et al., 2004) rapporterte også Impact-skårer. Gjennomsnittlige Impact-skårer var 0,9 (1,7) og 0,7 (1,4) for henholdsvis jenter og gutter (standardavvik i parentes) i Akershus. Andel deltakere med vansker på ett eller flere områder var 38 % og 36 % i henholdsvis Akershus og Nord-Norge. Av disse svarte henholdsvis 24 % og 28 % at vanskene plaget dem en god del eller mye.
Grenseverdier
Van Roy og kolleger i Helseprofil Akershus (2006) oppga 16 på Totale vansker som grenseverdi for grenseområdet («borderline range», mellom ca 80- og 90-persentilen), og 19 som grenseverdi for antatt klinisk område («abnormal», over ca 90 percentilen) (Tabell 3). Tilsvarende grenseverdier i Nord-Norge var 15 og 18 (Rønning, Handegård, et al., 2004), mens det britiske normmaterialet angir grenseverdiene 16 og 20 (sdqinfo.org).
Grenseverdier
Van Roy og kolleger i Helseprofil Akershus (2006) oppga 16 på Totale vansker som grenseverdi for grenseområdet («borderline range», mellom ca 80- og 90-persentilen), og 19 som grenseverdi for antatt klinisk område («abnormal», over ca 90 percentilen) (Tabell 3). Tilsvarende grenseverdier i Nord-Norge var 15 og 18 (Rønning, Handegård, et al., 2004), mens det britiske normmaterialet angir grenseverdiene 16 og 20 (sdqinfo.org).
Validitet
Faktoranalyser
UNGHUBRO, Helseprofil Akershus og den nordnorske tverrsnittstudien undersøkte SDQ-S’ faktorstruktur ved hjelp av konfirmatoriske faktoranalyser (Richter et al., 2011; Rønning, Handegård, et al., 2004; Van Roy et al., 2008). RMSEA (root mean square error of approximation)-indeksen på tvers av modeller og undergrupper varierte fra 0,042 til 0,056 (median: 0,047). Tilsvarende CFI (comparative fit index) varierte fra 0,94 til 0,98 (median: 0,96).
Diagnostisk nøyaktighet
Med Schedule for Affective Disorders and Schizophrenia for School Aged Children (K-SADS) som referansestandard og 90-persentilen som terskelverdi, hadde SDQ-S en sensitivitet på 17 % - 23 %, og en spesifisitet på 91 % - 95 %, og AUC (area under the curve) var 0,72-0,85 i ROC (Receiver operating characteristic curve) -analyser i en relativt liten studie av barn med lav fødselsvekt og kontrollgruppe (Indredavik et al., 2005).
Undergrupper vs generelle populasjoner
Mange av de inkluderte publikasjonene rapporterte om forskjeller i Totale vansker mellom generelle populasjoner og undergrupper (Tabell 4). Se Vedlegg 3 for gruppeforskjeller i subskalaskårer. De fleste subgruppene med somatiske eller psykiatriske sykdommer og barna med tiltak fra barnevernet hadde mer totale vansker enn kontrollgruppene. Dette var særlig uttalt for barna med tiltak fra barnevernet (Iversen, et al., 2007) og barn/ungdommer som var nyretransplantert (Diseth, et al., 2011). Ungdom med innvandrerbakgrunn hadde høyere skåre for totale vansker enn etnisk norske ungdommer i en stor epidemiologiske studie fra Oslo (Sagatun, et al., 2008), mens en studie av barn av vietnamesiske flyktninger ikke fant forhøyede skårer sammenlignet med resultatene fra Helseprofil Akershus (Vaage, et al., 2009). Alfstad og kolleger (2011) sammenliknet forekomsten av Totale vansker over 80-persentilen hos barn og ungdom med og uten epilepsi. Med epilepsi: 71/247 (29 %), uten epilepsi: 3495/19748 (18 %), p<0,001.
Korrelasjoner med andre instrumenter
En liten studie (N = 83) av barn med cerebral parese studerte samsvar mellom SDQ-S Totale vansker og Pediataric Quality of Life (PedsQL) 4.0, og rapporterte Intra-klasse korrelasjon (ICC) -0,93 (95% CI -0,89 til -0,95) (Ramstad, Jahnsen, Skjeldal & Diseth, 2012). Det negative fortegnet skyldes at høye PedsQL-skårer angir god livskvalitet, mens høye SDQ-skårer angir store vansker.
Reliabilitet
Åtte av artiklene rapporterte indre konsistens (Cronbachs α) for SDQ-S-skalaene (Bøe et al., 2012; Ingul et al., 2012; Nygaard et al., 2012; Oppedal et al., 2005; Rønning, Handegård, et al., 2004; Sagatun et al., 2008; Sagatun et al., 2007; Van Roy et al., 2008) (Tabell 5). Vi fant ingen andre mål på reliabilitet.
Diskusjon og konklusjon
Litteratursøket identifiserte 27 publikasjoner fordelt på 14 studier som hadde brukt SDQ-S. Det har vært omfattende norsk forskning på SDQ-S, med sterkt fokus på psykometriske egenskaper og data fra befolkningsutvalg. De befolkningsbaserte undersøkelsene hadde store utvalg og høye svarprosenter, men inkluderte regionale avgrensede populasjoner. Dataene kan derfor ikke brukes som norske nasjonale normer. Gjennomsnittsforskjellene i skårer mellom de fire utvalgene har ikke vært testet statistisk, men skårene fra Bergen lå langt lavere enn i de øvrige utvalgene. Det er vanskelig å forklare hva denne forskjellen skyldes. Det var mindre forskjeller mellom skårene fra Akershus, Oslo og Nord-Norge, og ikke konsistente funn i forhold til i hvilke utvalg som hadde høyest skårer. Grenseverdier for antatt avvikende skårer viste rimelig samsvar både mellom Akershus og Nord-Norge, og mellom Norge (særlig Akershus-materialet) og Storbritannina.
Forventete gruppeforskjeller og konfirmatoriske faktoranalyser støttet opp under instrumentets begrepsvaliditet. Samtidig konkluderte studiene av faktorstruktur med at enkelte spørsmål i SDQ-S kunne forbedres. Goodman og kolleger (2007)angir at endringer i et instruments spørsmål må vurderes nøye, da selv små endringer kan påvirke resultatene og gjøre sammenlikninger med tidligere versjon vanskelige.
Data fra én mindre studie viste lav sensitivitet og høy spesifisitet, når 90-percentilen ble brukt som terskel-verdi. Dette kan bety at SDQ-S har begrenset evne til å fange opp ungdommer med psykiske helseproblemer, mens testen fungerer godt for å utelukke psykisk sykdom.
Når det gjaldt reliabilitet var målene på indre konsistens basert på store utvalg. Den indre konsistensen var tilfredsstillende for Totale vansker. Det er ikke uvanlig at slike sumskårer får høy indre konsistens, og dette skyldes trolig det store antallet testledd som går inn i beregningen. Det ville ellers være rimelig å forvente en lav indre konsistens for sumskårer fra instrumenter som har flere uavhengige underskalaer. Den eneste underskalaen som hadde akseptabel indre konsistens var Emosjonelle symptomer. Den indre konsistensen var ikke tilfredsstillende for de øvrige underskalaene, og var spesielt lav for Atferdsproblemer. Skalaen Atferdsproblemer er basert på diagnostiske kriterier, som har et heterogent innhold. Man bør være forsiktig i tolkning av funn på underskalaene. Ingen av studiene rapporterte test-retest reliabilitet eller endringssensitivitet.
Den norske versjonen av SDQ-S er egnet for bruk i forskning, og kan være egnet for bruk i klinisk praksis som ledd i en tidlig kartlegging. Resultatene må ses i sammenheng med annen informasjon. SDQ-S er kortfattet og kunne være et egnet screeninginstrument. Screeningegenskapene er foreløpig for lite kjent, men foreliggende norsk og utenlandsk litteratur tyder på at det vil være for mye feilklassifisering til at dette kan anbefales. Her er det behov for mer forskning. Det er også behov for bedre normdata, og ikke minst studier som bruker SDQ for både foreldre, lærere og ungdom.