Innledning
Verdens helseorganisasjon – (fem) Well-Being Index (WHO-5) er et spørreskjema bestående av fem positivt formulerte utsagn om trivsel og velvære. WHO-5 ble utviklet ved Psykiatrisk Center Nordsjælland i Danmark og ble først presentert på et WHO-møte i Stockholm i 1998 (Psychiatric Center North Zealand, Mai 2019). WHO-5 er en forkortet versjon av WHO-10 (Bech, Gudex, & Johansen, 1996). WHO-10 var igjen en forkortet versjon av et spørreskjema bestående av 28-spørsmål som ble benyttet i en engelsk studie (Staehr, 1989; Warr, Banks, & Ullah, 1985). De 28 spørsmålene var sammensatt fra ulike skalaer som Zung scales for depression, distress and anxiety, General Health Questionnaire og Psychological General Well-Being Scale. For å lage WHO-5 ble kun positivt formulerte utsagn benyttet (Topp, Ostergaard, Sondergaard, & Bech, 2015).
Kusier and Folker (2019) drøfter det teoretiske grunnlaget for WHO-5 med fokus på hedonistisk teori. De skriver at WHO-5 avviker fra hedonistisk teori da den bare måler positive følelser og hyppighet av følelser, og ikke følelsenes varighet og intensitet. Videre hevder de at WHO-5 ikke er et mål på generell livstilfredshet, men et system for å vurdere positiv affekt (Kusier & Folker, 2019).
WHO-5 har blitt oversatt til 31 språk og ble oversatt til norsk av overlege Olaf Bakke i 2004. Selve oversettelsesprosessen er ikke beskrevet (Psychiatric Center North Zealand, Mai 2019). Spørreskjemaet er tilgjengelig på WHO-5s hjemmesider (Psychiatric Center North Zealand, Mai 2019), er gratis og krever ingen tillatelse for bruk (CORC, Mai 2019). Det er heller ikke rapportert noen kompetansekrav til administrering eller fortolkning av testresultatet (CORC, Mai 2019; Psychiatric Center North Zealand, Mai 2019).
WHO-5 måler trivsel og psykisk velvære og kan brukes blant barn og unge fra ni år og eldre i ulike kontekster (CORC, Mai 2019). Det tar ca. tre minutter å svare på de fem spørsmålene. Den som svarer blir bedt om å sette en sirkel rundt det svaret som beskriver best hvordan han/hun har følt seg gjennom de siste to ukene (f.eks. «I de siste to ukene har jeg følt meg glad og i godt humør» eller «I de siste to ukene har jeg følt meg rolig og avslappet). De fem spørsmålene blir besvart på en seks-punkt skala som går fra (0) «Aldri» til (5) «Hele tiden». For å beregne råskåren summerer man tallene for alle fem svar. En råskår på 0 indikerer lavest mulige trivsel og velvære og en råskår på 25 indikerer best mulig trivsel og velvære. Råskåren multipliseres ofte med fire for å få en skår som da kan variere fra 0 (verst mulige trivsel og velvære) til 100 (best mulig trivsel og velvære) (Psychiatric Center North Zealand, Mai 2019).
En kunnskapsoppsummering basert på 213 studier om WHO-5 konkluderte med at spørreskjemaet har adekvat validitet og kan brukes som et utfallsmål i kliniske studier samt som screening instrument for depresjon (Topp et al., 2015). Kunnskapsoppsummeringen vurderte ikke reliabiliteten til WHO-5. De skriver at spørreskjemaet er en generisk skala som måler generelt velvære. To av studiene i kunnskapsoppsummeringen brukte item response teori som bekreftet skalaens endimensjonalitet. Topp et al. (2015) fant at åtte av studiene brukte en cut-off skår på ≤ 50 i forhold til screening av depresjon. Disse åtte studiene fant en gjennomsnittlig sensitivitet på 0,87 og en spesifisitet på 0,81 for screening av depresjon. Studiene brukte stort sett strukturerte intervjuer for å diagnostisere depresjon. Topp et al. (2015) fant at WHO-5 har vært anvendt i mange ulike studier og oftest i studier som omhandlet endokrinologi, depresjon og stress (Topp et al., 2015).
Metode
Bibliotekar Sølvi Biedilæ ved Regionsenter for barn og unges psykiske helse, helseregion Øst og Sør, søkte etter dokumentasjon på testens psykometriske egenskaper i databasene, PsycINFO, Medline, Embase, Cochrane Library, Oria (BIBSYS), Norart, SveMed+, PubMed, CRIStin.no, NORA.no, Forskningsdatabasen.dk og Swepub. Søkedato: 28.03.2019. Søkestrategien er tilgjengelig på https://psyktestbarn.r-bup.no/no/artikler/who-5-who-five-well-being-index
Vi kontaktet også førsteforfattere av inkluderte artikler, samt oversetterne av WHO-5, for å identifisere dokumentasjon som eventuelt ikke ble fanget opp av det systematiske søket.
Vi inkluderte alle publikasjoner av studier som har undersøkt og rapportert minst ett av følgende i skandinaviske utvalg:
- normdata for testen
- reliabilitet: indre konsistens, test-retest, interrater
- validitet: samsvar med liknende testskårer, samsvar med referansestandard eller annet kriterium, og/eller faktorstruktur
I tillegg, og kun for norske versjoner av WHO-5, vil publikasjoner som rapporterer gjennomsnittsskårer og/eller forekomster for henholdsvis generelle populasjoner og kliniske undergrupper bli inkludert.
Etter fjerning av dubletter gikk begge forfatterne gjennom alle identifiserte publikasjoners sammendrag. Forfatterne foretok vurderingene uavhengig av hverandre. Alle publikasjoner som kunne virke relevante ble bestilt inn i fulltekst, og vurderingsprosessen ble gjentatt for disse.
Begge forfatterne vurderte normering, validitet og reliabilitet ved hjelp av en tilpasset versjon av Test review form and notes for reviewers (EFPA, 2013). Forfatterne foretok vurderingene uavhengig av hverandre.
Resultater
Litteratursøk
Søket etter norske, danske og svenske artikler i de ulike databasene førte til totalt 1303 treff. Etter fjerning av duplikater var det 1181 artikler igjen. Etter gjennomgang av tittel og sammendrag ble 1151 artikler ekskludert. Totalt 30 artikler ble vurdert i fulltekst. Av disse ble 25 artikler ekskludert: seks fordi de brukte et utvalg med voksne, tre fordi de ikke brukte et skandinavisk utvalg, tre var duplikater, åtte fordi det ikke ble rapportert psykometriske data, tre var postere med mangelfull informasjon og én artikkel var et prosjekt og ikke en studie (se Figur 1 for en oversikt). Kontakt med de inkluderte artiklenes førsteforfattere, oversetteren og en manuell gjennomgang av referanser i en kunnskapsoppsummering (Topp et al., 2015), resulterte ikke i flere treff.
Totalt fem artikler ble inkludert i denne kunnskapsoppsummering. Av disse har to artikler en blanding av norske og danske deltakere (Christensen, Haugen, Sirpal, & Haavet, 2015; Sirpal, Haugen, Christensen, & Haavet, 2016) og tre artikler er basert på svenske utvalg (Blom, Bech, Hogberg, Larsson, & Serlachius, 2012; Hogberg et al., 2012; Hogberg & Hallstrom, 2018). Alle de fem studiene som er inkluderte presenteres i Tabell 1.
Studiene av Christensen et al. (2015) og Sirpal et al. (2016) besto av 294 ungdommer fra Norge og Danmark i alderen 14–16 år som var trukket ut fra fastlegers pasientlister. I utgangspunktet ble 2374 ungdommer invitert til å delta og 373 leverte spørreskjemaet (svarprosent 16 %). Av disse 373 ungdommene, gjennomførte 294 et diagnostisk intervju (Composite International Diagnostic Interview) for å diagnostisere depresjon. Ungdommene fylte også ut Hopkins Symptom Check List (HSCL-6 og HSCL-10), tre nøkkelspørsmål og WHO-5. Christensen et al. (2015) sammenliknet screeninginstrumentene HSCL-6 og WHO-5 i sin studie. Deres mål var å validere de to spørreskjemaene for å kunne identifisere depressive lidelser. Sirpal et al. (2016) brukte screeninginstrumentene HSCL-6, HSCL-10, tre nøkkelspørsmål og WHO-5. De delte utvalget inn i en etnisk minoritetsgruppe med ungdommer som hadde flerkulturell bakgrunn (n = 44) og i en etnisk majoritetsgruppe bestående av norske og danske ungdommer (n = 250). Målet med studien var å sammenligne en etnisk minoritetsgruppe med resten av populasjonen ved bruk av ulike spørreinstrumenter, som blant annet benyttet WHO-5, for å identifisere depressive lidelser.
I studien av Blom et al. (2012) besto utvalget av 66 ungdommer fra Sverige i alderen 14–18 år som var pasienter ved et psykiatrisk sykehus. Ungdommene var diagnostisert med depressive lidelser og fylte ut Becks Depression Inventory (BDI-6) og WHO-5. Målet med studien var å teste den psykometriske validiteten til de to spørreskjemaene.
Hogberg and Hallstrom (2018) og Hogberg et al. (2012) rekrutterte svenske ungdommer med depressive lidelser fra polikliniske barne- og ungdomspsykiatriske avdelinger. I Hogberg and Hallstrom (2018) ble ungdommene randomisert til en intervensjonsgruppe (Malder = 14,2, SD = 1,1, n = 15) og en kontrollgruppe (Malder = 15,2, SD = 0,9, n = 12). Intervensjonsgruppen mottok kognitiv atferdsterapi, mens kontrollgruppen mottok ordinær behandling. I Hogberg et al. (2012) ble tilskudd med vitamin D gitt til ungdommer med depresjon (N = 54) som hadde lavt serum nivå av 25OHD. Studien var en pre-post studie og inkluderte ingen kontrollgruppe.
Tabell 1. Inkluderte studier
Referanse |
Design |
Populasjon |
N |
Mål |
Rapporterte egenskaper, verdier |
Blom et al. (2012) |
Tverrsnitt |
Svensk utvalg, pasienter med depressive lidelse i alderen 14–18 år |
63 |
WHO-5 |
Prediktiv validitet (cut-off skår sensitivitet og spesifisitet, ROC), begrepsvaliditet (korrelasjon med BDI-6, Loevingers`H) |
Christensen et al. (2015)a |
Tverrsnitt |
Norsk og dansk utvalg av ungdommer i alderen 14–16 år |
294 |
WHO-5 |
Gjennomsnitt og standardavvik, prediktiv validitet (cut-off skår sensitivitet og spesifisitet, ROC) |
Hogberg and Hallstrom (2018) |
RCT |
Svenske ungdommer med en depressiv lidelse rekruttert fra poliklinisk avdeling i BUP |
27 |
WHO-5 |
Endringssensitivitet |
Hogberg et al. (2012) |
Før og etter behandling, ingen kontrollgruppe |
Svenske ungdommer i alderen 10-19 år med depressive lidelser, rekruttert fra poliklinisk avdeling i BUP |
54 |
WHO-5 |
Endringssensitivitet |
Sirpal et al. (2016) a |
Tverrsnitt |
Samme utvalg som Christensen et al. (2015) |
294 |
WHO-5 |
Reliabilitet (Cronbachs alpha), prediktiv validitet (cut-off skår sensitivitet og spesifisitet, ROC), konstruktvaliditet (Loevingers`H) |
Note. aSamme utvalg er brukt i Christensen et al., 2015 og Shirpa et al., 2016.
Middelverdier og/eller forekomster i kliniske undergrupper
Christensen et al. (2015) rapporterte gjennomsnitt og standardavvik for norske og danske ungdommer som ikke var diagnostisert med en depressiv lidelse (M = 7.34, SD = 4.37, n = 281) og for norske og danske ungdommer diagnostisert med en depressiv lidelse (M = 15.18, SD = 4.65, n = 13) . Studien hadde reversert skåringen for WHO-5 slik at en høy verdi indikerte lavere trivsel (range på skåring fra 0 til 25).
Normer
Ingen av de inkluderte artiklene rapporterte normer.
Reliabilitet
Sirpal et al. (2016) rapporterte Cronbachs alpha på 0,90 for den etniske minoritetsgruppen (n = 44) hvilket betegnes som utmerket reliabilitet (European Federation of Psychologists’ Association (EFPA), 2013). Ingen av de andre studiene rapporterte Cronbachs alpha.
Validitet
Begrepsvaliditet
Blom et al. (2012) rapporterte en signifikant og negativ korrelasjon mellom WHO-5 og BDI-6 (r = - 0,49). Dette tyder på at de to skalaene kan være noe overlappende, men måler ulike dimensjoner. Både Blom et al. (2012) og Sirpal et al. (2016) rapporterte tilfredsstillende (> 0,05) homogenitetskoeffisienter (Loevingers`H) på henholdsvis 0,52 og 0,67.
Kriterierelatert validitet
Tre av de fem inkluderte artiklene rapporterte på WHO-5s cut-off skår, sensitivitet og spesifisitet (Blom et al., 2012; Christensen et al., 2015; Sirpal et al., 2016). Disse artiklene belyser både hvordan WHO-5 fungerer som screeninginstrument og skjemaets validitet. Alle de tre artiklene brukte intervju for å diagnostisere depresjon, og bruk av WHO-5 ble sammenlignet med diagnostisering utført av kliniker. Blom et al. (2012) fant en cut-off skår på < 50, med sensitivitet på 0.80 og spesifisitet på 0,29 for WHO-5. Christensen et al. (2015) fant en cut-off skår for WHO-5 på 11 for mild depresjon (sensitivitet 0,88 og spesifisitet 0,80), 13 for moderat depresjon (sensitivitet 0,75 og spesifisitet 0,89), og alvorlig depresjon 14 (sensitivitet 0,84 og spesifisitet 0,90). Studien hadde reversert skåringen for WHO-5 slik at høyere verdi indikerte lavere trivsel. Studien fant ingen kjønnsforskjeller. Christensen et al. (2015) rapporterte et ROC-området 0,89 for totalutvalget, 0,84 for det danske utvalget og 0,94 for det norske utvalget. Sirpal et al. (2016) fant en cut-off skår for WHO-5 på 11 for både en etnisk minoritetsgrupper og majoritetsgruppe (sensitivitet – etnisk minoritetsgruppe 0,91, majoritetsgruppe 0,85; spesifisitet – 0,80 for begge gruppene). Studien fant ingen forskjeller mellom kjønn. ROC-området for den etniske minoritetsgruppen var 0,91 og for majoritetsgruppen 0,85.
Endringssensitivitet
Hogberg and Hallstrom (2018) og Hogberg et al. (2012) brukte WHO-5 i evalueringsforskning for å måle effekten av to ulike behandlinger mot depressive lidelser. Hogberg and Hallstrom (2018) evaluerte effekten av en kognitiv atferdsterapi og sammenlignet resultatene med en gruppe ungdommer som mottok ordinær behandling. Resultatene viste en signifikant økning innad i både intervensjons- og kontrollgruppen på WHO-5, men det var ingen signifikant forskjell mellom gruppene. Skåren på WHO-5 for intervensjonsgruppen var før behandling 28 (n = 14) og etter behandling 63 (n = 14), mens for kontrollgruppen var det henholdsvis 32 (n = 7) og 69 (n = 5). Hogberg et al. (2012) evaluerte effekten av vitamin D tilskudd til ungdommer med depressive lidelser. WHO-5s gjennomsnittsskår gikk signifikant opp fra det ble målt før behandling (M = 25, SD = 18, n = 44) til etter behandling (M = 43, SD = 25, n = 30).
Diskusjon og konklusjon
WHO-5 er et kort spørreskjema som består av fem spørsmål som måler trivsel og velvære. Litteratursøket identifiserte fem artikler som ble inkludert. To av artiklene inkluderte samme utvalg som var en blanding av norske og danske ungdommer (Christensen et al., 2015; Sirpal et al., 2016). De tre resterende artiklene inkluderte svenske deltakere (Blom et al., 2012; Hogberg et al., 2012; Hogberg & Hallstrom, 2018).
De fem inkluderte artiklene så alle på depressive lidelser blant ungdom. Tre av studiene var valideringsstudier som sammenlignet WHO-5 som screening instrument for depresjon med andre måleinstrumenter for depresjon (Blom et al., 2012; Christensen et al., 2015; Sirpal et al., 2016). Studiene tyder på at WHO-5 kan brukes som screeninginstrument, men at det trenges flere studier for å avklare dette. To av de svenske artiklene undersøkte effekten av behandling mot depresjon (Hogberg et al., 2012; Hogberg & Hallstrom, 2018). Studiene var basert på relativt små utvalg, og endring i middelverdier er ikke et optimalt mål for endringssensitivitet sammenlignet med en invariansanalyse. Det er derfor vanskelig å trekke noen endelige konklusjoner basert på disse to studiene.
En studie rapporterte gjennomsnittsverdier på WHO-5 for ungdom med og uten en depressiv lidelse i et utvalg med norske og danske ungdommer (Christensen et al., 2015). Det ble ikke identifisert noe normgrunnlag for WHO-5 i denne kunnskapsoppsummeringen. Reliabilitet ble rapportert som utmerket i en studie, men kun på en liten undergruppe (Sirpal et al., 2016). Det ble ikke rapport noen form for test-retest reliabilitet.
Det er flere begrensninger ved de inkluderte studiene. WHO-5 er egentlig et mål på trivsel og velvære, men ingen av de inkluderte studiene har målt dette da de har benyttet WHO-5 som et screeningverktøy for depresjon. Det er også ønskelig at WHO-5 brukes i normalpopulasjonen for å måle trivsel og velvære og ikke bare i kliniske studier. En begrensning med denne studien er at flere av de inkluderte artiklene hadde små utvalg eller benyttet seg av undergrupper med få deltakere. Det foreligger også få studier generelt og det er dermed vanskelig å trekke en konklusjon om hvorvidt WHO-5 er egnet for å måle trivsel og velvære blant barn og unge. Det mangler forskning på norske og skandinaviske utvalg som dokumenterer validitet og reliabilitet. I tillegg mangler det også et norsk normgrunnlag for testen. De psykometriske egenskapene for WHO-5 er dermed ikke tilstrekkelig undersøkt for barn og unge i Norge. Det er behov for flere skandinaviske studier som undersøker WHO‑5s måleegenskaper.
Vurdér og oppgi mulige interessekonflikter
Forfatterne erklærer herved at de ikke har noen interessekonflikter.
Lenke til gratis elektronisk versjon av testen
Testen finnes gratis og fritt tilgjengelig i en elektronisk versjon, se https://www.psykiatri-regionh.dk/who-5/who-5-questionnaires/Pages/default.aspx.
Referanser
Bech, P., Gudex, C. & Johansen, K. S. (1996). The WHO (Ten) well-being index: Validation in diabetes. Psychotherapy and Psychosomatics, 65(4), 183-190. doi: https://doi.org/10.1159/000289073
Blom, E. H., Bech, P., Hogberg, G., Larsson, J. O. & Serlachius, E. (2012). Screening for depressed mood in an adolescent psychiatric context by brief self-assessment scales - testing psychometric validity of WHO-5 and BDI-6 indices by latent trait analyses. 10 (149). doi: https://doi.org/10.1186/1477-7525-10-149
Christensen, K. S., Haugen, W., Sirpal, M. K. & Haavet, O. R. (2015). Diagnosis of depressed young people-criterion validity of WHO-5 and HSCL-6 in Denmark and Norway. Family Practice, 32(3), 359-363. doi: https://doi.org/10.1093/fampra/cmv011
CORC. (Mai 2019). The World Health Organisation- Five Well-Being Index (WHO-5). Lokalisert, på https://www.corc.uk.net/outcome-experience-measures/the-world-health-organisation-five-well-being-index-who-5/
European Federation of Psychologists’ Association (EFPA). (2013). EFPA Review model for the description and evaluation of psychological tests: Test review form and notes for reviewers, v 4.2.6: EFPA.
Hogberg, G., Gustafsson, S. A., Hallstrom, T., Gustafsson, T., Klawitter, B., Petersson, M. et al. (2012). Depressed adolescents in a case-series were low in vitamin D and depression was ameliorated by vitamin D supplementation. 101, 779-783. doi: https://doi.org/10.1111/j.1651-2227.2012.02655.x
Hogberg, G. & Hallstrom, T. (2018). Mood regulation focused CBT based on memory reconsolidation, reduced suicidal ideation and depression in youth in a randomised controlled study. 15 (921). doi: https://doi.org/10.3390/ijerph15050921
Kusier, A. O. & Folker, A. P. (2019). The Well-Being Index WHO-5: hedonistic foundation and practical limitations. Med Humanit. doi: 10.1136/medhum-2018-011636
Psykiatric Center North Zealand. (Mai 2019). The WHO-5 website. Lokalisert, på https://www.psykiatri-regionh.dk/who-5/about-the-who-5/Pages/default.aspx
Sirpal, M. K., Haugen, W., Christensen, K. S. & Haavet, O. R. (2016). Validation study of HSCL-10, HSCL-6, WHO-5 and 3-key questions in 14-16 year ethnic minority adolescents. 17(1). doi: https://doi.org/10.1186/s12875-016-0405-3
Staehr, J. K. (1989). Multicentre Continuous Subcutaneous Insulin Infusion Pump Feasibility and Acceptability Study Experience. Copenhagen, Denmark: World Health Organization.
Topp, C. W., Ostergaard, S. D., Sondergaard, S. & Bech, P. (2015). The WHO-5 Well-Being Index: A Systematic Review of the Literature. Psychotherapy and Psychosomatics, 84(3). doi: https://doi.org/10.1159/000376585
Warr, P., Banks, M. & Ullah, P. (1985). The Experience of Unemployment among Black and White Urban Teenagers. British Journal of Psychology, 76, 75-87. doi: https://doi.org/10.1111/j.2044-8295.1985.tb01932.x