Innledning
Bayley Scales of Infant and Toddler Development (BSID; Bayley, 1969) er en etablert metode som er mye brukt i forskingen og praksis for å måle spebarns utvikling. Testen kom i en ny versjon i 1993 (BSID-II; Bayley, 1993), og den nyeste versjonen, BSID-III (Bayley, 2006) er den som er i bruk i dag. BSID-III er oversatt fra engelsk til norsk av Elisabeth Haukeland, som er profesjonell oversetter, og er forhandlet av Pearson Assessment and Information AB siden 2009. Den tekniske manualen er kun tilgjengelig på engelsk (Bayley, 2006).
BSID-III måler kognitiv, språklig og motorisk utviklingsfungering, samt sosial og emosjonell tilpassingsadferd hos sped- og småbarn i alder 1 til 42 måneder. Formålet med testen er å identifisere barn med utviklingsforsinkelser. Internasjonalt er instrumentet mest brukt til å undersøke sped- og småbarns kognitive og motoriske utvikling. BSID-III blir individuelt administrert og det finnes en tidsbegrensning for hvert testledd. Ved administrering av hele testen brukes det gjennomsnittlig 50 minutter ved 12 måneders alder, og 90 minutter ved 13 måneders alder. BSID-III består av fem deltester (tabell 1) som er sammenfattet til tre skalaer og tre spørreskjemaer (sosial-emosjonell skala, adaptiv adferds skala og det emosjonelle og adaptive adferds spørreskjema utfylt av foreldrene), men bare de tre kjerneskalaene (kognitiv skala, motorisk skala, og språklig skala) er inkludert i den norske utgaven av BSID-III (Bayley, 2009).
Alle testleddene får skåre 1 ved riktig respons og 0 ved feil respons. Det er aldersnormerte startpunkt i testen basert på normer fra normalbefolkningen i USA. På hvert alderstrinn må barnets basisnivå etableres ved at barnet skårer minst 1 poeng på de tre første oppgavene Administreringen av testledd fra hver deltest avsluttes når barnet klarer fem oppgaver på rad med null poeng. Hver deltest gir en skalert skåre som indikerer barnets prestasjon sammenlignet med jevnaldrende barn fra normalbefolkningen i USA (varierer mellom 1 og 19, med gjennomsnitt 10 og standardavvik 3) (Bayley, 2006, p.108). Det kan også beregnes aldersekvivalenter (gjennomsnittlig alder uttrykt i måneder for en bestemt råskåre er typisk) og en utviklingsskåre som indikator for prestasjonsutvikling uavhengig av variasjon i prestasjonsnivå. I tillegg kan det angis indeksskåre med persentiler, og persentiler på skalanivå.
Målet med de nye BSID-versjonene var å få nye normdata, utvide aldersspennet fra 2 - 30 måneder til 1 - 42 måneder, forbedre innholdsdekning, aktualisere testmaterial, modernisere testledd, forbedre psykometriske egenskaper, og å sikre den grunnleggende kvaliteten og strukturen til den originale BSID. Omtrent to tredjedeler av testleddene ble bevart i BSID-II, og omtrent 50 % nye testledd ble lagt til (Black & Matula, 1999). Moderate korrelasjoner var funnet mellom BSID- og BSID-II-skårer, med signifikant lavere skårer med BSID-II enn med BSID (Gagnon & Nagle, 2000). Resultater av sammenligningsundersøkelser fant at begge testversjoner måler veldig lignende konstrukter.
Psykometriske egenskaper for de to første versjonene kan delvis overføres til BSID-III fordi målte konstrukter og strukturen til testen er like. Men man må legge merke til at skårer fra de forskjellige versjonene ikke kan sammenlignes direkte siden BSID-III er mindre sensitiv enn BSID-II med hensyn til utviklingsforsinkelser (Msall, 2010).
Amerikanske normer for deltester på BSID-III er basert på data fra et demografisk spredd utvalg av 1700 friske barn født fra gestasjonsuke 36 til gestasjonsuke 42, og vurdert alder 1 - 42 måneder (Bayley, 2006). Det er 100 barn i hvert alderstrinn og like mange jenter og gutter i hver gruppe.
I amerikanske utvalg er intern konsistens estimert med split-half metode (Spearman Brown). Gjennomsnittlig høy intern konsistens (beregnet med Fishers z-transformasjon) for deltester varierer mellom 0,86 for finmotorikk og 0,91 for kognisjon, ekspressive kommunikasjon og grovmotorikk. Test-retest reliabilitet er analysert i en separat gruppe barn (N = 197) fordelt over hele aldersspekteret med et gjennomsnittlig intervall på 6 dager mellom testtidspunktene (Bayley, 2006). Pearson korrelasjonskoeffisienter varierer mellom 0,72 for deltesten reseptiv kommunikasjon og 0,80 for deltesten grovmotorikk. Deltestene korrelerte mellom 0,36 (ekspressiv kommunikasjon / grovmotorikk) og 0,53 (ekspressiv / reseptiv kommunikasjon). Konvergent validitet er undersøkt ved en sammenligning av BSID-III-skårer og WPPSI-III-skårer hos 57 barn (Bayley, 2006). Deltestene kognisjon, reseptiv og ekspressiv kommunikasjon korrelerte signifikant høyere med den totale intelligenskvotienten (henholdsvis 0,79; 0,80; 0,78) enn deltestene finmotorikk og grovmotorikk (0,47; 0,54) (Bayley, 2006).
Testen er anvendt både i forskning og i klinisk arbeid med sped– og småbarn. Forskjellige versjoner av Bayley Scales of Infant and Toddler Development er brukt i norske og skandinaviske forskningsprosjekter (for eksempel Faugli, Emblem, Bjørnland & Diseth, 2009; Kaaresen, Rønning, Tunby, Nordhov, Ulvlund & Dahl, 2007; Moe, 2002; Trasti, Vik, Jacobsen & Bakketeig, 1999; Skovgaard, Houmann, Christiansen, Olsen, Landorph, Lichtenberg & Jørgensen, 2008; Krogh, Væver, Harder & Køppe, 2013).
Metode
Det ble søkt etter dokumentasjon på BSID-IIIs psykometriske egenskaper i databasene Norart, BIBSYS, SveMed+, CRIStin.no, Cochrane Library, PsycINFO, Medline, Embase og PubMed (søkedato: 26.03.2012). Søkestrategien er tilgjengelig på: http://www.r-bup.no/CMS/ptb.nsf/pages/bayley.
Vi inkluderte alle publikasjoner av studier som har undersøkt og rapportert minst ett av følgende i skandinaviske utvalg :
- normdata for testen
- reliabilitet: indre konsistens, test-retest, interrater og endringssensitivitet
- validitet: samsvar med liknende testskårer, samsvar med referansestandard eller annet kriterium, og/eller faktorstruktur
I tillegg, og kun for norske versjoner av Bayley Scales of Infant and Toddler Development, inkluderte vi publikasjoner som rapporterte gjennomsnittsskårer og/eller forekomster for henholdsvis generelle populasjoner og kliniske undergrupper.
To forskere gikk gjennom sammendragene til alle identifiserte publikasjoner, uavhengig av hverandre, etter at dubletter var fjernet. Alle publikasjoner som kunne virke relevante ble bestilt i fulltekst, og prosessen over ble gjentatt for fulltekstrapportene.
To forskere vurderte normering, validitet og reliabilitet, uavhengig av hverandre, ved hjelp av en tilpasset versjon av Test review form and notes for reviewers (EFPA, 2008).
Resultater
Litteratursøk
Søkestrategien resulterte i referanser relatert til alle tre BSID-versjoner. Siden det bare én norsk og én dansk publikasjon handlet om BSID-III og forskjeller mellom versjonene i oppbygning, struktur og evaluering er små, bestemte vi å bruke all relevant informasjon uavhengig av versjon. Systematiske søk etter dokumentasjon på psykometriske egenskaper for den norske versjonen av BSID-III og deskriptive data resulterte i 60 treff, hvorav 15 artikler virket relevante og ble vurdert i fulltekst (seks artikler basert på BSID, åtte basert på BSID-II, og én basert på BSID-III). Syv av disse oppfylte inklusjonskriteriene, og er inkludert i rapporten (Eversen, Skranes, Brubakk, & Vik, 2009; Faugli, Emblem, Bjørnland, & Diseth, 2009; Kaaresen, Rønning, Tunby, Nordhov, Ulvund, & Dahl, 2008; Moe, 2002; Moe, & Slinning, 2001; Nordhov, Ronning, Dahl, Ulvlund, Tunby, & Kaaresen, 2010; Trasti, Vik, Jacobsen, & Bakketeig, 1999). Følgende artikler oppfylte ikke ekskludert: Angelsen, Vik, Jacobsen, & Bakketeig, 2001; Brandlistuen, Stene-Larsen, Holmstrom, Landolt, Eskedal, & Vollrath, 2010; Fallang, Saugstad, & Hadders-Algra, 2003; Nordhov, Rønning, Ulvlund, Dahl, & Kaaresen, 2012; Rao, Hediger, Levine, Naficy, & Vik, 2002; Skranes, Vik, Nilsen, Smevik, Andersson, & Brubakk, 1998; Ulvund, S.E., & Smith, L. 1996.
Bare én norsk studie rapporterte psykometriske egenskaper (BSID), men flere rapporterte middelverdier for forskjellige grupper sped- og småbarn (BSID, BSID-II): barn av røykere; barn med rusmiddelavhengige mødre; barn med øsofagusatresi (medfødt lukket spiserør) (tabell 2 og 3).
Litteratursøket etter dokumentasjon på psykometriske egenskaper for den svenske og danske versjonen av BSID-III ga 87 treff, hvorav 11 artikler virket relevante og ble vurdert i fulltekst (to artikler basert på BSID, åtte basert på BSID-II, og én basert på BSID-III), og én artikkel ble inkludert (Krogh, Vaever, Harder, & Koppe, 2012) Følgende artikler ble ekskludert: Angelsen, Vik, Jacobsen, & Bakketeig, (2001); Hallböök, Lundgren, Stjernqvist, Blennow, Strömblad, & Rosen, 2005; Hansen-Pupp, Hallin, Hellström-Westas, Cilio, Berg, Stjermqvist, Fellman, & Ley, 2008; Lind, Persson, Lönnerdal, Stenlund, & Hernell, 2004; Lundqvist Persson, Strandvik, & Sabel, 2011; Skiöld, Vollmer, Böhm, Hallberg, Horsch, Mosskin, Lagercrantz, Ånden, & Blennow, 2012; Skovgaard, Houmann, Landorph, & Christiansen, 2004; Skovgaard, Houmann, Christiansen et al., 2007; Skovgaard, Houmann, Christiansen, Olsen, Landorph, Lichtenberg, & Torben, 2008; Skovgaard, Olsen, Christiansen, Houmann, Landorph, Jørgensen, T. and the CCC 2000 Study Group, 2008.
Norske gjennomsnittsskårer for BSID-I og BSID-II i kliniske undergrupper
Normer
Det finnes ingen norske eller andre skandinaviske normer for noen av BSID-versjonene, men en dansk studie har sammenlignet danske BSID-III-data med de amerikanske normene. Forskerne fant signifikante og til dels store forskjeller mellom de danske og amerikanske skårene i alle tre delskaler, avhengig av alderstrinn (Krogh, Væver, Harder & Køppe, 2013).
Validitet
Det finnes én norsk studie om prediktiv validitet av psykomotorisk utviklingsindeks (PDI) i norsk BSID-data (Eversen, Skranes, Brubakk & Vik, 2009), estimert som ROC-analyse. Barn født for tidlig med lav fødselsvekt, barn født til termin men små i forhold til gestasjonsalder og kontrollbarn ble undersøkt med BSID ved 1-årsalder og med Movement Assessment Battery for Children (Movement ABC – Hendersen & Sugden, 1992)ved 14 år. Ved bruk av PDI < 2 standardavvik i kontrollbarn som cut-off-skår var 92 % (AUC: 0,92; 95 % CI: 0,78 – 1,0) av barna som var født for tidlig og hadde lav fødselsvekt riktig klassifisert som barn uten motoriske problemer ved 14 år (s. 513), 73 % av barnene som var født til termin men som var små i forhold til gestasjonsalder (AUC: 0,73; 95 % CI: 0,57 – 0.90) og 70 % av kontrollbarna født til termin (AUC: 0,70; 95 % CI: 0,58 – 0,82). Sensitivitet for PDI fra 1 år relatert til motoriske problemer på 14 år (Movement ABC skår < 5. persentil) i hele datamaterialet var 0,80 (95 % CI: 0,38 – 0,96), spesifisitet var 1,0 (95 % CI: 0,82 – 1,00), positiv prediktiv verdi var 1.00 (95 % CI: 0,51 – 1,00) og negativ prediktiv verdi var 0,94 (95 % CI: 0,74 – 0,99). Det ble konkludert, basert på relativt høy AUC i ROC-kurveanalysen, at PDI er et effektivt diagnostisk instrument (s. 516).
Reliabilitet
Ingen av de inkluderte studiene har undersøkt eller rapportert om testens reliabilitet.
Diskusjon og konklusjon
Det foreligger ikke dokumentasjon på psykometriske egenskaper og normer ved den norske versjonen av BSID-III, men en norsk undersøkelse attesterte PDI skåren av BSID en god prediktiv validitet basert om ROC-kurve analysen. Danske BSID-III data avviker betydelig fra amerikanske normer. Det er derfor viktig å være forsiktig når amerikanske normer anvendes til klinisk utviklingsvurdering av norske barn. Det er stort behov for studier om psykometriske egenskaper i norske utvalg og få norske normer.
Referanser
Angelsen, N.K., Vik, T., Jacobsen, G., & Bakketeig, L.S. (2001). Breast feeding and cognitive development at age 1 and 5 years. Archives of Disease in Childhood, 85(3), 183-188. doi:10.1136/adc.85.3.183
Bayley, N. (1969). Manual for the Bayley scales of infant development. San Antonio, TX: The Psychological Cooperation.
Bayley, N. (1993). Manual for the Bayley scales of infant development(2. utg.). San Antonio, TX: The Psychological Cooperation.
Bayley, N. (2006). Bayley scales of infant and toddler development(3. utg.). Technical manual. San Antonio, TX: Pearson og Psychological Cooperation.
Bayley, N. (2009). Bayley scales of infant and toddler development(3. utg.). Norsk manualsupplement. San Antonio, TX: Pearson.
Black, M.M., & Matula, K. (2000). Essentials of Bayley Scales of Infant Development II Assessment. Essentials of Psychological Assessment. New York: John Wiley.
Brandlistuen, R.E., Stene-Larsen, K., Holmstrom, H., Landolt, M.,A., Eskedal, L.T., & Vollrath, M.E. (2010). Motor and social development in 6-month-old children with congenital heart defects. Journal of Pediatrics, 156, 265-269. doi: 10.1016/j.peds.2009.08.035
European Federation of Psychologist Association (EFPA). (2008). EFPA Review model for the description and evaluation of psychological tests: Test review form and notes for reviewers (version 3.4.2).
Eversen, K.A.I., Skranes, J., Brubakk, A.-M., & Vik, T. (2009). Predictive value of early motor evaluation in preterm very low birth weight and term small for gestational age children. Early Human Development, 85, 511-518. doi: 10.1016/j.earlhumdev.2009.04.007
Fallang, B., Saugstad, O.D., & Hadders-Algra, M. (2003). Postural adjustments in preterm infants at 4 and 6 months post-term during volutary reaching in supine position. Pediatric Research, 54, 826-833. doi: 10.1203/01.PDR.0000088072.64794.F3
Faugli, A., R. Emblem, Bjørnland, K., & Diseth, T.H. (2009). Mental health in infants with esophageal atresia. Infant Mental Health Journal, 30, 40-56. doi: 10.1002/imhj.20202
Gagnon, S.G., & Nagle, R.J. (2000). Comparison of the revised and original versions of the Bayley Scales of Infant Development. School Psychology International, 21(3), 293-305. doi: 10.1177/0143034300213006
Hallböök, T., Lundgren, J., Stjernqvist, K., Blennow, G., Strömblad, L.-G., & Rosen, I. (2005). Vagus nerve stimulation in 15 children with therapy resistant epilepsy; its impact on cognition, quality of life, behaviour and mood. Seizure, 14(7), 504-513. doi: 10.1016/j.seizure.2005.08.007
Hansen-Pupp, I., Hallin, A.-L., Hellström-Westas, L., Cilio, C., Berg, A.-C, Stjermqvist, K., Fellman, V., & Ley, D. (2008). Inflammation at birth is associated with subnormal development in very preterm infants. Pediatric Research, 64(2), 183-188.
Hendersen, S., & Sugden, D. (1992). Movement Assessment Battery for Children. Manual. New York: The Psychological Cooperation.
Indredavik, M. S., Vik, T., Heyerdahl, S., Kulseng, S., & Brubakk A. M. (2005) Psychiatric symptoms in low birth weight adolescents, assessed by screening questionnaires. European Child & Adolescent Psychiatry, 14 (4), 226-236.
Kaaresen, P.I., Rønning, J.A., Tunby, J., Nordhov, S.M., Ulvund, S.E., & Dahl, L.B. (2008). A randomized controlled trial of an early intervention program in low birth weight children: outcome at 2 years. Early Human Development, 84, 201-209. doi: 10.1016/j.earlhumdev.2007.07.003
Krogh, M. T., Vaever, M. S., Harder, S., & Koppe, S. (2012). Cultural differences in infant development during the first year: A study of Danish infants assessed by the Bayley-III and compared to the American norms. European Journal of Developmental Psychology, 9(6), 730-736. doi: 10.1080/17405629.2012.688101
Lind, T., Persson, L.-A., Lönnerdal, B., Stenlund, H., & Hernell, O. (2004). Effects of weaning cereals with different phytate content on growth, development and morbidity: A randomized intervention trial in infants from 6 to 12 months of age. Acta Paediatrica, International Journal of Paediatrics, 93(12), 1575-1582.
Lundqvist Persson, C., Strandvik, B., & Sabel, K.-G. (2011). High OMEGA-6/OMEGA-3 ratio in early plasma and breast milk has negative effects on mental and emotional development in premature infants during infancy. Journal of Pediatric Gastroenterology and Nutrition 52, E66.
Moe V. (2002). Foster-placed and adopted children exposed in utero to opiates and other substances: prediction and outcome at four and a half years. Journal of Developmental & Behavioral Pediatrics, 23, 330-339.
Moe, V., & Slinning, K. (2001). Children prenatally exposed to substances: Gender-related differences in outcome from infancy to 3 years of age. Infant Mental Health Journal, 22, 334-350. doi: 10.1002/imhj.1005
Mshall, M.E. (2010). Measuring outcomes after extreme prematurity with the Bayley-II scales of infant and toddler development: a cautionary tale from Australia. Archives of Pediatric and Adolescnt Medicine, 164(4), 391-393.
Nordhov, S., J. A. Ronning, Dahl, L.B., Ulvlund, S.E., Tunby, J., & Kaaresen, P.I. (2010). Early intervention improves cognitive outcomes for preterm infants: Randomized controlled trial. Pediatrics, 126, e1088-e1094. doi: 10.1542/peds. 2010-0778
Nordhov, S., J. A. Ronning, Ulvlund, S.E., Dahl, L.B., & Kaaresen, P.I. (2012). Early intervention improves behavioral outcomes for preterm infants: Randomized controlled trial. Pediatrics, 129, e9-e16. doi: 10.1542/peds.2011-0248
Rao, M. R., Hediger, M.L., Levine, R.J., Naficy, A.B., & Vik, T. (2002). Effect of breastfeeding on cognitive development of infants born small for gestational age. Acta Paediatrica, 91(3), 267-274.
Skiöld, B., Vollmer, B, Böhm, B., Hallberg, B., Horsch, S., Mosskin, M., Lagercrantz, H., Ånden, U., & Blennow, M. (2012). Neonatal magnetic resonance imaging and outcome at age 30 months in extremely preterm infants. Journal of Pediatrics, 160, 559-566. doi: 10.1016/j.peds.2011.09.053
Skovgaard, A. M., Houmann, T., Christiansen, E., Olsen, E. M., Landorph, S. L., Lichtenberg, A., & Jorgensen, T. (2008). Can a general health surveillance between birth and 10 months identify children with mental disorder at 11/2 year? A case-control study nested in cohort CCC 2000. European Child and Adolescent Psychiatry, 17, 290-298. doi: 10.1007/s00787-007-0666-4
Skovgaard, A. M., Houmann, T., Christiansen, E., Landorph, S. L., Jorgensen, T., & CCC 2000 study team Olsen, E. M., Heering, K., Kaas-Nielsen, S., Samberg, V. & Lichtenberg, A., (2007). The prevalence of mental health problems in children 1 1/2 years of age--The Copenhagen Child Cohort 2000: Journal of Child Psychology and Psychiatry, 48(1), 62-70. doi: 10.1111/j.1469-7610.2006.01659.x
Skovgaard, A.M., Houmann, T., Christiansen, E., Olsen, E.M., Landorph, S.L., Lichtenberg, A., & Jørgensen, T. (2008). Can a general health surveillance between birth and 10 months identify children with mental disorder at 11/2 year? A case-control study nested in cohort CCC 2000. European Child and Adolescent Psychiatry, 17, 290-298. doi 10.1007/s00787-007-0666-4.
Skovgaard, A. M., Houmann, T., Landorph, S. L., & Christiansen, E. (2004). Assessment and classification of psychopathology in epidemiological research of children 0-3 years of age. A review of the literature. European Child and Adolescent Psychiatry, 13, 337-346. doi: 10.1007/s00787-004-0393-z
Skovgaard, A.M., Olsen, E.M., Christiansen, E., Houmann, T., Landorph, S.L., Jørgensen, T. and the CCC 2000 Study Group (2008). Predictors (0-10 months) of psychopathology at 11/2 years – a general population study in The Copenhagen Child Cohort CCC 2000. Journal of Child Psychology and Psychiatry, 49, 553-562. doi 10.1111/j.1469-7610.2007.01860.x
Skranes, J., Vik, T., Nilsen, G., Smevik, O., Andersson, H.W., & Brubakk, A.M. (1998). Can cerebral MRI at age 1 year predict motor and intellectual outcomes in very-low-birthweight children? Developmental Medicine and Child Neurology, 40(4), 256-262.
Trasti, N., Vik, T., Jacobsen, G., & Bakketeig, L.S. (1999). Smoking in pregnancy and children's mental and motor development at age 1 and 5 years. Early Human Development, 55, 137-147.
Ulvund, S.E., & Smith, L. (1996). The predictive validity of nonverbal communicative skills in infants with perinatal hazards. Infant Behavior and development, 19, 441-449.