Note. Normene som brukes som sammenligningsgrunnlag er hentet fra en britiske standardiseringsstudie publisert i manualen til plussversjonen av SPM (Raven, 2008b), og er den forventede skåren for en person som ligger på medianen (50. prosentil) i sin aldersgruppe. > betyr at normen ligger under studiens konfidensintervall, = betyr innenfor og < betyr over. Tallene er hentet fra artiklene, så antall desimaler kan variere noe. Originaltall som ikke hadde én desimal har for uniformitetens skyld enten blitt avrundet eller fått en ekstra null.
Middelverdier og/eller forekomster i kliniske undergrupper
For SPM ble det funnet én studie med rapporterte normer og kvantiler for populasjonen av døve barn (Frostad, 1995), samt to som brukte den som kovariat eller til å beskrive utvalget med et urelatert forskningsspørsmål. Disse oppga estimater for 18 forskjellige (relativt små) utvalg, delt på alder eller diagnose. Tabell 5 gir en oversikt over middelverdier og spredning i de kliniske undergruppene for SPM.
Frostad (1995) presenterer en mer utfyllende analyse av SPM for relativt små utvalg av døve i ulike aldre, blant annet en tabell med fordeling av skårer på delkomponenter for ulike evnenivåer, hvor deres utvalg er sammenlignet med amerikanske og tyske normer for normale barn. I tillegg presenteres korrelasjoner mellom oppgave-rangering og aldersgruppe, tabell med kumulativ distribusjon (sammenlignet med amerikanske normdata), og parvise sammenligninger av forskjeller mellom aldersgruppenes gjennomsnitt. Konklusjoner som kan trekkes fra Frostad (1995) er at SPM fungerer relativt godt for døve, med noen avvik fra de internasjonale normene for normale barn.
Internasjonale normer (hovedsaklig britiske; Raven, 2008a; Raven, 2008b) for forventet gjennomsnittlig skår for det aktuelle aldersspennet er supplert i tabellene (5 og 6) for å gi et sammenligningsgrunnlag. De fleste studiene i denne kunnskapsoppsummeringen har relativt lav n, noe som gjør konfidensintervallene (95 %) store. I alt åtte av 19 studier kunne vise til gjennomsnitt som avviker fra den internasjonale normen, hvorav to ligger under og seks ligger over.
Det ble funnet en studie som brukte CPM. Studien til Söderqvist, et al. (2012) omhandler barn i et betydelig aldersspekter, med en gruppe som mottok et kognitivt treningsprogram samt en kontrollgruppe. Utvalget er lite og har et bredt spekter av diagnoser, med svært få deltakere for hver diagnose, med det til felles at de skal være klassifisert med en intellektuell utviklingsforstyrrelse [intellectual disability], dvs. en intelligenskvotient (IQ) på under 70.
En sammenligning av så varierte og spesielle utvalg med en forventet medianskår må tas med en klype salt. Hvorvidt skårene burde ligge innenfor normalen avhenger også av om hva som forventes for den enkelte gruppen. Det faktum at det er lite entydighet i forholdet til medianen for sammenlignbare utvalg taler ikke til fordel for de britiske normenes brukbarhet. Studiene har imidlertid forholdsvis lav statistisk styrke, og betydningen av funnene bør derfor ikke overdrives.
Tabell 5. Middelverdier (M) og standardavvik (SD) for ulike normgrupper – SPM
Referanse
|
Utvalg/gruppe
|
Alder
|
N
|
Skala
|
Forventet skåre
jf. britiske normer
|
M
|
SD
|
Elbro and Buch-Iversen (2013)
|
6. klassinger, pretest kontrollgruppe
|
10–-11
|
85
|
38,9
|
10,2
|
> 32-33
|
|
6. klassinger, pretest eksperimentgruppe
|
10–11
|
151
|
39,5
|
8,91
|
> 21-33
|
Green, et al. (2009)
|
10. klassinger, normale barn
|
15–16
|
233
|
45,4
|
8,6
|
> 35-36
|
Landmark and Grinde (1962)
|
Normale barn fra Bærum, 8-9 år (2. klasse 1962, 5 skoler, loddtrekkning, representativ for bærum)
|
8–9
|
44
|
22,1
|
5,9
|
< 26-31
|
Lyster, et al. (2016)
|
Kontrollgruppe, 1. klasse
|
5–6
|
30
|
21,9
|
5,7
|
= 22-23 a
|
Solheim (2011)
|
5. klassinger, nasjonalt representativt, middelklasse
|
9–10
|
217
|
40,6
|
8,0
|
> 30-32
|
Note. Normene som brukes som sammenligningsgrunnlag er hentet fra en britiske standardiseringsstudie publisert i manualen til plussversjonen av SPM (Raven, 2008b), og er den forventede skåren for en person som ligger på medianen (50. prosentil) i sin aldersgruppe.(Raven, 2008b). > betyr at normen ligger under studiens konfidensintervall, = betyr innenfor og < betyr over. a Normer ikke tilgjengelig for aldersspenn, de supplerte er for 7-åringer. Tallene er hentet fra artiklene, så formateringen kan variere noe. Originaltall som ikke hadde én desimal har for uniformitetens skyld enten blitt avrundet eller fått en ekstra null.
Tabell 6. Middelverdier (M) og standardavvik (SD) for ulike normgrupper – CPM
Referanse
|
Utvalg/gruppe
|
Alder
|
N
|
Skala
|
Forventet skåre
jf. britiske normer
|
M
|
SD
|
|
Lervåg, et al. (2009)
|
Normale barn, 1. klassinger
|
5–6
|
228
|
21,1
|
6,1
|
= 18-21
|
|
Normale barn, 2. klassinger et år etter
|
6–7
|
228
|
25,7
|
5,4
|
= 22-27
|
Note. Normene som brukes som sammenligningsgrunnlag er hentet fra en britiske standardiseringsstudie publisert i manualen til plussversjonen av SPM (Raven, 2008b), og er den forventede skåren for en person som ligger på medianen (50. prosentil) i sin aldersgruppe. (Raven, 2008a). > betyr at normen ligger under studiens konfidensintervall, = betyr innenfor og < betyr over. Originaltall som ikke hadde én desimal har for uniformitetens skyld enten blitt avrundet eller fått en ekstra null.
|
|
Reliabilitet
I det norske søket fantes det to artikler som rapporterte reliabilitetsmål, begge på testens interne konsistens. Landmark and Grinde (1962) rapporterte for SPM en split half-reliabilitet på 0,89. Lervåg, et al. (2009) rapporterte for CPM alpha-koeffisienter (Cronbach's alpha; Cronbach, 1951) på 0,80 samt 0,85 når barna ble testet ett år senere. I de aller fleste artiklene basert på svenske/danske utvalg var ikke reliabilitet undersøkt for det aktuelle utvalget, men man hadde henvist til reliabilitet oppgitt i manualen. Tre av studiene hadde rapportert Cronbachs alpha for testen, med 0,80 (Olsson, et al., 2016) og 0,87 (Skagerlund & Traff, 2016a) for SPM, og 0,72 for CPM (Gustafson, et al., 2013). Disse verdiene betraktes som adekvate til gode i forhold til EFPA-kriteriene (EFPA, 2013).
Alpha-koeffisienter er kun ett begrenset mål på den nedre grensen for dette aspektet ved reliabilitet (mål som for eksempel test-retest og parallell-form adresserer andre viktige aspekter ved reliabilitet, men disse ble ikke rapportert i noen av studiene), og er bl.a. avhengig av en sentral antagelse om at oppgavene er likeverdige (Schmitt, 1996; Sijtsma, 2009). I en test som Raven, hvor oppgavene varierer i vanskelighetsgrad eller hvor det finnes tidspress, vil reliabiliteten for eksempel kunne variere sterkt avhengig av hvor på skalaen en person eller oppgave befinner seg samt hvor mange som befinner seg på et gitt punkt på skalaen og hvor godt de differensierer, og dette fanges ikke opp i enkeltstatistikker som alpha-koeffisienten. Her er latent variabel-modellering nødvendig (item response theory - se f.eks. Lord, Novic, & Birnbaum, 2008).
Validitet
Validitet - Norske studier
Fra det norske søket var det fire studier som belyste validiteten til SPM, samt to som belyste CPM, og da i hovedsak begrepsvaliditet.
En vanlig måte å undersøke begrepsvaliditeten til en test er å identifisere dens plass i det nomologiske nettverket (Cronbach, 1955), det vil si hvordan den relaterer seg til andre konstrukter som den teoretisk sett skal konvergere med eller divergere fra. Det ble ikke identifisert noen dedikerte valideringsstudier av Ravens matriser på den norske populasjonen, men noen artikler rapporterte relasjoner til andre konstrukter. Raven skal være en av de mest sentrale målene på flytende intelligens (Gf – eng: fluid intelligence) (Marshalek, et al., 1983). Dette betyr at mål på Gf burde være nærmere i testens nomologiske nettverk enn for eksempel mål på krystallisert intelligens (Gc – eng: crystallized intelligence) (McGrew, 2005), og relativt fjernt fra konstrukter som ikke har mye med intelligens å gjøre. Siden vi vet at Gf lader høyt på den overordnede g-faktoren (Kvist & Gustafsson, 2008), burde vi også anta at Raven i det minste vil korrelere noe med de fleste evnetester uavhengig av domene.
Her ser resultatene for SPM (Tabell 7) ut til å korrespondere godt med disse antakelsene for den norske populasjonen, ved at den er tettere relatert til visse intelligenstester enn til språkkonstrukter, mens holdningskonstrukter er relativt urelaterte til Raven. Ut ifra klassiske tommelfingerregler (se f.eks. Cohen, Cohen, West, & Aiken, 2003) kan vi si at SPM stort sett korrelerer middels (r = 0,30) til relativt høyt (r = 0,50) med andre intelligenstester for barn fra normalutvalg, og korrelerer tilsynelatende også høyt med tilsvarende matrisebaserte tester på et blandet klinisk utvalg. Det vises til lave (r = 0,10) til middels høye korrelasjoner med språklige konstrukter, samt en screeningtest for dysleksi. Holdningsbaserte konstrukter som reading self-efficacy og task value ser ut til å korrelere svært svakt med testen. Bosnes (2005) rapporterte også en korrelasjon på 0,81 mellom SPM og subtesten matriser fra WAIS III, men det er uklart om dette resultatet er fra den aktuelle studien. For ordens skyld, tilsvarer korrelasjonene som er observert her også noenlunde det som rapporteres for andre lands populasjoner (mer om internasjonale valideringsstudier kan bli funnet i kunnskapsoppsummeringen til John Rust og kolleger fra manualen til SPM; Raven, 2008b).
De norske studiene i kunnskapsoppsummeringen belyser det nomologiske nettverket til CPM (Tabell 8) viser en lav til middels relasjon mellom CPM og diverse språkkonstrukter (Lervåg, et al., 2009) samt en noe sterkere relasjon mellom CPM og WISC-R (Høie, et al., 2008), og er her på linje med SPM. Studien til Lervåg og kollegaer viser også en forventet utvikling i CPM-skår ettersom barna blir eldre. Når det gjelder forskjeller mellom grupper, viser Høie, et al. (2005) med et stort utvalg av barn med epilepsi (N = 309; alder = 8-12 år), at disse er sterkt overrepresentert i de lavere prosentiler av CPM, mens kontrollgruppen er sterkt overrepresentert i de øvre prosentiler. I en studie på den samme populasjonen fant Høie, Sommerfelt, et al. (2006) en negativ korrelasjon mellom CPM og lærer/foreldrerapporterte psykososiale vansker (r = -0,37), stort sett urelatert til om barnet hadde epilepsi eller ikke. De fant også i en annen studie (Høie, Mykletun, et al., 2006) at omtrent 20 % av variasjonen i et mål på eksekutive funksjoner kunne forklares av skår på CPM, etter å ha kontrollert for depresjon og sosioøkonomisk status. De sistnevnte studiene belyser det nomologiske nettverket til intelligenskonstruktet ved å vise at testen måler aspekter ved sentrale kognitive funksjoner, samt at lav intelligens-skår kan være en psykososial risikofaktor.
Tabell 7. Korrelasjonskoeffisienter mellom SPM og andre mål (norske studier)
Forfatter
|
Utvalg
|
Alder(år)
|
N
|
Skala
|
r
|
|
Bosnes (2005)
|
Blandet klinisk utvalg: spesifikke lærevansker, lettere psykiske vansker, psykisk utviklingshemming, traumatisk hjerneskade, ADHD, alvorlig psykisk lidelse, autisme, blødning i sentralnervesystemet og demens.
|
9-–68
|
41
|
WASI matriser
|
0,69
|
|
Green, et al. (2009)
|
10-klassinger (15–16 år), normale barn
|
15-–16
|
233
|
Duvan Dyslexia Screening test
|
0,32
|
|
Landmark and Grinde (1962)
|
Normale barn, 8–-9 år (2. klasse 1962), 5 skoler hvor elever er valgt etter loddtrekkning, representativ for Bærum, SPM sets A, AB, B, revised order (Raven, 1956)
|
8–9
|
44
|
Stanford-Binet, norsk standard
|
0,75
|
|
|
|
|
|
Leiter international performance scale, Arthur adaption
|
0,69
|
|
|
|
|
|
Columbia Mental Maturity scale
|
0,42
|
|
|
|
|
|
Goodenough "draw-a-man"
|
0,53
|
|
Solheim (2011)
|
5. klassinger, nasjonalt representativt, middelklasse
|
9–10
|
217
|
Word reading ability
|
0,25
|
|
|
|
|
|
Listening comprehension
|
0,27
|
|
|
|
|
|
Reading self-efficacy
|
0,10
|
n.s.
|
|
|
|
|
Reading task value
|
-0,15
|
|
|
|
|
|
Multiple choice (MC) reading comprehension
|
0,48
|
|
|
|
|
|
Constructed response (CR) reading comprehension
|
0,39
|
|
Note. Samtlige r (unntatt en merket n.s.) var signifikante. r = bivariat korrelasjon.
Tabell 8. Korrelasjonskoeffisienter mellom CPM og andre mål (norske studier)
Forfatter
|
Utvalg
|
Alder(år)
|
N
|
Skala
|
r
|
|
(Høie, et al., 2008))
|
Barn med epilepsi
|
6–12
|
269
|
WISC-R
|
0,63
|
|
Lervåg, et al. (2009)
|
Normale barn, 1. klassinger
|
5–6
|
228
|
Phoneme awareness
|
0,43
|
|
For korrelasjoner med subtester, se Lervåg and Hulme (2010)
|
|
|
|
Paired-associated learning (PAL)
|
0,36
|
|
|
|
|
|
Non-alphanumeric rapid automatized naming (RAN)
|
0,29
|
|
|
|
|
|
Verbal short-term memory
|
0,39
|
|
|
|
|
|
Letter knowledge
|
0,44
|
|
|
|
|
|
Verbal abilities
|
0,47
|
|
|
Normale barn, 2. klassinger, observasjon ett år etter
|
6–7
|
228
|
Phoneme awareness
|
0,47
|
|
|
|
|
|
Paired-associated learning (PAL)
|
0,34
|
|
|
|
|
|
Non-alphanumeric rapid automatized naming (RAN)
|
0,26
|
|
|
|
|
|
Verbal short-term memory
|
0,26
|
|
|
|
|
|
Letter knowledge
|
0,31
|
|
|
|
|
|
Verbal abilities
|
0,23
|
|
Note. Samtlige r var signifikante. r = bivariat korrelasjon.
Validitet – Svenske og Danske studier
Fra det svenske/danske søket var det til sammen 24 studier (Tabell 2) som i hovedsak belyste begrepsvaliditeten til testen på litt ulike måter. Disse kan grupperes avhengig av hvordan de kan sies å belyse begrepsvaliditeten enten i form av korrelasjoner med andre tester, forskjeller mellom grupper, intervensjoner for å øke intelligens eller faktoranalysestudier.
Korrelasjoner med andre tester.
Litt flere korrelasjonsstudier var gjennomført med SPM sammenlignet med CPM. Hovedfunn fra disse studiene i form av korrelasjoner er presentert i Tabell 9 og 10. De fleste studiene for Raven var gjennomført på skolebarn og viste generelt noe høyere korrelasjoner mellom Raven og tester som målte problemløsning, spatiale og matematiske evner sammenlignet med ulike verbale og språktester (Tabell 9). Dette er i tråd med antakelser om at Raven er et mål på non-verbal intelligens. I en prospektiv svensk studie ble det undersøkt om alder, SPM og arbeidshukommelse predikerte matematiske ferdigheter to år senere hos en gruppe tilfeldig valgte barn i alderen 6-16 år (N = 246) (Dumontheil & Klingberg, 2012). Alle prediktorene var signifikante (R2 = .58), inklusive Raven. De fleste studiene for CPM sammenlignet testen med mål på dekoding, hukommelse og ulike språktester der korrelasjonene varierte fra små og ikke signifikante til middels store (Tabell 10).
Tabell 9. Korrelasjonskoeffisienter mellom SPM og andre mål (svenske/danske studier)
Forfatter
|
Utvalg
|
Alder(år)
|
N
|
Skala/test
|
r
|
|
(Andersson, 2007)
|
Skolebarn, Sverige
|
10
|
69
|
Mathemathical word problem solving
|
0,43
|
|
|
|
|
|
Arithmetical calculation
|
0,44
|
|
|
|
|
|
Reading ability
|
0,34
|
|
|
|
|
|
Visual matrix task
|
0,23
|
|
|
|
|
|
Animal dual-task
|
0,28
|
|
|
|
|
|
Verbal fluency
|
0,27
|
|
|
|
|
|
Trail-making
|
0,41
|
|
|
|
|
|
Digit span
|
0,22
|
|
(Andersson, 2008)
|
Skolebarn, Sverige
|
10,3
|
121
|
Arithmetical composite measure
|
0,58
|
|
|
|
|
|
Reading task
|
0,35
|
|
|
|
|
|
Counting span task
|
0,36
|
|
|
|
|
|
Visual matrix span
|
0,41
|
|
|
|
|
|
Verbal fluency
|
0,27
|
|
|
|
|
|
Trail-making
|
0,61
|
|
|
|
|
|
Stroop task
|
0,18
|
|
|
|
|
|
Digit span task
|
0,23
|
|
|
|
|
|
Corsi-block span
|
0,29
|
|
(Fischbein, et al., 1999)
|
Skolebarn, Sverige
|
9–-15
|
73
|
Verbal test
|
0,42
|
|
|
|
|
|
Swedish
|
0,41
|
|
|
|
|
|
Arithmetic
|
0,52
|
|
(Forssman, et al., 2012)
|
Ungdommer, Sverige
|
15
|
120
|
ADHD/ODD symptoms behavior
|
0,09–0.22
|
|
|
|
|
|
Working memory
|
0,37
|
|
|
|
|
|
Interference control
|
0,20
|
|
|
|
|
|
Response inhibition
|
0,00
|
n.s.
|
|
|
|
|
Reaction time
|
0,29
|
|
(Skagerlund & Traff, 2016b)
|
Skolebarn, Sverige
|
9,7
|
133
|
Math score
|
0,43
|
|
|
|
|
|
Processing speed
|
0,22
|
|
|
|
|
|
Trail making
|
0,25
|
|
|
|
|
|
Visuospatial working memory
|
0,15
|
|
|
|
|
|
Verbal working memory
|
0,16
|
|
|
|
|
|
Symbolic number comparison
|
0,05
|
n.s.
|
|
|
|
|
Non-symbolic number discrim.
|
0,17
|
|
|
|
|
|
Mental roation
|
0,39
|
|
|
|
|
|
Paper folding
|
0,55
|
|
|
|
|
|
Time discrimmination
|
0,37
|
|
(Träff, 2013)
|
Skolebarn, Sverige
|
10-–13
|
134
|
Reading task
|
0,35
|
|
|
|
|
|
Arithmetic fact retrieval
|
0,29
|
|
|
|
|
|
Arithmetic calculation
|
0,43
|
|
|
|
|
|
Word problem solving
|
0,51
|
|
|
|
|
|
Subitizing and dot counting
|
0,29
|
|
|
|
|
|
Number line estimation errors
|
0,37
|
|
|
|
|
|
Symbolic number comparisons
|
0,14
|
|
|
|
|
|
Visual matrix span
|
0,30
|
|
|
|
|
|
Listening span
|
0,27
|
|
|
|
|
|
Verbal fluency
|
0,35
|
|
|
|
|
|
Color naming
|
0,23
|
|
Note: Alle korrelasjonene var i forventet retning og er derfor presentert uten fortegn i tabellen. Samtlige r (unntatt to merket n.s.) var signifikante. r = bivariat korrelasjon.
Tabell 10. Korrelasjonskoeffisienter mellom CPM og andre mål (svenske/danske studier)
Forfatter
|
Utvalg
|
Alder(år)
|
N
|
Skala
|
r
|
|
(Gellert & Elbro, 2013)
|
Skolebarn, Danmark
|
9,6
|
68–90
|
Vocabulary training
|
0,25
|
|
|
|
|
|
Definition knowledge
|
0,05
|
n.s.
|
|
|
|
|
Immediate recall
|
0,19
|
n.s.
|
|
|
|
|
Immediate recognition
|
0,29
|
|
|
|
|
|
Delayed recall
|
0,08
|
n.s.
|
|
|
|
|
Deladed recognition
|
0,08
|
n.s.
|
|
|
|
|
Receptive vocabulary
|
0,30
|
|
|
|
|
|
Expressive vocabulary
|
0,38
|
|
(Dahlin, 2011)
|
Barn med lærevansker
|
9–-12
|
57
|
Word decoding
|
0,39
|
|
|
|
|
|
Orthographic verification
|
0,37
|
|
|
|
|
|
Reading comprehension
|
0,52
|
|
|
|
|
|
Working memory training scores
|
0,41
|
|
(Gustafson, et al., 2013)
|
Skolebarn med og uten lesevansker
|
4 klasse
|
36x2
|
Reading ability
|
0,36
|
|
|
|
|
|
Decoding
|
0,06
|
n.s.
|
|
|
|
|
Phonological decoding
|
0,16
|
n.s.
|
|
|
|
|
Orthographic decoding
|
0,10
|
n.s.
|
|
|
|
|
Language comprehension
|
0,39
|
|
|
|
|
|
Word comprehension
|
0,48
|
|
|
|
|
|
Receptive grammar
|
0,43
|
|
|
|
|
|
Processing speed (Doodle matching)
|
-0,04
|
n.s.
|
(Nordberg, et al., 2014)
|
Barn med CP og språkvansker
|
11
|
15
|
Narrative assessment profile
|
0,06
|
n.s.
|
|
|
|
|
Expressive language
|
0,49
|
n.s.
|
|
|
|
|
Receptive language
|
0,30
|
n.s.
|
|
|
|
|
Visual memory
|
0,54
|
|
|
|
|
|
Auditory memory
|
0,06
|
n.s.
|
(Nordberg, et al., 2014)
|
Barn med CP og språkvansker
|
11,2
|
19
|
Articulation score
|
0,56
|
|
Note: a Studien presenterte r for begge grupper av barn. Korrelasjoner for vanlige skolebarn er presentert i tabellen. Alle korrelasjonene var i forventet retning og er derfor presentert uten fortegn i tabellen. Samtlige r (unntatt de som er merket n.s.) var signifikante. r = bivariat korrelasjon.
Forskjeller mellom grupper
En studie av Nutley et al. (2014) viste forskjeller i SPM mellom grupper av barn der de barna som spilte et instrument, skåret omtrent ett standardavvik over gruppen som ikke spilte musikk ved første måletidspunkt. Forskjellen mellom gruppene var fremdeles signifikant etter at man hadde kontrollert for en del demografiske og familiefaktorer som foreldres utdanningsnivå.
I en liten klinisk studie av barn med autisme ble gruppen sammenlignet med en gruppe med vanlige barn på ulike språktester samt CPM. Det var ikke signifikante forskjeller i Raven mellom disse gruppene, selv om tendensen gikk i forventet retning. Det vil si at barna diagnostisert med autisme skåret lavere enn sammenligningsgruppen. Studien hadde imidlertid lav statistisk styrke til å avdekke forskjeller siden det kun var 21 barn i hver gruppe (Brynskov, et al., 2017).
I en studie av premature barn med lav fødselsvekt (< 1500gr) ble ulike kognitive funksjoner undersøkt ved 9-årsalderen og resultatene sammenlignet med en kontrollgruppe med fulltermin barn med normalvekt (Bylund, et al., 2000). Resultatene viste signifikante forskjeller i skårer på SPM der gruppen av barn med lav fødselsvekt skåret i 3/4 standardavvik lavere enn kontrollgruppen (Hedges g = 0,72).
I en longitudinell studie av barn med lesevansker (N = 70) (Svensson & Jacobson, 2006) ble gruppen sammenlignet med barn uten lesevansker fra samme klassetrinn på en rekke kognitive tester først i 2. klasse og deretter 10 år senere. Det var ingen signifikant forskjell mellom gruppene på T1 på CPM, mens på T2 skåret gruppen med lesevansker signifikant lavere på CPM enn sammenligningsgruppen. Forskjellen mellom gruppene på T2 var over et standardavvik – noe som må betegnes som en stor forskjell (Svensson & Jacobson, 2006).
Studier for å øke intelligens
En intervensjonsstudie (Thirus, et al., 2016) ble inkludert i oppsummeringen der formålet var å undersøke om det var mulig å øke matematiske evner og generell intelligens målt med SPM blant elever i videregående skole. Studien var eksperimentell med 10 elever i intervensjonsgruppen og 11 i kontrollgruppen. Intervensjonsgruppen mottok et nettbasert program SMART (Strengthening Mental Abilities with Relational Training) som gikk over 8-12 uker. Resultatene indikerte at programmet hadde hatt en liten effekt på prestasjoner på SPM etter at man hadde kontrollert for alder og pre-test skårer på Raven. Studien er imidlertid svært liten og med betydelig frafall underveis.
Faktoranalysestudier
I flere studier har Gustafsson et al. undersøkt strukturen til intellektuelle evner, og ulike grupper er testet med en rekke kognitive og kunnskapstester, deriblant SPM. Den tidligste studien (Gustafsson, 1984) ble gjennomført på en stor gruppe skolebarn (N = 1224) i tolv-års alderen. En hierarkisk modell med tre nivå av faktorer, inklusive en g-faktor på det tredje nivået. Modellen fikk støtte og Raven ladet på en spatial faktor (Figural Relations) som igjen ladet på faktoren flytende intelligens (Gf) – denne ladet i sin tur på g-faktoren. I en nyere lignende studie av fireåringer ble også konfirmatorisk faktoranalyse benyttet for å undersøke hvilken struktur kognitive evner har (Gustafsson & Wolff, 2015). Studien viste at CPM ladet på faktoren for flytende visuospatiell intelligens (Gf) sammen med to andre Wechslertester (Block Design og Wechsler Non-verbal Scale for Intelligence) som er antatt å måle den samme faktoren. I en annen artikkel basert på de samme barna (Wolff & Gustafsson, 2015) der formålet var å undersøke faktorstrukturen til fonologiske evner, ble også CPM inkludert i faktoranalysen. I disse analysene ble en tre-faktor modell funnet der CPM ladet på faktoren flytende visuell intelligens.
Øvrig
En gammel studie (Vejleskov, 1968) undersøkte vanskelighetsgraden for de ulike oppgavene i de ulike settene for SPM, og i tillegg kjønns- og demografiske forskjeller. Studien gav støtte til antakelsen om at settene har økende vanskelighetsgrad og tilsvarende at de tolv oppgavene innen hvert sett også øker i vanskelighetsgrad. Gjennomsnittstallene fra de to danske skolene var svært like gjennomsnittene i manualen fra 1958 (Vejleskov, 1968).
Diskusjon og konklusjon
Reliabilitetsmessig ser de få resultatene som finnes ut til å sammenfalle noenlunde med de internasjonale forventningene. At det mangler statistikk på test retest-reliabilitet og parallelle former for norske eller skandinaviske populasjoner er en betydelig svakhet, og dette betyr at brukere av testen essensielt sett må ta en beslutning om hvorvidt de internasjonale reliabilitetsresultater kan antas å være gyldige også for den norske populasjonen.
Validitet har heller ikke vært overveldende undersøkt i Norge, men de studiene som er gjennomført ser ut til å støtte oppunder Ravens plass i det nomologiske nettverket. I Sverige har man funnet at testen også ligger i kjernen av konstruktet flytende intelligens både for barn (Gustafsson, 1984) og voksne (Kvist & Gustafsson, 2008), resultater som også har blitt påvist i Norge for lignende abstrakte resonneringstester (som Cattell's culture free test og WISC matriser; Undheim, 1981; Undheim & Gustafsson, 1987). Validiteten til Raven i Norge og Norden later følgelig til å sammenfalle med det vi vet fra internasjonal forskning på testen (Raven, 2000a), hvor den ansees som et godt mål på abstrakt resonneringsevne.
Selv om validiteten er god ser ikke testens normgrunnlag ut til å ha blitt målrettet undersøkt hverken i Norge, Sverige eller Danmark, med unntak av studien på hørselshemmede (Frostad, 1995). I publikasjonene som ble gjennomgått i kunnskapsoppsummeringen er det en del usikkerhet knyttet til forholdene testene er administrert under. Det er lite standardisert eller rapportert når det for eksempel gjelder hvilke test-sett som ble brukt, og få om noen har oppgitt hvilket tidspress barna var satt under når de tok testen. Dette er en betydelig systematisk feilkilde som sår tvil om sammenligningsgrunnlaget til middelverdiene. Fra de rapporterte middelverdiene for SPM, ser det ut til at en god del av studiene ikke samsvarer med normene fra manualen (Raven, 2008b). Hvorvidt dette skyldes at norske barn reagerer annerledes på oppgavenes stimuli enn barn fra andre kulturer, om det er en del av den internasjonale trenden med populasjonsomfattende økninger i skår på lignende tester (se f.eks. Flynn, 2011), eller om det kun er tilfeldige variasjoner, kan vi kun spekulere i. En islandsk studie av et relativt stort utvalg av tilfeldig valgte barn (N = 550) viste for eksempel at disse skåret to-tre poeng bedre på SPM enn normene i manualen noe forfatterne tilskrev Flynn-effekten ved at normene var omtrent 20 år gamle på det tidspunkt studien ble gjennomført (Pind, Gunnarsdóttir, & Jóhannesson, 2003). Mer forskning på den norske populasjonen er helt klart nødvendig, og en norsk standardisering av testen kunne adressert en del av usikkerhetsmomentene. En kunnskapsoppsummering av studier basert på Raven på tvers av kulturer og tidsrom viste betydelige økning i totalskår over tid, noe som understreker betydningen av å anvende oppdaterte normer (Raven, 2000b). Dette ble også funnet i en meta-analyse av studier med Raven basert på hele 48 land og over en periode på 64 år (Wongupparaj, Kumari, & Morris, 2015). Disse studiene understreker betydningen av å anvende oppdaterte normer.
Både SPM og CPM er generelt fri for språklige stimulus, og skal ideelt sett være relativt kulturfrie, men før det er foretatt noen ordentlig normstudie av testene i Norge, kan vi kun støtte oss på teoretiske antagelser om at den fungerer som den skal. Dette burde være forsvarlig i forskning hvor man er interessert i et rent mål på intelligens, med referanse til fordelingen i eget utvalg (noe som er tilfelle for majoriteten av studiene i denne kunnskapsoppsummeringen, men ikke alle). Det blir imidlertid problematisk å for eksempel bruke den i kliniske settinger hvor klassifikasjonsbeslutninger er basert på fordelingen i den norske normalpopulasjonen. Raven burde være et godt mål på intelligens, også i Norge, selv om de britiske normene kan ha begrenset overføringsverdi. Det vil derfor være svært nødvendig å få etablert norske normer for testen med tanke på klinisk bruk.
Referanser
Andersson, U. (2007). The contribution of working memory to children's mathematical word problem solving. Applied Cognitive Psychology, 21(9), 1201-1216.
Andersson, U. (2008). Working memory as a predictor of written arithmetical skills in children: The importance of central executive functions. British Journal of Educational Psychology, 78(2), 181-203.
Bosnes, O. (2005). Comparison of Wechsler Adult Intelligence Scale/Wechsler Intelligence Scale for Children-Revised, and Wechsler Abbreviated Scale of Intelligence in a Norwegian clinical sample. Tidsskrift for Norsk Psykologforening, 42(7), 598-602.
Brynskov, C., Eigsti, I.-M., Jorgensen, M., Lemcke, S., Bohn, O.-S. & Krojgaard, P. (2017). Syntax and morphology in Danish-speaking children with autism spectrum disorder. Journal of Autism and Developmental Disorders, 47(2), 373-383. doi: http://dx.doi.org/10.1007/s10803-016-2962-7
Bylund, B., Cervin, T., Finnström, O., Gäddlin, P.-O., Leijon, I., Mård, S. et al. (2000). Very low birth weight children at 9 years : School performance and behaviour in relation to risk factors. Prenatal and Neonatal Medicine, 5(2), 124-133.
Carpenter, P. A., Just, M. A. & Shell, P. (1990). What one intelligence test measures: a theoretical account of the processing in the Raven Progressive Matrices Test. Psychological review, 97(3), 404-431.
Cattell, R. (1940). A culture-free intelligence test I. Journal of Educational Psychology, 31(3), 161-179.
Cohen, J., Cohen, P., West, S. G. & Aiken, L. (2003). Applied Multiple Regression / Correlation Analysis for the Behavioral Sciences (3rd utg.). London: Lawrence Erlbaum associates.
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 74(1), 145-154.
Cronbach, L. J. (1955). Construct validity in psychological tests. Psychological bulletin, 52(4), 281-302.
Dahlin, K. I. (2011). Effects of working memory training on reading in children with special needs. Reading and Writing, 24(4), 479-491. doi: 10.1007/s11145-010-9238-y
Dumontheil, I. & Klingberg, T. (2012). Brain activity during a visuospatial working memory task predicts arithmetical performance 2 years later. Cerebral Cortex, 22(5), 1078-1085.
Elbro, C. & Buch-Iversen, I. (2013). Activation of background knowledge for inference making: Effects on reading comprehension. Scientific Studies of Reading, 17(6), 435-452.
European Federation of Pscyhologists’ Association - EFPA. (2013). EFPA Review model for the description and evaluation of psychological tests: Test review form and notes for reviewers, v 4.2.6: European Federation of Pscyhologists’ Association (EFPA).
Fasting, R. B. & Lyster, S.-A. H. (2005). The effects of computer technology in assisting the development of literacy in young struggling readers and spellers. European Journal of Special Needs Education, 20(1), 21-40.
Fischbein, S., Guttman, R. & Nathan, M. (1999). Genetic and environmental influences on pupil performances. Twin Research, 2(3), 183-195.
Flynn, J. R. (2011). Secular changes in intelligence. I R. J. Sternberg & S. B. Kaufman (Red.), The Cambridge handbook of intelligence (s. 647-663). New York: Cambridge University press.
Forssman, L., Eninger, L., Tillman, C. M., Rodriguez, A. & Bohlin, G. (2012). Cognitive functioning and family risk factors in relation to symptom behaviors of ADHD and ODD in adolescents. Journal of Attention Disorders, 16(4), 284-294. doi: 10.1177/1087054710385065
Frostad, P. (1995). Ravens progressive matriser brukt på et utvalg hørselshemmede elever : notat. Trondheim: P. Frostad.
Gellert, A. S. & Elbro, C. (2013). Do experimental measures of word learning predict vocabulary development over time? A study of children from grade 3 to 4. Learning and Individual Differences, 1-8.
Green, K., Tønnessen, F., Tambs, K., Thoresen, M. & Bjertness, E. (2009). Dyslexia: Group screening among 15-16-year-olds in Oslo, Norway. Scandinavian Journal of Educational Research, 53(3), 217-227.
Gustafson, S., Samuelsson, C., Johansson, E. & Wallmann, J. (2013). How simple is the simple view of reading? Scandinavian Journal of Educational Research, 57(3), 292-308.
Gustafsson, J.-E. (1984). A unifying model for the structure of intellectual abilities. Intelligence, 8(3), 179-203. doi: http://dx.doi.org/10.1016/0160-2896(84)90008-4
Gustafsson, J.-E. & Wolff, U. (2015). Measuring fluid intelligence at age four. Intelligence, 50, 175-185. doi: http://dx.doi.org/10.1016/j.intell.2015.04.008
Høie, B., Mykletun, A., Sommerfelt, K., Bjornæs, H., Skeidsvoll, H. & Waaler, P. E. (2005). Seizure-related factors and non-verbal intelligence in children with epilepsy a population-based study from Western Norway. Seizure, 14(4), 223-231.
Høie, B., Mykletun, A., Waaler, P., Skeidsvoll, H. & Sommerfelt, K. (2006). Executive functions and seizure-related factors in children with epilepsy in western Norway. Developmental Medicine & Child Neurology, 48(6), 519-525.
Høie, B., Sommerfelt, K., Waaler, P., Alsaker, F., Skeidsvoll, H. & Mykletun, A. (2006). Psychosocial problems and seizure-related factors in children with epilepsy. Developmental Medicine & Child Neurology, 48(3), 213-219.
Høie, B., Sommerfelt, K., Waaler, P. E., Alsaker, F. D., Skeidsvoll, H. & Mykletun, A. (2008). The combined burden of cognitive, executive function, and psychosocial problems in children with epilepsy: A population-based study. Developmental Medicine and Child Neurology, 50(7), 530-536.
Kvist, A. V. & Gustafsson, J.-E. (2008). The relation between fluid intelligence and the general factor as a function of cultural background: A test of Cattell's Investment theory. Intelligence, 36(5), 422-436. doi: 10.1016/j.intell.2007.08.004
Landmark, M. & Grinde, T. (1962). A group of normal children tested with five intelligence tests. Nordisk Psykologi, 14(4), 171-185.
Lervåg, A., Bråten, I. & Hulme, C. (2009). The cognitive and linguistic foundations of early reading development: A Norwegian latent variable longitudinal study. Developmental Psychology, 45(3), 764-781.
Lervåg, A. & Hulme, C. (2010). Predicting the growth of early spelling skills: Are there heterogeneous developmental trajectories? Scientific Studies of Reading, 14(6), 485-513.
Lord, F. M., Novic, M. R. & Birnbaum, A. (2008). Statistical theories of mental test scores. USA: Information age publishing inc.
Lyster, S.-A. H., Lervåg, A. O. & Hulme, C. (2016). Preschool morphological training produces long-term improvements in reading comprehension. Reading and Writing, 29(6), 1269-1288. doi: http://dx.doi.org/10.1007/s11145-016-9636-x
Marshalek, B., Lohman, D. & Snow, R. (1983). The complexity continuum in the radex and hierarchical models of intelligence. Intelligence, 7(2), 107-127.
McGrew, K. S. (2005). The Cattell-Horn-Carroll Theory of Cognitive Abilities: Past, Present, and Future. I P. Flanagan & P. L. Harrison (Red.), Contemporary Intellectual Assessment: Theories, Tests, and Issues. New York: Guilford press.
Nordberg, A., Dahlgren Sandberg, A. & Miniscalco, C. (2015). Story retelling and language ability in school-aged children with cerebral palsy and speech impairment. International Journal of Language & Communication Disorders / Royal College of Speech & Language Therapists, 50(6), 801-813. doi: http://dx.doi.org/10.1111/1460-6984.12177
Nordberg, A., Miniscalco, C. & Lohmander, A. (2014). Consonant production and overall speech characteristics in school-aged children with cerebral palsy and speech impairment. International Journal of Speech-Language Pathology, 16(4), 386-395.
Nutley, S. B., Darki, F. & Klingberg, T. (2014). Music practice is associated with development of working memory during childhood and adolescence. Frontiers in Human Neuroscience, 7, 926. doi: https://dx.doi.org/10.3389/fnhum.2013.00926
Oakland, T., Douglas, S. & Kane, H. (2016). The top ten standardized tests used with children and youth by school psychologists in 64 countries: A 24 year follow-up study. . Journal of Psychoeducational Assessment, 34, 166-176.
Olsson, L., Ostergren, R. & Traff, U. (2016). Developmental dyscalculia: A deficit in the approximate number system or an access deficit? Cognitive Development, 39, 154-167. doi: http://dx.doi.org/10.1016/j.cogdev.2016.04.006
Pind, J., Gunnarsdóttir, E. K. & Jóhannesson, H. S. (2003). Raven's Standard Progressive Matrices: new school age norms and a study of the test's validity. Personality and Individual Differences, 34(3), 375-386. doi: 10.1016/S0191-8869(02)00058-2
Primi, R. (2001). Complexity of geometric inductive reasoning tasks contribution to the understanding of fluid intelligence. Intelligence, 30(1), 41-70.
Raven, J. (1941). Standardization of progressive matrices, 1938. British Journal of Medical Psychology, 19, 137-150.
Raven, J. (2000a). Psychometrics, cognitive ability, and occupational performance. Review of Psychology, 7(1-2), 51-74.
Raven, J. (2000b). The Raven's Progressive Matrices: Change and Stability over Culture and Time. Cognitive Psychology, 41(1), 1-48.
Raven, J. (2008a). Manual for the coloured progressive matrices and Crichton vocabulary scale (UK utg.). London: Pearson education.
Raven, J. (2008b). Manual for the standard progressive matrices - plus version and Mill Hill vocabulary scale (UK utg.). London: Pearson education.
Samuelsson, S., Finnstrom, O., Flodmark, O., Gaddlin, P.-O., Leijon, I. & Wadsby, M. (2006). A Longitudinal Study of Reading Skills Among Very-Low-Birthweight Children: Is There a Catch-up? Journal of Pediatric Psychology, 31(9), 967-977.
Schmitt, N. (1996). Uses and abuses of coefficient alpha. Psychological assessment, 8(4), 350-353.
Sijtsma, K. (2009). On the Use, the Misuse, and the Very Limited Usefulness of Cronbach's Alpha. Psychometrika, 74(1), 107-120. doi: 10.1007/s11336-008-9101-0
Skagerlund, K. & Traff, U. (2016a). Number processing and heterogeneity of developmental dyscalculia: Subtypes with different cognitive profiles and deficits. Journal of Learning Disabilities, 49(1), 36-50. doi: http://dx.doi.org/10.1177/0022219414522707
Skagerlund, K. & Traff, U. (2016b). Processing of space, time, and number contributes to mathematical abilities above and beyond domain-general cognitive abilities. Journal of Experimental Child Psychology, 143, 85-101. doi: http://dx.doi.org/10.1016/j.jecp.2015.10.016
Solheim, O. J. (2011). The impact of reading self-efficacy and task value on reading comprehension scores in different item formats. Reading Psychology, 32(1), 1-27.
Svensson, I. & Jacobson, C. (2006). How persistent are phonological difficulties? A longitudinal study of reading retarded children. Dyslexia: An International Journal of Research and Practice, 12(1), 3-20.
Söderqvist, S., Nutley, S. B., Ottersen, J., Grill, K. M. & Klingberg, T. (2012). Computerized training of non-verbal reasoning and working memory in children with intellectual disability. Frontiers in Human Neuroscience Vol 6 Oct 2012, ArtID 271.
Thirus, J., Starbrink, M. & Jansson, B. (2016). Relational frame theory, mathematical, and logical skills: A multiple exemplar training intervention to enhance intellectual performance. International Journal of Psychology & Psychological Therapy, 16(2), 141-155.
Träff, U. (2013). The contribution of general cognitive abilities and number abilities to different aspects of mathematics in children (Vol. 116:2, s. 139-156): Journal of experimental child psychology. http://dx.doi.org/10.1016/j.jecp.2013.04.007
Undheim, J. O. (1981). On intelligence I: Broad ability factors in 15-year-old children and Cattell's theory of fluid and crystallized intelligence. Scandinavian Journal of Psychology, 22, 171–179. doi: 10.1111/j.1467-9450.1981.tb00391.x
Undheim, J. O. & Gustafsson, J. E. (1987). The Hierarchical Organization of Cognitive Abilities: Restoring General Intelligence Through the Use of Linear Structural Relations (LISREL). Multivariate Behavioral Research, Vol. 22 (2), 149-171. doi: 10.1207/s15327906mbr2202_2
Vaskinn, A. & Egeland, J. (2012). Testbruksundersøkelsen: En oversikt over tester brukt av norske psykologer. Tidsskrift for norsk psykologforening, 49, 658-665.
Vejleskov, H. (1968). An analysis of Raven matrix responses in fifth grade children: I. Scandinavian Journal of Psychology, 9(3), 177-186.
Wolff, U. & Gustafsson, J.-E. (2015). Structure of phonological ability at age four. Intelligence, 53, 108-117. doi: http://dx.doi.org/10.1016/j.intell.2015.09.003
Wongupparaj, P., Kumari, V. & Morris, R. G. (2015). A Cross-Temporal Meta-Analysis of Raven's Progressive Matrices: Age groups and developing versus developed countries. Intelligence, 49, 1-9. doi: 10.1016/j.intell.2014.11.008
|