De onderzoekers van het SCP hebben op basis van onder meer de scores op de Eindtoets van Cito de conclusie getrokken dat de resultaten van het basisonderwijs niet beter zijn geworden. Vervolgens is een discussie ontstaan over de vraag of het eigenlijk wel mogelijk is om op basis van Eindtoetsscores uitspraken te doen over het onderwijsniveau. In die discussie worden beweringen gedaan over de Eindtoetsscore die niet juist zijn. Cito legt graag uit hoe die score tot stand komt.
Misverstand
Het grote misverstand is dat Cito de gemiddelde score van de Eindtoets vooraf al vaststelt op 535. En dat vervolgens de leerlingen rondom dat gemiddelde verdeeld worden. Als je hiervan uitgaat, dan klopt het dat je aan de uitslag van de Eindtoets geen conclusies kunt verbinden op onderwijsniveau. Maar dit is niet het geval.
Wat is wel waar?
De gemiddelde score van de Eindtoets wordt elk jaar opnieuw berekend op basis van het aantal opgaven dat correct beantwoord werd door de leerlingen die dat jaar de toets maakten. Bij de totstandkoming van de score wordt dus niet gemikt op een gemiddelde van 535 of welke standaardscore dan ook. Omdat de Eindtoets elk jaar volledig uit nieuwe opgaven bestaat, kan de moeilijkheid van de toets van jaar tot jaar iets variëren. Deze variaties in moeilijkheid zijn echter zeer klein. Alle opgaven hebben twee keer in een proefafname meegedraaid voor ze in de Eindtoets terechtkomen. We weten dus al vooraf hoe moeilijk elke opgave is en we zorgen ervoor dat de toets elk jaar ongeveer evenveel makkelijke als moeilijke opgaven bevat. Maar zoals gezegd: de Eindtoets is niet elk jaar precies even moeilijk. Bij het berekenen van de scores houdt Cito daar rekening mee. In een ‘makkelijk’ jaar moet je een paar opgaven méér goed hebben dan in een ‘moeilijk’ jaar om dezelfde standaardscore te halen. Vergelijk het met een schaatswedstrijd, waarbij de ene schaatser op een buitenbaan schaatst en de andere binnen. De resultaten kunnen niet zonder meer met elkaar vergeleken worden. Om de resultaten toch vergelijkbaar te maken wordt gebruikgemaakt van een bepaalde statistische methode, equivaleren genoemd. We gebruiken deze equivaleringsmethode om de toetsen van verschillende jaren te vergelijken. Hierdoor is het prestatieniveau dat hoort bij een score van bijvoorbeeld 538 in een bepaald jaar vergelijkbaar met de score 538 in een ander jaar. In de praktijk blijkt dat de afgelopen jaren het landelijk gemiddelde schommelde om en nabij de score 535. Dit is dus een aanwijzing dat het niveau in die jaren niet is veranderd.
Conclusie op basis van Eindtoetsscore
Dit betekent niet dat op basis van alleen de Eindtoetsscore de conclusie getrokken kan worden dat het onderwijsniveau gelijk is gebleven. Ten eerste meet de Eindtoets alleen vaardigheden op het gebied van taal, rekenen en studievaardigheden. Ten tweede weten we niet zeker of de deelnemers aan de Eindtoets in twee opeenvolgende jaren even goed de Nederlandse schoolbevolking in groep 8 vertegenwoordigen. Elk jaar weer haken er scholen (even) af en komen er nieuwe scholen als deelnemer bij. Omdat de deelnemersgroepen dus van jaar tot jaar niet volstrekt vergelijkbaar zijn, kunnen we geen harde uitspraken doen over een daling of stijging van de gemiddelde vaardigheid die door de Eindtoets wordt gemeten. In het onderzoek van SCP wordt niet alleen verwezen naar de Eindtoetsscore, maar onder meer ook naar PPON (Periodieke Peiling van het Onderwijsniveau, waarbij niet alleen taal en rekenen wordt onderzocht, maar ook andere vakken zoals biologie, aardrijkskunde en burgerschap) en JPON (Jaarlijks Peilingonderzoek van het Onderwijsniveau taal en rekenen). Uit deze peilingen is gebleken dat in de afgelopen twintig jaar het onderwijsniveau van de gemeten vakken niet is gedaald, maar ook niet is gestegen.