Arviointi on yksi olennainen osa (kielten)opettajan työtä, kuten useissa verkkolehden lokakuun numeron kirjoituksissakin todetaan. Myöskään koulun ulkopuolella ei arvioinnilta voi välttyä: esimerkiksi työelämässä suoriutumistamme arvioidaan koko ajan monin erilaisin mittarein. Työntekijöinä me myös itse joudumme arvioimaan esimerkiksi esimiehemme suoriutumista. Arvioinnista on nykyisin tullut siinä määrin professionaalista toimintaa, että voidaan puhua jopa erillisestä arvioijien ammattikunnasta. Mitä kielitaidon arviointi professiona sitten on ja millaista käyttäytymistä, olemusta ja osaamista ammattitaitoiselta arvioijalta odotetaan? Pohdin näitä kysymyksiä omaan arvioija- ja kouluttajakokemukseeni tukeutuen. Kokemukseni arvioijana on pääasiassa ammatillisesta aikuiskoulutuksesta, Yleisistä kielitutkinnoista sekä kansallisten oppimistulosten arvioinnista. Yleisissä kielitutkinnoissa olen myös kouluttanut arvioijia sekä perehtynyt arvioinnin alalta tehtyyn tutkimukseen.
Arvioinnin lähtökohta: Mitä haluan tietää?
Kaiken arvioinnin lähtökohtana ovat näkemykset siitä, mitä arvioidaan ja mitä johtopäätöksiä tulosten pohjalta on tarkoitus tehdä. Kysymykset voivat vaikuttaa varsin selkeiltä ja yksiselitteisiltä, mutta käytännössä ne usein osoittautuvat todella haasteelliseksi. Olkoon tästä esimerkkinä kaksi monessa suhteessa hyvin erilaista arviointitilannetta: 9-luokkalaisen kielitaidon arviointi kansallisissa oppimistulosten arvioinneissa ja kielitaidon arviointi aikuisten ammatillisissa näyttötutkinnoissa.
Oppimistulosten kansallisella arvioinnilla arvioidaan 9-luokkalaisten kielitaitoa esimerkiksi A-englannissa (ks. lisää Huhta tässä numerossa). Koska kaikkia perusopetuksen päättövaiheessa olevia oppilaita ei kuitenkaan voida arvioida samanaikaisesti, ikäluokasta tehdään mahdollisimman edustava otos, jonka kokeessa menestymisen perusteella pyritään tekemään johtopäätöksiä koko ikäluokan englannin kielen osaamisesta ja oppimistavoitteiden saavuttamisesta perusopetuksen päättövaiheessa. Hyvän osaamisen taso (arvosana 8) on määritelty perusopetuksen opetussuunnitelman perusteissa (POPS 2004) eurooppalaisen viitekehyksen taitotasoasteikolla. Ymmärtämis- ja tuottamistehtävien laadintaan osallistuu kyseistä ikäluokkaa perusopetuksessa opettavia opettajia sekä arvioinnin tutkijoita. Yhdessä he laativat kokeeseen tehtäviä, jotka pyrkivät kattamaan mahdollisimman monipuolisesti opetussuunnitelman sisällöt ja tavoitteet sekä olemaan vaikeustasoltaan erilaisille oppilaille sopivia. Koetehtävät ja suoritusolosuhteet pyritään vakioimaan kaikille osallistujille mahdollisimman yhdenvertaisiksi.
Oppilaiden ymmärtämistaitoja arvioidessaan opettajilla on käytettävissään tarkat pisteitysohjeet mallivastauksineen. Tuottamistaitojen arvioinnin tukena heillä on ns. maamerkkisuorituksia taitotasoasteikon eri tasoilta. Oppimistulosten arvioinnin tarkoituksena on tehdä johtopäätöksiä suomalaisten 9-luokkaisten englannin kielen taidosta yleensä, sekä alueittain, sukupuolittain ja kieliryhmittäin. Arvioinnin tuloksia käytetään opetussuunnitelmien kehittämistyössä, esimerkiksi oppimistavoitteiden ja -sisältöjen tarkistamisessa. Yksittäiset oppilaat eivät kuitenkaan saa tarkempaa palautetta kokonaissuoriutumisestaan. Myöskään opettajille ei anneta tarkkaa tietoa yksittäisten oppilaiden menestymisestä esimerkiksi suhteessa muiden koulujen oppilaiden tuloksiin.
Kielitaidon arviointi aikuisten ammatillisissa näyttötutkinnoissa poikkeaa monessa suhteessa 9-luokkalaisten oppimistulosten arvioinnista. Koska kielitaito pyritään näyttötutkinnoissa arvioimaan osana tutkinnon suorittajan ammattitaitoa, vaihtelevat kielitaidon osoittamisessa käytetyt tehtävät hyvinkin paljon tutkinnon suorittajasta ja työpaikasta riippuen. Kaikilla työpaikoilla ei esimerkiksi ole mahdollista osoittaa toisen kotimaisen kielen osaamista, jollain toisella työpaikalla ruotsin kielen taito voi sen sijaan olla olennainen osa tutkinnossa vaadittavaa osaamista. Toinen keskeinen ero oppimistulosten arviointiin on, että näyttötutkinnoissa tutkinnon suorittajan kielitaitoa ei välttämättä arvioi kieltenopettaja: sen voi arvioida myös työpaikan edustaja tai ammattiaineen opettaja.
Kärjistäen voisi jopa väittää, että näyttötutkinnoissa ei tutkintotilaisuudessa arvioida tutkinnon suorittajan kielitaitoa per se, vaan pikemminkin hänen suoriutumistaan tehtävistä, joissa kielitaidon lisäksi vaaditaan myös muuta osaamista. Arviointikriteereinä käytetään tällöin ensisijaisesti muita kuin puhtaasti kielellisiä kriteereitä: esimerkiksi lääkärin kielitaitoa arvioitaessa yksi arviointikriteeri voi olla potilaskeskeisyys, asiakaspalvelutehtävissä suorituksen joutuisuus. Tutkintotilaisuudessa näyttötehtävät ovat hyvinkin erilaisia eri tutkinnoissa ja samankin tutkinnon suorittajilla eri tutkintotilaisuuksissa (Härmälä 2008). Osaaminen pyritään näyttötutkinnoissa osoittamaan työelämälähtöisesti, eli aidoissa työelämän kielenkäyttötilanteissa, ei erikseen järjestetyissä kielikokeissa. Tehtävien ja tilanteiden pitkälle menevästä ”räätälöinnistä” seuraa, että saatu näyte ei ole yhtä monipuolinen eikä arviointitilanteen ulkopuolelle yleistettävissä kuin edellä kuvatuissa oppimistulosten kansallisissa arvioinneissa. Osaamisesta (myös kielitaidosta) tehtävät johtopäätökset voidaankin ulottaa koskemaan vain kyseistä tilannetta ja tehtävää, eikä tällöin ole perusteltua edes väittää, että tutkinnon suorittajan kielitaito kokonaisuudessaan olisi tämän näytön perusteella esimerkiksi taitotasolla A2.1. Yhden tehtävän suorittamisella annettu näyttö ei ole riittävä tällaisten johtopäätösten tekemiseen.
Miten arvioijan toimintaa voi ennalta yhdenmukaistaa?
Sekä 9-luokkalaisen kielenoppijan että ammatillisen näyttötutkinnon suorittajan kielitaidosta tehtyjen johtopäätösten luotettavuuteen vaikuttaa osaltaan myös arvioijien toiminta. Esimerkiksi oppimistulosten arvioinneissa pyritään ymmärtämistaitojen arvioinnin luotettavuutta lisäämään tarkkojen pisteitysohjeiden avulla. Täysin aukottomia eivät nekään ole, sillä tehtävien laadintavaiheessa ei laatijoiden ole mahdollista täysin ennakoida kaikkia hyväksyttäviä vastausvaihtoehtoja. Tuottamistaidoissa arvioinnin luotettavuus on vieläkin suurempi haaste, sillä arviointi on kriteeriperusteista. Koska arvioijat ovat keskenään erilaisia, he myös tulkitsevat kriteereitä eri lailla ja samakin arvioija voi eri päivinä arvioida lempeämmin tai ankarammin esimerkiksi väsymyksestä johtuen.
Koska tuottamistaitojen arviointi nykyisin on kriteeriperusteista, voidaan arvioijilta edellyttää erityistä koulutusta ja perehtymistä kriteerien käyttöön myös käytännössä. Esimerkiksi Yleisissä kielitutkinnoissa arvioijat osallistuvat ennen Opetushallituksen arvioijarekisteriin pääsemistään heille järjestettyyn arvioijakoulutukseen ja tekevät joukon harjoitusarviointeja. Oleellinen osa arvioijakoulutusta on myös perehtyminen Yleisten kielitutkintojen kielitaitokäsitykseen. Tutkintojen tavoitteena on erilaisten tuottamis- ja ymmärtämistehtävien avulla arvioida sitä, miten luontevasti henkilö selviytyy kielitaitonsa avulla erilaisista arkielämän kielenkäyttötilanteista. Näin ollen tutkinto sijoittuu eräällä tavalla edellä kuvattujen oppimistulosarviointien ja aikuisten näyttötutkintojen välimaastoon, sillä Yleisissä kielitutkinnoissa kielitaitoa arvioidaan useammalla kuin yhdellä tuottamis- ja ymmärtämistehtävällä, joiden laadinnasta vastaavat kielikohtaiset laadintatiimit. Tutkintoon osallistujat suorittavat kulloisenkin tutkintokerran tehtävät eri tutkintopaikoissa, mutta kuitenkin samanaikaisesti ja valvotuissa olosuhteissa. Suoritukset arvioidaan keskitetysti ja tuottamistaitojen arvioinnissa käytetään arviointiasteikkoa, joka on verrannollinen eurooppalaisen viitekehyksen taitotasoasteikkoihin. Tutkintotodistusta käytetään muun muassa työelämässä tarvittavan kielitaidon osoittamiseen, mutta sen antama kuva tutkinnon suorittajan kielitaidosta on siis varsin erilainen kuin ammatillisissa näyttötutkinnoissa.
Arvioijien toimintaa Yleisissä kielitutkinnoissa valvotaan arvioijakoulutuksen jälkeenkin monin eri tavoin. Eri tutkintokertojen suorituksia arvioitaessa arvioijat osallistuvat kielikohtaisiin harjoitusarviointeihin, joissa keskustelemalla pyritään löytämään mahdollisimman yhdenmukainen käsitys kulloinkin arvioitavana olevasta suorituksesta. Arvioijat myös saavat jatkuvaa palautetta siitä, miten johdonmukaisesti ja yhdenmukaisesti he arvioivat suorituksia sekä yksilönä että suhteessa muihin arvioijiin.
Miten kuvaan osaamista: yksi vai useampi asteikko?
Edellisissä esimerkeissä kuvailtiin jo sitä, miten erilaisten arviointitapojen käyttäminen vaikuttaa tehtyihin johtopäätöksiin. Kriteeriperustaiseen arviointiin on olemassa monia, eri tilanteisiin ja erilaisille käyttäjille laadittuja asteikkoja. Meillä tunnetuin on eittämättä eurooppalainen viitekehys. Eurooppalaisen viitekehyksen myötä arvioinnin yhteismitallisuus ja läpinäkyvyys ovat lisääntyneet, mutta eräänlainen ”kaikkien samaan muottiin puristaminen” ei välttämättä ole vain hyvä asia. Esimerkiksi ammatillisessa koulutuksessa viitekehyksen soveltaminen ei ole ongelmatonta, sillä viitekehyksessä ei ole varsinaisesti ammatillisen kielitaidon arviointiin soveltuvia kuvaimia. Tästä johtuen erityisiä ammatillisen kielitaidon arviointiin soveltuvia arviointiasteikkoja onkin kehitelty erityisesti ammattikorkeakouluissa (ks. esim. Huhta 2010). Viitekehyksen kuvaimien riittämättömyys myös eri tekstityyppejä sisältävien suoritusten arviointiin lisää arvioinnin subjektiivisuutta ja arviointiasteikon ulkopuolisiin kriteereihin tukeutumista (Toropainen, Lahtinen & Härmälä 2012, tulossa).
Kun arvioijien omat piilokriteerit ja ns. mututuntuma alkavat vaikuttaa arviointiin, sen luotettavuus vaarantuu. Kielitaidon kuvaaminen monen, useasta eri maasta tulevan arvioijan jaettuun kielitaitokäsitykseen perustuen onkin ollut yksi eurooppalaisen viitekehyksen kantavista voimista. Suomessa viitekehyksen käyttöönottoa eri koulutusasteilla on perusteltu koulutuksellisen jatkumon ja arvioinnin läpinäkyvyyden lisääntymisellä.
Kielitaidon arvioijana ja arvioinnista lukuisia koulutuksia eri kouluasteiden kieltenopettajille pitäneenä on minusta edelleen varsin yllättävää huomata, että vaikka taitotasoajattelu on Euroopan laajuisesti ollut käytössä jo yli 10 vuotta, tavalliselle riviopettajalle viitekehysasteikko on yhä edelleen varsin vieras ja päivittäisestä opetustyöstä irrallaan oleva työkalu. Suurin osa opettajista kertoo myös saaneensa vain vähän tai ei ollenkaan koulutusta asteikon käyttöön ja soveltamiseen. Ongelma korostuu varsinkin pienissä kouluissa, joissa on ehkä vain yksi kieltenopettaja, eikä hänellä siksi ole omassa koulussaan mahdollisuutta keskustella muiden kielitaitoa arvioivien henkilöiden kanssa. Erilaisissa koulutustilaisuuksissa olenkin huomannut, että kielten opettajat kaipaisivat pitkäkestoisempaa, suoritusten arviointia viitekehyksen taitotasoasteikolla sisältävää koulutusta huomattavasti enemmän kuin sitä on nykyisin tarjolla. Toisaalta olen myös havainnut, että vaikka koulutusta tarjotaan, niin kaikilla opettajilla ei ole mahdollisuutta siihen osallistua, esimerkiksi koulutusmäärärahojen vähäisyyden tai sijaisjärjestelyjen vuoksi.
Miten laadin uskottavan arvioinnin?
Arviointikriteerien yhdenmukainen tulkinta on yksi luotettavan arvioinnin perusedellytyksistä. Myös muita arvioinnin luotettavuuteen vaikuttavia tekijöitä, kuten arvioinnin kohteen määrittelyä, arvioinnin vaikuttavuutta sekä arvioinnin tuloksista tehtyjä johtopäätöksiä olen myös tässä artikkelissani sivunnut. Erilaisista arviointitilanteista poimittujen esimerkkien avulla olen pyrkinyt osoittamaan, ettei kielitaidon arvioijana toimiminen ole helppo eikä yksinkertainen tehtävä. Arviointia voikin oikeutetusti pitää professiona, jossa osaamisen kehittymistä voi hahmottaa myös noviisi-ekspertti -akselilla. Pohjimmiltaan lienee kyse eräänlaisesta arvioijan eetoksesta, eli siitä, miten hyvin hän saa arvioinnin eri osapuolet vakuuttuneeksi uskottavuudestaan arvioijana.
Uskottavuus puolestaan on monen tekijän yhteisvaikutusta. Erityisen tärkeää on arvioijan omakohtainen kokemus siitä tilanteesta, mihin hänen arviointinsa kohdistuu. Jos en esimerkiksi koskaan ole työskennellyt kaupan kassana, niin miten luotettavasti osaisin arvioida hänen tarvitsemaansa kielitaitoa? Käytännön kokemuksen lisäksi tarvitaan arviointiteorioiden tuntemusta, jotta voi paremmin ymmärtää miten monitasoisesta ja monisyisestä prosessista arvioinnissa on kyse. Arvioinnissa, kuten niin monessa muussakin asiassa, kaikki vaikuttaa kaikkeen ja usein vaikutukset voivat olla ennalta arvaamattomia. Erityisesti silloin on tärkeää eräänlainen ”tuhojen minimointi”: mitä saamieni tulosten pohjalta voin ylipäätään väittää ja millaiseen evidenssiin johtopäätökseni perustan? Arvioinnin eri osapuolten tyytyväisyys ja tasapuolinen kohtelu vaikuttavat pitkälti siihen, miten uskottavana koko prosessi lopputuloksineen heille näyttäytyy.
Kirjoittaja on projektisuunnittelijana Opetushallituksessa vieraiden kielten ja A-ruotsin oppimistulosten kansallisissa arvioinneissa.
Lähteet
Huhta, M. 2010. Language for professional purposes: needs analysis methods in industry and business and their yield to stakeholders. Helsinki University of Technology, Department of Industrial Engineering and Management.
Härmälä, M. 2008. Riittääkö Ett ögonblick näytöksi merkonomilta edellytetystä kielitaidosta? Kielitaidon arviointi aikuisten näyttötutkinnoissa. Jyväskylän yliopisto: Jyväskylä Studies in Humanities 101.
POPS, 2014. Perusopetuksen opetussuunnitelman perusteet. Opetushallitus: Helsinki.
Toropainen, O., Lahtinen, S. & Härmälä, M. 2012 (tulossa). Yhdet kriteerit, kaksi eri tilannetta: L1- ja L2-kirjoittajien tuotosten kriteeripohjaisen arvioinnin haasteita. AFinLA-e, Soveltavan kielitieteen tutkimuksia.