Klassisk testteori

Klassisk testteori

En test er en vitenskapelig instrument I den grad den måler det den har til hensikt, det vil si at det er gyldig, og det måler godt, det vil si at det er nødvendig eller pålitelig. Hvis vi finner et instrument som vi ikke kan stole på tiltakene de gir, siden de varierer fra en gang til et annet når vi måler det samme objektet, vil vi si at det ikke er pålitelig. Et instrument, for å måle riktig Noe, det må være presist, for hvis ikke, måle hvilket mål, det vil måle det dårlig. Derfor er det å være nødvendig en nødvendig, men ikke tilstrekkelig tilstand. I tillegg må det være gyldig, det vil si hvilke tiltak med presisjon vil være det som er ment å måle, og ingenting annet.

Du kan også være interessert: varesvarteori - applikasjoner og tester

Pålitelighet:

Absolutt og relativ pålitelighet: Vi kan ta opp problemet med pålitelighet av en test på to forskjellige måter, selv om det er i tilfeldig bakgrunn.

Pålitelighet som unøyaktigheten av dets tiltak: Når et emne reagerer på en test oppnår en empirisk poengsum, noe som påvirkes av en feil. Hvis det ikke var noen feil, ville emnet få hans sanne poengsum. Testen er unøyaktig fordi den empiriske poengsum ikke samsvarer med den autentiske sanne poengsummen. Denne forskjellen mellom begge score er prøvefeilen, målefeilen. Han Typisk målefeil være Det typiske avviket av målefeil. Han Typisk målefeil Indikerer den absolutte presisjonen til testen, siden den tillater estimering av forskjellen mellom det oppnådde tiltaket og det som ville oppnås hvis det ikke var noen feil.

Pålitelighet som stabiliteten til tiltakene: En test vil være mer pålitelig, desto mer konstant eller stabil er resultatene de gir når de gjentas opprettholdes. Jo mer stabile resultatene er to ganger, jo større er korrelasjonen mellom dem. Denne korrelasjonen kalles Pålitelighetskoeffisient. Dette uttrykker oss, ikke feilmengden, men selve testen og beviset på informasjonen den tilbyr. Han Pålitelighetskoeffisient uttrykker testens relative pålitelighet.

Pålitelighetskoeffisienten og pålitelighetsindeksen: - Pålitelighetskoeffisienten av en test er korrelasjonen av selve testen, oppnådd for eksempel, i to parallelle former: RXX. - Presisjonsindeksen Det er sammenhengen mellom de empiriske score for en test og dens sanne score: RXV Presisjonsindeksen vil alltid være større enn pålitelighetskoeffisienten for å finne ut pålitelighetskoeffisienten er å fremheve disse tre klassiske metodene:

  • Å finne sammenhengen mellom testen og dens repetisjon: repetisjonsmetoden eller test-retest-metoden: den består i å anvende den samme testen på samme gruppe to ganger, og korrelasjonen mellom de to serien av score beregnes. Denne korrelasjonen er pålitelighetskoeffisienten. Denne metoden gir vanligvis en høyere pålitelighetskoeffisient enn de som er oppnådd ved andre prosedyrer, og kan være forurenset av de urovekkende faktorene.
  • Finn korrelasjonen mellom to parallelle former for testen: metoden for parallelle former: to parallelle former av samme test er utarbeidet, det vil si to tilsvarende former som gir samme informasjon, og gjelder samme gruppe av forsøkspersoner. Korrelasjonen mellom de to formene er pålitelighetskoeffisienten. Med denne metoden gjentas den samme testen ikke, unngås de urovekkende kildene til re-test-påliteligheten.
  • Finn korrelasjonen mellom to parallelle halvdeler av testen: metoden for de to halvdelene: Testen er delt inn i to ekvivalente halvdeler og korrelasjonen mellom dem er funnet. Det er den foretrukne metoden, siden den er enkel og unngår begrensningene i de tidligere prosedyrene. Du kan velge de rare elementene i testen, for å utgjøre den ene halvparten, og de jevn elementene for å utgjøre den andre.

Pålitelighetskoeffisienten og korrelasjonen mellom parallelle tester

Han Pålitelighetskoeffisient av en test indikerer andelen at den sanne variansen er av den empiriske variansen: Graph33 Pålitelighetskoeffisienten til en test varierer mellom 0 og 1 . For eksempel: Hvis korrelasjonen mellom to parallelle tester er RXX´ = 0'80, betyr det at 80% av variansen til testen skyldes det autentiske tiltaket, og resten, det vil si 20% av variansen til Test skyldes feil. Han Pålitelighetsindeks av en test er sammenhengen mellom dens empiriske score og dens sanne score indeks pålitelighet = pålitelighetsindeksen er lik kvadratroten til pålitelighetskoeffisienten

Når to parallelle former for en test er utdypet, blir variansanalyseprosedyren for å verifisere homogeniteten til variansene og forskjellen mellom tiltakene anvendt. Hvis avvikene er homogene, er forskjellen mellom strømpene ikke signifikant og de to formene er bygget med samme antall elementer av samme type og psykologisk innhold, kan det bekreftes at de er parallelle. Hvis ikke, må du reformere dem til de er. Fraværet av pålitelighet identifiseres med verdien RXX´ = 0 4.- Den typiske målefeilen: forskjellen mellom empirisk og ekte poengsum er den tilfeldige feilen, kalt målefeil. Det typiske avviket for målefeil kalles den typiske målefeilen. Han Typisk målefeil tillater estimater om testens absolutte pålitelighet, det vil si å estimere hvor mye målefeil som påvirker en poengsum.

Pålitelighet og lengde: Testens lengde refererer til antall elementer. Denne lengden avhenger av din pålitelighet. Hvis en test består av tre elementer, kan et emne oppnå en poengsum på 1 og en annen, eller i en parallell form, en poengsum på

Fra en anledning til en annen har poengsummen variert et poeng; Et poeng over tre er en variasjon på 33%, en høy variasjon. Hvis forsøkspersonene oppnår tilfeldige variasjoner av denne typen, vil korrelasjonen av selve testen eller den for de to parallelle formene for testen, være sterkt redusert og kan ikke være høy. Hvis testen er mye lengre, hvis den for eksempel har 100 elementer, kan et emne få 70 poeng ved en anledning og 67 i en parallell form. Om igjen har det variert 3 poeng; Det er en relativt liten varians i forhold til den totale testen, spesielt 3%. Disse små tilfeldige endringene av denne størrelsesorden, som forekommer i forsøkspersonene, når de går på en måte til parallellen, er relativt uviktige og vil ikke avta så mye som før korrelasjonen mellom de to.

Pålitelighetskoeffisienten vil være mye større enn i forrige tilfelle. Den spydbrune ligningen uttrykker forholdet mellom pålitelighet og lengde. Nøyaktigheten til en test er ugyldig når lengden er 0, og den øker når lengden øker. Selv om økningen er relativt lavere, da lengden er lagt er større. Dette betyr at presisjonen vokser mye i begynnelsen og relativt mindre etter. Når lengden har en tendens til uendelig, har pålitelighetskoeffisienten en tendens til

Ved å øke lengden på en test øker presisjonen fordi den sanne variansen øker med en høyere hastighet enn feilvariansen. Dette betyr at presisjonen til testen øker fordi andelen av variansen på grunn av feil reduseres. Rulon -formelen, så vel som Flanagan- og Guttman -formelen, er spesielt anvendelig når pålitelighetskoeffisienten beregnes med de to halvdelene. Dette er formler som brukes til beregning av pålitelighetskoeffisienten.

Pålitelighet og konsistens: Pålitelighetskoeffisienten kan også finnes på en annen måte, det er den så -kalt alfakoeffisient enten Generaliserbarhetskoeffisient eller representativitet (Cronbach). Denne alfakoeffisienten indikerer presisjonen som noen gjenstander måler et aspekt av personlighet eller atferd. Det kan tolkes som: et estimat av den gjennomsnittlige korrelasjonen av alle mulige elementer i et visst aspekt. Et mål på testens presisjon basert på dens sammenheng eller indre konsistens (sammenheng mellom elementene; i hvilken grad elementene i testen måler det samme) og dens lengde. Som indikerer testens representativitet, det vil si mengden hvor utvalget av elementer som komponerer den er representativ for befolkningen av mulige elementer av samme type og psykologisk innhold. Han alfakoeffisient reflekterer hovedsakelig to grunnleggende konsepter i presisjonen til en test: 1. Sammenhengen mellom elementene: i hvilken grad alle måler det samme godt.

Lengden på testen: Ved å øke antall tilfeller av en prøve, og hvis systematiske feil elimineres, representerer prøven bedre populasjonen som blir trukket ut og er mer usannsynlig å gripe inn den tilfeldige feilen. Hvis elementene i testen er dikotomikk, (ja eller nei, 1 eller 0, enighet eller uenighet osv.), Forenkles alfakoeffisienten Kuder-Richardson (KR20 og KR21). Gitt et visst antall elementer, vil en test være desto mer pålitelig, desto mer homogen. Alfakoeffisienten indikerer påliteligheten så snart den representerer homogenitet og sammenheng eller intern konsistens av elementene i en test.

Pålitelighetsstandarder og kriterier

I henhold til rommet for å prøve rommet er målet med testen å estimere tiltaket som ville bli oppnådd hvis alle elementene i prøveområdet ble brukt. Dette tiltaket vil være den sanne poengsummen, som de virkelige tiltakene nærmer seg mer eller mindre. I henhold til i hvilken grad et utvalg av elementer korrelerer med ekte score, er testen mer eller mindre pålitelig. I denne modellen er korrelasjonsmatrisen mellom alle elementene i prøveområdet sentralt.Denne prøvemodellen insisterer mer direkte på intern konsistens, og i den grad den oppnår den, garanterer den indirekte stabilitet.

Den lineære modellen for de parallelle testene insisterer mer på scoreens stabilitet, og i den grad den oppnår stabilitet, favoriserer indirekte intern konsistens. Hvis vi bruker en test for å etablere individuelle diagnoser og prognoser, må pålitelighetskoeffisienten være 0,90 opp. I kollektive prognoser og klassifiseringer er ikke etterspørselen slik.

Noen ganger, i en viss type tester, for eksempel personlighet, er det vanskelig å oppnå koeffisienter på mer enn 0'70. Hvis parallelle former, eller parallelle halvdeler blir brukt, etter et mer eller mindre stort intervall, kan tilfeldige feil være flere enn de som påvirker alfa -koeffisienten. Dette er fordi det som reduserer korrelasjonen ikke bare er de tilfeldige feilene iboende for testen og ved en enkelt anledning, som er de som tar hensyn til alfa -koeffisienten, men også påvirker alle feilene som kan komme fra de to forskjellige situasjonene, som kan variere i mange detaljer. Derfor er alfa -koeffisienten vanligvis større enn de andre koeffisientene.

Med unntak av koeffisienten funnet ved repetisjon av den samme testen, siden det er mer sannsynlig at de tilfeldige feilene i den første applikasjonen gjentas i den andre, og i stedet for å redusere korrelasjonen mellom de to, øker de den. Det må sikres at den andre applikasjonen er helt uavhengig av den første. Hvis vi oppnår dette, vil dette være den enkleste og mest økonomiske og tilrådelige metoden når du prøver å sette pris på stabiliteten i poengsummen, spesielt i lange perioder og med komplekse tester. > Neste: gyldigheten av testene

Denne artikkelen er bare informativ, i psykologi-online har vi ingen makt til å stille en diagnose eller anbefale en behandling. Vi inviterer deg til å gå til en psykolog for å behandle din spesielle sak.

Hvis du vil lese flere artikler som ligner på Klassisk testteori, Vi anbefaler at du går inn i vår kategori av eksperimentell psykologi.