10 exempel på tillförlitlighet mellan bedömare (tips för studenter)

Vad är interbedömartillförlitlighet och vilka typer och exempel finns på interbedömartillförlitlighet?

Tillförlitlighet mellan bedömare hänvisar till den nivå som flera bedömare, domare, inspektörer eller värderingsmän är överens om. Flera observatörer involverade i observationsforskning kommer att göra bedömningar om observerade beteenden.

Observatörerna kommer att vara mer oroliga om de kommer överens om ett gemensamt resultat eller inte. Olika inspektörer som observerar för att få resultat kommer att ha olika recensioner.

Det är dock viktigt att nivån av överensstämmelse förbättras eftersom det ökar den interna tillförlitligheten i en studie.

Exempel på tillförlitlighet mellan bedömare

Vad är Inter-Rater Reliability?

Tillförlitlighet mellan bedömare hänvisar till den nivå som flera bedömare, domare, inspektörer eller värderingsmän är överens om. Den mäter överensstämmelsen mellan subjektiva betyg från domare, inspektörer eller värderingsmän.

Låt oss säga att två experter skickades till ett sjukhus för att observera väntetider och utseendet på väntrummen och undersökningsrummen. Om de två experterna som deltar i denna observation är överens om alla punkter, skulle tillförlitligheten mellan bedömare vara perfekt.

Hög tillförlitlighet mellan bedömare betyder att två eller flera bedömarbetyg för samma artikel är konsekventa, medan låg tillförlitlighet indikerar att de är inkonsekventa.

Till exempel granskar domare ofta kvaliteten på akademiska skrivprover genom att betygsätta prestationer från 1-5.

Att komma åt tillförlitlighet mellan bedömare är mycket viktigt för att förstå hur mätsystem sannolikt kommer att felklassificera ett objekt.

Läs också: Vilka är de sociologiska begreppen? (Tips för studenter)

Inter-Rater vs. Intra-Rater Pålitlighet

Tillförlitlighet mellan bedömare hänvisar till den nivå som flera bedömare, domare, inspektörer eller värderingsmän är överens om. Det finns en skillnad mellan tillförlitlighet mellan bedömare och tillförlitlighet mellan bedömare.

När en individ bedömer ett evenemang under en längre tid är det viktigt att de inte är partiska i sina bedömningar.

Lärare förväntas betygsätta varje elevs arbete i enlighet med detta oavsett vilken tid på dygnet eller terminen lektionerna togs. Det definierar tillförlitlighet inom bedömare.

Ett enkelt sätt att kontrollera denna typ av validitet är att använda test-retestdesignen. Samma arbete kommer att presenteras för domaren mer än en gång för att kontrollera om arbetet kommer att få samma poäng.

Typer av tillförlitlighet mellan bedömare

Generellt finns det två enkla metoder för att utvärdera tillförlitlighet mellan bedömare, vilket är procentöverenskommelsen och Cohens Kappa.

Procentavtal

Detta innebär helt enkelt att räkna ihop procentandelen gånger två bedömare kommit överens om. Antalet kommer att variera från 0-100 och när det är närmare 100, desto större överensstämmelse.

Cohens Kappa

Procentavtal och Cohens Kappa är väldigt lika. Den använda formeln tar dock hänsyn till att bedömare ibland kommer att ha en gemensam överenskommelse inom sig själva.

Formeln kommer sannolikt att ge ett tal som sträcker sig från 0 till 1 och ju närmare 1, desto större överensstämmelse.

Exempel på tillförlitlighet mellan bedömare

Tillförlitlighet mellan bedömare mäter överensstämmelsen mellan betyg från flera domare eller bedömare och här är några exempel;

Observationsforskning Moderering

Att observera hur par i ett köpcentrum interagerar när två observatörer bedömer sitt beteende baserat på graden av tillgivenhet eller neutralitet.

Läs också: Koncept och konventioner för redovisning: Allt du behöver veta

Betygsmoderering vid universitetet

Det handlar om att erfarna lärare betygsätter uppsatser från studenter som lämnat in ansökningar om antagning till ett akademiskt program.

Få utomstående expertgranskning av nya prov

Generellt be en matematiklärare med många års erfarenhet att betygsätta svårighetsgraden för frågor i ett nytt prov.

Erfaren och oerfaren professionell som jämför anteckningar

Be även experter inom sjuksköterskeyrket att bedöma prestandan för nya sjuksköterskor som deltar i flera simulerade medicinska nödsituationer.

Erfarna proffs Betyg oerfarna kollegor.

Praktikanter som utför HLR i första hjälpen-kurser och deras prestationer bedöms av erfarna ambulanspersonal.

Mer detaljerade exempel på tillförlitlighet inom bedömare

Flera forskare har tidigare genomfört observationsforskning för att förstå beteenden.

Kodning av lingvistiska mönster för interaktioner mellan föräldrar och barn

Det är viktigt att forskare och utbildare förstår de faktorer som är involverade i språklig utveckling. Att få en bättre förståelse kommer att ge forskare viss insikt i en av de väsentliga färdigheterna i barns utveckling.

God verbal skicklighet spelar en viktig roll för att utmärka sig i akademiker och i allmänhet i livet.

På grund av detta fortsätter många forskare att ägna sig åt detta studieområde. Att observera interaktionen mellan föräldrar och spädbarn har gett mer exakta data genom åren.

För att få resultat kan forskare ha tränat observatörer att observera beteenden nära i hemmen.

När en förälder och ett barn deltar i olika interagerande aktiviteter, kommer deras beteenden att observeras av utbildade observatörer och poäng kommer att registreras.

Forskaren kommer att bedöma tillförlitligheten mellan bedömare av sina betyg för att säkerställa att registrerade poäng är tillförlitliga.

Ainsworth Strange Situations Test

Den berömda amerikansk-kanadensiska utvecklingspsykologen Dr, Mary Ainsworth skapade en labbmetod för att utvärdera anknytningsstilen hos spädbarn.

Ett enkelt sätt att övervaka barnets beteende är att observera allt bakom en tvåvägsspegel. De utbildade observatörerna som sitter bakom tvåvägsspegeln kommer att bedöma barnets agerande när mamman kommer tillbaka.

Att bedöma en domares tillförlitlighet vid en provningstävling

Resultatet av en provningstävling kommer antingen att marknadsföra en produkt eller sätta företag i konkurs.

Eftersom det är så mycket som står på spel vid detta evenemang finns det flera skäl att tvivla på domarnas trovärdighet. Ett enkelt beslut kan påverka försäljningen av en produkt på marknaden.

För att säkerställa att domarna inte är partiska i sina betyg, bjöds en annan panel på fyra domare in att smaka på replikaprover av 30 drycker som deltog i en tävling i Kalifornien.

Cirka 68 domare deltog i färdigställandet varje år och de betygsatte produkterna i samma skala i tävlingen. Endast cirka 10 % av domarna upprepade de betyg de gav under tävlingen.

Läs också: Exempel på institutionell rasism (tips för studenter)

Bandura Bobo Doll Study

Under 1960-talet utfördes en av de mest inflytelserika studierna inom psykologi av den kanadensisk-amerikanske psykologen Dr. Albert Bandura.

Smakämnen studie involverad låter små barn se en video där en vuxen är aggressiv eller icke-aggressiv mot en Bobo-docka.

Barnen fördes till ett separat rum med Bodo-dockan och de observerades noga när de lekte med den.

Bedömning av Synkronsim

Under synkronsimtävlingar granskas och betygsätts prestationerna av en domare. Antalet domare kan vara fler än 20 under en tävling för att utvärdera kvaliteten på rutiner.

Läs också: Exempel på checkar och saldon (tips för studenter)

Hur man beräknar tillförlitlighet mellan bedömare

Det finns flera metoder för att beräkna intrabedömartillförlitlighet, som inkluderar;

Procentavtal
Cohens Kappa
Krippendorffs alfa
Spearman's Rho

Vanliga frågor

Nedan finns vanliga frågor om exempel på tillförlitlighet mellan bedömare.

Vad är skillnaden mellan test-retest och intra-rater-tillförlitlighet?

Test-retest design och interbedömartillförlitlighet kan kontrollera om en individ kommer att få samma poäng vid olika tidpunkter. Medan testets omtestdesign används för att testa tillförlitligheten hos alla objektivt poängsatta test, testar interbedömarens tillförlitlighet om poängtagaren kommer att ge ett liknande poäng under en subjektiv bedömning.

Vad är interscorers reliability?

I en situation där mer än en person övervakar betyg eller bedömning av människor, är det viktigt att de fattar rätt och liknande beslut.

Interscorers reliability är ett mått på graden av enighet mellan domare.

Slutsats

Tillförlitlighet mellan bedömare hänvisar till den nivå som flera bedömare, domare, inspektörer eller värderingsmän är överens om. Människor kommer att acceptera resultatet av psykologisk forskning eftersom de mestadels förlitar sig på utvärderingen av utbildade observatörer.

Bedömare utbildas ordentligt i vad de ska observera och hur de effektivt klassificerar sina observationer. De måste förstå hur de klassificerar sina observationer innan data samlas in.

Rekommendationer

Referensprojekt

Hjälpsamma professorer: 15 Exempel på tillförlitlighet mellan bedömare
Statistikbyjim: Inter-Rater Reliability: Definition, exempel & bedömning
Study.com: Vad är Inter-Rater Reliability?
Link.Springer: Interbedömares tillförlitlighet
ScienceDirect: Interbedömares överenskommelse och tillförlitlighet mellan bedömare: Nyckelbegrepp, tillvägagångssätt och tillämpningar
SimplyPsychology: Banduras Bobo Doll Experiment om socialt lärande