Vad är interbedömartillförlitlighet och vilka typer och exempel finns på interbedömartillförlitlighet?
Tillförlitlighet mellan bedömare hänvisar till den nivå som flera bedömare, domare, inspektörer eller värderingsmän är överens om. Flera observatörer involverade i observationsforskning kommer att göra bedömningar om observerade beteenden.
Observatörerna kommer att vara mer oroliga om de kommer överens om ett gemensamt resultat eller inte. Olika inspektörer som observerar för att få resultat kommer att ha olika recensioner.
Det är dock viktigt att nivån av överensstämmelse förbättras eftersom det ökar den interna tillförlitligheten i en studie.
Vad är Inter-Rater Reliability?
Tillförlitlighet mellan bedömare hänvisar till den nivå som flera bedömare, domare, inspektörer eller värderingsmän är överens om. Den mäter överensstämmelsen mellan subjektiva betyg från domare, inspektörer eller värderingsmän.
Låt oss säga att två experter skickades till ett sjukhus för att observera väntetider och utseendet på väntrummen och undersökningsrummen. Om de två experterna som deltar i denna observation är överens om alla punkter, skulle tillförlitligheten mellan bedömare vara perfekt.
Hög tillförlitlighet mellan bedömare betyder att två eller flera bedömarbetyg för samma artikel är konsekventa, medan låg tillförlitlighet indikerar att de är inkonsekventa.
Till exempel granskar domare ofta kvaliteten på akademiska skrivprover genom att betygsätta prestationer från 1-5.
Att komma åt tillförlitlighet mellan bedömare är mycket viktigt för att förstå hur mätsystem sannolikt kommer att felklassificera ett objekt.
Läs också: Vilka är de sociologiska begreppen? (Tips för studenter)
Inter-Rater vs. Intra-Rater Pålitlighet
Tillförlitlighet mellan bedömare hänvisar till den nivå som flera bedömare, domare, inspektörer eller värderingsmän är överens om. Det finns en skillnad mellan tillförlitlighet mellan bedömare och tillförlitlighet mellan bedömare.
När en individ bedömer ett evenemang under en längre tid är det viktigt att de inte är partiska i sina bedömningar.
Lärare förväntas betygsätta varje elevs arbete i enlighet med detta oavsett vilken tid på dygnet eller terminen lektionerna togs. Det definierar tillförlitlighet inom bedömare.
Ett enkelt sätt att kontrollera denna typ av validitet är att använda test-retestdesignen. Samma arbete kommer att presenteras för domaren mer än en gång för att kontrollera om arbetet kommer att få samma poäng.
Typer av tillförlitlighet mellan bedömare
Generellt finns det två enkla metoder för att utvärdera tillförlitlighet mellan bedömare, vilket är procentöverenskommelsen och Cohens Kappa.
Procentavtal
Detta innebär helt enkelt att räkna ihop procentandelen gånger två bedömare kommit överens om. Antalet kommer att variera från 0-100 och när det är närmare 100, desto större överensstämmelse.
Cohens Kappa
Procentavtal och Cohens Kappa är väldigt lika. Den använda formeln tar dock hänsyn till att bedömare ibland kommer att ha en gemensam överenskommelse inom sig själva.
Formeln kommer sannolikt att ge ett tal som sträcker sig från 0 till 1 och ju närmare 1, desto större överensstämmelse.
Exempel på tillförlitlighet mellan bedömare
Tillförlitlighet mellan bedömare mäter överensstämmelsen mellan betyg från flera domare eller bedömare och här är några exempel;
Observationsforskning Moderering
Att observera hur par i ett köpcentrum interagerar när två observatörer bedömer sitt beteende baserat på graden av tillgivenhet eller neutralitet.
Läs också: Koncept och konventioner för redovisning: Allt du behöver veta
Betygsmoderering vid universitetet
Det handlar om att erfarna lärare betygsätter uppsatser från studenter som lämnat in ansökningar om antagning till ett akademiskt program.
Få utomstående expertgranskning av nya prov
Generellt be en matematiklärare med många års erfarenhet att betygsätta svårighetsgraden för frågor i ett nytt prov.
Erfaren och oerfaren professionell som jämför anteckningar
Be även experter inom sjuksköterskeyrket att bedöma prestandan för nya sjuksköterskor som deltar i flera simulerade medicinska nödsituationer.
Erfarna proffs Betyg oerfarna kollegor.
Praktikanter som utför HLR i första hjälpen-kurser och deras prestationer bedöms av erfarna ambulanspersonal.
Mer detaljerade exempel på tillförlitlighet inom bedömare
Flera forskare har tidigare genomfört observationsforskning för att förstå beteenden.
Kodning av lingvistiska mönster för interaktioner mellan föräldrar och barn
Det är viktigt att forskare och utbildare förstår de faktorer som är involverade i språklig utveckling. Att få en bättre förståelse kommer att ge forskare viss insikt i en av de väsentliga färdigheterna i barns utveckling.
God verbal skicklighet spelar en viktig roll för att utmärka sig i akademiker och i allmänhet i livet.
På grund av detta fortsätter många forskare att ägna sig åt detta studieområde. Att observera interaktionen mellan föräldrar och spädbarn har gett mer exakta data genom åren.
För att få resultat kan forskare ha tränat observatörer att observera beteenden nära i hemmen.
När en förälder och ett barn deltar i olika interagerande aktiviteter, kommer deras beteenden att observeras av utbildade observatörer och poäng kommer att registreras.
Forskaren kommer att bedöma tillförlitligheten mellan bedömare av sina betyg för att säkerställa att registrerade poäng är tillförlitliga.
Ainsworth Strange Situations Test
Den berömda amerikansk-kanadensiska utvecklingspsykologen Dr, Mary Ainsworth skapade en labbmetod för att utvärdera anknytningsstilen hos spädbarn.
Ett enkelt sätt att övervaka barnets beteende är att observera allt bakom en tvåvägsspegel. De utbildade observatörerna som sitter bakom tvåvägsspegeln kommer att bedöma barnets agerande när mamman kommer tillbaka.
Att bedöma en domares tillförlitlighet vid en provningstävling
Resultatet av en provningstävling kommer antingen att marknadsföra en produkt eller sätta företag i konkurs.
Eftersom det är så mycket som står på spel vid detta evenemang finns det flera skäl att tvivla på domarnas trovärdighet. Ett enkelt beslut kan påverka försäljningen av en produkt på marknaden.
För att säkerställa att domarna inte är partiska i sina betyg, bjöds en annan panel på fyra domare in att smaka på replikaprover av 30 drycker som deltog i en tävling i Kalifornien.
Cirka 68 domare deltog i färdigställandet varje år och de betygsatte produkterna i samma skala i tävlingen. Endast cirka 10 % av domarna upprepade de betyg de gav under tävlingen.
Läs också: Exempel på institutionell rasism (tips för studenter)
Bandura Bobo Doll Study
Under 1960-talet utfördes en av de mest inflytelserika studierna inom psykologi av den kanadensisk-amerikanske psykologen Dr. Albert Bandura.
Smakämnen studie involverad låter små barn se en video där en vuxen är aggressiv eller icke-aggressiv mot en Bobo-docka.
Barnen fördes till ett separat rum med Bodo-dockan och de observerades noga när de lekte med den.
Bedömning av Synkronsim
Under synkronsimtävlingar granskas och betygsätts prestationerna av en domare. Antalet domare kan vara fler än 20 under en tävling för att utvärdera kvaliteten på rutiner.
Läs också: Exempel på checkar och saldon (tips för studenter)
Hur man beräknar tillförlitlighet mellan bedömare
Det finns flera metoder för att beräkna intrabedömartillförlitlighet, som inkluderar;
- Procentavtal
- Cohens Kappa
- Krippendorffs alfa
- Spearman's Rho
Vanliga frågor
Nedan finns vanliga frågor om exempel på tillförlitlighet mellan bedömare.
Vad är skillnaden mellan test-retest och intra-rater-tillförlitlighet?
Test-retest design och interbedömartillförlitlighet kan kontrollera om en individ kommer att få samma poäng vid olika tidpunkter. Medan testets omtestdesign används för att testa tillförlitligheten hos alla objektivt poängsatta test, testar interbedömarens tillförlitlighet om poängtagaren kommer att ge ett liknande poäng under en subjektiv bedömning.
Vad är interscorers reliability?
I en situation där mer än en person övervakar betyg eller bedömning av människor, är det viktigt att de fattar rätt och liknande beslut.
Interscorers reliability är ett mått på graden av enighet mellan domare.
Slutsats
Tillförlitlighet mellan bedömare hänvisar till den nivå som flera bedömare, domare, inspektörer eller värderingsmän är överens om. Människor kommer att acceptera resultatet av psykologisk forskning eftersom de mestadels förlitar sig på utvärderingen av utbildade observatörer.
Bedömare utbildas ordentligt i vad de ska observera och hur de effektivt klassificerar sina observationer. De måste förstå hur de klassificerar sina observationer innan data samlas in.
Rekommendationer
- 10 fransmäns fysiska egenskaper och egenskaper
- Vilka är exemplen på social ojämlikhet? (Tips för studenter)
- 20 exempel på moral och etik (tips för studenter)
- 45 bästa talangexemplen (tips för studenter)
- De bästa tecknen på att ditt barn behöver undervisning i matematik
Referensprojekt
- Hjälpsamma professorer: 15 Exempel på tillförlitlighet mellan bedömare
- Statistikbyjim: Inter-Rater Reliability: Definition, exempel & bedömning
- Study.com: Vad är Inter-Rater Reliability?
- Link.Springer: Interbedömares tillförlitlighet
- ScienceDirect: Interbedömares överenskommelse och tillförlitlighet mellan bedömare: Nyckelbegrepp, tillvägagångssätt och tillämpningar
- SimplyPsychology: Banduras Bobo Doll Experiment om socialt lärande
Kommentera uppropet