Increase of Item Response Consistency By Prior Item Response

1973 ◽  
Vol 33 (1) ◽  
pp. 113-121 ◽  
Author(s):  
Daniel S.P. Schubert ◽  
Donald W. Fiske
2020 ◽  
Vol 63 (6) ◽  
pp. 1916-1932 ◽  
Author(s):  
Haiying Yuan ◽  
Christine Dollaghan

Purpose No diagnostic tools exist for identifying social (pragmatic) communication disorder (SPCD), a new Diagnostic and Statistical Manual of Mental Disorders, Fifth Edition category for individuals with social communication deficits but not the repetitive, restricted behaviors and interests (RRBIs) that would qualify them for a diagnosis of autism spectrum disorder (ASD). We explored the value of items from a widely used screening measure of ASD for distinguishing SPCD from typical controls (TC; Aim 1) and from ASD (Aim 2). Method We applied item response theory (IRT) modeling to Social Communication Questionnaire–Lifetime ( Rutter, Bailey, & Lord, 2003 ) records available in the National Database for Autism Research. We defined records from putative SPCD ( n = 54), ASD ( n = 278), and TC ( n = 274) groups retrospectively, based on National Database for Autism Research classifications and Autism Diagnostic Interview–Revised responses. After assessing model assumptions, estimating model parameters, and measuring model fit, we identified items in the social communication and RRBI domains that were maximally informative in differentiating the groups. Results IRT modeling identified a set of seven social communication items that distinguished SPCD from TC with sensitivity and specificity > 80%. A set of five RRBI items was less successful in distinguishing SPCD from ASD (sensitivity and specificity < 70%). Conclusion The IRT modeling approach and the Social Communication Questionnaire–Lifetime item sets it identified may be useful in efforts to construct screening and diagnostic measures for SPCD.


2020 ◽  
Vol 63 (11) ◽  
pp. 3877-3892
Author(s):  
Ashley Parker ◽  
Candace Slack ◽  
Erika Skoe

Purpose Miniaturization of digital technologies has created new opportunities for remote health care and neuroscientific fieldwork. The current study assesses comparisons between in-home auditory brainstem response (ABR) recordings and recordings obtained in a traditional lab setting. Method Click-evoked and speech-evoked ABRs were recorded in 12 normal-hearing, young adult participants over three test sessions in (a) a shielded sound booth within a research lab, (b) a simulated home environment, and (c) the research lab once more. The same single-family house was used for all home testing. Results Analyses of ABR latencies, a common clinical metric, showed high repeatability between the home and lab environments across both the click-evoked and speech-evoked ABRs. Like ABR latencies, response consistency and signal-to-noise ratio (SNR) were robust both in the lab and in the home and did not show significant differences between locations, although variability between the home and lab was higher than latencies, with two participants influencing this lower repeatability between locations. Response consistency and SNR also patterned together, with a trend for higher SNRs to pair with more consistent responses in both the home and lab environments. Conclusions Our findings demonstrate the feasibility of obtaining high-quality ABR recordings within a simulated home environment that closely approximate those recorded in a more traditional recording environment. This line of work may open doors to greater accessibility to underserved clinical and research populations.


1985 ◽  
Vol 28 (4) ◽  
pp. 539-547 ◽  
Author(s):  
Michael A. Primus ◽  
Gary Thompson

An operant conditioning discrimination paradigm was evaluated in terms of relationships between response behavior of young children and two stimulus components of the paradigm, the discriminative stimulus (DS) and the reinforcing stimulus (RS). Experiment I measured response performance in normal 1-year-old subjects as a function of differences in intensity and/or complexity among three DSs. Results showed no significant differences in conditioning rate, habituation, or consistency of the conditioned response relative to variable properties of the DS. Experiment II examined response performance of normal 2-year-old children as a function of two modifications in the RS, reinforcement schedule and reinforcement novelty. Subjects reinforced on a variable-ratio schedule of intermittent reinforcement and subjects reinforced on a 100% schedule demonstrated equivalent response habituation and consistency. In the second part of the experiment, subjects receiving novel RSs showed significantly greater response recovery than subjects reinforced with familiar RSs. Comparison of normal 1- and 2-year-old children revealed similar rates of conditioning and response consistency. However, 2-year-olds habituated more rapidly than 1-year-olds.


2020 ◽  
Vol 34 (3-4) ◽  
pp. 201-219
Author(s):  
Kathleen Schnick-Vollmer ◽  
Christiane Diefenbach ◽  
Christine Gräf ◽  
Dorle Hoffmann ◽  
Isabell Hoffmann ◽  
...  

Zusammenfassung. Das schulbezogene Wohlbefinden (SBWB) ist eine wichtige Voraussetzung für schulischen Erfolg. Trotzdem existieren – insbesondere mit Blick auf die Erfassung des SBWB von Erstklässlern – im deutschsprachigen Raum nur vereinzelt Studien. Dies lässt sich möglicherweise durch das Fehlen geeigneter Instrumente begründen. Dies gilt auch und insbesondere dann, wenn der Gesundheitszustand der Kinder berücksichtigt werden soll. Das Ziel der vorliegenden Arbeit besteht in der Validierung des adaptierten Fragebogens zur Erfassung von emotionalen und sozialen Schulerfahrungen (FEESS 1 – 2; Rauer & Schuck, 2004 ) mit Fokus auf die Eignung des Instruments für chronisch kranke und gesunde Kinder. Dafür wird zunächst das Konstrukt Wohlbefinden (WB) resp. SBWB definiert und in einschlägige Theorien – die Selbstbestimmungstheorie nach Deci und Ryan (1985) und das Erwartung-mal-Wert-Modell nach Wigfield und Eccles (2000) – eingebettet. Die Bedeutung der verwendeten FEESS-Skalen und ihr Zusammenhang zum schulischen Erfolg werden aufgezeigt. 1491 Kinder wurden zu ihrer Lernfreude (LF), sozialen Integration (SI) und zu ihrem schulbezogenen Fähigkeitsselbstkonzept (SK) befragt. Die Erfassung des Gesundheitszustands wurde über Elternfragebögen und Schuleingangsuntersuchungen eruiert. Zudem wurden die Eltern zur gesundheitsbezogenen Lebensqualität (LQ) ihrer Kinder mit Hilfe eines Fragebogens zur Erfassung der Lebensqualität von Kindern (KINDL; Bullinger, Mackensen & Kirchberger, 1994 ) befragt. Die psychometrische Qualität der adaptierten FEESS-Skalen wurde für beide Gruppen (erkrankt / gesund) auf Skalen- und Itemebene untersucht. Hierzu kamen sowohl klassische Verfahren als auch Verfahren der Item-Response-Theorie zum Einsatz. Die Ergebnisse untermauern die Validität des Konstruktes SBWB und stützen die Annahme der Dreidimensionalität (LF, SI, SK). Alle drei Skalen zeigen eine zufriedenstellende bis sehr gute Reliabilität. Die Items zeigen sehr gute MNSQ-Werte (weighted mean-square; gewichtete Abweichungsquadrate) und geeignete Trennschärfen. Die externe Validität, für deren Berechnung der Zusammenhang zwischen den Angaben der Kinder und den Angaben der Eltern zur gesundheitsbezogenen LQ untersucht wurde, konnte noch nicht ausreichend nachgewiesen werden. Bis auf diese Einschränkung kann mit Hilfe der adaptierten FEESS-Skalen im nächsten Schritt das SBWB von gesunden und erkrankten Kindern verglichen werden, um mögliche Chancenungleichheiten auszugleichen.


Diagnostica ◽  
2004 ◽  
Vol 50 (2) ◽  
pp. 65-77 ◽  
Author(s):  
Thomas Eckes

Zusammenfassung. Leistungsbeurteilungen unterliegen einer Reihe von Urteilsfehlern, die ihre Genauigkeit und Validität erheblich mindern können. Ein besonders kritischer Urteilsfehler ist die Tendenz zur Strenge bzw. Milde. In der vorliegenden Arbeit wird mit der Multifacetten-Rasch-Analyse (“many-facet Rasch measurement“; Linacre, 1989 ; Linacre & Wright, 2002 ) ein Item-Response-Modell vorgestellt, das Messungen der Strenge bzw. Milde eines jeden Beurteilers erlaubt und die ermittelten Strengemaße zusammen mit den Fähigkeitsmaßen der beurteilten Personen und den Schwierigkeitsmaßen der Aufgaben oder Beurteilungskriterien in einen gemeinsamen Bezugsrahmen stellt. Das Modell ermöglicht ferner eine um die Strenge der Beurteiler korrigierte Leistungsmessung. Mittels dieses Ansatzes werden im Rahmen des “Test Deutsch als Fremdsprache“ (TestDaF) Beurteilungen analysiert, die je 2 von insgesamt 29 Beurteilern zu Leistungen von 1359 Pbn im schriftlichen Ausdruck nach 3 Kriterien abgegeben haben. Die Gruppe der Beurteiler erweist sich als sehr heterogen, so dass eine Strengekorrektur der Urteile geboten ist. Abschließend werden verschiedene Implikationen des Multifacetten-Rasch-Modells für die Evaluation von Leistungsbeurteilungen diskutiert.


Diagnostica ◽  
2020 ◽  
Vol 66 (3) ◽  
pp. 158-171 ◽  
Author(s):  
Katharina Voltmer

Zusammenfassung. Das Emotionswissen von Kindern umfasst neben dem Ablesen von Emotionen aus Gesichtern anderer Menschen auch das Erkennen von externalen und internalen Ursachen von Emotionen sowie das Wissen über ihre Konsequenzen und Regulationsmöglichkeiten. Im deutschsprachigen Raum gibt es bisher kein Testverfahren, welches das Emotionswissen auf diese Weise differenziert und gleichzeitig reliabel und valide erfasst. Mit dem Adaptiven Test des Emotionswissens (ATEM) wird diese Lücke geschlossen. Der ATEM fragt in einem adaptiven Design 6 Teilaspekte des Emotionswissens ab, wobei die 32 Items in eine kinderfreundliche Geschichte eingebettet sind. Der nach der Item-Response-Theorie aufgebaute Test zeigt mit einer Gesamtstichprobe von N = 581 Kindern im Alter zwischen 3 und 9 Jahren gute psychometrische Eigenschaften. In einer Substichprobe von n = 254 Kindern im Alter zwischen 3 und 5 Jahren wurde der ATEM anhand von Korrelationen mit verschiedenen Variablen validiert. Insgesamt eignet sich der ATEM gut zur differenzierten Messung des Emotionswissens bei Kindern.


2012 ◽  
Vol 63 (1) ◽  
pp. 43-49 ◽  
Author(s):  
Johannes Hartig ◽  
Andreas Frey
Keyword(s):  

Zusammenfassung. Kompetenzkonstrukte in der empirischen Bildungsforschung werden in der Regel auf kontinuierlichen Skalen abgebildet. Bei der Verwendung von Messmodellen der Item-Response-Theorie (IRT) kann auf Basis der gemeinsamen Metrik für individuelle Kompetenzausprägungen und Itemschwierigkeiten eine kriteriumsorientierte Testwertbeschreibung vorgenommen werden. Da die gemessene Kompetenz hierbei bezogen auf Itemschwierigkeiten beschrieben wird, ist es von großem Interesse, warum bestimmte Items empirisch schwieriger sind als andere. Der vorliegende Beitrag stellt zunächst den generellen Nutzen der Vorhersage von Itemschwierigkeiten dar. Dieser besteht (1) in der Prüfung von Hypothesen über die gemessene Kompetenz im Sinne einer Konstruktvalidierung, (2) in der Fundierung einer kriteriumsorientierten Skaleninterpretation und (3) in der Steuerung und Optimierung der Itemkonstruktion. Die IRT-basierte Vorhersage von Itemschwierigkeiten wird auf Basis von Daten aus dem DFG-Schwerpunktprogramm-Projekt zur Kompetenzmodellierung in Englisch als Fremdsprache illustriert (N = 9409). Für den Bereich Leseverstehen in Englisch als Fremdsprache kann gezeigt werden, dass sowohl die sprachlichen Anforderungen des Textes als auch die Anforderungen hinsichtlich der Informationsverarbeitung für das Konstrukt bedeutsam sind.


2020 ◽  
Vol 41 (4) ◽  
pp. 207-218
Author(s):  
Mihaela Grigoraș ◽  
Andreea Butucescu ◽  
Amalia Miulescu ◽  
Cristian Opariuc-Dan ◽  
Dragoș Iliescu

Abstract. Given the fact that most of the dark personality measures are developed based on data collected in low-stake settings, the present study addresses the appropriateness of their use in high-stake contexts. Specifically, we examined item- and scale-level differential functioning of the Short Dark Triad (SD3; Paulhus & Jones, 2011 ) measure across testing contexts. The Short Dark Triad was administered to applicant ( N = 457) and non-applicant ( N = 592) samples. Item- and scale-level invariances were tested using an Item Response Theory (IRT)-based approach and a Structural Equation Modeling (SEM) approach, respectively. Results show that more than half of the SD3 items were flagged for Differential Item Functioning (DIF), and Exploratory Structural Equation Modeling (ESEM) results supported configural, but not metric invariance. Implications for theory and practice are discussed.


Sign in / Sign up

Export Citation Format

Share Document