A general model for the operating characteristic of graded item response

Author(s):  
Fumiko Samejima
2019 ◽  
Vol 3 (Supplement_1) ◽  
pp. S799-S799
Author(s):  
Albert Sanchez-Niubo ◽  
Francisco Felix Caballero ◽  
Christina Daskalopoulou ◽  
Javier de la Fuente ◽  
Alejandro de la Torre ◽  
...  

Abstract Although life longevity has increased across the world, evidence suggests some heterogeneity of the ageing process across individuals. To investigate different ageing patterns, the ATHLOS project harmonised data from 411,000 individuals across 17 existing cohort studies. The harmonised dataset provides comparable information on functioning measures, cognition, mental health, sociodemographic and lifestyle behaviours. To measure the process of healthy ageing across time and cohorts, we employed a Bayesian Multilevel Item Response Theory(IRT) and created a common metric of health status by using items of functioning. The IRT measurement model includes parameters describing the difficulty and discriminatory power of each item. We adopted the Bayesian Multilevel framework as it allows item parameters to vary among studies and the simultaneous estimation of all parameters under a Markov Chain Monte Carlo(MCMC) method. Finally, we assessed the predictive validity of the metric against mortality by performing a Receiver Operating Characteristic(ROC) curve analysis.


2020 ◽  
Vol 37 ◽  
Author(s):  
Cláudia Nascimento Guaraldo JUSTI ◽  
Natália CUNHA ◽  
Francis Ricardo dos Reis JUSTI

Abstract This study evaluated the precision of a Letter-Name Knowledge task in predicting children at risk/non-risk of reading and writing difficulties in Brazil. A second goal was to compare the precision of classification of two versions of this task: a 26 letter-task and a 15 letter-task. A total of 213 Brazilian children performed the 26 letter-task when they were in kindergarten. Of those children, 176 performed a writing task and 174 performed a reading task in 1st grade Elementary School. The choice of letters for the 15 letter-task was based on the Item Response Theory and on neural network simulation. The results based on the Receiver Operating Characteristic curve analysis, showed that both tasks could be used for screening children with reading and writing difficulties (areas under the curve of 0.83 and 0.80).


2020 ◽  
Vol 63 (6) ◽  
pp. 1916-1932 ◽  
Author(s):  
Haiying Yuan ◽  
Christine Dollaghan

Purpose No diagnostic tools exist for identifying social (pragmatic) communication disorder (SPCD), a new Diagnostic and Statistical Manual of Mental Disorders, Fifth Edition category for individuals with social communication deficits but not the repetitive, restricted behaviors and interests (RRBIs) that would qualify them for a diagnosis of autism spectrum disorder (ASD). We explored the value of items from a widely used screening measure of ASD for distinguishing SPCD from typical controls (TC; Aim 1) and from ASD (Aim 2). Method We applied item response theory (IRT) modeling to Social Communication Questionnaire–Lifetime ( Rutter, Bailey, & Lord, 2003 ) records available in the National Database for Autism Research. We defined records from putative SPCD ( n = 54), ASD ( n = 278), and TC ( n = 274) groups retrospectively, based on National Database for Autism Research classifications and Autism Diagnostic Interview–Revised responses. After assessing model assumptions, estimating model parameters, and measuring model fit, we identified items in the social communication and RRBI domains that were maximally informative in differentiating the groups. Results IRT modeling identified a set of seven social communication items that distinguished SPCD from TC with sensitivity and specificity > 80%. A set of five RRBI items was less successful in distinguishing SPCD from ASD (sensitivity and specificity < 70%). Conclusion The IRT modeling approach and the Social Communication Questionnaire–Lifetime item sets it identified may be useful in efforts to construct screening and diagnostic measures for SPCD.


VASA ◽  
2014 ◽  
Vol 43 (6) ◽  
pp. 423-432 ◽  
Author(s):  
Qingtao Meng ◽  
Si Wang ◽  
Yong Wang ◽  
Shixi Wan ◽  
Kai Liu ◽  
...  

Background: Orthostatic hypotension (OH) is a disease prevalent among middle-aged men and the elderly. The association between arterial stiffness and OH is unclear. This study evaluates whether arterial stiffness is correlated with OH and tests the usefulness of brachial-ankle pulse wave velocity (baPWV), an arterial stiffness marker, with regard to identifying OH. Patients and methods: A sample of 1,010 participants was recruited from the general population (64.8 ± 7.7 years; 426 men) who attended health check-ups. BaPWV and the radial augmentation index (rAI) were both assessed as the arterial stiffness markers, and OH was determined using blood pressure (BP) measured in the supine position, as well as 30 seconds and 2 minutes after standing. Results: The prevalence of OH in this population was 4.9 %. Compared with the non-OH group, both baPWV (20.5 ± 4.5 vs 17.3 ± 3.7, p < 0.001) and rAI (88.1 ± 10.8 vs 84.2 ± 10.7, p < 0.05) were significantly higher in the OH group. In the multiple logistic regression analysis, baPWV (OR, 1.3; 95 % CI, 1.106–1.528; p < 0.05) remained associated with OH. Moreover, the degree of orthostatic BP reduction was related to arterial stiffness. In addition, increases in arterial stiffness predicted decreases in the degree of heart rate (HR) elevation. Finally, a receiver operating characteristic (ROC) curve analysis showed that baPWV was useful in discriminating OH (AUC, 0.721; p < 0.001), with the cut-off value of 18.58 m/s (sensitivity, 0.714; specificity, 0.686). Conclusions: Arterial stiffness determined via baPWV, rather than rAI, was significantly correlated with the attenuation of the orthostatic hemodynamic response and the resultant OH. The impaired baroreceptor sensitivity might be the mechanism. In addition, baPWV appears to be a relatively sensitive and reliable indicator of OH in routine clinical practice.


2020 ◽  
Vol 34 (3-4) ◽  
pp. 201-219
Author(s):  
Kathleen Schnick-Vollmer ◽  
Christiane Diefenbach ◽  
Christine Gräf ◽  
Dorle Hoffmann ◽  
Isabell Hoffmann ◽  
...  

Zusammenfassung. Das schulbezogene Wohlbefinden (SBWB) ist eine wichtige Voraussetzung für schulischen Erfolg. Trotzdem existieren – insbesondere mit Blick auf die Erfassung des SBWB von Erstklässlern – im deutschsprachigen Raum nur vereinzelt Studien. Dies lässt sich möglicherweise durch das Fehlen geeigneter Instrumente begründen. Dies gilt auch und insbesondere dann, wenn der Gesundheitszustand der Kinder berücksichtigt werden soll. Das Ziel der vorliegenden Arbeit besteht in der Validierung des adaptierten Fragebogens zur Erfassung von emotionalen und sozialen Schulerfahrungen (FEESS 1 – 2; Rauer & Schuck, 2004 ) mit Fokus auf die Eignung des Instruments für chronisch kranke und gesunde Kinder. Dafür wird zunächst das Konstrukt Wohlbefinden (WB) resp. SBWB definiert und in einschlägige Theorien – die Selbstbestimmungstheorie nach Deci und Ryan (1985) und das Erwartung-mal-Wert-Modell nach Wigfield und Eccles (2000) – eingebettet. Die Bedeutung der verwendeten FEESS-Skalen und ihr Zusammenhang zum schulischen Erfolg werden aufgezeigt. 1491 Kinder wurden zu ihrer Lernfreude (LF), sozialen Integration (SI) und zu ihrem schulbezogenen Fähigkeitsselbstkonzept (SK) befragt. Die Erfassung des Gesundheitszustands wurde über Elternfragebögen und Schuleingangsuntersuchungen eruiert. Zudem wurden die Eltern zur gesundheitsbezogenen Lebensqualität (LQ) ihrer Kinder mit Hilfe eines Fragebogens zur Erfassung der Lebensqualität von Kindern (KINDL; Bullinger, Mackensen & Kirchberger, 1994 ) befragt. Die psychometrische Qualität der adaptierten FEESS-Skalen wurde für beide Gruppen (erkrankt / gesund) auf Skalen- und Itemebene untersucht. Hierzu kamen sowohl klassische Verfahren als auch Verfahren der Item-Response-Theorie zum Einsatz. Die Ergebnisse untermauern die Validität des Konstruktes SBWB und stützen die Annahme der Dreidimensionalität (LF, SI, SK). Alle drei Skalen zeigen eine zufriedenstellende bis sehr gute Reliabilität. Die Items zeigen sehr gute MNSQ-Werte (weighted mean-square; gewichtete Abweichungsquadrate) und geeignete Trennschärfen. Die externe Validität, für deren Berechnung der Zusammenhang zwischen den Angaben der Kinder und den Angaben der Eltern zur gesundheitsbezogenen LQ untersucht wurde, konnte noch nicht ausreichend nachgewiesen werden. Bis auf diese Einschränkung kann mit Hilfe der adaptierten FEESS-Skalen im nächsten Schritt das SBWB von gesunden und erkrankten Kindern verglichen werden, um mögliche Chancenungleichheiten auszugleichen.


Author(s):  
Kathrin Dolle ◽  
Gerd Schulte-Körne ◽  
Nikolaus von Hofacker ◽  
Yonca Izat ◽  
Antje-Kathrin Allgaier

Fragestellung: Die vorliegende Studie untersucht die Übereinstimmung von strukturierten Kind- und Elterninterviews sowie dem klinischen Urteil bei der Diagnostik depressiver Episoden im Kindes- und Jugendalter. Zudem prüft sie, ob sich die Treffsicherheit und die optimalen Cut-off-Werte von Selbstbeurteilungsfragebögen in Referenz zu diesen verschiedenen Beurteilerperspektiven unterscheiden. Methodik: Mit 81 Kindern (9–12 Jahre) und 88 Jugendlichen (13–16 Jahre), die sich in kinder- und jugendpsychiatrischen Kliniken oder Praxen vorstellten, und ihren Eltern wurden strukturierte Kinder-DIPS-Interviews durchgeführt. Die Kinder füllten das Depressions-Inventar für Kinder und Jugendliche (DIKJ) aus, die Jugendlichen die Allgemeine Depressions-Skala in der Kurzform (ADS-K). Übereinstimmungen wurden mittels Kappa-Koeffizienten ermittelt. Optimale Cut-off-Werte, Sensitivität, Spezifität sowie positive und negative prädiktive Werte wurden anhand von Receiver operating characteristic (ROC) Kurven bestimmt. Ergebnisse: Die Interviews stimmten untereinander sowie mit dem klinischen Urteil niedrig bis mäßig überein. Depressive Episoden wurden häufiger nach klinischem Urteil als in den Interviews festgestellt. Cut-off-Werte und Validitätsmaße der Selbstbeurteilungsfragebögen variierten je nach Referenzstandard mit den schlechtesten Ergebnissen für das klinische Urteil. Schlussfolgerungen: Klinische Beurteiler könnten durch den Einsatz von strukturierten Interviews profitieren. Strategien für den Umgang mit diskrepanten Kind- und Elternangaben sollten empirisch geprüft und detailliert beschrieben werden.


Diagnostica ◽  
2004 ◽  
Vol 50 (2) ◽  
pp. 65-77 ◽  
Author(s):  
Thomas Eckes

Zusammenfassung. Leistungsbeurteilungen unterliegen einer Reihe von Urteilsfehlern, die ihre Genauigkeit und Validität erheblich mindern können. Ein besonders kritischer Urteilsfehler ist die Tendenz zur Strenge bzw. Milde. In der vorliegenden Arbeit wird mit der Multifacetten-Rasch-Analyse (“many-facet Rasch measurement“; Linacre, 1989 ; Linacre & Wright, 2002 ) ein Item-Response-Modell vorgestellt, das Messungen der Strenge bzw. Milde eines jeden Beurteilers erlaubt und die ermittelten Strengemaße zusammen mit den Fähigkeitsmaßen der beurteilten Personen und den Schwierigkeitsmaßen der Aufgaben oder Beurteilungskriterien in einen gemeinsamen Bezugsrahmen stellt. Das Modell ermöglicht ferner eine um die Strenge der Beurteiler korrigierte Leistungsmessung. Mittels dieses Ansatzes werden im Rahmen des “Test Deutsch als Fremdsprache“ (TestDaF) Beurteilungen analysiert, die je 2 von insgesamt 29 Beurteilern zu Leistungen von 1359 Pbn im schriftlichen Ausdruck nach 3 Kriterien abgegeben haben. Die Gruppe der Beurteiler erweist sich als sehr heterogen, so dass eine Strengekorrektur der Urteile geboten ist. Abschließend werden verschiedene Implikationen des Multifacetten-Rasch-Modells für die Evaluation von Leistungsbeurteilungen diskutiert.


Diagnostica ◽  
2020 ◽  
Vol 66 (3) ◽  
pp. 158-171 ◽  
Author(s):  
Katharina Voltmer

Zusammenfassung. Das Emotionswissen von Kindern umfasst neben dem Ablesen von Emotionen aus Gesichtern anderer Menschen auch das Erkennen von externalen und internalen Ursachen von Emotionen sowie das Wissen über ihre Konsequenzen und Regulationsmöglichkeiten. Im deutschsprachigen Raum gibt es bisher kein Testverfahren, welches das Emotionswissen auf diese Weise differenziert und gleichzeitig reliabel und valide erfasst. Mit dem Adaptiven Test des Emotionswissens (ATEM) wird diese Lücke geschlossen. Der ATEM fragt in einem adaptiven Design 6 Teilaspekte des Emotionswissens ab, wobei die 32 Items in eine kinderfreundliche Geschichte eingebettet sind. Der nach der Item-Response-Theorie aufgebaute Test zeigt mit einer Gesamtstichprobe von N = 581 Kindern im Alter zwischen 3 und 9 Jahren gute psychometrische Eigenschaften. In einer Substichprobe von n = 254 Kindern im Alter zwischen 3 und 5 Jahren wurde der ATEM anhand von Korrelationen mit verschiedenen Variablen validiert. Insgesamt eignet sich der ATEM gut zur differenzierten Messung des Emotionswissens bei Kindern.


Sign in / Sign up

Export Citation Format

Share Document