scholarly journals Why Hedges’ g*s based on the non-pooled standard deviation should be reported with Welch’s t-test

2021 ◽  
Author(s):  
Marie Delacre ◽  
Daniel Lakens ◽  
Christophe Ley ◽  
Limin Liu ◽  
Christophe Leys

Researchers are generally required to report and interpret effect sizes and associated confidence intervals. When comparing two independent groups, the most commonly used estimator of effect size is Cohen’s ds where sample mean difference is divided by the pooled standard deviation. However, computing the pooled error term is not valid when both groups do not share common population variances. Furthermore, the assumption of equal population variances is unlikely in many psychological fields. Consequently, researchers shift to the use of Welch’s t-test over Student’s t-test in the context of hypothesis testing. Meanwhile, the question which effect size to report when equal variances are not assumed remains open. Based on Monte Carlo simulations, we compare Hedges’ gs (i.e. Cohen’s ds with correction for bias) to Glass’s gs, Shieh’s gs and Hedges’ g_s^*. Comparisons are made under normality as well as under realistic deviations from the assumptions of normality and equal variances. Although it is not directly related with Welch’s t-test (unlike Shieh’s gs), we recommend the use of Hedges’ g_s^* because it shows better properties than all other estimators. Practical recommendations, R package and Shiny App in order to compute effect size estimators and confidence intervals are provided.

2013 ◽  
Author(s):  
Σουσάνα Ανίσογλου

ΣΚΟΠΟΣ: Η συλλογή, ανάλυση και επεξεργασία στοιχείων ογκολογικών ασθενών που νοσηλεύθηκαν στη Μονάδα Εντατικής Θεραπείας (Μ.Ε.Θ.) και η συσχέτισή τους με συγκεκριμένους πιθανούς παράγοντες κινδύνου .ΥΛΙΚΟ: Πρόκειται για μία προοπτική μελέτη παρατήρησης (prospective observational) σε δείγμα 125 ογκολογικών ασθενών που νοσηλεύθηκαν στη Μ.Ε.Θ. κατά την τελευταία διετία.ΜΕΘΟΔΟΣ: Αξιολογήθηκαν επιδημιολογικοί, κλινικοί και λειτουργικοί παράγοντες. Ειδικότερα ελέγχθηκαν η πρωτοπαθής νεοπλασματική νόσος, η ηλικία, η παρουσία στεφανιαίας νόσου, χρόνιας αποφρακτικής πνευμονοπάθειας, σακχαρώδους διαβήτη, νεφρικής ανεπάρκειας, ο δείκτης μάζας σώματος, η εφαρμογή χημειοθεραπείας ή και ακτινοθεραπείας, η διάρκεια νοσηλείας, τα score βαρύτητας (APACHE II, SAPS II, SOFA) και η έκβαση (εξιτήριο ή θάνατος) και έγιναν συσχετίσεις με τα προηγούμενα στοιχεία. Χρησιμοποιήθηκε το στατιστικό λογισμικό πακέτο SPSS 17.0 (SPSS, Chicago, IL, USA) για Windows. Οι συνεχείς μεταβλητές παρουσιάζονται ως μέσοι όροι + τυπική απόκλιση (mean + standard deviation). Για τη σύγκριση των μέσων όρων μεταξύ δύο ομάδων έγινε χρήση του student’s t-test, εφόσον οι μεταβλητές ακολουθούσαν την κανονική κατανομή και του Mann-Whitney U test στην αντίθετη περίπτωση. Για την ανάδειξη συσχετίσεων μεταξύ ποιοτικών μεταβλητών έγινε χρήση του x2 test.ΑΠΟΤΕΛΕΣΜΑΤΑ: Η θνητότητα ανήλθε στο 48.8%. Στατιστικά σημαντικοί παράγοντες κακής έκβασης κατά την εισαγωγή του ασθενούς στη ΜΕΘ ήταν τα score βαρύτητας (APACHE II, SAPS II, SOFA), το πτωχό performance status και τα συνυπάρχοντα σοβαρά νοσήματα. Στατιστικά σημαντικοί παράγοντες κακής έκβασης κατά τη διάρκεια νοσηλείας του ασθενούς στη Μ.Ε.Θ. ήταν η διάρκεια του μηχανικού αερισμού, η χρήση αγγειοσυσπαστικών, η πολυοργανική ανεπάρκεια και η σηπτική κατάσταση. Από τις εργαστηριακές εξετάσεις στατιστικά σημαντικές ήταν ο χαμηλός αριθμός αιμοπεταλίων και η θετική αιμοκαλλιέργεια. Ο στατιστικός έλεγχος αξιολόγησης κατά Hosmer Lemeshow παρά τον σχετικά μικρό αριθμό του δείγματος επιβεβαίωσε τη χρησιμότητα των APACHE II, SAPS II, SOFA ως προγνωστικών μοντέλων.ΣΥΜΠΕΡΑΣΜΑΤΑ: Η πρόγνωση ογκολογικών ασθενών που εισάγονται στη ΜΕΘ είναι μέτρια. Υπάρχουν σαφείς προγνωστικοί παράγοντες κινδύνου που μπορούν να συνθέσουν ένα είδος προγνωστικού μοντέλου, ωστόσο απαιτούνται περαιτέρω πολυκεντρικές μελέτες με προοπτικό χαρακτήρα σε μεγαλύτερο αριθμό ασθενών.


1986 ◽  
Vol 69 (4) ◽  
pp. 664-666
Author(s):  
Peter F Kane

Abstract The official AOAC manual Kjeldahl methods for determining crude protein in animal feeds have several disadvantages. For the HgO catalyst method, there are environmental concerns and a lengthy digestion. For the CuS04 catalyst method, the digestion period is shorter, but still 90 min. A different catalyst combination, CuS04-Ti02, makes 40 min digestion feasible. Comparison of these catalysts on a group of representative feeds resulted in a mean difference, Cu-Ti minus HgO, of 0.034% protein. Standard deviation of the differences was 0.36. A Student’s t-test showed no significant difference. The method will be collaboratively studied.


1981 ◽  
Vol 6 (2) ◽  
pp. 107-128 ◽  
Author(s):  
Larry V. Hedges

Glass's estimator of effect size, the sample mean difference divided by the sample standard deviation, is studied in the context of an explicit statistical model. The exact distribution of Glass's estimator is obtained and the estimator is shown to have a small sample bias. The minimum variance unbiased estimator is obtained and shown to have uniformly smaller variance than Glass's (biased) estimator. Measurement error is shown to attenuate estimates of effect size and a correction is given. The effects of measurement invalidity are discussed. Expressions for weights that yield the most precise weighted estimate of effect size are also derived.


1980 ◽  
Vol 5 (4) ◽  
pp. 337-349 ◽  
Author(s):  
Philip H. Ramsey

It is noted that disagreements have arisen in the literature about the robustness of the t test in normal populations with unequal variances. Hsu's procedure is applied to determine exact Type I error rates for t. Employing fairly liberal but objective standards for assessing robustness, it is shown that the t test is not always robust to the assumption of equal population variances even when sample sizes are equal. Several guidelines are suggested including the point that to apply t at α = .05 without regard for unequal variances would require equal sample sizes of at least 15 by one of the standards considered. In many cases, especially those with unequal N's, an alternative such as Welch's procedure is recommended.


2020 ◽  
Vol 19 ◽  
pp. e209937
Author(s):  
Adriana Postiglione Buhrer Samra ◽  
Marcos Pomini ◽  
Francielly Granville ◽  
Adrielly Zavolski ◽  
Fabio Brasil de Oliveira ◽  
...  

Aim: To compare the accuracy (trueness and precision)of cost-accessible three-dimensional (3D) printed models.Methods: A maxillary typodont (MM) was scanned andprinted 10 times in polylactic acid, resulting in 10 digitalmodels (DMs). Polyvinylsiloxane impressions were made toobtain 10 conventional stone models (SMs). All models werescanned and imported to CloudCompare software. The totalarea and three locations of interest were evaluated (zenith toincisal [Z-I], canine to canine [C-C], and first molar to canine[1M-C] distances). Total area evaluations were performed byaligning the MM and experimental models using the best-fitalgorithm and were compared using the Haussdorf distance.The distances between points of interest were measured usingthe point-picking tool at the same 3D coordinates. The meanvolumetric deviations were considered for trueness analysis.Precision was set as the standard deviation. Statisticaldifferences were evaluated using the Student’s t-test. Results:Total area volumetric comparisons showed that DMs showedsuperior trueness and precision (-0.02 ± 0.03) compared tothe SMs (0.37 ± 0.29) (P < 0.001). No differences between themodels were observed for Z-I (P = .155); however, SMs showedfewer deviations for C-C (P = .035) and 1M-C (P = .001) thanDMs. Conclusions: The DMs presented superior trueness andprecision for total area compared to the SMs; however, the SMswere more accurate when points of interest were evaluated.


2014 ◽  
Vol 5 (3) ◽  
pp. 693-698 ◽  
Author(s):  
Stephen Gorard

This paper confirms that confidence intervals are not a generally useful measure or estimate of anything in practice. CIs are recursive in definition and reversed in logic, meaning that they are widely misunderstood. Perhaps most importantly, they should not be used with cases that do not form a complete and true random sample from a known population – the latter is a key premise underlying their calculation. This means that, whatever their merits, CIs should not be used in the vast majority of real-life social science analyses. The second part of the paper illustrates the dangers of ignoring this premise, perhaps on some purported pragmatic grounds. Using 100 simulations of a sample of 100 integers from a uniform population with members in the range 0 to 9, it shows that CIs are very misleading as soon as there is deviation from randomness. For example, when 5% of the cases in each sample are deleted a reported 95% CI would be no better than a 66% CI in reality. If 10% of the lowest score cases are replaced with the achieved mean for the sample, then a reported 95% CI would be more like a 43% CI in reality. In addition, the simulation shows that the mean and standard deviation for any sample are correlated (an issue of linked scale). This illustrates that using the sample standard deviation as an estimate for the SD of the sampling distribution in order to try and assess whether the sample mean is close to the mean of the sampling distribution will simply make matters worse. The best and only available estimate of the sampling distribution mean, in practice, is the sample mean.


2017 ◽  
Author(s):  
Ιωάννης Σταθούλης

Εισαγωγή: Τα τελευταία χρόνια, η αλματώδης πρόοδος της τεχνολογίας έχει επηρεάσει αναπόφευκτα και το χώρο της υγείας, με την εισαγωγή σε αυτή πολλών νέων κατηγοριών ιατροτεχνολογικού εξοπλισμού που σκοπό έχουν τη βελτίωση της παρεχόμενης φροντίδας υγείας, την ποιοτικότερη παροχή υπηρεσιών υγείας και τη γρήγορη αποκατάσταση τωνασθενών. Σκοπός: Η διερεύνηση του τρόπου και των μεθόδων, με τις οποίες οι νοσηλευτές εκπαιδεύονται στην εκμάθηση των βασικών αρχών λειτουργίας και τη χρήση του Ιατροτεχνολογικού εξοπλισμού που χρησιμοποιείται στην καθημερινή κλινική πρακτική. Επιπλέον, διερευνώνται οι θετικές αλλά και αρνητικές επιπτώσεις της χρήσης του καθώς και οι πιθανές συνέπειες τόσο για τους ασθενείς όσο και για τους νοσηλευτές. Μεθοδολογία: Το αρχικό δείγμα της μελέτης αποτέλεσαν 733 νοσηλευτές εκ των οποίων 6 δεν έδωσαν συγκατάθεση συμπλήρωσης και κατά συνέπεια το τελικό δείγμα της μελέτης αποτέλεσαν 727 νοσηλευτές Πρωτοβάθμιας Φροντίδας Υγείας, Δευτεροβάθμιων,Τριτοβάθμιων Νοσηλευτικών Ιδρυμάτων της Χώρας εγγεγραμμένοι σε Νοσηλευτικούς Φορείς και Επιστημονικές Εταιρείες που εργάζονται σε Κλινικές ή Μονάδες Εντατικής Νοσηλείας και σε Δομές Πρωτοβάθμιας Περίθαλψης. Στην πρώτη φάση της μελέτης, πραγματοποιήθηκε κατασκευή νέου ερωτηματολογίου, το οποίο στηρίχθηκε στα ερωτηματολόγια των McConnell Ε. Α. (1995), Paclova, S., Mornstein, V. & Caruana, C. J.(2009) και Liu, S., Cheng, P., Huang, H. and Zhang, Q. (2013). Επίσης, διενεμήθη και η ελεύθερη στο διαδίκτυο κλίμακα ποσοτικής εκτίμησης του άγχους του Hamilton (1976). Στη δεύτερη φάση της μελέτης πραγματοποιήθηκαν εκπαιδευτικές παρεμβάσεις στο πλαίσιο διαδραστικών κλινικών φροντιστηρίων με επίδειξη ή και εκπαίδευση στις ίδιες τις συσκευές (Hands-On Training), που αφορούσαν στην αξιολόγηση των γνώσεων στην ασφαλή χρήσητου παλμικού οξυμέτρου, των χειρουργικών διαθερμιών και των απινιδωτών σε δείγμα 78,62 και 65 νοσηλευτών αντίστοιχα με τη συμπλήρωση ερωτηματολογίων πριν και μετά από κάθε εκπαιδευτική παρέμβαση. Θα πρέπει να σημειωθεί ότι οι Χειρουργικές Διαθερμίες και ο Απινιδωτής επιλέχθηκαν ως συσκευές για την εκπαιδευτική παρέμβαση με βάση τα αποτελέσματα της στατιστικής ανάλυσης του ερωτηματολογίου ανίχνευσης εκπαιδευτικών αναγκών, όπου για τις συγκεκριμένες συσκευές παρουσιάστηκαν αυξημένα ποσοστά άγχους των νοσηλευτών κατά τη χρήση των συσκευών αυτών. Επιπλέον, πραγματοποιήθηκε επιλογή για εκπαιδευτική παρέμβαση και του Παλμικού Οξυμέτρου, εξαιτίας του γεγονότος ότι η συγκεκριμένη συσκευή αν και δεν επιφέρει αύξηση του άγχους των νοσηλευτών κατά τη χρήση της, παρόλα αυτά από τη βιβλιογραφία φάνηκε ότι υπάρχει κενό γνώσης σε αυτή το οποίο είναι καταγεγραμμένο τόσο στην Ελληνική όσο και στην Ξενόγλωσση βιβλιογραφία(Κιέκκας και συν., 2012; Kiekkas et al., 2013; Milutinovic, Repic, and Arandelovic, 2016).Οι μέσες τιμές (mean), οι τυπικές αποκλίσεις (Standard Deviation=SD) και οι διάμεσοι (median) και τα ενδοτεταρτημοριακά εύρη (interquartile range) χρησιμοποιήθηκαν για την περιγραφή των ποσοτικών μεταβλητών. Οι απόλυτες (Ν) και οι σχετικές (%) συχνότητες χρησιμοποιήθηκαν για την περιγραφή των ποιοτικών μεταβλητών. Για τη σύγκριση ποσοτικών μεταβλητών μεταξύ δυο ομάδων χρησιμοποιήθηκε το Student’s t-test. Για τησύγκριση ποσοτικών μεταβλητών μεταξύ περισσοτέρων από δυο ομάδων χρησιμοποιήθηκε o παραμετρικός έλεγχος ανάλυσης διασποράς (ANOVA). Για τον έλεγχο του σφάλματος τύπου Ι, λόγω των πολλαπλών συγκρίσεων χρησιμοποιήθηκε η διόρθωση κατά Bonferroni σύμφωνα με την οποία το επίπεδο σημαντικότητας είναι 0,05/κ (κ= αριθμός των συγκρίσεων). Για τον έλεγχο της σχέσης δυο ποσοτικών μεταβλητών χρησιμοποιήθηκε ο συντελεστής συσχέτισης του Spearman (r). Η συσχέτιση θεωρείται χαμηλή όταν ο συντελεστής συσχέτισης (r) κυμαίνεται από 0,1 έως 0,3, μέτρια όταν ο συντελεστής συσχέτισης κυμαίνεται από 0,31 έως 0,5 και υψηλή όταν ο συντελεστής είναι μεγαλύτερος από 0,5. Για τη σύγκριση των σωστών απαντήσεων πριν και μετά την παρέμβαση χρησιμοποιήθηκε το McNemar test. Για τη σύγκριση των βαθμολογιών γνώσεων πριν και μετά την παρέμβαση χρησιμοποιήθηκε το paired t-test. Η ανάλυση γραμμικής παλινδρόμησης (linear regression analysis) με τη διαδικασία διαδοχικής ένταξης/αφαίρεσης (stepwise) χρησιμοποιήθηκε για την εύρεση ανεξάρτητων παραγόντων που σχετίζονται με τις μεταβολές στις βαθμολογίες γνώσεων από την οποία προέκυψαν συντελεστές εξάρτησης (β) και τα τυπικά σφάλματά τους (standard errors=SE). Η εσωτερική αξιοπιστία του ερωτηματολογίου ελέγχθηκε με τη χρήση του συντελεστή Cronbach’s-a. Τα επίπεδα σημαντικότητας είναι αμφίπλευρα και η στατιστική σημαντικότητα τέθηκε στο 0,05. Για την ανάλυση χρησιμοποιήθηκε το στατιστικό πρόγραμμα SPSS 19.0.Αποτελέσματα: Το 92,1% των νοσηλευτών θεωρεί ότι η χρήση ιατροτεχνολογικού εξοπλισμού στην καθημερινή κλινική πρακτική οδηγεί πολύ/πάρα πολύ στη βελτίωση της ποιότητας της φροντίδας υγείας. Επίσης, το 90,9% των νοσηλευτών θεωρεί ότι η χρήση ιατροτεχνολογικού εξοπλισμού στην καθημερινή κλινική πρακτική οδηγεί πολύ/πάρα πολύστην ασφάλεια του ασθενούς και το 88,7% στη σωστή διάγνωση για την κατάσταση υγείας του ασθενούς. Το 67,3% των νοσηλευτών ήταν ενήμεροι σχετικά με τις επιπτώσεις από τη χρήση της συσκευής στην υγεία και ασφάλεια του ασθενή και το 59,7% σχετικά με τις επιπτώσεις από τη χρήση της συσκευής στην ατομική τους υγεία και ασφάλεια.Το 20,7% των συμμετεχόντων δήλωσε ότι η χρήση ιατροτεχνολογικού εξοπλισμού στην καθημερινή κλινική πρακτική αύξησε πολύ/πάρα πολύ το χρόνο επιτήρησης εκ μέρους της ορθής και χωρίς προβλήματα λειτουργίας του.Συμπεράσματα: Οι νοσηλευτές πραγματοποιούν συχνή χρήση του ιατροτεχνολογικού εξοπλισμού καθημερινά. Επίσης, ένα μεγάλο μέρος των νοσηλευτών έχει διδαχθεί στο παρελθόν μάθημα σχετικό με τη χρήση ιατροτεχνολογικού εξοπλισμού, στοιχείο που καταδεικνύει την επιθυμία και την ανάγκη του νοσηλευτικού προσωπικού να εκπαιδεύεται στη χρήση του εν λόγω εξοπλισμού. Η εκπαίδευση σε προπτυχιακό επίπεδο δεν είναι επαρκής. Η μετά τη βασική εκπαίδευση στην ασφαλή χρήση του Ιατροτεχνολογικού εξοπλισμού, βελτιώνει το επίπεδο των γνώσεων και των πρακτικών των νοσηλευτών. Απαιτείται συνεχιζόμενη εκπαίδευση και επικαιροποίηση των γνώσεων δεδομένης τηςαλματώδους ανάπτυξης της τεχνολογίας στο χώρο της υγείας.Λέξεις κλειδιά: Ιατροτεχνολογικός Εξοπλισμός, Νοσηλευτές, Νοσηλευτική Εκπαίδευση, Συνεχιζόμενη Επαγγελματική Εκπαίδευση, Βιοϊατρική Μηχανική.


2018 ◽  
Vol 3 (1) ◽  
pp. 22-27
Author(s):  
S. Supratman ◽  
Sri Wulandari Muhlis

The formulation of the problem in this research are: (1) How the result of learning mathematics of students after taught by SAVI learning model?, (2) How the result of learning mathematics of students after taught by NHT learning model?, (3) Is the result of learning mathematics of students who taught with SAVI learning model is higher than students taught by NHT learning model. The purpose of this study are: (1) To know how the results of learning mathematics students after teaching with SAVI learning model, (2) To find out how the results of learning mathematics students after being taught with NHT learning model, (3) To determine whether the results of learning mathematics students taught by SAVI learning models higher than students taught by NHT learning models. Type of research using experimental method. The population in this study is all students of class X spread in 11 parallel classes with the number of 310 people. Sampling was done by using cluster random sampling technique. In this research as a sample taken 2 classes from the entire population that is class X A3 as experiment class 1 using SAVI learning model and class X A1 as experiment class 2 using NHT learning model. From result of data analysis obtained that: (1) result of student learning taught by using SAVI learning model which consist of 25 students show minimum value 62, maximum value 96, mean (mean) 80,36, with standard deviation 9,10; (2) student learning outcomes taught using NHT learning model consisting of 25 students showing minimum score 62, maximum value 96, mean (mean) 79,62, with standard deviation 10,512; (3) result of t-test analysis using independent sample t-test obtained tcount = 0,302 at = 0,05 with degrees of freedom (dk) = 48 obtained t table = 2,011. Because t <t table then Ha is rejected and H0 is accepted. So it can be concluded that the mathematics learning outcomes of students who were taught with the SAVI model was not higher than the students taught by the NHT model.


2018 ◽  
Vol 17 (1) ◽  
Author(s):  
Lis Nursyanti

Abstrak Brief Strategic Family Therapy adalah terapi keluarga yang bertujuan untuk menghilangkan atau mengurangi perilaku maladaptif pada anak dengan merestrukturisasi masalah relasi dalam keluarga. Penelitian ini bertujuan untuk meningkatkan relasi keluarga anak binaan di Rutan Klas I Bandung yang mengalami disfungsi keluarga, dengan cara meningkatkan komunikasi dan kelekatan diantara anggota  keluarga. Pendekatan ini didasarkan pada asumsi bahwa relasi berbasis keluarga berpengaruh terhadap perilaku anak dan bahwa peningkatan relasi keluarga akan mengurangi masalah perilaku maladaptif. Metode Penelitian yang digunakan adalah pendekatan kuantitatif dengan desain subyek tunggal dengan model ABA. Data dianalisis dengan menggunakan statistik inferensial dilakukan untuk menguji hipotesis dengan uji t atau t-test dan statistik deskriptif dengan menggunakan perbandingan two standard deviation. Hasil penelitian menunjukkan bahwa penerapan BSFT dapat meningkatkan relasi dalam keluarga, selain itu dapat merubah perilaku maladaptif pada anak yang  berperilaku menentang. Adapun kelemahan dari penerapan BSFT pada saat penelitian, karena dilakukan di dua lokasi yaitu rumah dan rutan, sehingga hasilnya kurang maksimal. Oleh karena itu, penerapan BSFT akan lebih efektif jika dilakukan pada keluarga yang anggotanya berada dalam satu lokasi, sehingga perilaku dan relasi antar angota keluarga dapat diamati dan diukur secara jelas. Kata kunci;  BSFT, meningkatkan relasi keluarga,  menghilangkan perilaku maladaptif.


Sign in / Sign up

Export Citation Format

Share Document