Comparing Linear Discriminant Function With Logistic Regression for the Two-Group Classification Problem

1999 ◽  
Vol 67 (3) ◽  
pp. 265-286 ◽  
Author(s):  
Xitao Fan ◽  
Lin Wang
2021 ◽  
Vol 6 (4) ◽  
pp. 295-306
Author(s):  
Ananda B. W. Manage ◽  
Ram C. Kafle ◽  
Danush K. Wijekularathna

In cricket, all-rounders play an important role. A good all-rounder should be able to contribute to the team by both bat and ball as needed. However, these players still have their dominant role by which we categorize them as batting all-rounders or bowling all-rounders. Current practice is to do so by mostly subjective methods. In this study, the authors have explored different machine learning techniques to classify all-rounders into bowling all-rounders or batting all-rounders based on their observed performance statistics. In particular, logistic regression, linear discriminant function, quadratic discriminant function, naïve Bayes, support vector machine, and random forest classification methods were explored. Evaluation of the performance of the classification methods was done using the metrics accuracy and area under the ROC curve. While all the six methods performed well, logistic regression, linear discriminant function, quadratic discriminant function, and support vector machine showed outstanding performance suggesting that these methods can be used to develop an automated classification rule to classify all-rounders in cricket. Given the rising popularity of cricket, and the increasing revenue generated by the sport, the use of such a prediction tool could be of tremendous benefit to decision-makers in cricket.


2018 ◽  
Vol 24 (106) ◽  
pp. 407
Author(s):  
رباب عبد الرضا صالح ◽  
محمد شاكر محمود

   يعد اسلوبي الانحدار اللوجستي الثنائي Binary logistic regression والدالة المميزة الخطية Linear discriminant function من اهم الاساليب الاحصائية المستخدمة في التصنيف والتنبؤ، عندما تكون البيانات من النوع الثنائي (0،1) فانه لا يمكن استخدام الانحدار الاعتيادي فلذلك نلجأ الى الانحدار اللوجستي الثنائي والدالة المميزة الخطية في حالة وجود مجموعتين او اكثر، وفي حالة وجود مشكلة التعدد الخطي Multicollinearity بين البيانات (ان البيانات يوجد فيها ارتباطات عالية بين المتغيرات) اصبح عدم الامكان في استخدام الانحدار اللوجستي والدالة المميزة الخطية، ولحل هذه المشكلة توجد عدة طرائق منها طريقة انحدار المربعات الصغرى الجزئية Partial least square regression لحل مشكلة التعدد الخطي. وقد جرى في هذه البحث المقارنة بين الانحدار اللوجستي الثنائي binary logistic regression والدالة المميزة الخطية linear discriminant function عن طريق خطأ التصنيف. حيث تم توليد بيانات بمتغير استجابة (Y) نوع ثنائي (0,1) تحتوي على مشكلة التعدد الخطي وبحجوم عينات (50-100-150-250-400) ومتغيرات (5-10-20). حيث تمت معالجة مشكلة التعدد الخطي بأستعمال طريقة المربعات الصغرى الجزئية Partial least square. وتوصل البحث الى ان الدالة المميزة الخطية linear discriminant function هي أفضل في تصنيف البيانات من الانحدار اللوجستي الثنائي binary logistic regression، اذ صنفت الدالة المميزة البيانات بشكل صحيح وأكثر دقة من الانحدار اللوجستي الثنائي.  


2017 ◽  
Vol 23 (99) ◽  
pp. 373
Author(s):  
رباب عبد الرضا صالح البكري ◽  
محمد شاكر محمود

المستخلص    تعد طريقة الانحدار اللوجستي الثنائي Binary logistic regression والدالة المميزة الخطية Linear discriminant function من اهم الطرائق الاحصائية المستخدمة في التصنيف والتنبؤ، عندما تكون البيانات من النوع الثنائي (0،1) فانه لا يمكن استخدام الانحدار الاعتيادي فلذلك نلجأ الى الانحدار اللوجستي الثنائي والدالة المميزة الخطية في حالة وجود مجموعتين، وفي حالة وجود مشكلة التعدد الخطي Multicollinearity بين البيانات (ان البيانات يوجد فيها ارتباطات عالية بين المتغيرات) اصبح عدم الامكان في استخدام الانحدار اللوجستي والدالة المميزة الخطية، ولحل هذه المشكلة نلجأ الى طريقة انحدار المربعات الصغرى الجزئية Partial least square regression لحل مشكلة التعدد الخطي. وقد جرى في هذه البحث المقارنة بين الانحدار اللوجستي الثنائي binary logistic regression والدالة المميزة الخطية linear discriminant function عن طريق خطأ التصنيف. حيث تم جمع بيانات عن مرض فقر الدم بمتغيرين هما فقر الدم الحاد بالرمز (0)، وفقر الدم المزمن بالرمز (1) وبعدة متغيرات حول المرض. جمعت البيانات من عدة مستشفيات عراقية، وجمعت عينة من المرضى الراقدين في المستشفى وحالات سابقة رقدت في المستشفى بعينة قدرها (140) مريضاً مصاباً بهذا المرض. وعند اختبار البيانات وجدت ان هناك مشكلة التعدد الخطي Multicollinearity تمت معالجتها بأستعمال طريقة المربعات الصغرى الجزئية Partial least square. وتوصل البحث الى ان الدالة المميزة الخطية linear discriminant function هي أفضل في تصنيف البيانات من الانحدار اللوجستي الثنائي binary logistic regression، اذ صنفت الدالة المميزة البيانات بشكل صحيح وأكثر دقة من الانحدار اللوجستي الثنائي.


1969 ◽  
Vol 60 (1) ◽  
pp. 105-112
Author(s):  
Calixta S. Torres ◽  
Juan L. Aguiar ◽  
Eleanor F. Gotay

Employees of an agricultural research unit were evaluated for selection as rum tasters. Prospects were classified and ranked considering their relative consistency in four organoleptic tests of four rum samples and their evaluation relative to those of an experienced rum taster. Statistical techniques used were variance analysis of Latin squares for the scores of the evaluation of 10 rum attributes and the calculation of a rum evaluation index for each taster using a linear discriminant function.


Sign in / Sign up

Export Citation Format

Share Document