scholarly journals التحليل المميز والانحدار اللوجستي بأستعمال المربعات الصغرى الجزئية (دراسة تجريبية (محاكاة))

2018 ◽  
Vol 24 (106) ◽  
pp. 407
Author(s):  
رباب عبد الرضا صالح ◽  
محمد شاكر محمود

   يعد اسلوبي الانحدار اللوجستي الثنائي Binary logistic regression والدالة المميزة الخطية Linear discriminant function من اهم الاساليب الاحصائية المستخدمة في التصنيف والتنبؤ، عندما تكون البيانات من النوع الثنائي (0،1) فانه لا يمكن استخدام الانحدار الاعتيادي فلذلك نلجأ الى الانحدار اللوجستي الثنائي والدالة المميزة الخطية في حالة وجود مجموعتين او اكثر، وفي حالة وجود مشكلة التعدد الخطي Multicollinearity بين البيانات (ان البيانات يوجد فيها ارتباطات عالية بين المتغيرات) اصبح عدم الامكان في استخدام الانحدار اللوجستي والدالة المميزة الخطية، ولحل هذه المشكلة توجد عدة طرائق منها طريقة انحدار المربعات الصغرى الجزئية Partial least square regression لحل مشكلة التعدد الخطي. وقد جرى في هذه البحث المقارنة بين الانحدار اللوجستي الثنائي binary logistic regression والدالة المميزة الخطية linear discriminant function عن طريق خطأ التصنيف. حيث تم توليد بيانات بمتغير استجابة (Y) نوع ثنائي (0,1) تحتوي على مشكلة التعدد الخطي وبحجوم عينات (50-100-150-250-400) ومتغيرات (5-10-20). حيث تمت معالجة مشكلة التعدد الخطي بأستعمال طريقة المربعات الصغرى الجزئية Partial least square. وتوصل البحث الى ان الدالة المميزة الخطية linear discriminant function هي أفضل في تصنيف البيانات من الانحدار اللوجستي الثنائي binary logistic regression، اذ صنفت الدالة المميزة البيانات بشكل صحيح وأكثر دقة من الانحدار اللوجستي الثنائي.  

2017 ◽  
Vol 23 (99) ◽  
pp. 373
Author(s):  
رباب عبد الرضا صالح البكري ◽  
محمد شاكر محمود

المستخلص    تعد طريقة الانحدار اللوجستي الثنائي Binary logistic regression والدالة المميزة الخطية Linear discriminant function من اهم الطرائق الاحصائية المستخدمة في التصنيف والتنبؤ، عندما تكون البيانات من النوع الثنائي (0،1) فانه لا يمكن استخدام الانحدار الاعتيادي فلذلك نلجأ الى الانحدار اللوجستي الثنائي والدالة المميزة الخطية في حالة وجود مجموعتين، وفي حالة وجود مشكلة التعدد الخطي Multicollinearity بين البيانات (ان البيانات يوجد فيها ارتباطات عالية بين المتغيرات) اصبح عدم الامكان في استخدام الانحدار اللوجستي والدالة المميزة الخطية، ولحل هذه المشكلة نلجأ الى طريقة انحدار المربعات الصغرى الجزئية Partial least square regression لحل مشكلة التعدد الخطي. وقد جرى في هذه البحث المقارنة بين الانحدار اللوجستي الثنائي binary logistic regression والدالة المميزة الخطية linear discriminant function عن طريق خطأ التصنيف. حيث تم جمع بيانات عن مرض فقر الدم بمتغيرين هما فقر الدم الحاد بالرمز (0)، وفقر الدم المزمن بالرمز (1) وبعدة متغيرات حول المرض. جمعت البيانات من عدة مستشفيات عراقية، وجمعت عينة من المرضى الراقدين في المستشفى وحالات سابقة رقدت في المستشفى بعينة قدرها (140) مريضاً مصاباً بهذا المرض. وعند اختبار البيانات وجدت ان هناك مشكلة التعدد الخطي Multicollinearity تمت معالجتها بأستعمال طريقة المربعات الصغرى الجزئية Partial least square. وتوصل البحث الى ان الدالة المميزة الخطية linear discriminant function هي أفضل في تصنيف البيانات من الانحدار اللوجستي الثنائي binary logistic regression، اذ صنفت الدالة المميزة البيانات بشكل صحيح وأكثر دقة من الانحدار اللوجستي الثنائي.


2020 ◽  
Vol 2020 ◽  
pp. 1-11
Author(s):  
Thomas O. S. Akowuah ◽  
Ernest Teye ◽  
Julius Hagan ◽  
Kwasi Nyandey

The potential of nondestructive prediction of egg freshness based on near-infrared (NIR) spectra fingerprints would be beneficial to quality control officers and consumers alike. In this study, handheld NIR spectrometer in the range of 740 nm to 1070 nm and chemometrics were used to simultaneously determine egg freshness based on marked date of lay for eggs stored under cold and ambient conditions. The spectra acquired from the eggs were preprocessed using multiplicative scatter correction and principal component analysis (MSC-PCA). Linear discriminant analysis (LDA) was used to build identification model to predict the category of freshness, while partial least square regression (PLS-R) was used to determine the marked date of lay. The performance of LDA model was above 95% identification rate in both calibration and prediction set for the eggs stored under ambient and cold storage. For eggs stored in ambient storage, LDA had 95.54% identification rate at 5 principal components, while at cold storage LDA has 100% identification rate at 5 principal components for determining the marked date of lay, and partial least square regression (PLS-R) gave R = 0.87 and RMSEI = 2.57 for ambient storage and R = 0.88 and RMSEI = 2.66 for cold storage in independent set, respectively. The results show that handheld spectrometer and multivariate analysis could be used for rapid and nondestructive measurement of egg freshness. This provides a novel solution for egg integrity prediction along the value chain.


2020 ◽  
Vol 27 (35) ◽  
pp. 43439-43451 ◽  
Author(s):  
Jianfeng Yang ◽  
Yumin Duan ◽  
Xiaoni Yang ◽  
Mukesh Kumar Awasthi ◽  
Huike Li ◽  
...  

2021 ◽  
Vol 36 (06) ◽  
Author(s):  
NGUYEN MINH QUANG ◽  
TRAN NGUYEN MINH AN ◽  
NGUYEN HOANG MINH ◽  
TRAN XUAN MAU ◽  
PHAM VAN TAT

In this study, the stability constants of metal-thiosemicarbazone complexes, logb11 were determined by using the quantitative structure property relationship (QSPR) models. The molecular descriptors, physicochemical and quantum descriptors of complexes were generated from molecular geometric structure and semi-empirical quantum calculation PM7 and PM7/sparkle. The QSPR models were built by using the ordinary least square regression (QSPROLS), partial least square regression (QSPRPLS), primary component regression (QSPRPCR) and artificial neural network (QSPRANN). The best linear model QSPROLS (with k of 9) involves descriptors C5, xp9, electric energy, cosmo volume, N4, SsssN, cosmo area, xp10 and core-core repulsion. The QSPRPLS, QSPR PCR and QSPRANN models were developed basing on 9 varibles of the QSPROLS model. The quality of the QSPR models were validated by the statistical values; The QSPROLS: R2train = 0.944, Q2LOO = 0.903 and MSE = 1.035; The QSPRPLS: R2train = 0.929, R2CV = 0.938 and MSE = 1.115; The QSPRPCR: R2train = 0.934, R2CV = 0.9485 and MSE = 1.147. The neural network model QSPRANN with architecture I(9)-HL(12)-O(1) was presented also with the statistical values: R2train = 0.9723, and R2CV = 0.9731. The QSPR models also were evaluated externally and got good performance results with those from the experimental literature.


2020 ◽  
Vol 33 (10) ◽  
pp. 1633-1641
Author(s):  
Dae-Hyun Lee ◽  
Seung-Hyun Lee ◽  
Byoung-Kwan Cho ◽  
Collins Wakholi ◽  
Young-Wook Seo ◽  
...  

Objective: The objective of this study was to develop a model for estimating the carcass weight of Hanwoo cattle as a function of body measurements using three different modeling approaches: i) multiple regression analysis, ii) partial least square regression analysis, and iii) a neural network.Methods: Data from a total of 134 Hanwoo cattle were obtained from the National Institute of Animal Science in South Korea. Among the 372 variables in the raw data, 20 variables related to carcass weight and body measurements were extracted to use in multiple regression, partial least square regression, and an artificial neural network to estimate the cold carcass weight of Hanwoo cattle by any of seven body measurements significantly related to carcass weight or by all 19 body measurement variables. For developing and training the model, 100 data points were used, whereas the 34 remaining data points were used to test the model estimation.Results: The R2 values from testing the developed models by multiple regression, partial least square regression, and an artificial neural network with seven significant variables were 0.91, 0.91, and 0.92, respectively, whereas all the methods exhibited similar R2 values of approximately 0.93 with all 19 body measurement variables. In addition, relative errors were within 4%, suggesting that the developed model was reliable in estimating Hanwoo cattle carcass weight. The neural network exhibited the highest accuracy.Conclusion: The developed model was applicable for estimating Hanwoo cattle carcass weight using body measurements. Because the procedure and required variables could differ according to the type of model, it was necessary to select the best model suitable for the system with which to calculate the model.


2009 ◽  
Vol 620-622 ◽  
pp. 21-24
Author(s):  
Shuang Ping Yang ◽  
Yong Hui Song ◽  
Liu Hua Xin

With practical data of the BF ironmaking from Jiuquan Iron&Steel Cooperation Ltd. (JISC), taking the quality of pig iron as evaluation indicator, mathematical models based on the least square regression and partial least square regression were set up respectively by co-relation analysis of feeding-to-product interval of the BF processing. The calculation results showed that the reasonable description can be obtained by the partial least square regression model; and 10 of 29 parameters with obvious impact on the BF operation were listed accordingly. Meanwhile, an optimal group of parameters was found by genetic algorism calculation method. The optimal index of the group was 99.13%. This study is beneficial to the improvement of feeding adjustment and optimal operation of BF ironmaking.


Sign in / Sign up

Export Citation Format

Share Document