The Comparison Of Partial Least Squares Regression, Principal Component Regression And Ridge Regression With Multiple Linear Regression For Predicting Pm10 Concentration Level Based On Meteorological Parameters

2021 ◽  
pp. 663-692
Author(s):  
Esra Polat ◽  
Suleyman Gunay
2015 ◽  
pp. 55 ◽  
Author(s):  
Ll. Pérez-Planells ◽  
J. Delegido ◽  
J. P. Rivera-Caicedo ◽  
J. Verrelst

<p class="Bodytext">Los métodos de regresión no paramétricos son una gran herramienta estadística para obtener parámetros biofísicos a partir de medidas realizadas mediante teledetección. Pero los resultados obtenidos se pueden ver afectados por los datos utilizados en la fase de entrenamiento del modelo. Para asegurarse de que los modelos son robustos, se hace uso de varias técnicas de validación cruzada. Estas técnicas permiten evaluar el modelo con subconjuntos de la base de datos de campo. Aquí, se evalúan dos tipos de validación cruzada en el desarrollo de modelos de regresión no paramétricos: hold-out y k-fold. Los métodos de regresión lineal seleccionados fueron: Linear Regression (LR) y Partial Least Squares Regression (PLSR). Y los métodos no lineales: Kernel Ridge Regression (KRR) y Gaussian Process Regression (GPR). Los resultados de la validación cruzada mostraron que LR ofrece los resultados más inestables, mientras KRR y GPR llevan a resultados más robustos. Este trabajo recomienda utilizar algoritmos de regresión no lineales (como KRR o GPR) combinando con la validación cruzada k-fold con un valor de k igual a 10 para hacer la estimación de una manera robusta.</p>


2019 ◽  
Vol 8 (4) ◽  
pp. 496-505
Author(s):  
Vetranella .T.R.A. Sinaga ◽  
Diah Safitri ◽  
Rita Rahmawati

The multiple regression classic assumptions are used to give linear unbiased and minimum variance estimator. In Human Development Index (HDI) and influencing factors in East Java, there are two variables with VIF more than 10 so the assumption of non-multicollinearity is not fulfilled. Principal component regression (PCR) and partial least squares regression (PLS-R) can solve this problem. By doing principal component analysis, there are two linear combinations to take as the new   independent variables which are free from collinearity. In the PLS-R, NIPALS algorithm is used to calculate the components and other structures and to estimate the parameter. While in PCR all independent variables are significant, the percentage of households with drinking water is feasibles is not significant in the model. PLS-R’s  is 95,85% is greater than PCR’s  = 93,42%. PCR’s PRESS = 81,78 is greater than PLS-R’s PRESS = 61,0595.Keywords: Human Development Index (HDI), Multicollinearity, Principal Component Regression, Partial Least Squares Regression, , PRESS


Sign in / Sign up

Export Citation Format

Share Document