scholarly journals Implementasi Metode TwoStep Clustering untuk Klasterisasi Karakteristik Akademik Mahasiswa

2021 ◽  
Vol 7 (2) ◽  
pp. 121
Author(s):  
Raden Gunawan Santosa ◽  
Yuan Lukito ◽  
Antonius Rachmat Chrismanto

Salah satu algoritma clustering yang paling banyak dipakai adalah K-Means dimana algoritma ini membutuhkan masukan jumlah klaster yang ingin dibentuk.  Pada kenyataannya jumlah klaster yang tepat tidak bisa diketahui sehingga pemilihan nilai k bergantung pada subyektifitas peneliti. Kemudian algoritma K-Means hanya bisa menangani atribut dalam bentuk numerik kontinyu padahal ada atribut dalam bentuk kategorikal atau campuran keduanya.  Pada penelitian ini dilakukan pengelompokkan data akademik mahasiswa dengan menggunakan algoritma twostep clustering yang dapat menentukan jumlah klaster secara otomatis dan dapat menangani atribut dalam bentuk kategorikal, numerik kontinyu atau campuran keduanya. Metode twostep clustering diterapkan pada data mahasiswa angkatan 2008-2019 dengan analisis diterapkan pada setiap angkatannya. Penelitian ini menghasilkan klaster-klaster yang mencerminkan tingkat heterogenitas setiap angkatan mahasiswa.  Klaster-klaster yang didapat merupakan klaster yang optimal setelah diukur menggunakan Bayesian Information Criterion dan Ratio Distance Measure.

Economies ◽  
2020 ◽  
Vol 8 (2) ◽  
pp. 49 ◽  
Author(s):  
Waqar Badshah ◽  
Mehmet Bulut

Only unstructured single-path model selection techniques, i.e., Information Criteria, are used by Bounds test of cointegration for model selection. The aim of this paper was twofold; one was to evaluate the performance of these five routinely used information criteria {Akaike Information Criterion (AIC), Akaike Information Criterion Corrected (AICC), Schwarz/Bayesian Information Criterion (SIC/BIC), Schwarz/Bayesian Information Criterion Corrected (SICC/BICC), and Hannan and Quinn Information Criterion (HQC)} and three structured approaches (Forward Selection, Backward Elimination, and Stepwise) by assessing their size and power properties at different sample sizes based on Monte Carlo simulations, and second was the assessment of the same based on real economic data. The second aim was achieved by the evaluation of the long-run relationship between three pairs of macroeconomic variables, i.e., Energy Consumption and GDP, Oil Price and GDP, and Broad Money and GDP for BRICS (Brazil, Russia, India, China and South Africa) countries using Bounds cointegration test. It was found that information criteria and structured procedures have the same powers for a sample size of 50 or greater. However, BICC and Stepwise are better at small sample sizes. In the light of simulation and real data results, a modified Bounds test with Stepwise model selection procedure may be used as it is strongly theoretically supported and avoids noise in the model selection process.


2019 ◽  
Vol 3 (1) ◽  
pp. 2-13 ◽  
Author(s):  
M. J. Bayarri ◽  
James O. Berger ◽  
Woncheol Jang ◽  
Surajit Ray ◽  
Luis R. Pericchi ◽  
...  

2021 ◽  
Vol 20 (3) ◽  
pp. 450-461
Author(s):  
Stanley L. Sclove

AbstractThe use of information criteria, especially AIC (Akaike’s information criterion) and BIC (Bayesian information criterion), for choosing an adequate number of principal components is illustrated.


2021 ◽  
Vol 26 (1) ◽  
pp. 49-56
Author(s):  
Luisa Fernanda Naranjo Guerrero ◽  
Alberiro López Herrera ◽  
Juan Carlos Rincon Florez ◽  
Luis Gabriel González Herrera

La Raza criolla Blanco Orejinegro (BON) tiene un proceso de adaptación de más de 500 años a las condiciones ambientales de Colombia. Se caracteriza por ser una raza doble propósito utilizada para la producción de leche y carne, convirtiéndola en un patrimonio biológico de gran importancia que debe ser estudiado. El objetivo de este estudio fue identificar un modelo lineal adecuado para evaluar características pre-destete en ganado criollo Blanco Orejinegro. Se recolectó y depuró información de pesajes de cuatro hatos de ganado BON. Las características evaluadas fueron peso a los 4 meses (P4M), peso al destete (PD) y ganancia diaria de peso entre los 4 meses y el destete (GDP4M-D). Se evaluaron nueve modelos lineales en los que se incluyeron como efectos fijos los siguientes factores: sexo, hato, mes de pesaje o nacimiento, número de parto, época de pesaje o época de nacimiento (época seca o lluviosa), edad (covariable, efecto fijo y ajustada por regresión), año de pesaje o año de nacimiento y grupo contemporáneo (GC) compuesto por sexo y hato para GDP4M-D y sexo, hato y año de pesaje para P4M y PD, con mínimo cinco observaciones por GC. Para identificar el modelo lineal más adecuado para cada característica se utilizó el valor de AIC (Akaike information criterion), BIC (Bayesian information criterion), coeficiente de determinación (R2) y la suma de cuadrados del error (SCE). El modelo más adecuado para todas las características fue aquel que involucró el GC y edad como efecto fijo para P4M y edad como covariable para PD.


Sign in / Sign up

Export Citation Format

Share Document