scholarly journals Ανάπτυξη πολυκριτήριου συστήματος συστάσεων για προσωποποιημένο μάρκετινγκ

2018 ◽  
Author(s):  
Ιωάννης Ζήσος

Ένα από τα πιο καίρια ερωτήματα για τους χρήστες του διαδικτύου, είναι πώς θα καταφέρουν να διαχειριστούν την τεράστια ποσότητα διαθέσιμης πληροφορίας, ώστε να καταλήξουν σε επιλογή προϊόντων που ανταποκρίνονται όσο το δυνατό καλύτερα στις προτιμήσεις και ανάγκες τους. Αντίστοιχα, οι εταιρείες που παρέχουν προϊόντα ή υπηρεσίες μέσω του διαδικτύου, προσπαθούν συστηματικά να εντοπίσουν μεθόδους ώστε να αποκωδικοποιήσουν με ακρίβεια τα προφίλ προτίμησης των χρηστών, με στόχο να καταφέρουν να προσαρμόσουν κατάλληλα τα προϊόντα τους και να αυξήσουν τις πωλήσεις τους.Για τους παραπάνω λόγους, η επιστημονική και ερευνητική κοινότητα που δραστηριοποιείται στο τομέα της ανάλυσης δεδομένων και το μάρκετινγκ έχει επικεντρώσει την προσπάθεια της, στην δημιουργία μεθοδολογιών που θα απαντήσουν όσο το δυνατόν πιο αποτελεσματικά τα παραπάνω ερωτήματα. Οι περισσότερες από αυτές τις μεθοδολογίες καταλήγουν στην ανάπτυξη προσαρμοστικών συστημάτων που αντλούν δεδομένα από το διαδίκτυο και εξάγουν προτάσεις για τους χρήστες. Η πιο γνωστή κατηγορία τέτοιου είδους συστημάτων είναι τα συστήματα συστάσεων (Recommender Systems). Στην παρούσα ερευνητική εργασία παρουσιάζεται η μεθοδολογία και τα αποτελέσματα πιλοτικής λειτουργίας ενός νέου υβριδικού συστήματος συστάσεων που βασίζεται στη χρήση μεθόδων ανάλυσης συναισθήματος, πολυκριτήριας ανάλυσης καθώς και μεθόδων φιλτραρίσματος. Η μεθοδολογία καταλήγει σε τέσσερα διαφορετικά είδη σύστασης, με άκρως ενδιαφέροντα αποτελέσματα.Μέσω του μεθοδολογικού πλαισίου γίνεται εφικτός ο προσδιορισμός των προτιμησιακών προφίλ των χρηστών του συστήματος, τα οποία εν συνεχεία αντιστοιχίζονται σε «προφίλ πελατών» που επιλέγουν συγκεκριμένα προϊόντα/υπηρεσίες που τους «ταιριάζουν».Έτσι, καταλήγουμε σε προσωποποιημένες συστάσεις προϊόντων στον χρήστη του συστήματος, που είναι ανάλογες των προτιμήσεων του. Επιπλέον δίνεται στο χρήστη η δυνατότητα να φιλτράρει τις διαθέσιμες εναλλακτικές με σχετική επιλογή από ένα σύνολο κατ’ αποκοπή κριτηρίων. Η χρήση του κατωφλιού ελάχιστης ικανοποίησης, που προσδιορίζεται από τα αποτελέσματα της ανάλυσης συναισθήματος στα σχόλια των πελατών, εγγυάται την ποιότητα των συστάσεων.Τα δεδομένα του συστήματος είναι πραγματικές απόψεις και βαθμολογίες χρηστών για καταλύματα, καθώς και χαρακτηριστικά καταλυμάτων που αντλήθηκαν από γνωστή διαδικτυακή πλατφόρμα κρατήσεων. H ανάπτυξη του συστήματος βασίστηκε στην μεθοδολογία CRISP-DM(Shearer, 2000a). Η αξιολόγηση του συστήματος συστάσεων γίνεται με μέτρηση της ακρίβειας προβλέψεων αξιολογήσεων σε πείραμα με πραγματικούς χρήστες.Για τη μελέτη περίπτωσης χρησιμοποιήθηκαν δεδομένα για τα τουριστικά καταλύματα του Νομού Χανίων. Τα πιο σημαντικά χαρακτηριστικά της συγκεκριμένης ερευνητικής προσπάθειας είναι: α. H χρήση μεγάλου όγκου πραγματικών δεδομένων σε αντίθεση με τις περισσότερες από τις υπάρχουσες έρευνες που χρησιμοποιούν έτοιμα τεστ σετ δεδομένων. β. Η χρησιμοποίηση όλης της διαθέσιμης αντλημένης πληροφορίας προκειμένου να καταλήξουμε σε σύσταση. Πιο συγκεκριμένα στην παρούσα μεθοδολογία χρησιμοποιούνται δεδομένα βαθμολογιών προϊόντων για την ανάλυση ικανοποίησης πελατών, δεδομένα απόψεων για τη συναισθηματική ανάλυση, στατικά δεδομένα των προϊόντων σαν κατ’ αποκοπή κριτήρια σε αντίθεση με τις περισσότερες μελέτες όπου χρησιμοποιούνται είτε βαθμολογίες, είτε ανάλυση σχολίων για την τελική σύσταση.γ. Η χρήση των αποτελεσμάτων της ανάλυσης συναισθήματος ως κατώφλια ποιότητας σύστασης. δ. Η επιτυχής εφαρμογή παραλλαγής της πρόσφατα παρουσιασθείσας μεθόδου WAP, για τη δημιουργία προτιμησιακού προφίλ χρήστη.ε. Η απαίτηση για εισαγωγή ελάχιστων δεδομένων από το χρήστη.στ. Ο ελάχιστος χρόνος που απαιτείται για την παραγωγή της σύστασης κατά τη λειτουργία του συστήματος.η. Η αποφυγή άντλησης προσωπικών δεδομένων του χρήστη για χρήση τους στη διαδικασία της σύστασης. θ. H αποφυγή του προβλήματος της καθυστερημένης εκκίνησης (cold start). ι. Τα άκρως ικανοποιητικά αποτελέσματα με βάση τις μετρικές που χρησιμοποιήθηκαν για τη δοκιμή του συστήματος.κ. Η χρησιμότητα του συστήματος είναι χαρακτηριστική για όλες τις ομάδες στόχου, καθώς δίνεται η δυνατότητα παροχής χρήσιμης πληροφορίας τόσο στον πελάτη με σύσταση ανάλογη των αναγκών του, όσο και στον πάροχο υπηρεσίας/προϊόντος, προσδιορίζοντας του τις τάσεις όσον αφορά την ικανοποίηση των πελατών. Οι κύριες μετρικές που χρησιμοποιούνται για την μέτρηση της ποιότητας των συστάσεων που παράγονται είναι οι: Mean Square Error (MSE), Root Mean Square Error (RMSE), Mean Absolute Error (MAE), Mean Absolute Percentage Error (MAPE).H διατριβή ολοκληρώνεται, με προτάσεις, για μελλοντική έρευνα και επέκταση του παρόντος συστήματος.

2020 ◽  
Vol 30 (4) ◽  
pp. 249-257
Author(s):  
Reid J. Reale ◽  
Timothy J. Roberts ◽  
Khalil A. Lee ◽  
Justina L. Bonsignore ◽  
Melissa L. Anderson

We sought to assess the accuracy of current or developing new prediction equations for resting metabolic rate (RMR) in adolescent athletes. RMR was assessed via indirect calorimetry, alongside known predictors (body composition via dual-energy X-ray absorptiometry, height, age, and sex) and hypothesized predictors (race and maturation status assessed via years to peak height velocity), in a diverse cohort of adolescent athletes (n = 126, 77% male, body mass = 72.8 ± 16.6 kg, height = 176.2 ± 10.5 cm, age = 16.5 ± 1.4 years). Predictive equations were produced and cross-validated using repeated k-fold cross-validation by stepwise multiple linear regression (10 folds, 100 repeats). Performance of the developed equations was compared with several published equations. Seven of the eight published equations examined performed poorly, underestimating RMR in >75% to >90% of cases. Root mean square error of the six equations ranged from 176 to 373, mean absolute error ranged from 115 to 373 kcal, and mean absolute error SD ranged from 103 to 185 kcal. Only the Schofield equation performed reasonably well, underestimating RMR in 51% of cases. A one- and two-compartment model were developed, both r2 of .83, root mean square error of 147, and mean absolute error of 114 ± 26 and 117 ± 25 kcal for the one- and two-compartment model, respectively. Based on the models’ performance, as well as visual inspection of residual plots, the following model predicts RMR in adolescent athletes with better precision than previous models; RMR = 11.1 × body mass (kg) + 8.4 × height (cm) − (340 male or 537 female).


2014 ◽  
Vol 7 (3) ◽  
pp. 1247-1250 ◽  
Author(s):  
T. Chai ◽  
R. R. Draxler

Abstract. Both the root mean square error (RMSE) and the mean absolute error (MAE) are regularly employed in model evaluation studies. Willmott and Matsuura (2005) have suggested that the RMSE is not a good indicator of average model performance and might be a misleading indicator of average error, and thus the MAE would be a better metric for that purpose. While some concerns over using RMSE raised by Willmott and Matsuura (2005) and Willmott et al. (2009) are valid, the proposed avoidance of RMSE in favor of MAE is not the solution. Citing the aforementioned papers, many researchers chose MAE over RMSE to present their model evaluation statistics when presenting or adding the RMSE measures could be more beneficial. In this technical note, we demonstrate that the RMSE is not ambiguous in its meaning, contrary to what was claimed by Willmott et al. (2009). The RMSE is more appropriate to represent model performance than the MAE when the error distribution is expected to be Gaussian. In addition, we show that the RMSE satisfies the triangle inequality requirement for a distance metric, whereas Willmott et al. (2009) indicated that the sums-of-squares-based statistics do not satisfy this rule. In the end, we discussed some circumstances where using the RMSE will be more beneficial. However, we do not contend that the RMSE is superior over the MAE. Instead, a combination of metrics, including but certainly not limited to RMSEs and MAEs, are often required to assess model performance.


2021 ◽  
Vol 12 (1) ◽  
pp. 95-104
Author(s):  
Firəngiz Sadıyeva ◽  

Məqalədə COVID-19 pandemiyasını proqnozlaşdırmaq üçün avtoreqressiv inteqrasiya edilmiş hərəkətli ortalama (ing. ARIMA. Autoregressive İntegrated Moving Average) modeli təklif edilmişdir. COVID-19 dünyada sürətlə yayılan və hazırda davam edən yeni növ pandemiyadır. Son dövrlərdə pandemiyaya yoluxanların sayı Azərbaycanda rekord həddə çatmışdır. Məhz bu səbəbdən COVID-19 pandemiyasının proqnozu məsələsinə baxılmışdır və bir neçə ayı əhatə edən real verilənlərlə eksperimentlərdə təklif edilmiş ARIMA modelinin COVID-19 zaman sıralarının proqnozlaşdırılması üçün müxtəlif parametrlərlə tətbiq edilmişdir. Verilənlər dedikdə, 22.01.2020 – 22.10.2020 tarixləri arasında Azərbaycan Respublikasının Səhiyyə Nazirliyi (www.sehiyye.gov.az) tərəfindən rəsmi olaraq qeydiyyata alınan gündəlik yoluxma hallarının sayı nəzərdə tutulur. Bu verilənlərdən istifadə etməklə, növbəti zaman aralığında ölkəmizdə baş verəcək yoluxma halları proqnoz edilmişdir. Bunun üçün ARIMA modelinə müxtəlif parametrlər verilmiş və uyğun olaraq hər bir modelin səhv dərəcəsi qiymətləndirilmişdir. Səhvin qiymətləndirilməsi üçün MAPE (Mean Absolute Persentace Error), MAE (Mean Absolute Error) və RMSE (Root Mean Square Error) funksiyaları istifadə edilib. Müqayisələr nəticəsində ən uyğun model seçilmişdir. Alınmış nəticələr ölkəmizdə pandemiya dövründə həm səhiyyə sistemi, həm də adi vətəndaşlar üçün vacib amildir. Əldə edilmiş nəticələr statistik metodların koronavirusa aid qeyri-stasionar zaman sıralarının proqnozlaşdırılmasının digər məsələlərə tətbiqində də məhsuldar ola biləcəyini təsdiqləyir.


Author(s):  
Muhammad Wahdeni Pramana ◽  
Ika Purnamasari ◽  
Surya Prangga

Ekspor merupakan aktivitas perdagangan atau penjualan barang dari dalam negeri ke luar negeri. Ekspor nonmigas sebagai salah satu komponen pembentuk Produk Domestik Regional Bruto (PDRB) sehingga perlu adanya suatu peramalan nilai di masa mendatang. Fuzzy Time Series (FTS) merupakan metode peramalan dengan berdasarkan teori himpunan fuzzy, logika fuzzy, serta hasil peramalan yang dapat dibahasakan (linguistik). Metode Weighted Fuzzy Time Series (WFTS) Lee merupakan perluasan dari metode FTS dengan penambahan pembobotan pada tiap pola relasi yang terbentuk. Tujuan penelitian ini adalah memperoleh nilai peramalan ekspor nonmigas Provinsi Kalimantan Timur pada bulan November 2020 serta memperoleh nilai akurasi peramalan berdasarkan metode Mean Absolute Percentage Error (MAPE) dan Root Mean Square Error (RMSE). Berdasarkan hasil analisis diperoleh nilai akurasi peramalan untuk data Ekspor Nonmigas Provinsi Kalimantan Timur bulan Januari 2019 – Oktober 2020 dengan konstanta pembobot   menggunakan metode MAPE diperoleh hasil keseluruhan dibawah 10% sehingga diperoleh konstanta pembobot terbaik yaitu  dengan nilai MAPE terminimum yaitu sebesar 3,62% dan RMSE minimum sebesar 50,67. Dari hasil tersebut, diperoleh hasil peramalan untuk bulan November 2020 dengan menggunakan kontanta pembobot terbaik  yaitu sebesar 850,96 juta USD.


2014 ◽  
Vol 7 (1) ◽  
pp. 1525-1534 ◽  
Author(s):  
T. Chai ◽  
R. R. Draxler

Abstract. Both the root mean square error (RMSE) and the mean absolute error (MAE) are regularly employed in model evaluation studies. Willmott and Matsuura (2005) have suggested that the RMSE is not a good indicator of average model performance and might be a misleading indicator of average error and thus the MAE would be a better metric for that purpose. Their paper has been widely cited and may have influenced many researchers in choosing MAE when presenting their model evaluation statistics. However, we contend that the proposed avoidance of RMSE and the use of MAE is not the solution to the problem. In this technical note, we demonstrate that the RMSE is not ambiguous in its meaning, contrary to what was claimed by Willmott et al. (2009). The RMSE is more appropriate to represent model performance than the MAE when the error distribution is expected to be Gaussian. In addition, we show that the RMSE satisfies the triangle inequality requirement for a distance metric.


2018 ◽  
Vol 14 (2) ◽  
pp. 225
Author(s):  
Indriyanti Indriyanti ◽  
Agus Subekti

Konsumsi energi bangunan yang semakin meningkat mendorong para peneliti untuk membangun sebuah model prediksi dengan menerapkan metode machine learning, namun masih belum diketahui model yang paling akurat. Model prediktif untuk konsumsi energi bangunan komersial penting untuk konservasi energi. Dengan menggunakan model yang tepat, kita dapat membuat desain bangunan yang lebih efisien dalam penggunaan energi. Dalam tulisan ini, kami mengusulkan model prediktif berdasarkan metode pembelajaran mesin untuk mendapatkan model terbaik dalam memprediksi total konsumsi energi. Algoritma yang digunakan yaitu SMOreg dan LibSVM dari kelas Support Vector Machine, kemudian untuk evaluasi model berdasarkan nilai Mean Absolute Error dan Root Mean Square Error. Dengan menggunakan dataset publik yang tersedia, kami mengembangkan model berdasarkan pada mesin vektor pendukung untuk regresi. Hasil pengujian kedua algoritma tersebut diketahui bahwa algoritma SMOreg memiliki akurasi lebih baik karena memiliki nilai MAE dan RMSE sebesar 4,70 dan 10,15, sedangkan untuk model LibSVM memiliki nilai MAE dan RMSE sebesar 9,37 dan 14,45. Kami mengusulkan metode berdasarkan algoritma SMOreg karena kinerjanya lebih baik.


2018 ◽  
Vol 19 (2) ◽  
pp. 83
Author(s):  
Mukhamad Adib Azka ◽  
Prabu Aditya Sugianto ◽  
Andreas Kurniawan Silitonga ◽  
Imma Redha Nugraheni

Curah hujan merupakan parameter meteorologi yang sangat berpengaruh dalam kehidupan. Saat ini, pengamatan secara in situ sangat kurang representatif untuk digunakan sebagai analisis karena jangkauannya yang sangat sempit sehingga memerlukan instrumen pendukung seperti satelit agar dapat memberikan gambaran yang lebih baik terkait distribusi hujan. Namun, data satelit juga belum tentu sepenuhnya benar karena resolusi dan kondisi dari setiap wilayah berbeda. Penelitian ini bertujuan untuk mendapatkan nilai akurasi, bias, korelasi, root mean square error (RMSE), dan mean absolute error (MAE) data estimasi curah hujan GPM IMERG dengan data curah hujan pengamatan langsung. Penelitian ini dilakukkan di Surabaya dengan menggunakan data estimasi curah hujan GPM IMERG dan data curah hujan pengamatan langsung dari Stasiun Meteorologi Kelas I Juanda Surabaya selama tahun 2017 mewakili musim hujan, musim kemarau, dan periode transisi. Hasil penelitian menunjukkan bahwa data curah hujan produk GPM IMERG memiliki korelasi yang sangat baik untuk memperkirakan akumulasi curah hujan bulanan. Sedangkan, untuk akumulasi harian, memiliki korelasi yang sangat rendah. Sementara itu untuk akumulasi sepuluh harian, data curah hujan produk satelit GPM IMERG memiliki korelasi yang baik terutama di periode musim hujan dan musim kemarau, akan tetapi memiliki korelasi yang rendah selama periode transisi dari musim hujan ke musim kemarau atau sebaliknya. Pada umumnya, produk ini sangat bagus dalam menentukan ada atau tidaknya hujan, tetapi performanya sangat rendah dalam menentukan besarnya intensitas curah hujan.


2019 ◽  
Vol 12 (1) ◽  
pp. 10 ◽  
Author(s):  
Khalil Ur Rahman ◽  
Songhao Shang ◽  
Muhammad Shahid ◽  
Yeqiang Wen

Merging satellite precipitation products tends to reduce the errors associated with individual satellite precipitation products and has higher potential for hydrological applications. The current study evaluates the performance of merged multi-satellite precipitation dataset (daily temporal and 0.25° spatial resolution) developed using the Dynamic Bayesian Model Averaging algorithm across four different climate regions, i.e., glacial, humid, arid and hyper-arid regions, of Pakistan during 2000–2015. Four extensively evaluated SPPs over Pakistan, i.e., Tropical Rainfall Measurement Mission (TRMM) Multi-satellite Precipitation Analysis (TMPA) 3B42V7, Precipitation Estimation from Remotely Sensed Information using Artificial Neural Networks-Climate Data Record (PERSIANN-CDR), Climate Prediction Center MORPHing technique (CMORPH), and Era-Interim, are used to develop the merged multi-satellite precipitation dataset. Six statistical indices, including Mean Bias Error, Mean Absolute Error, Root Mean Square Error, Correlation Coefficient, Kling-Gupta efficiency, and Theil’s U coefficient, are used to evaluate the performance of merged multi-satellite precipitation dataset over 102 ground precipitation gauges both spatially and temporally. Moreover, the ensemble spread score and standard deviation are also used to depict the spread and variation of precipitation of merged multi-satellite precipitation dataset. Skill scores for all statistical indices are also included in the analyses, which shows improvement of merged multi-satellite precipitation dataset against Simple Model Averaging. The results revealed that DBMA-MSPD assigned higher weights to TMPA (0.32) and PERSIANN-CDR (0.27). TMPA presented higher skills in glacial and humid regions with average weights of 0.32 and 0.37 as compared to PERSIANN-CDR of 0.27 and 0.25, respectively. TMPA and Era-Interim depicted higher skills during pre-monsoon and monsoon seasons, with average weights of 0.31 and 0.52 (TMPA) and 0.25 and 0.21 (Era-Interim), respectively. Merged multi-satellite precipitation dataset overestimated precipitation in glacial/humid regions and showed poor performance, with the poorest values of mean absolute error (2.69 mm/day), root mean square error (11.96 mm/day), correlation coefficient (0.41), Kling-Gupta efficiency score (0.33) and Theil’s U (0.70) at some stations in glacial/humid regions. Higher performance is observed in hyper-arid region, with the best values of 0.71 mm/day, 1.72 mm/day, 0.84, 0.93, and 0.37 for mean absolute error, root mean square error, correlation coefficient, Kling-Gupta Efficiency score, and Theil’s U, respectively. Merged multi-Satellite Precipitation Dataset demonstrated significant improvements as compared to TMPA across all climate regions with average improvements of 45.26% (mean bias error), 30.99% (mean absolute error), 30.1% (root mean square error), 11.34% (correlation coefficient), 9.53% (Kling-Gupta efficiency score) and 8.86% (Theil’s U). The ensemble spread and variation of DBMA-MSPD calculated using ensemble spread score and standard deviation demonstrates high spread (11.38 mm/day) and variation (12.58 mm/day) during monsoon season in the humid and glacial regions, respectively. Moreover, the improvements of DBMA-MSPD quantified against fixed weight SMA-MSPD reveals supremacy of DBMA-MSPD, higher improvements (40–50%) in glacial and humid regions.


Sign in / Sign up

Export Citation Format

Share Document