Applying spark based machine learning model on streaming big data for health status prediction

2018 ◽  
Vol 65 ◽  
pp. 393-399 ◽  
Author(s):  
Lekha R. Nair ◽  
Sujala D. Shetty ◽  
Siddhanth D. Shetty

Machine learning is a prominent tool for getting data from large amounts of information. Whereas a good amount of machine learning analysis has targeted on increasing the accuracy and potency of coaching and reasoning algorithms, there is less attention within the equally vital issues of observing the standard of information fed into the machine learning model. The standard of huge information is far away from good. Recent studies have shown that poor quality will bring serious errors to the result of big data analysis and this could have an effect on in making additional precise results from the information. Advantages of data preprocessing within the context of ML are advanced detection of errors, model-quality improves by the usage of better data, savings in engineering hours to debug issues


2021 ◽  
Vol 2020 (1) ◽  
pp. 1277-1285
Author(s):  
Bagaskoro Cahyo Laksono ◽  
Ika Yuni Wulansari

Krisis Covid-19 berdampak pada revenue perusahaan, jika perusahaan tidak meningkatkan strategi pemasaran yang tepat terhadap konsumen, akan beresiko gulung tikar karena tidak memiliki target pasar yang jelas. Disamping itu, perusahaan dapat mengembangkan bisnisnya menggunakan big data untuk mendukung decision making. Big data dalam industry e-commerce yang mencakup ukuran dan kecepatan transaksi yang tinggi dapat digunakan untuk menganalisis perilaku konsumen bahkan memprediksi nilai konsumen. Pada zaman sekarang perusahaan mulai mengembangkan ketertarikan bisnis yang berorientasi konsumen daripada berorientasi produk. Salah satu cara yang dapat digunakan untuk menentukan nilai konsumen yaitu dengan menghitung Customer Lifetime Value (CLV). Dengan mengetahui CLV di level individu, akan berguna untuk membantu pengambil keputusan untuk mengembangkan segmentasi konsumen dan alokasi sumber daya. Penting dilakukan segmentasi atau pengelompokkan konsumen yang menggambarkan kelompok loyalitas konsumen. Oleh karena itu tujuan dalam penelitian ini adalah melakukan penghitungan CLV dan segmentasi konsumen dengan menggunakan metode analisis RFM dengan K-Means Clustering Machine Learning Model. Tahapan analisis diantaranya mendefinisikan RFM Segmentation Value yang merupakan clustering yang dibangun dari angka kumulatif yang berisi penjumlahan Recency, Frequency dan Monetary Level yang dimiliki masing-masing konsumen. Kombinasi nilai level yang tercipta berkisar antara 0,1,2,3,4,5,6 yang artinya semakin tinggi nilainya maka semakin berharga konsumen tersebut. Pada akhirnya, metode segmentasi konsumen yang di bangun penulis dapat digunakan untuk optimasi strategi perusahaan untuk mendapat profit yang maksimum. Metode ini dapat diterapkan pada berbagai kasus dan perusahaan lain. Hasil penelitian ini diharapkan dapat membantu perusahaan untuk bertahan di tengah krisis akibat Covid-19.


Author(s):  
Rohan Benhal

Abstract: Machine learning-based (IDS) have become a critical component of safeguarding our economic and national security because of the massive quantities of data produced each day and the growing interconnection of the world's Internet infrastructures. The existing machine Learning Model technique may have difficulty comprehending the ever-increasingly complex distribution of data invasion patterns. With a small number of data points, a single deep learning algorithm may be ineffective at capturing different patterns for intrusive attacks. We presented CNN-LSTM Novel Intrusion Detection Model for Big Data to improve the efficiency of IDS-based CNN-LSTM even further (NIDM). NIDM uses behavioural traits and content functions to understand the characteristics when compared to earlier single learning model tactics, this strategy can improve the rate of intrusive attack detection. Keywords: IDS, Machine Learning, LSTM, CNN.


Sign in / Sign up

Export Citation Format

Share Document