PENGGUNAAN DATA MINING DALAM EKSTENSIFIKASI PENELITIAN ULANG

Ardandy Amrie Irshadi; Alam Wahyu Santoso

doi:10.31092/jpbc.v5i2.1305

PENGGUNAAN DATA MINING DALAM EKSTENSIFIKASI PENELITIAN ULANG

JURNAL PERSPEKTIF BEA DAN CUKAI ◽

10.31092/jpbc.v5i2.1305 ◽

2021 ◽

Vol 5 (2) ◽

pp. 218-132

Author(s):

Ardandy Amrie Irshadi ◽

Alam Wahyu Santoso

Keyword(s):

Data Mining ◽

Data Model ◽

Analytical Data ◽

Trade Flows ◽

Model Data ◽

Standard Process ◽

Regional Office ◽

Trade Effect ◽

Industry Standard ◽

Clearance Control

ABSTRACT Due to increasing volume of international trade, effect on increasing customs document, Customs play a role so that trade flows run without obstacles, this causes inspection of imported goods to be less than optimal, but on the other hand Customs are required to collect state revenues optimally. This study tries to solve this problem from the post-clearance control side with re-examination by construct an analytical data model to predict the suitable classification. This study uses data on the Notification of Imported Goods during 2020 at the Regional Office of DJBC XXX which using a sample of goods that has similarities but has the potential to be misclassified. This study uses the Cross-industry Standard Process for Data Mining (CRISP-DM) model and the Rapid Miner Studio 9.9.2 application. Based on the model formed, the prediction results obtained according to the appropriate classification according to data mining. It also found the factors that most impact to goods classification, the most impact is the Importer status, whereas the least impact is the goods lane. ABSTRAK: Seiring dengan volume perdagangan internasional yang semakin tinggi, jumlah dokumen kepabeanan yang harus diperiksa juga mengalami peningkatan. Hal ini menghambat peran Bea dan Cukai sebagai fasilitator perdagangan yang menyebabkan pemeriksaan barang impor kurang optimal. Di sisi lain, Bea dan Cukai dituntut untuk menghimpun penerimaan negara secara optimum. Penelitian ini mencoba untuk menyelesaikan permasalahan tersebut pada tahap post clearance dengan penelitian ulang, yaitu dengan membangun model data analitik untuk memprediksi klasifikasi barang yang diberitahukan oleh importir sudah sesuai atau belum. Penelitian ini menggunakan data Pemberitahuan Impor Barang selama tahun 2020 pada Kanwil DJBC XXX yang sampel data barangnya memiliki kemiripan tetapi berpotensi salah klasifikasi. Penelitian ini menggunakan model Cross-industry Standard Process for Data Mining (CRISP-DM) dan aplikasi Rapid Miner Studio 9.9.2. Berdasarkan permodelan yang dibentuk, didapatkan hasil prediksi klasifikasi yang sesuai menurut data mining. Didapat pula faktor yang paling memengaruhi kebenaran pemberitahuan klasifikasi barang impor, yaitu status importir, sedangkan yang paling tidak berpengaruh adalah jalur pengeluaran barang impor. Kata Kunci: Penelitian Ulang, Data Analitik, Penerimaan Negara, Klasifikasi Barang

Download Full-text

Evaluasi Telemarketing Kartu Kredit Bank Menggunakan Algoritma Genetika untuk Seleksi Fitur dan Naive Bayes

Jurnal Aplikasi Pelayaran dan Kepelabuhanan ◽

10.30649/japk.v10i1.71 ◽

2020 ◽

Vol 10 (1) ◽

pp. 12

Author(s):

Ekka Pujo Ariesanto Akhmad

Keyword(s):

Data Mining ◽

Naive Bayes ◽

Naïve Bayes ◽

Standard Process ◽

Industry Standard

Bagian pemasaran bank sudah menampung data dari nasabah atau pelanggan bank dengan cara memasarkan atau mensosialisasikan kartu kredit lewat telepon (telemarketing). Evaluasi telemarketing kartu kredit yang sudah dilakukan bank masih kurang membawa hasil dan berdaya guna. Salah satu cara yang tepat untuk evaluasi laporan telemarketing kartu kredit bank adalah menggunakan teknik data mining. Tujuan penggunaan data mining untuk mengetahui kecenderungan dan pola nasabah yang berpeluang untuk berlangganan kartu kredit yang ditawarkan bank. Metode penelitian menggunakan Cross Industry Standard Process for Data Mining (CRISP-DM) dengan Algoritma Genetika untuk Seleksi Fitur (GAFS) dan Naive Bayes (NB). Hasil penelitian menunjukkan jumlah atribut pada dataset telemarketing kartu kredit bank sejumlah 15 atribut terdiri dari 14 atribut biasa dan 1 atribut spesial. Dataset telemarketing bank mengandung data berdimensi tinggi, sehingga diterapkan metode GAFS. Setelah menerapkan metode GAFS diperoleh 7 atribut optimal terdiri dari 6 atribut biasa dan 1 atribut spesial. Enam atribut biasa meliputi pekerjaan, balance, rumah, pinjaman, durasi, poutcome. Sedangkan atribut spesial adalah target. Hasil penelitian menunjukkan algoritma NB mempunyai nilai akurasi 86,71%. Algoritma GAFS dan NB meningkatkan nilai akurasi menjadi 90,27% untuk prediksi nasabah bank yang mengambil kartu kredit.

Download Full-text

Mining multiple sources of historical data: The example of a standardized dataset of medieval monasteries and convents in France

Proceedings of the ICA ◽

10.5194/ica-proc-2-85-2019 ◽

2019 ◽

Vol 2 ◽

pp. 1-7

Author(s):

Adam Mertel ◽

David Zbíral

Keyword(s):

Data Mining ◽

Spatial Patterns ◽

Data Model ◽

Computational Analysis ◽

Historical Data ◽

Model Data ◽

Multiple Sources ◽

The Public ◽

Comprehensive Collection ◽

Online Databases

Abstract. In this paper, we present a dataset of medieval monasteries and convents on the territory of today’s France and discuss the workflow of its integration. Spatial historical data are usually dispersed and stored in various forms &ndash; encyclopedias and catalogues, websites, online databases, and printed maps. In order to cope with this heterogeneity and proceed to computational analysis, we have devised a method that includes the creation of a data model, data mining from sources, data transformation, geocoding, editing, and conflicts solving. The resulting dataset is probably the most comprehensive collection of records on medieval monasteries within the borders of today’s France. It can be used for understanding the spatial patterns of medieval Christian monasticism and the implantation of the official Church infrastructure, as well as the relation between this official infrastructure and phenomena covered in other datasets. We open this dataset, as well as scripts for mining, to the public (https://github.com/adammertel/dissinet.monasteries) and provide a map tool to visualize, filter, and download the records (http://hde.geogr.muni.cz/monasteries).

Download Full-text

Aplicación de los árboles de decisión en la identificación de patrones de lesiones fatales por causa externa en el municipio de Pasto, Colombia

Universidad y Salud ◽

10.22267/rus.171903.101 ◽

2017 ◽

Vol 19 (3) ◽

pp. 388

Author(s):

Ricardo Timaran-Pereira ◽

Andrés Calderón-Romero ◽

Arsenio Hidalgo-Troya

Keyword(s):

Data Mining ◽

Standard Process ◽

Industry Standard ◽

America Latina

Introducción: La Organización Panamericana de la Salud (OPS) desde el año 1993 y la Organización Mundial de la Salud (OMS) en 1996, aceptaron que la violencia es un problema de salud pública, situación que se corrobora en el Informe de Violencia y Salud, en el cual América Latina presentó una tasa de homicidios de 18 por cada 100.000 personas, y es considerada como una de las regiones más violentas del mundo. Objetivo: Detectar patrones delictivos con técnicas de minería de datos en el Observatorio del Delito del municipio de Pasto (Colombia). Materiales y métodos: Se aplicó Cross Industry Standard Process for Data Mining (CRISP-DM), una de las metodologías utilizadas en el desarrollo de proyectos de minería de datos en los ambientes académico e industrial. La fuente de información fue el Observatorio del Delito del municipio de Pasto, donde está almacenadas las cifras históricas, limpias y transformadas sobre las lesiones de causa externa (fatales y no fatales), registrados en 11 años. Resultados: Se construyó un modelo de clasificación basado en árboles de decisión que permitió descubrir patrones de muertes por causa externa. Para el caso de homicidios, estos sucedieron en su mayoría en la Comuna 5 de Pasto, los fines de semana, en la madrugada, en el segundo semestre del año, en la vía pública y las víctimas fueron hombres adultos, de oficios varios, la causa de los homicidios fueron riñas y se produjeron con arma de fuego. Conclusión: El conocimiento generado ayudará a los organismos gubernamentales y de seguridad a tomar decisiones eficaces en lo relacionado a la implementación de planes de prevención de delitos y seguridad ciudadana.

Download Full-text

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN CALON NASABAH DAN NASABAH TETAPBANK BRI SYARIAH MENERIMA PENAWARAN PROGRAM DEPOSITO BERJANGKA

Jurnal Teknologi dan Informasi ◽

10.34010/jati.v8i1.906 ◽

2018 ◽

Vol 8 (1) ◽

Author(s):

Wahyu Nurjaya WK ◽

Yusrina Adani

Keyword(s):

Data Mining ◽

Naive Bayes ◽

Naïve Bayes ◽

Data Preparation ◽

Standard Process ◽

Industry Standard

Bank BRI Syariah memiliki banyak produk yang menarik untuk ditawarkan kepada calon nasabah maupun nasabah tetap berupa produk jangka panjang atau jangka pendek, yang menawarkan banyak keuntungan bagi nasabah itu sendiri. Salah satu produknya adalah Deposito berjangka yang merupakan produk investasi dengan menyimpan uang dan penarikanya hanya bisa dilakukan pada kurun waktu tertentu yang telah di janjikan oleh pihak bank dengan persetujuan nasabah. Dengan telemarketing yang baik oleh pihak bank maka diharapkan calon nasabah dan nasabah tetap mengetahui produk ini.Telemarketing adalah salah satu cara dalam mempromosikan produk-produk atau jasa layanan yang ada di bank. Seorang telemarketing bank harus dapat membuat target nasabah, nasabah mana yang berpotensi untuk meningkatkan deposito dengan melihat data-data nasabah bank yang telah tersimpan dalam database. Dikarenakan database nasabah sangat besar, maka tidak mungkin untuk mencari pola prediksi calon nasabah atau nasabah tetap yang berminat untuk program Deposito dengan cara konvensional.Berdasarkan hal tersebut, pengelolaan data yang sangat besar bisa diatasi dengan memanfaatkan Data Mining yaitu proses iteratif dan interaktif untuk menentukan pola atau model baru yang sempurna, bermanfaat dan dapat dimengerti dalam suatu database yang sangat besar. Data Mining berisi pencarian trend pola yang diinginkan dalam database besar untuk membantu pengambilan keputusan diwaktu yang akan datang. Dengan menggunakan Data Mining diharapkan dapat mengoptimasikan proses prediksi data nasabah oleh seorang telemarketing, sehingga dia mampu menawarkan deposito dengan target calon nasabah atau nasabah tetap yang tepat sasaran. Adapun Teknik Klasifikasi Data Mining menggunakan algoritma Naïve Bayes. Naïve Bayes bekerja sangat efektif saat diuji pada dataset yang besar untuk menentukan pola dimasa lalu dan mencari fungsi yang akan menjadi pola penilaian data dimasa yang akan datang. Untuk mencapai hasil yang diharapkan metode CRISP-DM (Cross Industry Standard Process for Data Mining) sangat cocok sebagai solusi, melalui proses business understanding, data understanding, data preparation, modeling, evaluation dan deployment. Dengan ini hasil prediksi akan lebih akurat, sehingga untuk target telemarketing produk Deposito Bank BRI Syariah akan tepat sasaran.

Download Full-text

Desenvolvimento de um Sistema de Apoio a Decisão para priorização de Pedidos de Desembolso no Estado de Pernambuco

Revista de Engenharia e Pesquisa Aplicada ◽

10.25286/repa.v3i3.975 ◽

2018 ◽

Vol 3 (3) ◽

Author(s):

Itallo Henrique de Santana Santos ◽

Alexandre Magno Andrade Maciel

Keyword(s):

Data Mining ◽

Standard Process ◽

Industry Standard

A Secretaria da Controladoria Geral do Estado (SCGE) analisa mensalmente despesas geradas pelos diferentes órgãos do Estado de Pernambuco com o objetivo de garantir os pagamentos daquelas que são mais sensíveis. Mais de 1 bilhão de reais em despesas ficaram pendentes no exercício de 2016, demonstrando importância de priorização dos pagamentos. Nesse contexto o artigo apresenta o processo de desenvolvimento de um Sistema de Apoio a Decisão (SAD) para a Secretaria da Controladoria Geral do Estado de Pernambuco. O sistema proposto tem a capacidade de classificar as despesas públicas por meio de árvore de decisão auxiliando o trabalho de análise dos gestores responsáveis na priorização de pagamentos. No artigo é detalhado a caracterização do problema, a fundamentação teórica usada no trabalho, a aplicação da metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) e o sistema. A utilização de árvore de decisão na classificação das despesas teve como resultado uma acurácia de 99%, mostrando que o uso desse tipo de modelo atendeu satisfatoriamente na solução do problema encontrado.

Download Full-text

Beyond Cross Industry Standard Process for Data Mining

Nov/Dec 2019 ◽

10.1287/lytx.2019.06.04 ◽

2019 ◽

Keyword(s):

Data Mining ◽

Standard Process ◽

Industry Standard

Download Full-text

Analisis Sentimen pada Ulasan pengguna Aplikasi Bibit Dan Bareksa dengan Algoritma KNN

JATISI (Jurnal Teknik Informatika dan Sistem Informasi) ◽

10.35957/jatisi.v8i2.962 ◽

2021 ◽

Vol 8 (2) ◽

pp. 636-646

Author(s):

Aluisius Dwiki Adhi Putra

Keyword(s):

Data Mining ◽

Nearest Neighbors ◽

Standard Process ◽

K Nearest Neighbors ◽

Industry Standard ◽

Google Play

Investasi online merupakan kegiatan menanam modal baik langsung maupun tidak dengan harapan pada suatu waktu pemilik modal mendapatkan sejumlah keuntungan yang dilakukan secara online. Terdapat contoh aplikasi investasi online yang sudah banyak diunduh masyarakat menurut google play store yepenaitu bibit dan bareksa. Sehingga Tujuan penelitian ini adalah untuk menganalisa sentimen pada ulasan pengguna aplikasi investasi online yaitu bibit dan bareksa. Jumlah ulasan yang akan digunakan pada penelitian ini sebanyak 998 yang terdiri dari 484 sentimen positif dan 514 sentimen negatif untuk aplikasi bareksa sedangkan untuk aplikasi bibit menggunakan 1063 data yang terdiri dari 541 sentimen positif dan 522 sentimen negatif. Data tersebut juga melewati tahapan preprocessing dan modelling. Pada penelitian ini menggunakan model CRISP-DM (Cross Industry Standard Process for Data Mining) dan algoritma yang digunakan pada penelitian ini adalah K-Nearest Neighbors. Berdasarkan hasil yang diperoleh dari tahapan modelling dengan menggunakan algoritma k-nearest neighbors dan perbandingan 60:40 untuk data training dan data testing, maka nilai akurasi precision dan recall yang dihasilkan dari tiap aplikasi yaitu untuk bibit 85,14% , 91,91%, dan 76,44% sedangkan untuk bareksa yaitu 81,70% , 87,15%, 75,73%.

Download Full-text

Klasifikasi Keatraktifan e-Commerce Indonesia Menggunakan Algoritma Regresi Logistik

JURNAL MEDIA INFORMATIKA BUDIDARMA ◽

10.30865/mib.v4i2.1717 ◽

2020 ◽

Vol 4 (2) ◽

pp. 271

Author(s):

Agus Riyanto ◽

Richky Faizal Amir

Keyword(s):

Data Mining ◽

Rapid Development ◽

Confusion Matrix ◽

Value Added ◽

Knowledge Discovery In Databases ◽

Standard Process ◽

Industry Standard ◽

Good Investment ◽

Forecast Data ◽

Logistic Regression Algorithm

The rapid development of the internet gives a significant influence in various aspects of life, data mining is the search for value-added processes one of a series of knowledge discovery in databases (KDD). Utilization of data mining can be seen from two aspects, namely commercial and scientific. The collection of test datasets is done by observing the research object on the analysis site that provides vital information and forecast data for the local e-commerce web. The study was conducted by exploration and experimentation, the standard research method used in testing is the cross industry standard process for data mining (CRISP-DM) which consists of 6 phases with the Weka framework 3-8-3. Logistic regression algorithm is a method of data analysis that formulates the response variable with one or more predictor variables. The results of testing the value of e-commerce attractiveness in the confusion matrix, 5 are categorized as having high probability of investment objectives and profiles, 1 are categorized as having good investment probability prospects, 2 are categorized as having good investment probabilities with promising profiles and 1 with promising investment probabilities and profiles not good and 31 in terms of probability and profile is not good. While the results for the Origin class confusion matrix are 31 identified from local Indonesia with confusion 5, 4 from Global with uncertainty 0

Download Full-text

PENERAPAN METODE CLUSTERING K-MEANS UNTUK PENGELOMPOKAN PRESTASI MAHASISWA DI POLITEKNIK LP3I BANDUNG

TEMATIK ◽

10.38204/tematik.v1i1.36 ◽

2014 ◽

Vol 1 (1) ◽

pp. 59-68

Author(s):

Tubagus Riko Rivanthio, S.Kom.

Keyword(s):

Data Mining ◽

Standard Process ◽

Industry Standard

Abstrak : Penelitian ini bertujuan untuk mengelompokkan mahasiswa berdasarkan prestasi menggunakan teknik data mining dengan metode clustering K-Means. Hasil pengelompokkan mahasiswa diharapkan menjadi indikator bagi lembaga Politeknik LP3I Bandung dan pembimbing akademik mahasiswa dalam melakukan bimbingan terhadap mahasiswa. Metode penelitian yang digunakan adalah menggunakan metode standar data mining yaitu Cross Industry Standard Process for Data Mining (CRISP-DM), dengan pemodelan yang digunakan adalah metode clustering, dimana pengklusteran merupakan pengelompokan record pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Sedangkan K-Means merupakan algoritma yang berisi tahapan dari pengelompokkan. Berdasarkan hasil penelitian bahwa pengelompokkan menggunakan Clustering K-Means cukup efektif, Dari 368 data/mahasiswa terbentuk empat kelompok yang terdiri dari kluster pertama 13 data, kluster kedua 27 data, kluster ketiga 142, dan kluter keempat 186 data.

Download Full-text

Letting the Computers Take Over: Using AI to Solve Marketing Problems

California Management Review ◽

10.1177/0008125619859318 ◽

2019 ◽

Vol 61 (4) ◽

pp. 156-185 ◽

Cited By ~ 12

Author(s):

Gijs Overgoor ◽

Manuel Chica ◽

William Rand ◽

Anthony Weishampel

Keyword(s):

Artificial Intelligence ◽

Data Mining ◽

Customer Service ◽

Cutting Edge ◽

Standard Process ◽

Industry Standard ◽

Marketing Problems

Artificial intelligence (AI) has proven to be useful in many applications from automating cars to providing customer service responses. However, though many firms want to take advantage of AI to improve marketing, they lack a process by which to execute a Marketing AI project. This article discusses the use of AI to provide support for marketing decisions. Based on the established Cross-Industry Standard Process for Data Mining (CRISP-DM) framework, it creates a process for managers to use when executing a Marketing AI project and discusses issues that might arise. It explores how this framework was used to develop three cutting-edge Marketing AI applications.

Download Full-text