scholarly journals PYTHON MÜHİTİNDƏ K-MEANS, K-MEANS++ VƏ MİNİ BATCH K-MEANS ALQORİTMLƏRİNİN MÜQAYİSƏLİ ANALİZİ

2021 ◽  
Vol 12 (2) ◽  
pp. 119-128
Author(s):  
Elton Əhmədov ◽  

Məqalədə k-means alqortitmi və onun modifikasiyalarının Python mühitində müxtəlif ölçülü verilənlərə tətbiqi məsələlərinə baxılır. Eyni zamanda ənənəvi k-means klasterləşdirmə alqoritmi və onun modifikasıyalarının mövcud vəziyyəti, imkanları, çatışmazlıqları, meydana çıxan problemlər tədqiq edilmiş və onların həlli üçün təkliflər verilmişdir. k-means++ alqoritmi vasitəsilə ənənəvi k-means metodunun başlanğıc mərkəzlərin təsadüfi seçilməsi çatışmazlığı aradan qaldırılmışdır. Mini batch k-means alqoritmi vasitəsilə böyük verilənlər paketlərə bölünməklə analiz edilmişdir ki, bu da böyük həcmli, kompleks verilənlərin analiz prosesini sürətləndirmişdir. Verilənlərin klasterləşdirilməsi zamanı ölçünün azaldılması və klasterlərin optimal sayının tapılması üçün hibrid PCA və elbow metodu təklif edilmişdir. Bu yanaşmanın effektivliyinin qiymətləndirilməsi üçün alqoritmlər müxtəlif ölçülü bir neçə verilənlər çoxluğu üzərində sınaqdan keçirilmişdir. Alqoritmlərin effektivliyinin qiymətləndirilməsi üçün siluet və Devis-Boldin indekslərindən istifadə edilmişdir. Eksperimentin nəticəsi göstərmişdir ki, təklif olunan yanaşma böyük ölçülü verilənlərin klasterləşdirilməsində daha effektivdir. Təklif edilən hibrid PCA və elbow metodu irihəcmli, çoxölçülü verilənlərin emal prosesində böyük hesablama resursları tələb edən məsələlərin həllinə yeni imkanlar yaradır.

Sign in / Sign up

Export Citation Format

Share Document