Analisis Perbandingan Optimasi Stochastic Gradient Descent dan Adaptive Moment Estimation dalam Klasifikasi Emosi dari Audio Menggunakan Convolutional Neural Network
Main Article Content
Abstract
Emosi memainkan peran fundamental dalam kehidupan manusia, mempengaruhi perilaku, interaksi sosial, dan pengambilan keputusan. Keberhasilan komunikasi dan pemahaman antar individu sangat bergantung pada kemampuan kita untuk mengenali dan mengekspresikan emosi. Dalam konteks ini, suara atau audio memainkan peran kunci sebagai medium yang mencerminkan dan menyampaikan ekspresi emosional manusia. Di era teknologi informasi dan kecerdasan buatan, pengenalan emosi melalui suara telah menjadi fokus penelitian yang semakin berkembang. Algoritma pembelajaran mesin, terutama jaringan saraf tiruan, dapat dilatih untuk memahami dan mengklasifikasikan emosi yang disampaikan dalam berbagai bentuk, termasuk teks, gambar, video, dan audio. Di antara algoritma-algoritma ini, Convolutional Neural Network (CNN) telah menunjukkan kinerja yang menjanjikan dalam tugas klasifikasi emosi. Dalam penelitian ini, akan diselidiki perbandingan antara Optimizer Stochastic Gradient Descent (SGD) dan Adaptive Moment Estimation (Adam) dalam klasifikasi emosi dari audio menggunakan CNN. Penelitian bertujuan untuk menentukan optimizer optimal untuk tugas klasifikasi emosi. Hasil penelitian menunjukkan bahwa SGD lebih unggul dibandingkan Adam dalam hal akurasi keseluruhan, dengan SGD mencapai akurasi 53% dibandingkan dengan akurasi Adam sebesar 48% dalam dataset The Ryerson Audio-Visual Database of Emotional Speech and Song (RAVDESS). Oleh karena itu, untuk klasifikasi emosi dari data audio, disarankan untuk menggunakan Optimizer Stochastic Gradient Descent (SGD) untuk kinerja yang lebih baik.
Downloads
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.