Performa Backbone RestNet50 dan MobileNetV2 pada DeeplabV3+ untuk Segmentasi Karakter Komik Lokal
Keywords:
pretrained model, image segmentation, comic image datasetAbstract
Dalam analisa dokumen digital, khususnya komik, pengenalan karakter menjadi salah satu langkah penting terkait potensi pengaplikasiannya di industri, seperti analisa konten, perlindungan hak cipta, dan penerapannya sebagai perangkat pintar interaktif. Penelitian ini bertujuan untuk menerapkan teknik analisa dokumen digital pada komik dengan cara menguji potensi penerapan teknik segmentasi semantik dalam mengenali karakter pada komik lokal. Dua arsitektur DeepLabV3+ dengan backbone ResNet50 dan MobileNetV2 diimplementasikan untuk menganalisis performa pada dataset kecil. Tujuan penelitian ini adalah untuk memahami karakteristik karakter komik lokal dan kontribusi pada perkembangan teknik analisis dokumen digital. Namun, hasil prediksi pada kedua arsitektur menunjukkan tingkat akurasi yang belum memuaskan, terutama dalam mengenali karakter pada kasus penelitian ini. Meskipun demikian, model dengan backbone MobileNetV2 menunjukkan performa yang lebih baik karena mampu mengenali lebih banyak kelas daripada ResNet50 yang cenderung lebih overfitting. Penelitian ini menyimpulkan bahwa pengenalan karakter dalam komik lokal merupakan tantangan yang memerlukan pendekatan lebih cermat dalam mengatasi variasi dan kompleksitas gambar. Hasil penelitian ini dapat menjadi landasan bagi penelitian selanjutnya, seperti penambahan dataset, penyesuaian hyperparameter dan teknik menangani kelas yang tidak seimbang, serta penerapan teknik untuk memisahkan mengabaikan kelas yang tidak digunakan. Diharapkan penelitian ini memberikan wawasan baru bagi pengembangan teknologi analisis dokumen digital dan penerapan dalam konteks komik lokal di masa depan