Cải thiện hiệu năng mạng nơ ron tích chập bằng phương pháp gộp dựa trên logic mờ
9 lượt xemDOI:
https://doi.org/10.54939/1859-1043.j.mst.112.2026.29-37Từ khóa:
CNN; Học sâu; Logic mờ; Lớp gộp; Phân lớp.Tóm tắt
Trong các bài toán nhận dạng và phân loại ảnh tự động, mạng nơ ron tích chập (CNN) được sử dụng rộng rãi, trong đó phép gộp (pooling) đóng vai trò quan trọng trong việc tổng hợp và làm nổi các đặc trưng dữ liệu ảnh. Bài báo này đề xuất một phương pháp gộp (pooling) dựa trên logic mờ, tích hợp các phản hồi đặc trưng tối thiểu, trung bình và tối đa thông qua một cơ chế suy luận Takagi Sugeno đơn giản. Khác với các phương pháp gộp truyền thống, cách tiếp cận được đề xuất mô hình hóa một cách tường minh tính bất định trong quá trình tổng hợp đặc trưng, từ đó cho phép đạt được sự cân bằng tốt hơn giữa các đặc trưng cục bộ nổi bật và ngữ cảnh, nhằm bảo toàn thông tin quan trọng của ảnh. Hiệu quả của phương pháp được đánh giá trên các bộ dữ liệu MNIST và CIFAR-10. Kết quả thực nghiệm cho thấy phương pháp gộp mờ được đề xuất đạt hiệu quả phân loại vượt trội so với các phương pháp gộp truyền thống, đồng thời vẫn duy trì độ phức tạp tính toán tương đương. Phương pháp của bài báo có thể áp dụng hiệu quả trong các bài toán phân loại ảnh dựa trên mạng nơ ron tích chập.
Tài liệu tham khảo
[1]. R. Bhargava, N. Arivazhagan & K.S. Babu, "Hybrid RMDL-CNN for speech recognition from unclear speech signal". Int J Speech Technol 28, 195–217, (2025).
[2]. S. Chinnaiyan, A.B. Haffishthullah, S. Naveen, et al. "Optimized graph convolutional shunted self-attention neural network for multilingual speech-to-text training using cross-language voice conversion of speech representations". Int J Speech Technol 29, 22, (2026).
[3]. M. Bojarski et al., “End-to-end learning for self-driving cars,” arXiv preprint, arXiv:1604.07316, (2016).
[4]. A. G. Gad, “Particle swarm optimization algorithm and its applications: A systematic review,” Archives of Computational Methods in Engineering, Vol. 29, No. 5, pp. 2531–2561, (2022).
[5]. Q. Li et al., “EEG-based anxiety emotion classification using an optimized convolutional neural network and transformer,” Signal, Image and Video Processing, Vol. 19, pp. 501–509, (2025).
[6]. J. Zhang et al., “PCB defect recognition by image analysis using deep convolutional neural network,” Journal of Electronic Testing, Vol. 40, No. 5, pp. 657–667, (2024).
[7]. P. S. Geidarov, “Analytical calculation of weights of convolutional neural networks,” Optical Memory and Neural Networks, Vol. 33, No. 2, pp. 157–177, (2024).
[8]. X. Lin et al., “LIBS feature variable extraction method based on convolutional neural network,” Journal of Applied Spectroscopy, Vol. 92, No. 1, pp. 218–224, (2025).
[9]. C. Tang et al., “DeepSCNN: A simplicial convolutional neural network for deep learning,” Applied Intelligence, Vol. 55, pp. 281–295, (2025).
[10]. M. Zhu et al., “ShuffleNeXt: Modern lightweight convolutional neural network architecture,” Pattern Analysis and Applications, Vol. 27, No. 4, pp. 123–135, (2024).
[11]. C. Y. Lee, P. Gallagher, and Z. Tu, “Generalizing pooling functions in convolutional neural networks: Mixed, gated, and tree pooling,” IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 40, No. 4, pp. 863–875, (2017).
[12]. R. Nirthika, S. Manivannan, and A. Ramanan, “An experimental study on convolutional neural network-based pooling techniques for the classification of HEp-2 cell images,” Proc. of 10th International Conference on Information and Automation for Sustainability (ICIAfS), Colombo, Sri Lanka, (2021).
[13]. M. S. Greeshma and V. R. Bindu, “Single image super-resolution using fuzzy deep convolutional networks,” Proc. of International Conference on Technological Advancements in Power and Energy (TAP Energy), Kollam, India, (2017).
[14]. M. M. Hasan et al., “FP-CNN: Fuzzy pooling-based convolutional neural network for lung ultrasound image classification with explainable AI,” Computers in Biology and Medicine, Vol. 165, Article no. 107407, (2023).
[15]. S.B. Tharun, S. Jagatheswari, "A U-shaped CNN with type-2 fuzzy pooling layer and dynamical feature extraction for colorectal polyp applications". Eur. Phys. J. Spec. Top. 234, 2627–2635 (2025).
[16]. M. Sarkar, A. Mandal, "Atrous convolution and fuzzy pooling-based multi-channel CNN model for accurate follicle segmentation". Evolving Systems 17, 37 (2026).
[17]. C. Ozdemir, Y. Dogan, and Y. Kaya, “A new local pooling approach for convolutional neural networks: Local binary pattern pooling,” Multimedia Tools and Applications, Vol. 83, No. 12, pp. 34137–34151, (2023).
