Nghiên cứu thuật toán học cặp từ điển phân biệt trong phân loại hình ảnh
##plugins.themes.academic_pro.article.main##
Author
-
Nguyễn Hoàng Vũ*, Trần Quốc Cường, Trần Thanh Phong
Từ khóa:
Đại diện thưa
học từ điển
từ điển tổng hợp
từ điển phân tích
học từ điển phân biệt
phân loại hình ảnh
Tóm tắt
Phương pháp học từ điển dựa trên biểu diễn thưa là mô hình đã được áp dụng rộng rãi trong nhiều hệ thống thị giác máy tính với những kết quả đầy hứa hẹn. Trong bài báo này, một giải thuật học cặp từ điển phân biệt (DDPL) mới được đề xuất nhằm cải thiện hiệu quả phân loại hình ảnh. Mô hình đề xuất có khả năng huấn luyện đồng thời một từ điển phân tích và một từ điển tổng hợp với sự kết hợp của ràng buộc không mạch lạc và đại diện hạng thấp. Thuật toán đảm bảo từ điển sau khi được huấn luyện có khả năng phân biệt mạnh và tín hiệu sau mã hóa là tách biệt. So sánh với các phương pháp học từ điển trước đây, DDPL sử dụng ánh xạ mã thưa nên giảm phần lớn gánh nặng tính toán trong huấn luyện và kiểm tra. Kết quả phân loại hình ảnh trên nhiều tập dữ liệu tiêu chuẩn đã chứng minh tính hiệu quả của phương pháp đề xuất.
Tài liệu tham khảo
-
[1] J. Wright, A. Y. Yang, A. Ganesh, S. S. Sastry, và Y. Ma, “Robust face recognition via sparse representation”, IEEE Trans. Pattern Anal. Mach. Intell., vol. 31, no. 2, pp. 210–227, 2009, doi: 10.1109/TPAMI.2008.79.
[2] Y. Xu, D. Zhang, J. Yang, và J. Y. Yang, “A two-phase test sample sparse representation method for use with face recognition”, IEEE Trans. Circuits Syst. Video Technol., vol. 21, no. 9, pp. 1255–1262, Sep. 2011, doi: 10.1109/TCSVT.2011.2138790.
[3] M. Aharon, M. Elad, và A. Bruckstein, “K-SVD: An algorithm for designing overcomplete dictionaries for sparse representation”, IEEE Trans. Signal Process., vol. 54, no. 11, pp. 4311–4322, 2006, doi: 10.1109/TSP.2006.881199.
[4] M. Elad và M. Aharon, “Image denoising via sparse and redundant representations over learned dictionaries”, IEEE Trans. Image Process., vol. 15, no. 12, pp. 3736–3745, Dec. 2006, doi: 10.1109/TIP.2006.881969.
[5] X. Y. Jing, F. Wu, X. Zhu, X. Dong, F. Ma, và Z. Li, “Multi-spectral low-rank structured dictionary learning for face recognition”, Pattern Recognit., vol. 59, pp. 14–25, Nov. 2016, doi: 10.1016/j.patcog.2016.01.023.
[6] Q. Zhang và B. Li, “Discriminative K-SVD for dictionary learning in face recognition”, Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit., pp. 2691–2698, 2010, doi: 10.1109/CVPR.2010.5539989.
[7] Z. Jiang, Z. Lin, và L. S. Davis, “Label consistent K-SVD: Learning a discriminative dictionary for recognition”, IEEE Trans. Pattern Anal. Mach. Intell., vol. 35, no. 11, pp. 2651–2664, 2013, doi: 10.1109/TPAMI.2013.88.
[8] I. Ramirez, P. Sprechmann, và G. Sapiro, “Classification and clustering via dictionary learning with structured incoherence and shared features”, in Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2010, pp. 3501–3508, doi: 10.1109/CVPR.2010.5539964.
[9] Q. Zhang và B. Li, “Discriminative K-SVD for dictionary learning in face recognition”, in Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2010, pp. 2691–2698, doi: 10.1109/CVPR.2010.5539989.
[10] H. Nguyen, W. Yang, B. Sheng, và C. Sun, “Discriminative low-rank dictionary learning for face recognition”, Neurocomputing, vol. 173, pp. 541–551, Jan. 2016, doi: 10.1016/j.neucom.2015.07.031.
[11] R. Rubinstein, T. Peleg, M. E.-I. T. on Signal, and undefined 2012, “Analysis K-SVD: A dictionary-learning algorithm for the analysis sparse model”, ieeexplore.ieee.org.
[12] R. Rubinstein và M. Elad, “Dictionary Learning for Analysis-Synthesis Thresholding”, IEEE Trans. SIGNAL Process., vol. 62, no. 22, 2014, doi: 10.1109/TSP.2014.2360157.
[13] S. Gu, L. Zhang, W. Zuo, và X. Feng, “Projective dictionary pair learning for pattern classification”, Adv. Neural Inf. Process. Syst., vol. 1, no. January, pp. 793–801, 2014.
[14] B. Chen, J. Li, B. Ma, và G. Wei, “Discriminative dictionary pair learning based on differentiable support vector function for visual recognition”, Neurocomputing, vol. 272, pp. 306–313, 2018, doi: 10.1016/j.neucom.2017.07.003.
[15] Z. Zhang et al., “Jointly learning structured analysis discriminative dictionary and analysis multiclass classifier,” IEEE Trans. Neural Networks Learn. Syst., vol. 29, no. 8, pp. 3798–3814, Aug. 2018, doi: 10.1109/TNNLS.2017.2740224.
[16] T. Lin, S. Liu, and H. Zha, “Incoherent dictionary learning for sparse representation,” in Proceedings - International Conference on Pattern Recognition, 2012, pp. 1237–1240.
[17] S. Boyd et al., “Distributed Optimization and Statistical Learning via the Alternating Direction Method of Multipliers,” Found. Trends R Mach. Learn., vol. 3, no. 1, pp. 1–122, 2010, doi: 10.1561/2200000016.
[18] J. F. Cai, E. J. Candès, and Z. Shen, “A singular value thresholding algorithm for matrix completion,” SIAM J. Optim., vol. 20, no. 4, pp. 1956–1982, 2010, doi: 10.1137/080738970.
[19] A. S. Georghiades, P. N. Belhumeur, and D. J. Kriegman, “From few to many: Illumination cone models for face recognition under variable lighting and pose,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 23, no. 6, pp. 643–660, Jun. 2001, doi: 10.1109/34.927464.
[20] A. Mart Nez and R. Benavente, “The AR Face Database,” CVC Tech. Rep., 1998.
[21] L. Fei-Fei, R. Fergus, and P. Perona, “Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories,” Comput. Vis. Image Underst., vol. 106, no. 1, pp. 59–70, Apr. 2007, doi: 10.1016/j.cviu.2005.09.012.
[22] M. Yang, L. Zhang, X. Feng, and D. Zhang, “Fisher Discrimination Dictionary Learning for sparse representation,” Proc. IEEE Int. Conf. Comput. Vis., pp. 543–550, 2011, doi: 10.1109/ICCV.2011.6126286.
[23] Z. Zhang, W. Jiang, Z. Zhang, S. Li, G. Liu, and J. Qin, “Scalable Block-Diagonal Locality-Constrained Projective Dictionary Learning,” IJCAI Int. Jt. Conf. Artif. Intell., vol. 2019-August, pp. 4376–4382, May 2019.
[24] T. H. Chan, K. Jia, S. Gao, J. Lu, Z. Zeng, and Y. Ma, “PCANet: A Simple Deep Learning Baseline for Image Classification?,” IEEE Trans. Image Process., vol. 24, no. 12, pp. 5017–5032, Dec. 2015, doi: 10.1109/TIP.2015.2475625
Xem thêm
Ẩn bớt
##plugins.themes.academic_pro.article.sidebar##
Đã Xuất bản
Jan 31, 2021
Download
Cách trích dẫn
Nguyen Hoang Vu*, Tran Quoc Cuong, Tran Thanh Phong. “Nghiên cứu thuật toán học cặp từ điển phân biệt Trong phân loại hình ảnh”. Tạp Chí Khoa học Và Công nghệ - Đại học Đà Nẵng, vol 19, số p.h 1, Tháng Giêng 2021, https://jst-ud.vn/jst-ud/article/view/3571.