Preview

Доклады БГУИР

Расширенный поиск

Формирование обучающей выборки для свёрточных нейронных сетей при реидентификации людей по видеоданным

https://doi.org/10.35596/1729-7648-2023-21-3-87-95

Аннотация

Для повышения точности работы системы реидентификации людей предлагается комплексный подход при формировании обучающей выборки для свёрточных нейронных сетей, предполагающий использование нового набора изображений, увеличение количества тренировочных примеров за счет существующих баз данных и применение ряда преобразований для повышения их разнообразия. Созданный набор данных PolReID1077 содержит изображения людей, которые были получены во все времена года, что позволит повысить корректность работы систем реидентификации при смене сезонов. ПреимуществомPolReID1077 является также использование видеоданных, полученных при внешнем и внутреннем наблюдении в большом количестве различных мест съемки. Поэтому изображения людей в созданном наборе характеризуются вариабельностью фона, яркостных и цветовых характеристик. Объединение созданного набора с существующими CUHK02, CUHK03, Market-1501, DukeMTMC-ReID и MSMT17 позволило получить 109 772 изображения для обучения. Увеличение разнообразия сформированных примеров достигается за счет применения к ним циклического сдвига, исключения цветности и замещения фрагмента уменьшенной копией другого изображения. Представлены результаты исследований по оценке точности реидентификации для свёрточных нейронных сетей ResNet-50 и DenseNet-121 при их тренировке с использованием предложенного подхода для формирования обучающей выборки.

Об авторах

С. А. Игнатьева
Полоцкий государственный университет имени Евфросинии Полоцкой
Беларусь

Игнатьева Светлана Александровна,

211440, г. Новополоцк, ул. Блохина, 29

Тел.: +375 214 42-30-31



Р. П. Богуш
Полоцкий государственный университет имени Евфросинии Полоцкой
Беларусь

д. т. н., доцент, заведующий кафедрой вычислительных систем и сетей

Полоцк



Список литературы

1. Shorten С., Taghi M. K. (2019) A Survey on Image Data Augmentation for Deep Learning. Journal of Big Data. (6), 1–48. DOI: 10.1186/s40537-019-0197-0.

2. Chen H., Ihnatsyeva S., Bohush R., Ablameyko S. (2022) Choice of Activation Function in Convolution Neural Network in Video Surveillance Systems. Programming and Computer Software. (5), 312–321. DOI: 10.1134/S0361768822050036.

3. Wei L., Wang X. (2013) Locally Aligned Feature Transforms Across Views. 2013 IEEE Conference on Computer Vision and Pattern Recognition. 3594–3601. DOI: 10.1109/CVPR.2013.461.

4. Li W., Zhao R., Xiao T., Wang X. (2014) DeepReID: Deep Filter Pairing Neural Network for Person Re-Identification. 2014 IEEE Conference on Computer Vision and Pattern Recognition. 152–159. DOI: 10.1109/CVPR.2014.27.

5. Zheng L., Shen L., Tian L., Wang S., Wang J., Tian Q. (2015) Scalable Person Re-Identification: a Benchmark. 2015 IEEE International Conference on Computer Vision. 1116–1124. DOI: 10.1109/ICCV.2015.133.

6. Ristani E., Solera F., Zou R. S., Cucchiara R., Tomasi C. (2016) Performance Measures and a Data Set for Multi-Target, Multi-Camera Tracking. ECCV Workshops. DOI: 10.1007/978-3-319-48881-3_2.

7. Wei L., Zhang S., Gao W., Tian Q. (2017) Person Transfer GAN to Bridge Domain Gap for Person Re-Identification. 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. 79–88. DOI: 10.1109/CVPR.2018.00016.

8. Felzenszwalb P., Girshick R., McAllester D., Ramanan D. (2010) Object Detection with Discriminatively Trained Part-Based Models. PAMI. DOI: 10.1109/TPAMI.2009.167.

9. Gong Y., Zeng Z. (2021) An Effective Data Augmentation for Person Re-Identification. ArXiv, abs/2101.08533. DOI: 10.48550/arXiv.2101.08533.

10. Fu D., Chen D., Bao J., Yang H., Yuan L., Zhang L., Li H., Chen D. (2021) Unsupervised Pre-Training for Person Re-Identification. 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition. 14745–14754. DOI: 10.1109/CVPR46437.2021.01451.

11. Cubuk E. D., Zoph B., Shlens J., Le Q. V. (2020) Randaugment: Practical Automated Data Augmentation with a Reduced Search Space. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. 3008–3017. DOI: 10.1109/CVPRW50498.2020.00359.

12. Hendrycks D., Mu N., Cubuk E. D., Zoph B., Gilmer J., Lakshminarayanan B. (2019) AugMix: a Simple Data Processing Method to Improve Robustness and Uncertainty. ArXiv, abs/1912.02781. DOI: 10.48550/arXiv.1912.02781.

13. Zhang H., Cissй M., Dauphin Y., Lopez-Paz D. (2017) Mixup: Beyond Empirical Risk Minimization. ArXiv, abs/1710.09412. DOI: 10.48550/arXiv.1710.09412.

14. Zhong Z., Zheng L., Kang G., Li S., Yang Y. (2017) Random Erasing Data Augmentation. AAAI Conference on Artificial Intelligence. DOI: 10.1609/AAAI.V34I07.7000.

15. Yun S., Han D., Oh S., Chun S., Choe J., Yoo Y. J. (2019) CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features. 2019 IEEE/CVF International Conference on Computer Vision. 6022– 6031. DOI: 10.1109/ICCV.2019.00612.

16. Xie T., Cheng X., Wang X., Liu M., Deng J., Zhou T., Liu M. (2021) Cut-Thumbnail: a Novel Data Augmentation for Convolutional Neural Network. Proceedings of the 29th ACM International Conference on Multimedia. DOI: 10.1145/3474085.3475302.


Рецензия

Для цитирования:


Игнатьева С.А., Богуш Р.П. Формирование обучающей выборки для свёрточных нейронных сетей при реидентификации людей по видеоданным. Доклады БГУИР. 2023;21(3):87-95. https://doi.org/10.35596/1729-7648-2023-21-3-87-95

For citation:


Ihnatsyeva S.A., Bohush R.P. Training Sample Formation for Convolution Neural Networks to Person Re-Identification from Video. Doklady BGUIR. 2023;21(3):87-95. (In Russ.) https://doi.org/10.35596/1729-7648-2023-21-3-87-95

Просмотров: 358


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1729-7648 (Print)
ISSN 2708-0382 (Online)