Preview

Вестник НГУЭУ

Расширенный поиск

Эффективность моделей TensorFlow в приложении к задаче обнаружения глаз на фотографии

https://doi.org/10.34020/2073-6495-2022-2-228-238

Аннотация

В данной статье автор проводит сравнение эффективности моделей обнаружения TensorFlow при решении задачи детектирования области глаз на фотографии лица человека. Для этого был проведен ряд экспериментов двух видов: дообучение предварительно обученной модели обнаружения и обучение модели с нуля. Для формирования обучающей и оценочных выборок использовались изображения лиц из открытой базы данных Flickr-Faces-HQ Dataset. В статье приведены параметры обучения, показаны графики потерь классификации и локализации, произведена оценка точности работы обученных моделей, а также продемонстрирована работа обученной с нуля модели обнаружения «SSD MobileNet V2 FPNLite 320×320», которая получила самые высокие оценки точности после обучения с нуля и после дообучения. Для программ с требованием по IoU обнаруживаемых объектов больше 0,5 точность работы модели составила 99,9 %. Результаты экспериментов могут быть использованы в различных исследованиях, в которых применяется платформа TensorFlow для обнаружения объектов на изображениях, и производится обнаружение объектов только одного класса. 

Об авторе

С. О. Бурдуковский
Новосибирский государственный университет экономики и управления «НИНХ»
Россия

аспирант,

Новосибирск



Список литературы

1. Бурдуковский С.О. Анализ и оценка программ глубинного обучения // Развитие интеллектуального потенциала молодежи Кубани–2019: Материалы II Всероссийской научно-практической конф., 13–18 мая 2019 г. Анапа: Анапский филиал ФГБОУ ВО «МПГУ», 2019. С. 18–24.

2. Совпель Д.С. Анализ эмоций человека по портретному снимку // 56-я научная конференция аспирантов, магистрантов и студентов БГУИР, 18–20 мая 2020 г. Минск: БГУИР, 2020. С. 159–161.

3. Araujo G.M., Ribeiro F.M.L., Silva E.A.B., Goldenstein S.K. Fast eye localization without a face model using inner product detectors // 2014 IEEE International Conference on Image Processing, 27–30 october 2014. Paris, 2014. P. 1366–1370. DOI: 10.1109/ICIP.2014.7025273

4. LeCun Y., Bengio Y., Hinton G. Deep learning // Nature. 2015. Vol. 521. P. 436–444. ISSN 1476-4687. DOI: 10.1038/nature14539

5. Markuš N., Frljak M., Pandžić I.S., Ahlberg J., Forchheimer R. Eye pupil localization with an ensemble of randomized trees // Pattern Recognition. 2014. Vol. 47. P. 578–587. DOI: 10.1016/j.patcog.2013.08.008

6. Maxwell A., Warner T.A., Guillén L.A. Accuracy Assessment in Convolutional Neural Network-Based Deep Learning Remote Sensing Studies – Part 1: Literature Review // Remote Sensing. 2021. Vol. 13. P. 1–27. ISSN 2072-4292. DOI: 10.3390/rs13132450

7. Rehman T.U., Mahmud Md.S., Chang Y.K., Shin J.J.J. Current and future applications of statistical machine learning algorithms for agricultural machine vision systems // Computers and Electronics in Agriculture. 2019. Vol. 156. P. 585–605. ISSN 0168- 1699. DOI: 10.1016/j.compag.2018.12.006

8. Saha D., Manickavasagan A. Machine learning techniques for analysis of hyper-spectral images to determine quality of food products: A review // Cur-rent Research in Food Science. 2020. Vol. 4. P. 28–44. ISSN 2665-9271. DOI: 10.1016/j.crfs.2021.01.002

9. Swirski L., Bulling A., Dodgson N.A. Robust real-time pupil tracking in highly of-axis images // Proceedings of the 7th Eye Tracking Research and Applications Symposium. 2012. P. 173–176. DOI: 10.1145/2168556.2168585

10. Timm F., Barth E. Accurate eye centre localisation by means of gradients // VISAPP 2011 – Proceedings of the Sixth International Conference on Computer Vision Theory and Applications, 5–7 march 2011. Vilamora, 2011. P. 125–130.

11. Valenti R., Gevers T. Accurate eye center location through invariant isocentric patterns // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2012. Vol. 34. P. 1785–1798. DOI: 10.1109/TPAMI.2011.251

12. Xie D., Zhang L., Bai L. Deep Learning in Visual Computing and Signal Processing // Applied Computational Intelligence and Soft Computing. 2017. Vol. 2017. P. 1–13. DOI: 10.1155/2017/1320780.

13. Zhang X., Han L., Han L., Zhu L. How Well Do Deep Learning-Based Methods for Land Cover Classification and Object Detection Perform on High Resolution Remote Sensing Imagery? // Remote Sensing. 2020. Vol. 12. P. 1–29. ISSN 2072-4292. DOI: 10.3390/rs12030417

14. COCO – Common Objects in Context. [Электронный ресурс]. URL: https://cocodataset. org/ (дата обращения: 26.03.2022). 15. Flickr-Faces-HQ Dataset (FFHQ). [Электронный ресурс]. URL: https://github.com/NVlabs/ffhq-dataset (дата обращения: 08.03.2022).

15. Intersection over Union (IoU) for object detection – PyImageSearch. [Электронный ресурс]. URL: https://pyimagesearch.com/2016/11/07/intersection-over-union-iou-forobject-detection/ (дата обращения: 03.04.2022).

16. Measuring Labelling Quality with IOU and F1 Score / by Isaac Tan Supahands Tech Blog // Medium. [Электронный ресурс]. URL: https://medium.com/supahandstechblog/measuring-labelling-quality-with-iou-and-f1-score-1717e29e492f (дата обращения: 03.04.2022).

17. Object Detection -IOU-Intersection Over Union / by Ananth Sandeep // Medium. [Электронный ресурс]. URL: https://medium.com/@nagsan16/object-detection-iouintersection-over-union-73070cb11f6e (дата обращения: 03.04.2022).

18. ResearchGate – Best percent of divided the training data and testing data. [Электронный ресурс]. URL: https://www.researchgate.net/post/can_someone_recommend_what_is_the_best_percent_of_divided_the_training_data_and_testing_data_in_neural_network_7525_or_8020_or_9010 (дата обращения: 08.03.2022).

19. ResearchGate – Is there an ideal ratio between a training set and validation set. [Электронный ресурс]. URL: https://www.researchgate.net/post/Is-there-an-ideal-ratiobetween-a-training-set-and-validation-set-Which-trade-off-would-you-suggest (дата обращения: 08.03.2022).

20. TensorFlow. [Электронный ресурс]. URL: https://www.tensorflow.org (дата обращения: 20.03.2022).


Рецензия

Для цитирования:


Бурдуковский С.О. Эффективность моделей TensorFlow в приложении к задаче обнаружения глаз на фотографии. Вестник НГУЭУ. 2022;(2):228-238. https://doi.org/10.34020/2073-6495-2022-2-228-238

For citation:


Burdukowsky S.O. The efficiency of the TensorFlow models in the application to the task of detection of eyes in the photo. Vestnik NSUEM. 2022;(2):228-238. (In Russ.) https://doi.org/10.34020/2073-6495-2022-2-228-238



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2073-6495 (Print)