Skip to content

Latest commit

 

History

History
124 lines (100 loc) · 4.86 KB

File metadata and controls

124 lines (100 loc) · 4.86 KB

人脸检测模型

简介

face_detection中提供高效、高速的人脸检测解决方案,包括最先进的模型和经典模型。

模型库

WIDER-FACE数据集上的mAP

网络结构 输入尺寸 图片个数/GPU 学习率策略 Easy/Medium/Hard Set 预测时延(SD855) 模型大小(MB) 下载 配置文件
BlazeFace 640 8 1000e 0.885 / 0.855 / 0.731 - 0.472 下载链接 配置文件
BlazeFace-FPN-SSH 640 8 1000e 0.907 / 0.883 / 0.793 - 0.479 下载链接 配置文件

注意:

快速开始

数据准备

我们使用WIDER-FACE数据集进行训练和模型测试,官方网站提供了详细的数据介绍。

  • WIDER-Face数据源:
    使用如下目录结构加载wider_face类型的数据集:

    dataset/wider_face/
    ├── wider_face_split
    │   ├── wider_face_train_bbx_gt.txt
    │   ├── wider_face_val_bbx_gt.txt
    ├── WIDER_train
    │   ├── images
    │   │   ├── 0--Parade
    │   │   │   ├── 0_Parade_marchingband_1_100.jpg
    │   │   │   ├── 0_Parade_marchingband_1_381.jpg
    │   │   │   │   ...
    │   │   ├── 10--People_Marching
    │   │   │   ...
    ├── WIDER_val
    │   ├── images
    │   │   ├── 0--Parade
    │   │   │   ├── 0_Parade_marchingband_1_1004.jpg
    │   │   │   ├── 0_Parade_marchingband_1_1045.jpg
    │   │   │   │   ...
    │   │   ├── 10--People_Marching
    │   │   │   ...
    
  • 手动下载数据集: 要下载WIDER-FACE数据集,请运行以下命令:

cd dataset/wider_face && ./download_wider_face.sh

参数配置

基础模型的配置可以参考configs/face_detection/_base_/blazeface.yml; 改进模型增加FPN和SSH的neck结构,配置文件可以参考configs/face_detection/_base_/blazeface_fpn.yml,可以根据需求配置FPN和SSH,具体如下:

BlazeNet:
   blaze_filters: [[24, 24], [24, 24], [24, 48, 2], [48, 48], [48, 48]]
   double_blaze_filters: [[48, 24, 96, 2], [96, 24, 96], [96, 24, 96],
                           [96, 24, 96, 2], [96, 24, 96], [96, 24, 96]]
   act: hard_swish #配置backbone中BlazeBlock的激活函数,基础模型为relu,增加FPN和SSH时需使用hard_swish

BlazeNeck:
   neck_type : fpn_ssh #可选only_fpn、only_ssh和fpn_ssh
   in_channel: [96,96]

训练与评估

训练流程与评估流程方法与其他算法一致,请参考GETTING_STARTED_cn.md
注意: 人脸检测模型目前不支持边训练边评估。

在WIDER-FACE数据集上评估

  • 步骤一:评估并生成结果文件:
python -u tools/eval.py -c configs/face_detection/blazeface_1000e.yml \
       -o weights=output/blazeface_1000e/model_final \
       multi_scale=True

设置multi_scale=True进行多尺度评估,评估完成后,将在output/pred中生成txt格式的测试结果。

  • 步骤二:下载官方评估脚本和Ground Truth文件:
wget http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/support/eval_script/eval_tools.zip
unzip eval_tools.zip && rm -f eval_tools.zip
  • 步骤三:开始评估

方法一:python评估:

git clone https://github.com/wondervictor/WiderFace-Evaluation.git
cd WiderFace-Evaluation
# 编译
python3 setup.py build_ext --inplace
# 开始评估
python3 evaluation.py -p /path/to/PaddleDetection/output/pred -g /path/to/eval_tools/ground_truth

方法二:MatLab评估:

# 在`eval_tools/wider_eval.m`中修改保存结果路径和绘制曲线的名称:
pred_dir = './pred';  
legend_name = 'Paddle-BlazeFace';

`wider_eval.m` 是评估模块的主要执行程序。运行命令如下:
matlab -nodesktop -nosplash -nojvm -r "run wider_eval.m;quit;"

Citations

@article{bazarevsky2019blazeface,
      title={BlazeFace: Sub-millisecond Neural Face Detection on Mobile GPUs},
      author={Valentin Bazarevsky and Yury Kartynnik and Andrey Vakunov and Karthik Raveendran and Matthias Grundmann},
      year={2019},
      eprint={1907.05047},
      archivePrefix={arXiv},