五、人工智能网络训练与预(图片、视频、人脸和车牌)

人工智能网络训练与预测,包含 图片训练及预测和视频训练及预测

1 、图片训练及预测

打开 TeguCV GUI,选择 IMAGE DETECTION 模块。

(安装包中的 TeguCV GUI 1.15/Dataset/CarDataset 可用于学习本章教程内容)

• 新建项目

点击新建项目 New Project,开启新的神经网络训练工作(仅支持英文路径及项目名)。

填写必要信息,即可新建项目。

• 打开项目

点击打开项目 Open Project,使用之前的训练项目继续训练工作。

程序会自动记录上一个训练程序的路径。在 TeguCV GUI 中,训练工程文件的后缀名为「.tegu」。

新建项目或打开项目后,可以看到以下界面。

红色区域为参数区,蓝色区域为日志区。

• 训练区模块

Epoch 最大训练轮次

使用全部数据训练一次为一个epoch;模型训练达到设定的最大训练轮次数时,训练自动停止。

Learning Rate 学习率

学习率控制的是参数的更新速度,学习率设置过大,会导致损失函数在极小值附近来回变化,不收敛,学习率设置过小,会导致学习速度变慢。

Data root 训练集数据位置

数据 (图片或视频) 的文件路径

(仅支持英文路径)

Serval Path 标注位置

使用Tegu标注的结果(.serval 文件)路径

(仅支持英文路径)

Model Save Path 模型保存位置

训练过程中生成的模型的保存位置

(仅支持英文路径)

Save Epoch 每X轮保存一次

每训练x轮次保存一次模型

Visualization When Save

预览模型效果

每次保存模型时,选择 20% 的数据进行预测,并在 project_path/model/model_name/ 路径下以图片形式展示预测效果。

(Auto Train 模式下不可用)

Start/Stop Train

开始/结束训练

点击点击钮,即可随时开始或结束训练

系统将点击照预设的学习率对模型进行训练,轮次达到「最大训练轮次」Epoch 值时自动完成训练。

Start/Stop Auto Train

开始/结束自动训练

点击点击钮,系统将自动搜寻最佳 Learning Rate。

搜索完毕后将最佳 Learning Rate 填入 Learning Rate 栏中。用户此时可使用推荐的 Learning Rate,点击 Start Train 开始训练。

• 日志区

在预测时,日志区会展示出训练效果。

日志中各指标如下:

current epoch 当前轮次

当前的训练的轮次

total epoch 总轮次

与训练是指定的「最大训练轮次」一致,训练到达这个轮次时自动停止。

loss 训练集误差

训练集数据的预测结果与标注结果对比后的误差

val loss 校验集误差

校验集数据的预测结果与标注结果对比后的误差

rec 召回率

代表对目标物体而言,有多少物体被成功检测。

rec = True Positive/(True Positive + False Negative)

prec 精确率

代表对预测结果而言,有多少预测结果是真正正确的

prec = True Positive/(True Positive + False Positive)

mAP 平均精度均值

综合衡量精确率与召回率的重要指标。总体来说,mAP 值越高,模型预测效果越好。

• 预测区模块

Model Path 模型路径

使用Tegu训练生成的模型 .tegumodel 路径

(仅支持英文路径)

Data Path 预测数据集路径

希望预测的数据的存放路径

(仅支持英文路径)

Result Save Path 结果保存路径

预测结果存放路径

(仅支持英文路径)

Visualize When Predict

预览预测结果

预测时,预测结果不仅以 txt 格式保存,并且会在 project_path/predict/predict-hr-mm-ss/ 下在图片中展示预测结果

Start/Stop Predict 开始/停止预测

点击点击钮,开始/暂停预测

预测结果将存储在 project_path/predict/predict-hr-mm-ss.txt

Categorize into Folders 文件分类

将文件分类到不同的文件夹中,每个物体单独存为一个文件夹。

2、视频训练

打开 TeguCV GUI,选择 VIDEO CLASSIFICATION 模块。

• 新建项目

点击新建项目 New Project,开启新的深度学习网络训练工作。

填写必要信息,即可新建项目。

• 打开项目

点击打开项目 Open Project,使用之前的训练项目继续训练工作。

程序会自动记录上一个训练程序的路径。在 Tegu 中,训练工程文件的后缀名为「.tegu」。

新建项目或打开项目后,可在界面中对视频数据进行预处理。输入数据及保存路径后,点击 Process 将视频转换为机器学习中常见的 .hdf5 格式。如果你已经有相应的 hdf5 文件,可直接点击 Next Step 跳过预处理步骤(仅支持英文路径)。

完成视频预处理,点击 Next Step 可以看到以下界面。

红色区域为参数区,蓝色区域为日志区。

• 训练区模块

Epoch 最大训练轮次

使用全部数据训练一次为一个epoch;模型训练达到设定的最大训练轮次数时,训练自动停止。

Learning Rate 学习率

学习率控制的是参数的更新速度,学习率设置过大,会导致损失函数在极小值附近来回变化,不收敛,学习率设置过小,会导致学习速度变慢。

Data root 训练集数据位置

数据 (图片或视频) 的文件路径

(仅支持英文路径)

Hdf5 Path

预处理时所获得的 Hdf5 文件路径

(仅支持英文路径)

Annotation Path 标注位置

使用Tegu标注的结果(.serval 文件)路径

(仅支持英文路径)

Model Save Path 模型保存位置

训练过程中生成的模型的保存位置

Save Epoch 每X轮保存一次

每训练x轮次保存一次模型

Train/Stop Train

开始/结束训练

点击点击钮,即可随时开始或结束训练

系统将点击照预设的学习率对模型进行训练,轮次达到「最大训练轮次」Epoch 值时自动完成训练。

• 预测区模块

Model Path 模型路径

使用Tegu训练生成的模型 .tegumodel 路径

(仅支持英文路径)

Data Path 预测数据集路径

希望预测的数据的存放路径

(仅支持英文路径)

Result Save Path 结果保存路径

预测结果存放路径

(仅支持英文路径)

Start/Stop Predict 开始/停止预测

点击点击钮,开始/暂停预测

• 日志区

在训练时,日志区会展示出训练效果。

日志中各指标如下:

current epoch 当前轮次

当前的训练的轮次

total epoch 总轮次

与训练是指定的「最大训练轮次」一致,训练到达这个轮次时自动停止。

loss 训练集误差

训练集数据的预测结果与标注结果对比后的误差

val loss 校验集误差

校验集数据的预测结果与标注结果对比后的误差

3、人脸识别

打开 TeguCV GUI,选择 Face Detection 模块。

• Build Face Dataset 建立人脸模型

在 Face Dataset 中输入人脸数据集路径。点击 Start Build Manager 开始为人脸建模。人脸数据集结构应与下图中数据结构相仿:

• Run Detection 人脸识别预测

在 Data Path 输入需要预测的图片文件夹路径。在 Result Save Path 中输入结果存储路径。根据你使用场景对可靠性的要求(如刷脸进门等),我们允许你调节 Threshold。Threshold 值越高,检出率越高,但误检率也会有所提高。Threshold 值越低,检出率越低,但误检率也会有所降低。点击 Start Detection 开始预测。预测结果将同步显示在右侧日志栏,同时将以 detection-face-hr-mm-ss 格式存储于项目路径下。

4、车牌识别

打开 TeguCV GUI,选择 License Plate Detection 模块。

在 Data Path 输入需要预测的图片文件夹路径。在 Result Save Path 中输入结果存储路径,点击 Start Detection 开始预测。预测结果将同步显示在右侧日志栏。

Last updated