PaddleOCR检测模型训练深度解析
b 指标数据漂亮 hmean 0.9以上,但你很难纠正模型固有的思维(除非拿近似级别的数据量去纠正),效果难达到预期。b 在开源数据集上训练,带有开源数据集的基本特征。因为官方模型或三方模型不能有效的达到项目检测目标,所以自训练能实现需求的模型。b 公开数据泛化强,针对弱。b 在一定精度上起步,精度指标天生高,对自有数据实际效果不明显。a 从0起步训练,对自有数据的效果明显,但提高训练精度指标难。
·
意义和目的:
因为官方模型或三方模型不能有效的达到项目检测目标,所以自己训练能实现需求的模型。
模型概述:
骨干网络
resnet 残差卷积神经网络
mobilenet 轻量卷积神经网络
技术路线:
a:从骨干网络基础上训练模型(自己训练基座模型)
b:基于PP-OCR模型的微调(官方训练出的基座模型上微调)
区别:
a 能学习到自有数据集的基本特征;b 在开源数据集上训练,带有开源数据集的基本特征
优劣:
a 对自有数据集的针对性强,泛化弱;b 公开数据泛化强,针对弱。
现象:
a 从0起步训练,对自有数据的效果明显,但提高训练精度指标难。
b 在一定精度上起步,精度指标天生高,对自有数据实际效果不明显。
总之:
b 指标数据漂亮 hmean 0.9以上,但你很难纠正模型固有的思维(除非拿近似级别的数据量去纠正),效果难达到预期。
a hmean 0.6左右就有明显效果,但进一步提升需要寻找更佳超参组合,或加数据量。
实际训练和测试
更多推荐
所有评论(0)