深度学习论文: EasyQuant: Post-training Quantization via Scale Optimization及其PyTorch实现

深度学习论文: EasyQuant: Post-training Quantization via Scale Optimization及其PyTorch实现EasyQuant: Post-training Quantization via Scale OptimizationPDF:https://arxiv.org/abs/2006.16669v1.pdfPyTorch: https://gi

mingo_敏

1323人浏览 · 2020-10-16 22:23:28

mingo_敏 · 2020-10-16 22:23:28 发布

深度学习论文: EasyQuant: Post-training Quantization via Scale Optimization及其PyTorch实现
EasyQuant: Post-training Quantization via Scale Optimization
PDF:https://arxiv.org/abs/2006.16669v1.pdf
PyTorch: https://github.com/shanglianlm0525/PyTorch-Networks

1 概述

EasyQuant通过引入cos 相似性作为目标函数，通过交替搜索权值(weights)和激活(activations)的量化因子(scale)来最大化量化前后激活值的 cos相似性，来找到权值和激活值的最优量化因子。
在这里插入图片描述
权值量化因子
TRT: $weight\_scale = 128/max(abs(weight))$
Tensorflow: $weight\_scale = 128/max(abs(weight))$
激活量化因子
TRT: 通过计算KL散度的方式来确定最佳阈值从而得到量化因子
Tensorflow: 训练中,使用EMA(exponential moving average)公式 $move\_max =move\_max * monment + max(abs(curr\_activation))(1-monment)$
,训练后通过计算 $activation\_scale = 128/move\_max$

2 Scale Optimization

假设 X 为输入张量, S为量化尺度因子,则量化公式表示为
在这里插入图片描述
其中表示elementwise点乘操作, Round表示取整操作, Clip表示截断操作.则对于卷积操作

权值(int8)量化和输入激活(int8)量化得到的第l层量化输出激活（int32）再反量化的结果(float32) 为

EasyQuant通过引入cos 相似性作为目标函数,优化原始浮点激活输出与量化实现得到反量化输出的 cos 相似性(cos越大越相似)
在这里插入图片描述
来搜索权值和激活值的量化因子,实际求解通过交替优化两个的量化因子来求解

3 INT7 Post-training Inference

相对于int8，int7可以有更好的加速效果。所以EasyQuant在实际端上推理阶段则采用权值和激活 int7 量化，中间 int16 累加器累加最多八次的方式，使得推理速度优于权值和激活 int8 量化，中间 int16 累加器只能累加两次(溢出)的方式，同时还可以比较好的保持量化后算法的精度。
在这里插入图片描述

4 Experiments

4-1 与PTQ比较

在这里插入图片描述

4-2 与QAT比较

在这里插入图片描述

4-3 与TRT低于8比特时比较

在这里插入图片描述

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

AI 浪潮下的锚与帆：工程师文化的变与不变 | 架构师夜生活

腾讯云开发者社区

腾讯云架构师技术沙龙 · 长沙站圆满落幕，共话AI驱动下的技术架构与前沿应用

人工智能已成为推动技术创新与产业变革的重要引擎，开发者正身处一场前所未有的技术变革之中。通过本次腾讯云架构师技术沙龙，各位专家深入分享前沿技术洞察，探讨 AI 落地的应用路径与实践经验，为架构师的职业发展指明方向。腾讯云架构师长沙同盟和腾讯云架构师技术同盟长沙地区理事会正式成立。未来，腾讯云架构师长沙同盟将凝心聚力，打造属于本地架构师的学习与成长的家园，助力中国架构的蓬勃发展。未来已来，让我们携手

腾讯云开发者社区

从具身智能到行业应用，腾讯云携业界专家共话 AI 新趋势

在热烈的讨论气氛下，本次活动圆满落幕。与会专家实地参观大模型创新生态社区“模速空间”，体验 AI 前沿创新应用落地。来自工业制造、数字化、AI领域的专家分享最新 AI 落地实践与思考，共同探讨从认知智能到物理交互的前沿先进路径，让我们看到AI在各行业释放出的巨大潜力。在头脑风暴环节，各位专家从不同角度深入探讨 AI 技术发展路径，提出诸多具有建设性的观点与建议，提供创新思路与方向，开启智能新时代的