阿里巴巴机器智能团队的三年工作总结

发布时间：2019-05-23 05:06:59 所属栏目：经验来源：汪思颖

导读：本文转自雷锋网，如需转载请至雷锋网官网申请授权。从 2016 年至今，阿里巴巴机器智能实验室线下智能团队开始涉足线下智能领域。探索至今，算法方面，他们提出了自主研发的模型压缩方法，新型模型结构和目标检测框架；工程方面，他们研发出一套非数据依赖

FPGA 上的推理框架由服务器研发团队完成。ResNet18 网络的推理时间只需要 0.174ms，目前已知业内最佳性能。在边缘计算产品 alibabaedge 上，基于硬件实现的高效算子，推理速度为边缘 GPU 的两倍。在后面，我们会结合产品形态整体的介绍这一方案。

GPU

falcon_conv 是机器智能技术团队开发的一款由 CUDA C++编写，在 Nvidia GPU 上运行的低精度卷积库，它接受 2 份低精度（INT8）张量作为输入，将卷积结果以 float/int32 数据输出，同时支持卷积后一些常规操作（scale,batchnorm,relu… ）的合并。我们在单张 Tesla P4 GPU 上，对 falcon_conv 的性能与 Nvidia 官方计算库 Cudnn v7.1 做了比较，如图所示。几乎所有情况 falcon_conv 都优于 Cudnn，个别用例有高至 5 倍的提升，用例选自 RESNET 和 VGG 中耗时较多的卷积参数。

阿里巴巴机器智能实验室线下智能团队三年工作总结

产品化

（编辑：威海站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

4/5

首页

尾页

phpcms网站出现330错误	PHPCMS 惯用函数
Dedecms备份还原网站方	DEDECMS怎么把文档跳转