文章列表

老显卡福音!美团开源首发INT8无损满血版DeepSeek R1

搜索和推荐平台部
DeepSeek R1模型权重原生为FP8类型,仅能被英伟达新型GPU支持。美团技术团队进行了INT8精度量化的尝试,量化后模型精度基本无损,可部署到A100等其他型号GPU,从而解锁了芯片限制;相比BF16实现了50%的吞吐提升,降低了推理成本。相关技术已在Hugging Face上开源。 阅读全文

通用目标检测开源框架YOLOv6在美团的量化部署实战

庆源 李亮 奕铎 张勃 王新 祥祥
基于美团目标检测模型开源框架 YOLOv6,本文提供了一种通用的量化部署方案,在保持精度的同时大幅提升了检测的速度,为通用检测的工业化部署探索出一条可行之路,希望能给大家带来一些启发或者帮助。 阅读全文