文章来源:福汇下载发布时间:2025-03-15 10:39:51
3 月 14 日消息,清华大学高性能计算研究所翟季冬教授团队、清华系科创企业清程极智今日联合宣布,大模型推理引擎“赤兔 Chitu”现已开源。
据介绍,该引擎首次实现在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,实现 DeepSeek 推理成本降低一半、性能翻番。其定位为“生产级大模型推理引擎”,提供如下特性:
多元算力适配:不仅支持 NVIDIA 最新旗舰到旧款的多系列产品,也为国产芯片提供优化支持。 全场景可伸缩:从纯 CPU 部署、单 GPU 部署到大规模集群部署,赤兔引擎提供可扩展的解决方案。 长期稳定运行:可应用于实际生产环境,稳定性足以承载并发业务流量。官方表示,当前开源的赤兔引擎在部署 DeepSeek-R1-671B 满血版时,在 A800 集群的测试中,相比部分国外开源框架,实现了 GPU 使用量减少 50% 的同时,推理速度提升 3.15 倍。
1AI附开源地址:https://github.com/thu-pacman/chitu
相关攻略 更多
最新资讯 更多
OpenAI 发布新一代语音模型,让 AI 智能体语音表达更自然
更新时间:2025-03-24
Anthropic AI 聊天机器人 Claude 新增联网搜索功能
更新时间:2025-03-24
阿里云与亚洲 10 所高校及政府机构达成 AI人才培养合作
更新时间:2025-03-24
英伟达黄仁勋称全球 50% 的 AI 研究人员来自中国
更新时间:2025-03-24
微软联合开发 Aardvark 天气系统:无需超算复杂模拟,AI 精准预测未来天气
更新时间:2025-03-24
调查显示 ChatGPT 为全球职场最受欢迎 AI 工具,印度使用率居首
更新时间:2025-03-24
健康专家警示:AI伴侣可补充但不能替代现实社交关系
更新时间:2025-03-24
在 AI 时代如何证明你是人类,OpenAI 奥尔特曼推聊天应用 World 尝试虹膜识别
更新时间:2025-03-24
超越 Mistral 和 Qwen:谷歌 Gemini Embedding 登顶 MTEB,问鼎最强文本嵌入 AI模型
更新时间:2025-03-24
董明珠:将基于 DeepSeek 等打造格力智能家居垂类大模型
更新时间:2025-03-22