英特尔

你敢想象:仅一台仅装备了单块24G显存消费级显卡的系统,不但能跑满血671BDeepSeekR1模型,还能带来5并发51Token/秒的性能(更细节数据见下图),要知道这个性能水准,足以搞定像报告解读或数据分析这类对实时性要求不高的任务了。这就是英特尔开发的全新异构LLM服务方案流出的最新测试数据,这个方案基于HeteroFlow软件框架,搭配了至强6性能核CPU(配MRDIMM内存,开启AMX加

A5创业网 版权所有