“小龙虾”好玩但太费钱 国产GPU厂商云天励飞放言:成本将降低100万倍

快科技3月6日消息,2026年开年爆火的AI当属OpenClaw,被称为小龙虾的它可以充当7x24小时AI打工人,玩法非常多,但消耗的Token太多了,很多人烧不起。 这也是最近2个月国产AI大模型调用超越了谷歌、OpenAI、Anthropic的原因,他们的Koken费用比国外便宜多了,但还是不够便宜,要想解决这个问题还得需要大幅降低成本。 国产GPU初创企业云天励飞董事长兼CEO陈宁日前提出了一个新观点,表示未来5到10年全球AI竞争将从过去10年的谁最聪明转向最能让AI应用大规模落地。 目前AI应用落地的瓶颈就在成本,Token费用是OpenClaw这样的智能体落地的关键难点, 而他的目标就是用各种方式在未来5年在十五五期间将成本降低100万倍,2030年百亿Token只要1分钱。 云天励飞具体怎么实现这个目标就没细节了,不过该公司今年初发布了新一代GPU路线图,将推出GPNPU芯片,名字有GPU+NPU的双重含义,可以兼容CUDA,只需一行代码就完成GPU到国产芯片的部署迁移。 在具体的产品上,他们设计了prefill与decode分离的系统架构,P芯片侧重计算密集,D芯片侧重访存密集,以此实现极致的推理效率与极致性价比。 他们的GPNPU芯片也会有多个芯片协同的超节点,其中26年将推出第一代超节点P芯片, 算力对标NVIDAI的Hopper架构芯片 ,27年则会推出第一代超节点D芯片,主打超低时延推理,对标NVIDAI的Blackwell架构芯片。 28年的第二代超节点D芯片则会对标NVIDIA的Rubin芯片 ,有望实现毫秒级推理时延。