36氪获悉,3月16日,月之暗面Kimi发布技术报告,对大模型十年没有根本性变化的核心结构残差连接进行重新设计,使每一层能够选择性地关注此前各层输出,而非统一求和。测试显示,48B模型训练效率提升1.25倍。该研究由Kimi联创杨植麟、吴育昕、周昕宇等联合完成。论文发布后,马斯克发文称“令人印象深刻”。