
前 DeepSeek 研究员、有「AI 天才少女」称号的罗福莉近日证实加入小米,并在社交平台发文表示:「智慧终将从语言迈向物理世界。我正在 Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力构建这样的未来,全力奔赴我们心目中的 AGI」,正式回应早前有关她转投小米的传闻。
Xiaomi MiMo 是小米首个推理大模型团队,罗福莉加入标志着小米在 AI 大模型领域的战略布局进入新阶段。今年 2 月曾有传媒报导指小米集团董事长雷军以 1,000 万人民币年薪招揽罗福莉,领导小米 AI 大模型团队。不过当时小米和罗福莉本人均未回应此。
现年约 30 岁的罗福莉本科毕业于北京师范大学电脑专业,硕士阶段进入北京大学计算语言学深造。她在北京大学读硕士期间,于 2019 年在人工智能领域顶级国际会议 ACL 上发表 8 篇论文,当中 2 篇为第一作者。硕士毕业后,罗福莉加入 Alibaba 达摩院担任机械智慧实验室研究员,负责开发多语言预训练模型 VECO,并推动 AliceMind 项目的开源工作。
2022 年罗福莉加入 DeepSeek 母公司幻方量化从事深度学习相关工作,后来担任 DeepSeek 深度学习研究员,参与研发 DeepSeek-V2 等模型。DeepSeek-V2 采用混合专家架构,总参数量达 2,原文出自 unwire.hk, 360 亿,但每个 token 仅启动 210 亿参数,与 DeepSeek 670 亿模型相比,训练成本节省 42.5%,KV cache 减少 93.3%,最大生成吞吐量提升 5.76 倍。
该模型在数学推理和程式码生成方面表现优异,被业界称为「性价比之王」,价格仅为 GPT-4 的 1/100。
【免责声明】本网站欢迎网民与用户发表建设性留言,目的在于互动与交流,并不代表本网赞同其观点和对其真实性负责,也非本网站立场,任何人身攻击、鼓吹种族宗教隔阂、诽谤造谣、网络霸凌、抹黑等煽动性留言,本网站有权删除违规留言。
天才是百分之一的灵感,百分之九十九的汗水。—— 爱迪生
”以一元店模式崛起 宜购百货李家发晋身富豪榜
随着宜购百货于去年5月成功上市,其创办人兼董事经理拿督斯里李家发的身家同步攀升,首次跻身《福布斯》马来西亚富豪榜。
以一元店模式崛起 宜购百货李家发晋身富豪榜
随着宜购百货于去年5月成功上市,其创办人兼董事经理拿督斯里李家发的身家同步攀升,首次跻身《福布斯》马来西亚富豪榜。
飞机起降时打开遮光板 关乎飞行安全
如果你曾搭乘飞机,应该会发现一个看似不起眼却反覆被提醒的细节:在飞机起飞、降落,甚至滑行时,空服员都会要求坐在窗边的乘客把窗户遮光板打开。这个规定并不是为了让乘客欣赏风景,而是与飞行安全息息相关。
外卖员去白宫送快餐 特朗普打赏百元小费
日前,一名年逾六旬的外送员谢龙·西蒙斯,手提两袋麦当劳餐点,按响了白宫椭圆形办公室的大门。美国总统特朗普亲自应门,将这次外送变成一场即兴却巧妙的公共沟通场景。
Mesra便利商店 连4年销售破10亿
国油贸易正加速摆脱对传统燃油业务的依赖,旗下Mesra便利商店持续成为非燃油收入的重要引擎,连续4年录得超过10亿令吉销售额,展现稳健增长动能。
误加17倍辣椒「劲辣酱料」竟大卖 失魂员工变业绩王
有时“错有错着”,反而能成就意想不到的惊喜。日本岩手县一家酱油厂近日推出一款名为“小林调错比例的17倍辣味烤肉酱”,凭借独特的诞生故事与强烈口感,迅速吸引市场关注,成为嗜辣族群热议的新品。










