aig

前 DeepSeek 研究员、有「AI 天才少女」称号的罗福莉近日证实加入小米,并在社交平台发文表示:「智慧终将从语言迈向物理世界。我正在 Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力构建这样的未来,全力奔赴我们心目中的 AGI」,正式回应早前有关她转投小米的传闻。

Xiaomi MiMo 是小米首个推理大模型团队,罗福莉加入标志着小米在 AI 大模型领域的战略布局进入新阶段。今年 2 月曾有传媒报导指小米集团董事长雷军以 1,000 万人民币年薪招揽罗福莉,领导小米 AI 大模型团队。不过当时小米和罗福莉本人均未回应此。

AgczyA7_v-eeFAvpUUPRFQ2GKEL3SpN0nRmaUJ0ZmlA

现年约 30 岁的罗福莉本科毕业于北京师范大学电脑专业,硕士阶段进入北京大学计算语言学深造。她在北京大学读硕士期间,于 2019 年在人工智能领域顶级国际会议 ACL 上发表 8 篇论文,当中 2 篇为第一作者。硕士毕业后,罗福莉加入 Alibaba 达摩院担任机械智慧实验室研究员,负责开发多语言预训练模型 VECO,并推动 AliceMind 项目的开源工作。

2022 年罗福莉加入 DeepSeek 母公司幻方量化从事深度学习相关工作,后来担任 DeepSeek 深度学习研究员,参与研发 DeepSeek-V2 等模型。DeepSeek-V2 采用混合专家架构,总参数量达 2,原文出自 unwire.hk, 360 亿,但每个 token 仅启动 210 亿参数,与 DeepSeek 670 亿模型相比,训练成本节省 42.5%,KV cache 减少 93.3%,最大生成吞吐量提升 5.76 倍。

该模型在数学推理和程式码生成方面表现优异,被业界称为「性价比之王」,价格仅为 GPT-4 的 1/100。
G ERA LOGO-2

【免责声明】本网站欢迎网民与用户发表建设性留言,目的在于互动与交流,并不代表本网赞同其观点和对其真实性负责,也非本网站立场,任何人身攻击、鼓吹种族宗教隔阂、诽谤造谣、网络霸凌、抹黑等煽动性留言,本网站有权删除违规留言。

 


天才是百分之一的灵感,百分之九十九的汗水。—— 爱迪生

企业热点

看更多

意大利首设「火腿起司专校」 传扬美食文化

意大利首设「火腿起司专校」 传扬美食文化

意大利腌火腿、起司闻名全球,为发扬此一饮食文化,诞生了全意首间提供专门课程与训练的「火腿起司学校」。创办人齐马第(Claudio Cimardi)强调,希望向年轻世代传递这项优良传统,因为这些知识不是一朝一夕可学会。

澳洲15岁少年自学经商 靠「一台机器」赚到笑

澳洲15岁少年自学经商 靠「一台机器」赚到笑

澳洲雪梨一名15岁青少年Haven Sun的生活和同龄孩子完全不同,他在看了YouTube 影片后,决定以一个简单的生意点子展开副业,就是自动贩卖机,如今他有着5台自动贩卖机,其他2台已有净赚。

60岁一起练出紧实曲线! 时尚夫妻好好变老

60岁一起练出紧实曲线! 时尚夫妻好好变老

活得老,也要活得好!韩国一对网红夫妻,年龄加起来119岁,从2、3年前开始一起努力健身,不仅练出了好身材,外貌也大大减龄,激励了许多人加入健身行列。他们如今比年轻时更健康、更快乐,而最大的收获,是两人能携手变老,持续挑战自我,同时更加了解彼此。

9岁神童被誉为「当代毕卡索」 抽象派画风卖出天价

9岁神童被誉为「当代毕卡索」 抽象派画风卖出天价

美国被誉为「神童」、「小毕卡索」的10岁艺术家瓦伦西亚(Andres Valencia),以超现实主义画作在当代艺术界快速窜红,他去年曾在迈阿密艺术节及纽约的Chase Contemporary画廊举行个展,并卖出几件超过12.5万美元。

卖惨发财术! 单亲妈卖眼泪赚钱过圣诞

卖惨发财术! 单亲妈卖眼泪赚钱过圣诞

美国成人内容创作者、同时也是四个孩子的单亲妈妈瑞弗(Liz River),为了养家并筹措圣诞礼物费用,竟突发奇想贩售自己的眼泪,一瓶售价 600 美元(约2479.5令吉)。她表示,顾客愿意付高价购买,近日已成功售出逾百瓶,足以支应家庭的圣诞开销。