今天是
杭州的程序员们赢麻了!一举包揽全球前三
发布时间:2025-03-31   都市快报

杭州的程序员们赢麻了。

3月28日,全球最大AI开源社区HuggingFace发布的最新趋势榜单,排在前三的分别是DeepSeek-V3-0324、群核SpatialLM,以及通义千问Qwen2.5-Omni-7B,全部来自杭州,领先于英伟达、谷歌等公司模型。

此前有网友戏称:在开源大模型领域,杭州正在“挑战”杭州。现在,杭州成了全球范围内少有的,同时拥有三个世界顶级开源模型的城市。

老手稳定发挥

新力量迅速崛起

排名第一和第三的开源大模型大家比较眼熟,分别来自深度求索和阿里巴巴。

排第一位的DeepSeek-V3-0324,是3月26日凌晨由DeepSeek将此前热门的基座模型DeepSeek-V3进行全新小版本迭代而来。

DeepSeek-V3-0324在推理能力、代码生成、中文写作、搜索能力等方面都实现了显著提升。根据官方报告,它不仅全面超越Claude-3.7-Sonnet和与Qwen-Max等同类型优质模型,在数学、代码类等相关评测集上胜过GPT-4.5。经过这些天的测试,有人发现,它的代码能力甚至已经超过了DeepSeek-R1。

新版V3模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提升

仅仅24小时后,阿里开源了首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可以同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。

Qwen2.5-Omni-7B可以接近人类的多感官方式“立体”认知世界并与之实时交互。你可以像打电话或视频通话一样与Qwen聊天,他甚至还能识别音视频中人物情绪。在复杂任务中进行更智能、更自然的反馈与决策。

在权威的多模态融合任务OmniBench等测评中,Qwen2.5-Omni-7B刷新业界纪录,全维度远超Google的Gemini-1.5-Pro等同类模型。从开源到登上榜单前三,只用了一天时间。

相比排在第一位的DeepSeek和第三位的Qwen,SpatialLM是个新兵蛋子。

SpatialLM来自因为“杭州六小龙”火出圈的群核科技。虽然在大模型领域资历是个新手,不过从发布、开源到登上榜单第二,也只用了不到10天的时间。

SpatialLM最早亮相于3月20日的英伟达GTC2025大会上,是群核科技自主研发的空间理解模型,能让AI更好地认识真实的三维世界。

SpatialLM 基于视频重建的3D结构化场景

来源:都市快报    作者:记者 沈积慧    编辑:李佳萌