首页 实时讯息

国产AI突围,杭州三家科技公司大模型拿下HuggingFace趋势榜前三

时间: 2025-03-28 20:39:00

每经记者:叶晓丹 每经编辑:陈俊杰

近日,来自杭州的三家科技公司发布的大模型拿下全球最大AI开源社区HuggingFace趋势榜前三。

这三款模型分别是DeepSeek-v3、群核科技SpatialLM、通义千问Qwen2.5-Omni。

《每日经济新闻》记者从阿里云方面了解到,Qwen2.5-Omni采用了通义团队全新首创的Thinker-Talker双核架构,Position Embedding (位置嵌入)融合音视频技术,位置编码算法TMRoPE(Time-aligned Multimodal RoPE)。

双核架构Thinker-Talker让Qwen2.5-Omni拥有了人类的“大脑”和“发声器”,形成了端到端的统一模型架构,实现了实时语义理解与语音生成的高效协同。

3月27日凌晨,阿里巴巴发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。

相较于动辄数千亿参数的闭源大模型,Qwen2.5-Omni以7B的小尺寸让全模态大模型在产业上的广泛应用成为可能。即便在手机上,也能轻松部署和应用Qwen2.5-Omni模型。

而近期群核科技发布的空间理解开源模型SpatialLM,登上全球最大AI开源社区HuggingFace趋势榜第二位。

公开资料显示,SpatialLM是群核科技自主研发的一款空间理解模型,该模型仅通过一段视频即可生成物理正确的3D场景布局。不同于传统大语言模型,SpatialLM突破了对物理世界几何与空间关系的理解局限,将在机器类人的空间认知和解析能力上发挥重大作用。

而据《每日经济新闻》此前报道,3月24日,DeepSeek发布了V3的一个小版本更新,版本号为V3-0324。虽然官方称这只是“小版本升级”,但实测能力接近V3.5版本,尤其在复杂逻辑和多模态理解上表现突出。

每日经济新闻

猜你喜欢

网站内容来自网络,如有侵权请联系我们,立即删除!
Copyright © 屯百科 琼ICP备2023011085号-1