人人澡人人爽 人妻斩_日本一区二区三区四区视频_亚洲妇乱亚洲妇乱无码_亚洲国产欧美一区二区三区_无码一区二区三区巨免费
阿里开源千问3,参数量为DeepSeek-R1三分之一|界面新闻 · 科技

阿里开源千问3,参数量为DeepSeek-R1三分之一|界面新闻 · 科技

chushichang 2025-04-29 360 88 次浏览 0个评论

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(千问3),参数量为DeepSeek-R1的三分之一,成本大幅下降。据称,该模型性能全面超越R1、OpenAI-o1等领先模型,登顶全球最强开源模型。

千问3是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,节省算力消耗。

阿里巴巴表示,千问3系列支持119种语言,并基于近36万亿个token(标记)进行训练,使用的数据量是千问2.5的两倍。

千问3系列包括两个专家混合(MoE)模型和另外六个模型。阿里巴巴开源了两个MoE模型的权重:拥有2350多亿总参数和220多亿激活参数的Qwen3-235B-A22B,以及拥有约300亿总参数和30亿激活参数的小型MoE?模型Qwen3-30B-A3B。

阿里开源千问3,参数量为DeepSeek-R1三分之一|界面新闻 · 科技

阿里巴巴表示,Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,可媲美DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型

此外,六个Dense模型也已开源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,均在Apache 2.0许可下开源。

阿里开源千问3,参数量为DeepSeek-R1三分之一|界面新闻 · 科技

阿里巴巴表示,千问3代表了该公司在通往通用人工智能(AGI)和超级人工智能(ASI)旅程中的一个重要里程碑。未来,阿里计划从多个维度提升模型,包括优化模型架构和训练方法,以实现扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围等关键指标。

阿里巴巴集团CEO吴泳铭在今年2月的业绩会上表示,阿里集团在AI战略里面的首要目标是AGI(通用人工智能)的实现,可能远远超过现在可见的任何一个应用场景。

阿里开源千问3,参数量为DeepSeek-R1三分之一|界面新闻 · 科技

阿里巴巴预判如果实现AGI,人工智能相关产业大概率将会是全球最大的产业,有可能影响或者替代现在50%左右的GDP构成。

目前,包括谷歌在内的多家科技巨头推出了开源模型。今年3月,谷歌开源多模态大模型Gemma 3正式发布。这款仅需单块H100 GPU即可运行的27B参数模型,不仅性能对标谷歌闭源大模型Gemini 1.5 Pro,更以“低成本、高性能”的标签重新定义了行业标准。这一举措被业界视为谷歌在开源AI领域的一次重大战略升级。

今年3月底,OpenAI?宣布计划在今年发布自GPT-2以来的首个“开源”语言模型。据媒体报道,OpenAI的开源模型将采用“输入文本,输出文本”的模式,并可能允许开发者自由开启或关闭其“推理”功能。

?

转载请注明来自山东轻强建材有限公司,本文标题:《阿里开源千问3,参数量为DeepSeek-R1三分之一|界面新闻 · 科技》

百度分享代码,如果开启HTTPS请参考李洋个人博客
每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,88人围观)参与讨论

还没有评论,来说两句吧...

Top
 蔚来威马最新信息  渭南舞室招聘信息最新  新疆库车最新招聘信息  最新长垣招聘信息网  田黄最新视频信息下载  无锡工会最新招聘信息  益民金融招聘信息最新  真至美招聘信息最新  桂平北江最新房价信息  山西顺丰最新通告信息  高陵区招聘双休最新信息  慈溪招聘剪辑师最新信息  梁平虎城招聘信息最新  石利新村最新信息地图  八士中学招聘信息最新  同瑞医疗招聘信息最新  邵阳拜登最新信息视频  融泽汽车招聘信息最新  厦门集美最新地块信息  家顺世纪招聘信息最新  内邱移动招聘信息最新  米东区找工作信息最新  长岭最新招标信息查询  邢台疫情管控信息最新  柳州双腾招聘信息最新  涂山最新信息在线观看  子长房屋征收最新信息  博远女团最新信息发布  陈姓发展情况最新信息  璧山大兴征地最新信息