
阿里巴巴开源新一代通义千问模型Qwen3
财联社4月29日电,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型,参数量从0.6B到235B。与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等其他顶级模型相比,旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准评估中取得了有竞争力的结果。通义千问还表示,Qwen3模型推理能力大幅提升,在数学、代码和逻辑推理等评测中,达到同规模业界SOTA水平。
我要评论
反馈意见 

欢迎您发表有价值的评论,发布广告和不和谐的评论都将会被删除,您的账号将禁止评论。
关联话题
1.16W 人关注