1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

业界最强开源大模型来了!通义千问720亿参数模型正式开源

 2023-12-01 11:53  来源:互联网  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

12月1日,阿里云举办通义千问发布会,开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆Llama 2-70B和大部分商用闭源模型。未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。

通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。力度之大,业界无出其右。

业界最强开源模型,填补中国LLM开源领域空白

Qwen-72B基于3T tokens高质量数据训练,延续通义千问预训练模型一贯以来的强势表现,在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。

英语任务上,Qwen-72B在MMLU基准测试取得开源模型最高分;中文任务上,Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基准,得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。

在10大权威测评中,通义千问720亿参数模型获得开源模型最优成绩

通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4

Qwen-72B可以处理最多32k的长文本输入,在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制AI助手,要求大模型扮演某个角色或者执行特定的回复任务。

用户仅用一句提示词就可创建自己的AI助手

此前,中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型。Qwen-72B填补了国内空白,以高性能、高可控、高性价比的优势,提供不亚于商业闭源大模型的选择。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI for Science等科研工作。

从1.8B到72B, 通义千问 率先实现全尺寸开源

如果说Qwen-72B“向上摸高”,抬升了开源大模型的尺寸和性能天花板;发布会上的另一开源模型Qwen-1.8B则“向下探底”,成为尺寸最小的中国开源大模型,推理2K长度文本内容仅需3G显存,可在消费级终端部署。

从18亿、70亿、140亿到720亿参数规模,通义千问成为业界首个“全尺寸开源”的大模型。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配,推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

阿里云是国内最早开源自研大模型的科技企业,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单,得到中小企业和个人开发者的青睐,累计下载量超过150万,催生出150多款新模型、新应用。发布会现场,多位开发者伙伴现身说法,分享了他们用Qwen开发专属模型和特定应用的实践。

阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。

通义千问基座模型持续进化,多模态探索业界领先

通义千问在多模态大模型领域的探索也领先业界一步,当天,阿里云首次开源音频理解大模型Qwen-Audio。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

通义大模型能“听”也能“看”。通义千问8月开源出视觉理解大模型Qwen-VL,迅速成为国际开源社区最佳实践之一。本次发布会又宣布了Qwen-VL的重大更新,大幅提升通用OCR、视觉推理、中文文本理解基础能力,还能处理各种分辨率和规格的图像,甚至能“看图做题”。不论从权威测评成绩还是真人体验的效果看,Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通义千问闭源模型也在持续进化,一个月前发布的通义千问2.0版闭源模型,最近已进阶至2.1版,上下文窗口长度扩展到32k,代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。用户可以在通义千问APP免费体验最新版本的闭源模型。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
大模型

相关文章

  • 首届通义千问AI挑战赛开赛,参赛者可畅玩通义开源模型家族

    12月1日,首届“通义千问AI挑战赛”开赛,参赛者可免费畅玩通义开源模型家族,包括刚刚发布的720亿参数模型Qwen-72B。主办方为参赛者提供价值50万元的免费云上算力和丰厚奖金。赛事分为算法和Agent两大赛道,前者聚焦通义千问大模型的微调训练,希望通过高质量的数据探索开源模型的代码能力上限,后

    标签:
    大模型
  • 最强开源大模型来了!通义千问720亿参数模型开源发布

    12月1日通义千问发布会,阿里云开源通义千问720亿参数模型Qwen-72B。Qwen-72B在10个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆Llama2-70B和大部分商用闭源模型,可适配企业级、科研级的高性能应用。通义千问当天还开源了18亿参数模型Qwen-1.

    标签:
    大模型
  • 掰开安卓手机,满屏都是三个字:大模型

    这年头,安卓厂商没个大模型,都不敢开手机发布会了。前脚OPPO刚用大模型升级了语音助手,后脚vivo就官宣自研手机AI大模型;小米发布会则直接将大模型当场塞进手机系统……其竞争激烈程度,不亚于抢芯片首发。到底是怎么回事?究其原因,还是智能终端已经成为了各类AIGC应用的落地“新滩头”。先是图像生成大

    标签:
    大模型
  • 加速大模型落地,容联云发布多款生成式智能服务

    基于容联云自主研发的赤兔大模型能力,容联云容犀机器人真正将大模型强大的理解能力、知识学习能力、总结能力、挖掘能力、推理能力融入于实际落地应用中。开创性的打造生成式场景化智能问答、生成式智能辅助、AI运营话术库,帮助企业洞悉更精准的客户真实需求,提升一线客服人员的专业服务能力,并代替人工完成大量低价值

    标签:
    大模型
  • 从搜索到大模型,百度商业化的“惊险一跃”

    文:向善财经关于百度,最近发生了这么两件事儿。一个是华尔街分析师重申了对百度股票的买入评级和目标价,但在该公司11月21日公布第三季度收益之前下调了第三季度收入预期。分析师给出的理由是,线下广告支出走软,以及2G资金减少之后,给智能交通带来挑战。另外一个是最近文心一言正式上线了专业版,并且开始收费,

    标签:
    百度
    大模型
  • 协同办公大战再起,钉钉、飞书“决战”AI

    这些协同办公软件的出现,也为职场人的工作带去了高效与便捷。

  • 百度AI,能否“投”出未来?

    这是一道AI时代的必答题,如今还没有人交卷。

    标签:
    ai智能
    百度
  • 印度要求 AI 模型发布需政府批准

    近日,印度最新发布了一项指南,要求科技公司在推出新的AI模型前必须获得政府批准。印度电子和信息技术部上周五发布了这项指南。虽然这项指南并未公开发表,但TechCrunch已查阅了一份副本。在国外,AI模型的监管一直存在诸多问题。首先,AI技术的快速发展导致监管难以跟上。监管机构在技术和资源上常常面临

    标签:
    大模型
  • 财报解读:基本盘稳定后,联想如何进一步抢占AI时代?

    从2021年下半年开始,受诸多因素影响,消费电子行业始终处在承压状态,“不景气”这一关键词屡次被市场提及。但寒气没有持续,可以看到,消费电子行业正在逐渐回暖。国金证券在今年1月的研报中就指出,从多方面的情况来看,消费电子需求转好信号明显。而从一些企业的业绩中,也能感受到这股暖意。比如,联想最新发布的

    标签:
    联想
  • AI重塑CRM:腾讯企点精进不止,纷享销客折腾不息

    自从去年ChatGPT火爆以来,AI技术又成为了新的焦点,开始在各行各业发挥越来越大的作用。

  • 视频会议也可能有假人 怀疑对方AI换脸可以让对方摁鼻子

    近日,香港警方披露了一起多人“AI换脸”诈骗案,涉案金额高达2亿港元。一名香港公司的职员受邀参加总部首席财务官发起的“多人视频会议”,按照对方要求将2亿港元转账15次。据悉,在这起案件中,视频会议中只有受害人是“真人”,其他均是“AI换脸”后的诈骗人员!如何识别视频中的人物究竟是不是经过了AI换脸?

    标签:
    ai技术
  • 人工智能“第三浪”中,中国AI如何打造新质生产力?

    从ChatGPT到Sora,多模态大模型的发展浪潮一浪接着一浪。令人意外的是,引领这场科技风暴的并不是那些耳熟能详的科技巨头,而是一家AI创业公司——OpenAI。不过,AI创业公司的日子似乎并没有因此而变得好过。从去年开始,不少媒体报道了AI创业公司面临的各种困境。哪怕是OpenAI,也面临Cha

  • AIoT爆发在即,聆思科技“芯片+算法”深度耦合路线有何价值?

    在日趋成熟的AI技术助力下,物联网(IoT)领域已开始显现爆发势能。具体而言,IoT的经典架构包含了感知层、传输层、应用层等,涉及到对物理世界大量信息的收集和处理,过去受制于算法算力问题,难以对收集到的数据进行高效处理,现在借助于AI算法,才终于实现了从数据感知到数据认知的飞跃。在AI加持之下,Io

    标签:
    物联网
  • 盈利超预期,百度AI收获季还有多远

    在风风火火搞了一年大模型之后,外界对于AI大模型对百度到底有多大的拉动作用,始终抱有期待,外部投资人也在期待百度AI的现实回报。

    标签:
    百度ai
  • 数势联动百川,发布首批大模型联合解决方案,推动中国大模型价值落地

    近日,行业领先的数据智能产品提供商北京数势云创科技有限公司(以下简称“数势科技”)和国内通用大模型厂商北京百川智能科技有限公司(以下简称“百川”)联合发布大模型数据分析垂直领域应用解决方案。本次发布是数势科技与国内主流大模型厂商首批落地的联合解决方案,也是数势垂直应用能力与大模型底座能力耦合实现商业

    标签:
    大模型

编辑推荐