北京欧亿佳美装饰工程有限公司智源研究院：国内头部模型已达国际一流水平，但能力发展不均衡 - 北京欧亿佳美装饰工程有限公司

新浪科技讯 5月18日下午消息，在北京智源研究院（智源研究院）大模型评测发布会上，智源评测体系发布并公布了140余个国内外开/闭源语言及多模态大模型能力评测结果。评测结果显示，在中文语境下，国内头部语言模型的综合表现已接近国际一流水平，但存在能力发展不均衡情况；在多模态理解图文问答任务上，开闭源模型平分秋色，国产模型表现突出；在中文语境下的文生图能力上，国产多模态模型与国际一流水平差距较小。据评测结果，在中文语境下，字节跳动豆包Skylark2、OpenAI GPT-4位居第一、第二，国产大

让建站和SEO变得简单

让不懂建站的用户快速建站，让会建站的提高建站效率！

北京欧亿佳美装饰工程有限公司智源研究院：国内头部模型已达国际一流水平，但能力发展不均衡

发布日期：2024-10-18 06:18 点击次数：75

　　新浪科技讯 5月18日下午消息，在北京智源研究院（智源研究院）大模型评测发布会上，智源评测体系发布并公布了140余个国内外开/闭源语言及多模态大模型能力评测结果。评测结果显示，在中文语境下，国内头部语言模型的综合表现已接近国际一流水平，但存在能力发展不均衡情况；在多模态理解图文问答任务上，开闭源模型平分秋色，国产模型表现突出；在中文语境下的文生图能力上，国产多模态模型与国际一流水平差距较小。

　　据评测结果，在中文语境下，字节跳动豆包Skylark2、OpenAI GPT-4位居第一、第二，国产大模型更懂中国用户。在语言模型客观评测中，OpenAI GPT-4、百川智能Baichuan3位列第一、第二。百度文心一言4.0、智谱华章GLM-4和月之暗面Kimi均进入语言模型主客观评测前五。

　　多模态理解模型客观评测结果显示，图文问答方面，阿里巴巴通义Qwen-vl-max与上海人工智能实验室InternVL-Chat-V1.5先后领先于OpenAI GPT-4，LLaVA-Next-Yi-34B和上海人工智能实验室Intern-XComposer2-VL-7B紧随其后。

　　在海淀区教委支持下，智源研究院联合与海淀区教师进修学校对齐学生测验方式，考察大模型与人类学生的学科水平差异。评测发现，模型在综合学科能力上与海淀学生平均水平仍有差距，普遍存在文强理弱的情况，并且对图表的理解能力不足，大模型未来有很大的提升空间。

　　据介绍，2023年6月，智源研究院与多个高校团队共建FlagEval大模型评测平台上线，迄今为止已完成1000多次覆盖全球多个开源大模型的评测和报告发布。本次评测使用了20余个数据集、超8万道考题，包括与合作单位共建和智源自建的多个评测数据集。（文猛）

海量资讯、精准解读，尽在新浪财经APP

责任编辑：张倩北京欧亿佳美装饰工程有限公司

上一篇：北京欧亿佳美装饰工程有限公司马雪阳婚礼星光熠熠，张远李茂份子钱成焦点，兄弟情深引热议下一篇：北京欧亿佳美装饰工程有限公司裸眼3D概念盘中拉升，雷曼光电涨9.81%

热点资讯
- 北京欧亿佳美装饰工程有限公司六公主怂了，主动给周也送糖，周迅是突破口，
  【六公主主动破冰】北京欧亿佳美装饰工程有限公司在6月15日那天，盛大的上海国际电影节如期拉开帷幕。周也，这位备受瞩目的明星，选择了一款充满民国风情的发型，身着...
- 北京欧亿佳美装饰工程有限公司小米米兔儿童手表 S1 开售：支持心率血氧
  IT之家 5 月 31 日消息北京欧亿佳美装饰工程有限公司，小米米兔儿童手表 S1 现已在京东等电商平台开售，首发到手价为 1199 元。 IT之家获悉，米兔儿...
- 北京欧亿佳美装饰工程有限公司老郭力挺烧饼升副总！三点理由让人信服！
  2004年北京欧亿佳美装饰工程有限公司，十三岁的烧饼，懵懵懂懂地入了郭德纲的门下，开始了他的相声之路，这在德云社也算是一桩奇谈。这一待便是二十载，从籍籍无名的...
- 北京欧亿佳美装饰工程有限公司锂电池：2025年欧洲纯电动车销量预计增长
  来源：Gangtise投研北京欧亿佳美装饰工程有限公司锂电池分析师表示，2024年以来，海外主机厂采购策略保守，但9月开始正常采购，动力电池库存拐点显现。20...
- 北京欧亿佳美装饰工程有限公司新浪杯少年国手挑战赛即将开战参与赢国手签
  由新浪棋牌与少年纵横联合发起的新浪杯少年国手挑战赛将于7月2日0时至8月9日24时在少年纵横对弈平台开展。可通过少年纵横APP内的活动入口参与挑战“新浪杯少年...
相关资讯
- 北京欧亿佳美装饰工程有限公司世界最强壮男人MMA一打二！这么玩容易有生
  上周五，前世界大力士“野兽”艾迪-霍尔(Eddie Hall)在自己的MMA首秀中，以一敌二轻松虐爆两个对手获得比赛胜利。但值得一提的是，霍尔一个人的体重甚至比...
- 北京欧亿佳美装饰工程有限公司港股开盘：两大指数低开，恒生科技指数跌1.
  8月23日上午，港股开盘，两大指数低开，香港恒生指数跌0.68%，恒生科技指数跌1.64%。科技股多数下跌，网易跌超10%北京欧亿佳美装饰工程有限公司，百度集团...
- 喜信！津门虎中卫位置迎来久违的强救援阵，条约在2025年底到期
  日前，凭据津门虎跟队记者顾颖炫夸，外助中卫格兰特照旧郑重归队。格兰特将参加津门虎第一阶段冬训，以便能让状况复原到最好。对此，许多球迷王人直言很期待。因为，格兰特...
- 北京欧亿佳美装饰工程有限公司郭德纲新动态：揭秘初心，德云社郑好言之准确
  相声圈内部的矛盾从未消停过,但对于这个圈子里的大佬郭德纲来说,似乎都不在话下。这位被誉为相声泰斗的艺术家北京欧亿佳美装饰工程有限公司,多年来一直保持着低调优雅的...
- 北京欧亿佳美装饰工程有限公司 151-0，轰满分147分，苏格兰赛：张安
  北京时间12月12日凌晨，2024斯诺克单局限时赛继续进行。正在比赛的第二轮一场焦点比赛中，中国吴宜泽与印度选手开局78-9领先印度选手查达。稍早前，“中国一哥...