一周AIGC丨国内首个官方大模型评测结果出炉，MidjourneyV6升级

文章转载来源：邱祥宇

国内首个官方“大模型标准符合性评测”结果出炉，阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过评测。Midjourney V6史诗级升级，效果惊艳！

图片来源：由无界AI 生成

融资

AIGC 直播大模型公司“灵犀深智”完成 5000 万元天使轮融资

据金十 12 月 22 日报道，AIGC 直播大模型公司“灵犀深智”完成天使轮融资，投资方为趣丸科技、猎豹移动、零以创投，本轮融资共计 5000 万元。据了解，新的融资将用于技术研发，业务拓展以及团队搭建等。

小牛电动创始人在 AI 垂直模型领域创业，计划用一年时间突破 100 万用户规模

据界面新闻 12 月 22 日报道，小牛电动创始人胡依林再次创业，新公司“时研家”将 AI 技术融入腕表行业，推出面向腕表领域的 AI 垂直模型。目前时研家已经完成种子轮和天使轮两轮融资，由 Capital O 领投，IDG Capital、梅花创投、什么值得买、小牛电动、时研家创始团队和个人投资者跟投，总融资金额 5000 万元，投后估值 3 亿元。

法律 AI 初创公司 Harvey 获 8000 万美元 B 轮融资，估值达 7.15 亿美元

据站长之家 12 月 22 日报道，法律人工智能初创公司 Harvey 宣布获得 8000 万美元 B 轮融资，估值达 7.15 亿美元，由凯鹏华盈、红杉资本、OpenAI 初创基金等投资。

据了解，Harvey 基于 OpenAI 的 GPT-4 系列模型，结合专有法律数据进行预训练和微调，为律师提供了深度定制的 ChatGPT 助手。此外，Harvey 的产品广泛应用于法律服务机构、律师事务所和咨询公司。

AI 公司 rabbit 获千万美元融资

据极客公园报道，AI 公司 rabbit 近期又获得了一笔千万美元的融资，最新的投资来自美国风险投资家科斯拉（Vinod Khosla）。据相关人士透露，rabbit 近期在内部进行了一次大型行为模型的技术展示，他们的技术和产品的进展速度得到了科斯拉团队的认可和赞赏，于是做出了追加投资的决定。这 3 笔融资的总额为 3000 万美元。据介绍，rabbit 是一家基于大型行为模型（LAM，Large Action Model）研发下一代操作系统的 AI 公司。

AI 公司 AutoAgents.ai 完成数千万元天使轮融资，由创新工场领投

据 IT 桔子 12 月 25 日报道，AI 公司 AutoAgents.ai 近日完成数千万元天使轮融资，由创新工场领投，共青城七熹投资跟投。本轮融资资金主要用于产品研发，市场拓展以及扩大团队规模等。据悉，AutoAgents.ai 致力于为全球多个国家和地区的企业提供自主智能体（AI Agents）以及智能助理（Copilot）软件服务，以提高人们的工作效率。

大模型

国内首个官方大模型评测结果出炉，通义千问、腾讯混元等四款大模型通过

据新京报贝壳财经报道，12 月 22 日，记者从知情人士处获悉，国内首个官方“大模型标准符合性评测”结果出炉。阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过评测，代表着其在通用性、智能性等维度均达到国家相关标准要求。根据公开资料，上述四家企业拥有的大模型分别为通义千问、文心一言、360 智脑、混元大模型，其中通义千问是唯一的开源模型。

“大模型标准符合性评测”由中国电子技术标准化研究院发起，旨在建立中国大模型标准符合性名录，引领人工智能产业健康有序发展。该评测对外征集了学术界、产业界几十家头部单位意见，覆盖评估语言大模型通用性、智能性的 38 项具体评测维度，是基于官方大模型测试基准的权威评测。

智谱 AI 开源视觉语言模型 CogAgent，支持 GUI 图形界面问答

据站长之家 12 月 21 日消息，智谱 AI 开源了 CogAgent，它是一个视觉语言模型，拥有 180 亿参数规模。该模型在 GUI（图形用户界面）理解和导航方面表现出色，在多个基准测试上取得了 SOTA 的通用性能。此外，它还支持高分辨率的视觉输入和对话问答，并且可以针对任意 GUI 截图进行问答。

智源研究院发布 370 亿参数多模态大模型 Emu2

AI 新智界讯，12 月 21 日，北京智源研究院宣布发布具有 370 亿参数的多模态大模型 Emu2。

据介绍，Emu2 在少样本多模态理解任务上大幅超越 Flamingo-80B、IDEFICS-80B 等主流多模态预训练大模型，在包括 VQAv2、OKVQA、MSVD、MM-Vet、TouchStone 在内的多项少样本理解、视觉问答、主体驱动图像生成等任务上取得最优性能。

Emu2 表现出强大的多模态上下文学习能力，甚至可以解决需要即时推理的任务，例如视觉提示和基于对象的生成。基于 Emu2 微调的 Emu2-Chat 可以精准理解图文指令，实现更好的信息感知、意图理解和决策规划。Emu2-Gen 则可接受图像、文本、位置交错的序列作为输入，实现灵活、可控、高质量的图像和视频生成。研究团队还表示，Emu2 可以作为各种多模态任务的基础模型和通用接口。

苹果开放 AI 研究成果，发布多模态 LLM 模型 Ferret

据 IT 之家 12 月 25 日报道，苹果公司于 2023 年 10 月与哥伦比亚大学的研究人员合作发布了名为 Ferret（雪貂）的开源多模态 LLM，但在当时并没有引起太多关注。因此许多人工智能社区的人士都错过了 Ferret 的发布。

经营着一个专注于医学领域开源人工智能的欧洲非营利组织的 Bart de Witte 近日在 X 上发帖：“我不知何故错过了这一点，苹果于 10 月加入了开源人工智能社区。Ferret 的推出证明了苹果致力于影响深远的人工智能研究，巩固了其在多模态人工智能领域领导者的地位……ps：我期待着有一天，本地大型语言模型（LLLMs）作为重新设计的 iOS 的集成服务运行在我的 iPhone 上。”

Meta 发布全新 AI 翻译大模型，实时语音转换不超 2 秒

据站长之家 12 月 22 日报道，Meta 最新发布了一系列 AI 翻译大模型，实现实时语音转换延迟不超过 2 秒，支持多种语言翻译，并具备模仿语气、语速、情感等特征的能力。这一系列模型名为 Seamless Communication，包括 SeamlessExpressive、SeamlessStreaming、SeamlessM4T v2 和 Seamless，其中前三个已经在 GitHub 上开源。

为确保翻译准确性和避免滥用，Meta 采用了毒性缓解技术，在训练前过滤“有毒内容”并在翻译生成过程中自动检测和调整生成的有毒单词，同时为音频添加了水印以追踪来源。为了防止滥用风险，Meta 还为音频添加了水印，通过在音频中嵌入不可察觉的信号，可以准确追踪音频的来源，并对抗各种攻击手段。

轻松集团升级“轻松问医 Dr.GPT”大模型

据中国青年网报道，12 月 19 日，轻松集团旗下医疗健康服务平台“轻松健康”宣布，其自研的垂直领域大模型“轻松问医 Dr.GPT”全面升级。同时，轻松健康发布了七项 AI + 健康创新应用，包括针对用户的“智能问诊系统”“个性化健康管理顾问”“慢性病管理计划”“心理健康指导师”，以及面向医生的“医学知识库和技能培训平台”“辅助诊疗助手”“患教内容智创平台”。

应用

Midjourney 开放 V6 模型 alpha 版本测试

AI 新智界讯，12 月 21 日，Midjourney 在 discord 社区宣布开放 V6 模型的 alpha 版本测试。

Stable Diffusion 推出商业付费订阅计划

AI 新智界讯，Stability AI 近日发布新闻稿，宣布旗下文本生成图片模型 Stable Diffusion 推出会员订阅计划，其中非商业级会员，可免费使用核心模型，供个人和研究使用；

专业版月费 20 美元，适用于创作者、开发者和初创公司；企业版主要面向大型企业，可以为大规模运营量身定制，价格根据定制情况而定。

努比亚宣布 Z60 Ultra 手机搭载业界首个垂直影像 AI 大模型

据 IT 之家 12 月 19 日消息，正在举行的努比亚新品发布会上，努比亚 Z60 Ultra 宣布搭载业界首个垂直影像 AI 大模型。据介绍，经过训练的 AI 大模型，让努比亚的影像系统进化得更加强大。努比亚自 2012 年成立至今，在 30 多个影像领域，拥有海量且稀缺的专业影像数据，能够对 AI 进行定制化的专属影像场景训练。在努比亚强项的星空、人文等多方面，深度融合 AI 技术，打造业界首个垂直影像 AI 大模型。

小红书内测 AI 聊天机器人“Davinic 达芬奇”

据 Tech 星球 12 月 25 日消息，小红书在其主 App 中内测了一个名为“Davinic”（达芬奇）的 AI 功能。这项功能自 9 月开始测试，至今仍在持续，这也是继 AI 群聊后，小红书推出的又一项新的 AI 应用。

“Davinic”主要为用户提供智能问答等 AI 聊天功能，更偏向于提供好物生活类的问答，涵盖旅游攻略、美食攻略、地理和文化常识、生活技巧、个人成长和心理建议，以及活动推荐等多个方面。据悉，“Davinic”是基于 Meta 旗下的 LLAMA 大模型进行训练的产品。

大公司

微软 Copilot 集成 AI 音乐创作平台 Suno，可通过文本生成音乐

AI 新智界讯，12 月 20 日，微软在官网宣布与 AI 音乐创作平台 Suno 达成合作，并将其功能集成在 Copilot 中，允许用户通过文本生成多种类型音乐。

谷歌：已在 175 个国家/地区为所有层级的 Colab 用户提供 AI 编码权限

AI 新智界讯，12 月 20 日，谷歌宣布已在 175 个地区为所有级别的 Colab 用户提供了对 AI 编码的扩展访问权限。据悉，Colab 最初是由 Google Research 的一个小团队构建的工具，目前月活跃用户已超过 1000 万，其中包括全球数百万学生，使其成为 Google 最大的人工智能编码工具。

三星及 Naver 展示最新 AI 芯片，能效比英伟达芯片高约 8 倍

据《科创板日报》援引 Businesskorea 报道，三星电子和 Naver 展示了他们在最近的一年里共同开发的人工智能（AI）半导体，该产品能效比英伟达等竞争对手的芯片高出约 8 倍，预计将为 Naver 的超大规模 AI 模型 HyperCLOVA X 提供支持。

Meta 发布全新 AI 翻译大模型，实时语音转换不超 2 秒

观点

Linkedin 副总裁：AI 时代，学历价值“大幅缩水”

据 Business Insider 12 月 19 日报道，LinkedIn 副总裁 Aneesh Raman 近日在播客中表示，在生成式人工智能时代，拥有常春藤盟校的学士学位，可能不再是人们在职业生涯中取得成功的关键，学历的价值正“大幅缩水”。相比于学位，当今的关键软技能是适应能力。Raman 认为，在工作中使用 AI 不仅可以帮助员工提高工作效率，还可以帮助员工更有效地进行跨文化、跨语言和跨部门的沟通，并增强同理心。

亚马逊创始人贝索斯：ChatGPT 不是“发明”，而是“发现”

据爱范儿 12 月 21 日报道，亚马逊创始人贝索斯在著名科技播客 Lex Fridman Podcast 上分享了自己对生成式 AI 的见解。

对于 ChatGPT 等生成式 AI，贝索斯提出了相当有趣定义：“如今形式的大语言模型并不是发明，它们是发现。”在贝索斯看来，只有我们刻意设计，并清晰了解其运作原理的东西才是发明。譬如，望远镜是发明，但通过望远镜看到木星，知道它有自己的卫星，这是一个发现。大语言模型更像是发现。我们经常为它们的能力感到惊奇。它们并不是设计出来的产物。

至于 AI 对人类生存的潜在危害，贝索斯展示出乐观的态度：“我们人类有很多种方法让我们自己灭亡。这些技术有可能帮助我们不去做这些事，反倒会救了我们。”

AI 教授窦德景：国内大模型达到 GPT-3.5 水平，与 GPT-4 技术差距在缩小

据环球时报报道，12 月 23 日，著名人工智能和大数据专家，清华大学电子工程系兼职教授窦德景表示，国内大模型目前达到 GPT-3.5 水平，离 GPT-4 还有一定差距，但差距在缩小。“以后的人工智能可以达到更高的水平”，窦德景教授从事人工智能研究 20 余年，据他介绍，“人工智能”名词诞生于 1956 年，过去科技界预计 2050 年左右实现通用人工智能，而生成式人工智能和大模型的出现大大的加速了这一进程，目前来看，5 到 10 年内有望实现该目标。

人民日报评论：AI 客服把人逼疯？技术虽好，但绝非万能

AI 新智界讯，12 月 22 日，人民日报评论发文《AI客服把人逼疯？技术虽好，但绝非万能》。文章称，近期，一篇题为《“AI 客服快把人逼疯了”》的媒体报道受到关注，也再次引发广大网友对 AI 客服的一片调侃、“吐槽”之声。AI 客服的好，大家当然清楚：对消费者来说，24 小时在岗、随时响应、处理程序性事务快捷高效。然而就当前而言，AI 客服还远未达到人工客服能够撒手不管的程度。尤其是，那些需要提供更多情绪价值的服务，AI 很多时候不仅发挥不了作用，反而可能产生反效果。“我觉得被 AI 客服接待有一种不受重视的感觉。”这也是不少消费者的心声。可见，AI 虽好，却也并非万能，在应用中更不可能一劳永逸，商家关键还是要区分场景、因地制宜。

猎豹移动董事长傅盛：2024 年将是 AI 大模型应用的浪潮年

据界面新闻 12 月 22 日报道，猎豹移动董事长兼 CEO、猎户星空董事长傅盛在 2023 探索大会上表示，2023 年是 AI 的元年和浪潮年，上半年大家都在投千亿大模型。2024 年一定是 AI 大模型应用的浪潮年，一定会出现很多像移动智能手机出来的时候的滴滴、美团外卖一样在过去那个时代没有出现过的应用。

傅盛表示，作为一个企业创业者，要意识到只用通用大模型不能完全解决企业的自有问题。创业公司的核心竞争力是私有数据，并不是以前写在 ERP 系统里面的数据，而是公司里面各种决策的流程各种认知迭代的过程就是私有数据。

极越汽车 CEO 夏一平谈“大模型上车”：没有大模型的车是功能车

据 IT 之家 12 月 24 日消息，极越汽车 CEO 夏一平今天在微博上谈到“2024 年会是新能源大考年吗”的话题，认为继今年“汽车智能化元年”之后，明年将是智能汽车的赛场。夏一平认为，明年必将开启一场汽车智能化的变革，大模型是分水岭。没有大模型的是功能车，有大模型的是智能车，而当前超过 90% 的车主置换燃油车都会选择智能车。“大模型上车，汽车真正开始智能。”他还表示，未来 3-5 年将会是大模型的时代，大模型将是智能汽车的 OS。

研报

报告：到 2027 年，全球生成式 AI 智能手机出货量达到 5.22 亿台

据 IT 之家 12 月 21 日消息，根据市场调查机构 Counterpoint Research 近日发布的《生成式 AI 智能手机出货量洞察》报告，预估 2024 年会成为生成式 AI 智能手机的关键元年，预估出货量将达到 1 亿台。该机构预估到 2027 年，全球生成式 AI 智能手机出货量达到 5.22 亿台，复合年增长率为 83%。

该机构对“生成式 AI 手机”的定义，划分到 AI 智能手机类目下，指可以使用生成式 AI 来创建原创内容，可以本地运行 AI 模型。该机构认为三星和高通是直接的领导者。

我国 5% 至 8% 企业大模型参数跃升至万亿级

据央广网报道，工业和信息化部赛迪研究院发布的研究报告预测，到 2024 年年底我国将有 5%~8% 的企业大模型参数从千亿级跃升至万亿级，算力需求增速会达到 320%。目前我国参数规模达到万亿级别以上的大模型企业已有五家，随着参数规模不断突破，人工智能大模型赋能千行百业的速度也在不断提升。我国人工智能大模型 50 强行业应用共涉及 13 个领域，主要集中在金融行业，其次为工业、政务、交通等行业。在我国排名前十的人工智能大模型企业中，拥有自主算力资源的企业占比达 100%。