一周AIGC丨国内首个官方大模型评测结果出炉,MidjourneyV6升级

转载
366 天前
10186
邱祥宇

文章转载来源:邱祥宇

国内首个官方“大模型标准符合性评测”结果出炉,阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过评测。Midjourney V6史诗级升级,效果惊艳!

图片来源:由无界AI 生成


融资


AIGC 直播大模型公司“灵犀深智”完成 5000 万元天使轮融资

据金十 12 月 22 日报道,AIGC 直播大模型公司“灵犀深智”完成天使轮融资,投资方为趣丸科技、猎豹移动、零以创投,本轮融资共计 5000 万元。据了解,新的融资将用于技术研发,业务拓展以及团队搭建等。

小牛电动创始人在 AI 垂直模型领域创业,计划用一年时间突破 100 万用户规模

据界面新闻 12 月 22 日报道,小牛电动创始人胡依林再次创业,新公司“时研家”将 AI 技术融入腕表行业,推出面向腕表领域的 AI 垂直模型。目前时研家已经完成种子轮和天使轮两轮融资,由 Capital O 领投,IDG Capital、梅花创投、什么值得买、小牛电动、时研家创始团队和个人投资者跟投,总融资金额 5000 万元,投后估值 3 亿元。

法律 AI 初创公司 Harvey 获 8000 万美元 B 轮融资,估值达 7.15 亿美元

据站长之家 12 月 22 日报道,法律人工智能初创公司 Harvey 宣布获得 8000 万美元 B 轮融资,估值达 7.15 亿美元,由凯鹏华盈、红杉资本、OpenAI 初创基金等投资。

据了解,Harvey 基于 OpenAI 的 GPT-4 系列模型,结合专有法律数据进行预训练和微调,为律师提供了深度定制的 ChatGPT 助手。此外,Harvey 的产品广泛应用于法律服务机构、律师事务所和咨询公司。

AI 公司 rabbit 获千万美元融资

据极客公园报道,AI 公司 rabbit 近期又获得了一笔千万美元的融资,最新的投资来自美国风险投资家科斯拉(Vinod Khosla)。据相关人士透露,rabbit 近期在内部进行了一次大型行为模型的技术展示,他们的技术和产品的进展速度得到了科斯拉团队的认可和赞赏,于是做出了追加投资的决定。这 3 笔融资的总额为 3000 万美元。据介绍,rabbit 是一家基于大型行为模型(LAM,Large Action Model)研发下一代操作系统的 AI 公司。

AI 公司 AutoAgents.ai 完成数千万元天使轮融资,由创新工场领投

据 IT 桔子 12 月 25 日报道,AI 公司 AutoAgents.ai 近日完成数千万元天使轮融资,由创新工场领投,共青城七熹投资跟投。本轮融资资金主要用于产品研发,市场拓展以及扩大团队规模等。据悉,AutoAgents.ai 致力于为全球多个国家和地区的企业提供自主智能体(AI Agents)以及智能助理(Copilot)软件服务,以提高人们的工作效率。


大模型


国内首个官方大模型评测结果出炉,通义千问、腾讯混元等四款大模型通过

据新京报贝壳财经报道,12 月 22 日,记者从知情人士处获悉,国内首个官方“大模型标准符合性评测”结果出炉。阿里云、百度、360、腾讯四家企业旗下的大模型产品首批通过评测,代表着其在通用性、智能性等维度均达到国家相关标准要求。根据公开资料,上述四家企业拥有的大模型分别为通义千问、文心一言、360 智脑、混元大模型,其中通义千问是唯一的开源模型。

“大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的 38 项具体评测维度,是基于官方大模型测试基准的权威评测。

智谱 AI 开源视觉语言模型 CogAgent,支持 GUI 图形界面问答

据站长之家 12 月 21 日消息,智谱 AI 开源了 CogAgent,它是一个视觉语言模型,拥有 180 亿参数规模。该模型在 GUI(图形用户界面)理解和导航方面表现出色,在多个基准测试上取得了 SOTA 的通用性能。此外,它还支持高分辨率的视觉输入和对话问答,并且可以针对任意 GUI 截图进行问答。

智源研究院发布 370 亿参数多模态大模型 Emu2

AI 新智界讯,12 月 21 日,北京智源研究院宣布发布具有 370 亿参数的多模态大模型 Emu2。

据介绍,Emu2 在少样本多模态理解任务上大幅超越 Flamingo-80B、IDEFICS-80B 等主流多模态预训练大模型,在包括 VQAv2、OKVQA、MSVD、MM-Vet、TouchStone 在内的多项少样本理解、视觉问答、主体驱动图像生成等任务上取得最优性能。

Emu2 表现出强大的多模态上下文学习能力,甚至可以解决需要即时推理的任务,例如视觉提示和基于对象的生成。基于 Emu2 微调的 Emu2-Chat 可以精准理解图文指令,实现更好的信息感知、意图理解和决策规划。Emu2-Gen 则可接受图像、文本、位置交错的序列作为输入,实现灵活、可控、高质量的图像和视频生成。研究团队还表示,Emu2 可以作为各种多模态任务的基础模型和通用接口。

苹果开放 AI 研究成果,发布多模态 LLM 模型 Ferret

据 IT 之家 12 月 25 日报道,苹果公司于 2023 年 10 月与哥伦比亚大学的研究人员合作发布了名为 Ferret(雪貂)的开源多模态 LLM,但在当时并没有引起太多关注。因此许多人工智能社区的人士都错过了 Ferret 的发布。

经营着一个专注于医学领域开源人工智能的欧洲非营利组织的 Bart de Witte 近日在 X 上发帖:“我不知何故错过了这一点,苹果于 10 月加入了开源人工智能社区。Ferret 的推出证明了苹果致力于影响深远的人工智能研究,巩固了其在多模态人工智能领域领导者的地位……ps:我期待着有一天,本地大型语言模型(LLLMs)作为重新设计的 iOS 的集成服务运行在我的 iPhone 上。”

Meta 发布全新 AI 翻译大模型,实时语音转换不超 2 秒

据站长之家 12 月 22 日报道,Meta 最新发布了一系列 AI 翻译大模型,实现实时语音转换延迟不超过 2 秒,支持多种语言翻译,并具备模仿语气、语速、情感等特征的能力。这一系列模型名为 Seamless Communication,包括 SeamlessExpressive、SeamlessStreaming、SeamlessM4T v2 和 Seamless,其中前三个已经在 GitHub 上开源。

为确保翻译准确性和避免滥用,Meta 采用了毒性缓解技术,在训练前过滤“有毒内容”并在翻译生成过程中自动检测和调整生成的有毒单词,同时为音频添加了水印以追踪来源。为了防止滥用风险,Meta 还为音频添加了水印,通过在音频中嵌入不可察觉的信号,可以准确追踪音频的来源,并对抗各种攻击手段。

轻松集团升级“轻松问医 Dr.GPT”大模型

据中国青年网报道,12 月 19 日,轻松集团旗下医疗健康服务平台“轻松健康”宣布,其自研的垂直领域大模型“轻松问医 Dr.GPT”全面升级。同时,轻松健康发布了七项 AI + 健康创新应用,包括针对用户的“智能问诊系统”“个性化健康管理顾问”“慢性病管理计划”“心理健康指导师”,以及面向医生的“医学知识库和技能培训平台”“辅助诊疗助手”“患教内容智创平台”。


应用


Midjourney 开放 V6 模型 alpha 版本测试

AI 新智界讯,12 月 21 日,Midjourney 在 discord 社区宣布开放 V6 模型的 alpha 版本测试。

Stable Diffusion 推出商业付费订阅计划

AI 新智界讯,Stability AI 近日发布新闻稿,宣布旗下文本生成图片模型 Stable Diffusion 推出会员订阅计划,其中非商业级会员,可免费使用核心模型,供个人和研究使用;

专业版月费 20 美元,适用于创作者、开发者和初创公司;企业版主要面向大型企业,可以为大规模运营量身定制,价格根据定制情况而定。

努比亚宣布 Z60 Ultra 手机搭载业界首个垂直影像 AI 大模型

据 IT 之家 12 月 19 日消息,正在举行的努比亚新品发布会上,努比亚 Z60 Ultra 宣布搭载业界首个垂直影像 AI 大模型。据介绍,经过训练的 AI 大模型,让努比亚的影像系统进化得更加强大。努比亚自 2012 年成立至今,在 30 多个影像领域,拥有海量且稀缺的专业影像数据,能够对 AI 进行定制化的专属影像场景训练。在努比亚强项的星空、人文等多方面,深度融合 AI 技术,打造业界首个垂直影像 AI 大模型。

小红书内测 AI 聊天机器人“Davinic 达芬奇”

据 Tech 星球 12 月 25 日消息,小红书在其主 App 中内测了一个名为“Davinic”(达芬奇)的 AI 功能。这项功能自 9 月开始测试,至今仍在持续,这也是继 AI 群聊后,小红书推出的又一项新的 AI 应用。

“Davinic”主要为用户提供智能问答等 AI 聊天功能,更偏向于提供好物生活类的问答,涵盖旅游攻略、美食攻略、地理和文化常识、生活技巧、个人成长和心理建议,以及活动推荐等多个方面。据悉,“Davinic”是基于 Meta 旗下的 LLAMA 大模型进行训练的产品。


大公司


微软 Copilot 集成 AI 音乐创作平台 Suno,可通过文本生成音乐

AI 新智界讯,12 月 20 日,微软在官网宣布与 AI 音乐创作平台 Suno 达成合作,并将其功能集成在 Copilot 中,允许用户通过文本生成多种类型音乐。

谷歌:已在 175 个国家/地区为所有层级的 Colab 用户提供 AI 编码权限

AI 新智界讯,12 月 20 日,谷歌宣布已在 175 个地区为所有级别的 Colab 用户提供了对 AI 编码的扩展访问权限。据悉,Colab 最初是由 Google Research 的一个小团队构建的工具,目前月活跃用户已超过 1000 万,其中包括全球数百万学生,使其成为 Google 最大的人工智能编码工具。

三星及 Naver 展示最新 AI 芯片,能效比英伟达芯片高约 8 倍

据《科创板日报》援引 Businesskorea 报道,三星电子和 Naver 展示了他们在最近的一年里共同开发的人工智能(AI)半导体,该产品能效比英伟达等竞争对手的芯片高出约 8 倍,预计将为 Naver 的超大规模 AI 模型 HyperCLOVA X 提供支持。

Meta 发布全新 AI 翻译大模型,实时语音转换不超 2 秒

据站长之家 12 月 22 日报道,Meta 最新发布了一系列 AI 翻译大模型,实现实时语音转换延迟不超过 2 秒,支持多种语言翻译,并具备模仿语气、语速、情感等特征的能力。这一系列模型名为 Seamless Communication,包括 SeamlessExpressive、SeamlessStreaming、SeamlessM4T v2 和 Seamless,其中前三个已经在 GitHub 上开源。

为确保翻译准确性和避免滥用,Meta 采用了毒性缓解技术,在训练前过滤“有毒内容”并在翻译生成过程中自动检测和调整生成的有毒单词,同时为音频添加了水印以追踪来源。为了防止滥用风险,Meta 还为音频添加了水印,通过在音频中嵌入不可察觉的信号,可以准确追踪音频的来源,并对抗各种攻击手段。


观点


Linkedin 副总裁:AI 时代,学历价值“大幅缩水”

据 Business Insider 12 月 19 日报道,LinkedIn 副总裁 Aneesh Raman 近日在播客中表示,在生成式人工智能时代,拥有常春藤盟校的学士学位,可能不再是人们在职业生涯中取得成功的关键,学历的价值正“大幅缩水”。相比于学位,当今的关键软技能是适应能力。Raman 认为,在工作中使用 AI 不仅可以帮助员工提高工作效率,还可以帮助员工更有效地进行跨文化、跨语言和跨部门的沟通,并增强同理心。

亚马逊创始人贝索斯:ChatGPT 不是“发明”,而是“发现”

据爱范儿 12 月 21 日报道,亚马逊创始人贝索斯在著名科技播客 Lex Fridman Podcast 上分享了自己对生成式 AI 的见解。

对于 ChatGPT 等生成式 AI,贝索斯提出了相当有趣定义:“如今形式的大语言模型并不是发明,它们是发现。”在贝索斯看来,只有我们刻意设计,并清晰了解其运作原理的东西才是发明。譬如,望远镜是发明,但通过望远镜看到木星,知道它有自己的卫星,这是一个发现。大语言模型更像是发现。我们经常为它们的能力感到惊奇。它们并不是设计出来的产物。

至于 AI 对人类生存的潜在危害,贝索斯展示出乐观的态度:“我们人类有很多种方法让我们自己灭亡。这些技术有可能帮助我们不去做这些事,反倒会救了我们。”

AI 教授窦德景:国内大模型达到 GPT-3.5 水平,与 GPT-4 技术差距在缩小

据环球时报报道,12 月 23 日,著名人工智能和大数据专家,清华大学电子工程系兼职教授窦德景表示,国内大模型目前达到 GPT-3.5 水平,离 GPT-4 还有一定差距,但差距在缩小。“以后的人工智能可以达到更高的水平”,窦德景教授从事人工智能研究 20 余年,据他介绍,“人工智能”名词诞生于 1956 年,过去科技界预计 2050 年左右实现通用人工智能,而生成式人工智能和大模型的出现大大的加速了这一进程,目前来看,5 到 10 年内有望实现该目标。

人民日报评论:AI 客服把人逼疯?技术虽好,但绝非万能

AI 新智界讯,12 月 22 日,人民日报评论发文《AI客服把人逼疯?技术虽好,但绝非万能》。文章称,近期,一篇题为《“AI 客服快把人逼疯了”》的媒体报道受到关注,也再次引发广大网友对 AI 客服的一片调侃、“吐槽”之声。AI 客服的好,大家当然清楚:对消费者来说,24 小时在岗、随时响应、处理程序性事务快捷高效。然而就当前而言,AI 客服还远未达到人工客服能够撒手不管的程度。尤其是,那些需要提供更多情绪价值的服务,AI 很多时候不仅发挥不了作用,反而可能产生反效果。“我觉得被 AI 客服接待有一种不受重视的感觉。”这也是不少消费者的心声。可见,AI 虽好,却也并非万能,在应用中更不可能一劳永逸,商家关键还是要区分场景、因地制宜。

猎豹移动董事长傅盛:2024 年将是 AI 大模型应用的浪潮年

据界面新闻 12 月 22 日报道,猎豹移动董事长兼 CEO、猎户星空董事长傅盛在 2023 探索大会上表示,2023 年是 AI 的元年和浪潮年,上半年大家都在投千亿大模型。2024 年一定是 AI 大模型应用的浪潮年,一定会出现很多像移动智能手机出来的时候的滴滴、美团外卖一样在过去那个时代没有出现过的应用。

傅盛表示,作为一个企业创业者,要意识到只用通用大模型不能完全解决企业的自有问题。创业公司的核心竞争力是私有数据,并不是以前写在 ERP 系统里面的数据,而是公司里面各种决策的流程各种认知迭代的过程就是私有数据。

极越汽车 CEO 夏一平谈“大模型上车”:没有大模型的车是功能车

据 IT 之家 12 月 24 日消息,极越汽车 CEO 夏一平今天在微博上谈到“2024 年会是新能源大考年吗”的话题,认为继今年“汽车智能化元年”之后,明年将是智能汽车的赛场。夏一平认为,明年必将开启一场汽车智能化的变革,大模型是分水岭。没有大模型的是功能车,有大模型的是智能车,而当前超过 90% 的车主置换燃油车都会选择智能车。“大模型上车,汽车真正开始智能。”他还表示,未来 3-5 年将会是大模型的时代,大模型将是智能汽车的 OS。


研报


报告:到 2027 年,全球生成式 AI 智能手机出货量达到 5.22 亿台

据 IT 之家 12 月 21 日消息,根据市场调查机构 Counterpoint Research 近日发布的《生成式 AI 智能手机出货量洞察》报告,预估 2024 年会成为生成式 AI 智能手机的关键元年,预估出货量将达到 1 亿台。该机构预估到 2027 年,全球生成式 AI 智能手机出货量达到 5.22 亿台,复合年增长率为 83%。

该机构对“生成式 AI 手机”的定义,划分到 AI 智能手机类目下,指可以使用生成式 AI 来创建原创内容,可以本地运行 AI 模型。该机构认为三星和高通是直接的领导者。

我国 5% 至 8% 企业大模型参数跃升至万亿级

据央广网报道,工业和信息化部赛迪研究院发布的研究报告预测,到 2024 年年底我国将有 5%~8% 的企业大模型参数从千亿级跃升至万亿级,算力需求增速会达到 320%。目前我国参数规模达到万亿级别以上的大模型企业已有五家,随着参数规模不断突破,人工智能大模型赋能千行百业的速度也在不断提升。我国人工智能大模型 50 强行业应用共涉及 13 个领域,主要集中在金融行业,其次为工业、政务、交通等行业。在我国排名前十的人工智能大模型企业中,拥有自主算力资源的企业占比达 100%。