文章转载来源:芯片客
文章来源:新硅NewGeek
作者:刘白
前两天,谷歌Gemini又双叒叕公布了些新动向,给自家的Bard聊天机器人更新了文生图功能。
说实话,硅基君是有些失望的,Gemini一向在对抗OpenAI这事上被看做“全村的希望”,可这文生图功能去年10月就被整合进ChatGPT了。
五个月时间过去,谷歌又慢了一大步。
不过咱们还是先试试效果如何。
相比ChatGPT要开会员才能用上的DALLE-3,Bard可以免费用。
白嫖当然要第一时间赶到现场,可是没想到出师未捷直接被Bard原地拒绝了。
原因是春节加班属于不安全或者有风险的场景。
不能加班,只能帮我生成一个“喜庆”或“中立”的工作环境图片,结果就来了下面这图:
嗯,除了喜庆,其它的关键词那是八竿子打不着。
同样的话术交给GPT4试试。
不仅生图质量离谱,拒绝用户的理由还五花八门。
Bard觉得新年加班工作是不存在的,大家都应该在享受假期…它要努力做一个尊重各种文化和传统的机器人。
来源:微博
所以谷歌到底更新了个啥?
2月1日,谷歌官方博客连发两篇文章,一篇介绍了它们最新的文生图模型Imagen 2,不仅对生图质量和提示词理解进行了优化,还特别加上了肖像隐私保护和低俗内容限制。
而且针对外媒最近热论的AI造假风波,谷歌还特贴心的给自己的生图模型加上了SynthID技术。
也就是在不影响人肉眼看图的前提下,给生成的图片加一个数字水印,用来判断图片来源。
另一篇介绍了Bard的两大更新:Bard使用的模型Gemini Pro从只支持英语扩展到支持40多种语言、Bard可以用Imagen 2生成图片了。
多语言支持终于来了,语言门槛消除。
然而当网友兴冲冲跑去找Bard生图时,却发现它听不懂中文的提示词。
来源:小红书
不过这里的原因还真不是敏感词也不是歧视,是因为Bard目前只能通过英文的提示词生图…
谷歌这波更新真的迷惑性很强,因为大家看到的重大更新就是支持更多语言(包括中文)和文生图。
但是谁能想到Bard的聊天功能是Gemini Pro提供的,画图功能是Imagen 2提供的,增加多语言支持的只有前者,后者还是只能用英文。
多加一个提示词自动翻译成英文再喂给Imagen 2很难吗?非要用这么不顺畅的体验来折磨用户…
有了前车之鉴,我们直接用中文要求Bard写英文提示词,然后再复制粘贴测试生图效果。
首先是独自吃年夜饭:李独自坐在餐桌前,周围摆放着本应为家庭盛宴准备的未动过的菜肴,她看着电视上的春节联欢晚会,节日的氛围反而更加凸显了她的孤独。
内容和情绪捕捉的还算到位,把那种不甘的苦闷都刻在了脸上。
但是能看出来文字还是没优化过的,春联上的字跟乱码没区别,而且画风从照片到写实油画到像素风跳跃有点大。
还有右上这位老人家,就算是风吹日晒肤色也太深了…
独自看春晚:王坐在沙发上,周围是空啤酒罐和外卖盒子,他带着勉强的笑容看着春节联欢晚会,试图用这种方式淹没独自度过假期的空虚感。
提示词里性别明明是男,Bard生成出来两男两女,而且明显有一个人种已经不同了。
开始合理怀疑第一轮里右上的老人家,难道血统不同?
还有奇怪的一点是女性人物的脸部细节明显处理得更好,而男性的两只眼睛总朝着不同的方向看。
独自辞旧迎新:陈站在阳台上,看着烟花点亮夜空,泪水在她的眼中涌动,她渴望与亲人分享这一刻,而她周围的寂静与其他地方正在进行的欢乐庆典形成了鲜明对比。
这次性别倒是都对了,但是等等,怎么出现了陈姓的黑人姐妹?
虽然有可能是中非混血,爸爸是姓陈的中国人…Bard的内心戏是不是也太多了点。
现在大概实锤了,第一轮里右上肤色异常深的老人家应该是非洲血统。
独自许下新年愿望:晓坐在昏暗的房间里,借着烛光写下她的新年决心,摇曳的火焰在墙上投下跳跃的阴影,这鲜明地提醒着她孤独的状态,但同时也为即将到来的一年提供了一线希望。
看着前三张生成完我们的内心是放松和喜悦的,场景、人物、情绪、氛围都很到位,细节也不错。
直到第四张画风明显不同的黑妹子出现……不得不说Bard在让非洲人过上中国年这件事情上,是有点执念的。
reddit网友同样碰到了Bard生图的人种问题,只不过跟上面恰恰相反。
所以说只要明确提到种族就是涉嫌歧视,然而在人家特定文化背景下混入其他种族就是可以的。
这网飞无视历史背景和原著跨种族选角的本领,被Bard偷师了。
不过谷歌向来在聊天机器人的言论倾向上格外谨慎,早早在内部设立了“AI伦理部”,专门用来审核机器人是否会在跟人类沟通时产生歧视性语言或仇恨言论。
谨慎小心可以理解,毕竟机器人要是说错了话,受损的是公司形象和市值。
但是谨慎过头变成功能阉割了就很让用户恼火。
最后忍不住让Bard画了一下春运火车站的场景,它还真抓住了“人多”这个精髓。
但是人一多作画就完全崩坏了,所有人的脸都不能看。
不看大图,猛一看小图跟这几天虹桥的盛况也蛮相似。
来源:微博
谷歌也知道自己做的不够好,于是拼命的小步快跑。
2月3日,网友在推特上爆料谷歌将在2月7日正式把Bard改名为Gemini。
来源:推特
一同传出来的更新还包括:
推特网友对谷歌把安卓放在第一很激动……然而这摆明了是谷歌给自己亲儿子Pixel系列准备的。
来源:推特
reddit网友则表示谷歌你终于开窍了。
来源:reddit
ChatGPT虽然算不上什么好名字,但是ChatGPT作为应用名称,模型以GPT-X格式来命名,大家都比较好懂。
而Bard背后的模型已经彻彻底底换过三次:LaMDA、PaLM 2、Gemini。
23年2月谷歌匆匆推出Bard,首秀时只被问了一个问题:韦伯望远镜有什么新发现吗?
NASA出面证实它答案中的最后一点“韦伯望远镜拍摄到了第一张系外行星的照片”是错误的。
第一张系外行星照片早在2004年就被欧洲南方天文台的超大望远镜捕捉到了,韦伯望远镜2021年才发射升空。
有这种黑历史,谷歌想把Bard改成Gemini也好理解,毕竟谁也不想自家产品永世背着翻车的典故,改头换面重新开始得了。
Bard只是谷歌看ChatGPT杀疯了之后快速推出的竞品,实际上谷歌着手AI要早于现在所有能叫的上名字来的玩家。
早在2015年谷歌就开始自研用于加速机器学习的张量处理单元(TPU),遥遥领先这周才宣布入局自研芯片的Meta。
2017年,谷歌团队捣鼓出来了奠定现在GPT底层架构的Transformer。
随后几年谷歌推出了BERT、T5-xxl、Transformer-X几个模型,以及被自家工程师认为拥有了自我意识的聊天机器人LaMDA。
据内部员工透露,2013至2020年间,谷歌就研发出了类似ChatGPT的对话机器人Meena,但是公司高管多次拒绝了将产品公之于众的提议。
原因是聊天机器人不符合谷歌关于安全和公平的AI原则。
所以说底层技术不是不能打,是谷歌端着硅谷巨头小心驶得万年船的谨慎态度,被Open AI这种没有历史包袱的初创公司给弯道超车了。
谷歌和Open AI的厮杀愈演愈烈,最近谷歌颇有后来者居上的态势。
今年一月底,Bard(Gemini Pro)在UC伯克利的LLM榜单中一度冲到第二,结束了GPT-4系列长期霸榜前三的局面。
来源:推特
但是谷歌在第二的位置还没坐热乎,又很快被Open AI连夜更新的新模型给顶下来了。
虽然这次Bard更新的生图体验下来平平无奇甚至有点失望,但是谷歌在AI应用上明显开始加速了。
如果推特网友的爆料是真的,Gemini Advanced7号上线以后,能不能顺利冲回榜二呢?
来源:芯片客
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com