遥遥领先?Google发布AI大模型Gemini 1.0!
12月6日,在AMD忙着改名锐龙8000并且宣布AI PC时代来临时,Google也没忘抬了AI一手,而Google一出手就有点石破天惊的意思,正式发布了旗下迄今为止最强大、最通用、最灵活的模型 —— Gemini。
Gemini一出来,对标的就是目前公认一哥、口碑极佳的OpenAI GPT-4模型,并且Gemini Ultra能够在多个场景均有着比GPT-4更佳的表现,甚至部分场景还能超越人类专家?

细说超越人类专家?那还真没法细说,毕竟果式对比大家都会,90.0%的准确率与人类基准89.8%只有很小的差距,而图示里为了对比GPT-4凸显自身巨大优势,y轴上半部被拉长很多,也顺带AOE到人类专家(果式对比被群嘲之后,现在这条曲线已经被Google去掉了)。

所以我们就来大致说下这个“超越人类专家”的MMLU测试结果吧。点开巨长的测试报告的6、7页,其实可以看到Gemini Ultra只是在提示词32次样本(CoT@32)中以90.04%击败了人类基准和GPT-4,而在无提示词的5次尝试中(5-shot),Gemini Ultra的83.7%其实不如GPT-4的86.4%。
为我们人类打抱不平之后,小编也想看看Gemini现在的水平到底如何,而Google的使用门槛就比OpenAI的ChatGPT低多啦,页面下拉到“Bringing Gemini Pro to Bard”就能通过Bard使用Gemini Pro啦!对了,别忘了登录你的Google账号哦!
接着就是熟悉的Bard界面了,用过New Bing和ChatGPT的同学应该很容易上手,没用过的同学直接当作和SIRI聊天就行。然后你就可以用之前召唤无和谐版New Bing同样的方式,来召唤Gemini Pro。
先让Gemini Pro以李白的文风来自报家门吧:

你不是对语言理解很厉害么,小编接着掏出了博德之门3和后羿射日中西合璧疗效好,结果Gemini Pro似乎还应对得不错,大家说说它的回答能打几分:

总之小编觉得这个射日者设定还不错,Gemini Pro全自动做BG3的mod,甚至参与创作龙与地下城内容指日可待了。然后小编也让Gemini Pro锐评了一下TLOU2的剧情,这段看起来就更像收集全网评论然后洗稿了,显得不够尖锐不够主观,颇有端水大师的风范。

浅尝Gemini Pro模型后,小编个人感觉Google Bard使用门槛比ChatGPT要低不少,也不会限定IP、非会员限定GPT-3.5模型,关键也不会像ChatGPT非会员体验有卡卡的感觉,整体感觉会更丝滑。怎样,大家是不是也跃跃欲试想要vivo50试试实力了?那就打开Bard试试吧!
最新评论 22
:我试过了 菜量很足 老板人很好 下次还去 (此条5毛 括号内的删阝
:第一反应是葛mini 王者那个主播![[捂脸哭]](/assets/emoji/comment-emoji/dm_wulianku@2x.png?v=1)
![[捂脸哭]](/assets/emoji/comment-emoji/dm_wulianku@2x.png?v=1)
![[捂脸哭]](/assets/emoji/comment-emoji/dm_wulianku@2x.png?v=1)
:看成garmin了,还以为被收购了![[偷笑]](/assets/emoji/comment-emoji/dm_touxiao@2x.png?v=1)
:Google? Evil rising.
:我真的很担心自己
这个ai可比我这个普通人聪明很多
:小编,你这试了半天有没有可能试的不是 gemini pro 的版本,Gemini pro 现在只支持英文:网页链接>>
:你直接问bard,它是gemini还是gemini pro,它会回你说自己是pro
还和你解释gemini pro是Gemini的商业版本
:然后你问它为啥你在说中文。它会告诉你这是开发版,正在学习使用pro,所以能生成简单中文文本
:google 算个什么 也配称遥遥领先? LOL
:chatgpt基于transformer, transformer是谷歌提出的
:谷歌的数据甩微软几条街,其实还有另一个国家拥有更可怕的数据,不知道能不能搞出来