谷歌Gemini“悄悄变强”,快速缩小与GPT-4o差距,中文更是完成了超越!
谷歌Gemini“悄悄变强”,快速缩小与GPT-4o差距,中文更是完成了超越!
尽管亮相时被 OpenAI 压了一头,但谷歌一直在悄悄迭代 Gemini 大模型,和 OpenAI 最新大模型 GPT-4o 的差距已经显著缩小。最新测试结果显示,Gemini 1.5 Pro/Advanced 在综合测试中排名第 2,逼近 GPT-4o,轻量版 Gemini 1.5 flash 排名第 9,超越 Llama-3-70b,接近 GPT-4。
相比 4 月份的版本,免费的 Gemini Pro 和 Flash 的能力有明显加强。且上下文长度可以达到 100 万 token,远远超出 GPT-4 的 12.8 万 token。
Gemini 的中文能力更是惊艳,在中文测试中,Gemini Pro 和 Advanced 双双超越 GPT-4o,分别排在第一、第二位。
此外,在 Hard Prompts 测试中,Gemini 同样名列前茅。在 Hard Prompts 测试中,大模型需要面对那些更具挑战性的问题,Gemini 1.5 Pro 在这一测试中排名第二,仅次于 GPT-4o.
从大模型置信区间(Confidence Intervals)来看,Gemini 的测试结果也名列前茅。
值得一提的是,两周前,在 Google Gemini 更新撞档 GPT-4o 发布时。Gemini 因为羸弱的能力几乎引来了群嘲。根据多家科技博客的测评,即使谷歌已经对 1.5 Pro 进行了数月的改进,但从常识推理到多模态能力和代码能力,仍然无法与 OpenAI 最新的 GPT-4o 模型相媲美。唯一亮点就是更大的上下文窗口。如今谷歌 Gemini 取得了如此神速的进步,显示出 AI 界届黄埔军校仍然有深厚的技术底蕴。
-
- 短视频博主“疯产姐妹”时隔两年再更新,回应停更原因
-
2024-06-01 19:45:18
-
- 武大雷军班今年首次招生!招生30人,100%保研100%直博
-
2024-06-01 19:43:03
-
- 南海夏季风已爆发,我国全面进入主汛期
-
2024-06-01 19:40:47
-
- 撤职、降级6年后,原厅长被查!曾公款购买570瓶茅台受处分
-
2024-06-01 19:38:31
-
- 字节跳动游戏业务不卖了,游戏行业老兵张云帆走马上任
-
2024-06-01 03:40:54
-
- 京东618发布12大AI品类,预计推动超300万用户换新AI设备
-
2024-06-01 03:38:38
-
- 34项重罪全部成立,特朗普还能竞选总统吗?旗下公司股价一度暴跌12%
-
2024-06-01 03:36:22
-
- 长沙老人执意要找“不存在”的旧货市场,一个举动让交警决定帮她
-
2024-06-01 03:34:06
-
- 许家印“手段特别恶劣,情节特别严重”,恒大地产41.75亿元罚单全文公布
-
2024-06-01 03:31:50
-
- 新加坡坠亡女留学生男友发声:事发凌晨,她独自在高处坐了几个小时
-
2024-06-01 03:29:34
-
- 27岁了喊亲戚还得靠父母教?看到大家都在“装”大人,那我就放心了
-
2024-06-01 03:27:18
-
- 中国和阿拉伯国家关于巴勒斯坦问题的联合声明
-
2024-06-01 03:25:02
-
- 吃不惯白人饭的留学生们,正在流行吃预制菜
-
2024-06-01 03:22:46
-
- AI大模型仍然只是复读机?这是蚂蚁集团CTO的几点最新研判
-
2024-06-01 03:20:30
-
- 奥创光年联合创始人兼COO 杨海:AI时代的市场策略变革
-
2024-05-30 18:28:19
-
- 北京新房悄悄降价,指导价成“虚标”
-
2024-05-30 18:26:03
-
- 中国企业花13亿美金快把港口建好了,这个南美国家竟突然想反悔?
-
2024-05-30 18:23:47
-
- 保时捷混动 911 发布!纽北提升 8.7 秒,但却不能上绿牌?
-
2024-05-30 18:21:31
-
- 是什么绊住了年轻人婚恋的脚步
-
2024-05-30 18:19:15
-
- 女生遭校园霸凌转学后又失学:被获刑同学的家长举报违规借读
-
2024-05-30 18:16:59