一句话与GPT-4的差距是什么？

发布时间：2023-03-20 09:28:59作者：顺晟科技点击：

本周无疑是AI爆炸周。昨晚微软推出微软365Copilot，办公软件全面接入生成式AI功能。在刚刚过去的疯狂星期四，“中国GPT”文新也迎来了备受瞩目的亮点时刻。当天下午2点，百度创始人李彦宏出现在发布会现场，展示了文心的使用场景表现。

据悉，从3月16日起，首批用户通过邀请码说一句关于官网的话就可以在文心体验产品，产品将陆续开放给更多用户。值得注意的是，昨日发布会开始后，百度集团港股股价持续下跌，最高跌幅一度达到9%，收盘时最终下跌6%。然而，今天情况发生了逆转。截至记者发稿时，百度香港股价已持续上涨超过14%。

无独有偶，在文新正式上线的前一天，OpenAI正式公布了大型号GPT-4，距离上一次惊艳的ChatGPT上线仅4个月。最新的官方GPT-4不仅提高了语言模型的能力，还增加了“多模态”图像识别功能。简而言之，GPT 4号更聪明，更人性化。

对于文新伊彦和GPT-4来说，几乎同时在线的节奏意味着他们之间的比较是不可避免的。新榜编辑部在第一时间获得内测资格后，分别向文欣怡和搭载GPT-4版本的微软必应提出了九个相同的问题，看他们如何回应。(想了解问答的朋友可以直接跳转到第三部分)P . S月16日起，个人用户可登陆yiyan.baidu.com，点击“立即体验”参与排队。文心一言：是不及预期，还是值得期待？

“十月怀胎，生一次。”在文心正式发布之前，李彦宏用这句话总结了百度多年来在文心AI系列产品上的布局。2019年3月，百度推出文心二胎1.0以来，经历了多次迭代。此次发布的文新是对之前产品的延续和升级。

李彦宏还表示，对于文新，大家的期望是对ChatGPT甚至GPT4进行基准测试，这个门槛还是很高的。在全球各大厂商中，百度最先发布。(ChatGPT由OpenAI开发，不隶属于微软，双方是合作伙伴。)

在产品演示环节，李彦宏演示了文易欣在文学创作、商业文案、数学计算、中文理解、多模态生成五个使用场景的表现，如概括小说《三体》的核心内容、命名公司、写广告语、计算同笼鸡兔的数学问题、根据文字自动生成图片和视频等。

值得注意的是，以上演示链接均为预先录制的视频演示，现场并未演示向文心实时提问的效果，让不少用户感到失望，认为产品并未达到预期的惊艳效果，间接影响了百度在资本市场的走势，导致其港股价格在发布会期间直接跳水。意想不到的示范效果，与百度高调宣布文心的话，抢着推出产品有关。

今年年初ChatGPT出圈后不久，百度宣布正在筹备一款类似的AI产品，预计3月份对外开放。在2月底发布2022年Q4和年度财报后，李彦宏在致全体员工的信中提到，“百度的很多主流业务都与文心安易进行了整合，包括搜索、智能云、Apollo自动驾驶和小型智能设备”。

同时，文新还在紧锣密鼓的测试和开放中。据《华尔街日报》报道，文心上线前一周，有百度员工表示，产品的基础功能还不完善，基于它的AI模型还在接受数据训练。或许是各种因素的叠加。李彦宏在发布会一开始就表示，文新在内测期的话并不完美，但考虑到市场需求，一定会推出，并强调用户反馈可以帮助文新不断优化迭代。

发布会上，李彦宏宣布已有650家机构宣布加入文心伊彦生态，李彦宏也表示看好未来AI市场的爆发式需求。百度官方数据显示，截至3月17日10点，已有7.6万家企业申请文信伊彦API调用服务测试。“百度敢于在当下这个时点发布自己的大模型，还是有很大的勇气，行业关注度很高，客观上能够促进国内AIGC上下游的发展。”一帧视频CEO雷涛告诉我们，其旗下产品“一帧秒创”也支持文字转视频，所以比较关注文心一言的多模态输出能力，但发布会演示的效果不及预期。

他认为，对于中国的互联网创业者来说，现在是一个“AI平权”的阶段。今天，任何人工智能创业公司与百度的差距都远远小于百度与OpenAI的差距，所以小公司也有机会在中国互联网上与行业巨头竞争。并且基于已有模型成果的应用开发，小公司也有更多尝试的机会。AIGC的黄金十年可能已经开启。GPT-4升级多模态，国内如何接招？

回顾文心伊彦的诞生，除了百度自身十几年的技术积累，ChatGPT才是引爆这场AI技术大战的关键点。今年2月初，微软推出了新的人工智能搜索引擎Bing和Edge浏览器，谷歌发布了实验性的对话AI服务Bard。“中国版ChatGPT”在哪里？很多目光转向了百度等国内厂商，很快百度官方公布了文心的一句话。

无独有偶，在文新发布的前一天，3月15日凌晨，OpenAI推出了多模态大型模型GPT-4。这一里程碑式的升级，让人感叹“这个压力给了百度”。GPT-4主要有以下更新：1 .新的视觉输入GPT-4支持将图像作为输入，并生成相应的文本描述、分类和分析。图像支持包括带有文本和照片的文件、图表或截图。

在示例演示中，我们可以看到GPT-4不仅可以处理图表，回答考试问题，总结论文摘要，还可以解释题干图。比如GPT-4看到了这张图的特别之处，就是一个人挂在车上熨衣服的极端操作。对于地图和鸡块的结合，GPT-4也能点出梗的幽默。在GPT-4大会上，有一张网站设计草图参赛，甚至当场只用了十秒钟就生成了完整的前端HTML代码，制作了一个网站。

不过目前图像输入还是研究的预览版，并没有对C端用户开放。2.更长的上下文GPT-4可以处理超过25，000个单词的文本，允许使用长格式内容来创建、扩展对话以及搜索和分析文档。这意味着用户不用像以前一样分几段提问，处理长文本更方便。例如，进入蕾哈娜的一个百科网站，GPT-4可以阅读内容并根据要求整合信息，回答她在超级碗中的表现如何。

3.可控性(角色扮演)目前，开发者(很快所有ChatGPT用户)可以通过在“系统”消息中输入描述来指定AI的风格和任务。换句话说，AI可以根据用户的要求进行角色扮演，用特定人物的语气风格说话，比如例子中的苏格拉底的导师，莎士比亚的海贼。此外，与上一代GPT-3.5相比，GPT-4的答题深度、专业性和解题能力也有了显著提升。