大家好,我是文森。作为“ChatGPT学家“,上次刚刚和大家介绍完什么是ChatGPT,它都拥有什么能力。作为OpenAI发布的一款产品,ChatGPT刚刚面世的时候就惊艳到了我们所有人,并且我们预测ChatGPT很有可能会取代很多我们人类的岗位。不过当时我们还是有很多小伙伴对此抱有不同的看法,有人认为ChatGPT这种AI可以取代我们,另外一些小伙伴认为它只能为我们的工作提供辅助作用。在3月15日北京时间凌晨的时候,OpenAI发布了ChatGPT的“升级版本”—GPT4模型,仅仅时隔四个月,对比我们以往熟知的ChatGPT(GPT3.5)有着颠覆性的升级。同样在北京时间3月16日下午的时候,百度同样也发布了基于中文社区的“文心一言”这一款AI产品。
OpenAI的老板
Sam Altman
直接开门见山的都说,GPT-4 是“我们迄今为止最强大、对齐最好的模型”。
GPT-4 能够接受图像和文本输入,输出文本,在各项测试和基准上的表现已经与人类水平相当。根据OpenAI官网的介绍显示,GPT-4是一个超大的
多模态模型
,也就是说他的输入可以是文字(上限2.5万字),甚至是可以上传图像,我们可以直接把一篇长达50页的学术论文直接丢给GPT-4,这是以往的GPT-3.5不可以做到的。
更强的计算能力
在演示视频中,OpenAI总裁兼联合创始人格雷格·布罗克曼(Greg Brockman)挑选了一篇文章,并要求ChatGPT将其浓缩成每个单词都以“G”开头的一段话,对此ChatGPT确实对文章内容进行了浓缩,但无法让每个单词都以“G”开头,而GPT4则可以很好地完成这项任务。
但是反观GPT+3.5
还未尝试就
已经放弃了任务,GPT-4 跟 GPT-3.5 具有相同的 API 接口和交互界面,但在文本总结和加工能力上,GPT-4 有了明显的提升,这表现提出指令后,模型能更好地遵循指令给出答案。
发布会直播上,OpenAI总裁Greman现场表演了GPT-4给代码修复bug。如果代码出现了问题,我们什么都不用想也不用管。我们直接把一万多字符的程序文档放进GPT-4里就行,也不需要管格式之类的东西,只需要无脑的Ctrl+A,Ctrl+C,Ctrl+V就可以。最后在附上出现的问题,短短几秒钟我们便可以得到解决问题的答案。
不仅如此,GPT-4 还能基于税务法则,帮助一对夫妻精准地计算出2018年缴纳的税额,并给出详尽的算法步骤,以便阅读解释。
此外,GPT-4开始逐渐具备了一点点幽默感,它可以说出一些质量不咋样的冷笑话。甚至可以根据我们的设定来让它去模仿苏格拉底等等名人的语气和我们对话,至少它已经开始理解了人类的幽默感这一特质。
识图功能
GPT
-3.5
只能通过向其输入文字提问才能生成文字回答,但GPT4可以直接输入图像,并令其用语言描述图像内容。在
Greman的
演示案例中,GPT4就详细描述了
Greman
发给它的电脑网页截图,甚至精确描述了该截图的中心、左侧和右侧分别是什么内容。除了描述图片内容外,
我
们
还可以基于图片向GPT4提其他问题,
比如Greman
在演示中输入了一张拿着照相机的松鼠漫画,并询问GPT4“这张图片好笑在哪?”,GPT4回答,“这张图片展现了一个松鼠拿着照相机,像专业摄影师一样拍摄松果,其笑点在于这实际上只有人类才做得到,松鼠是吃松果的,我们不能指望它像人类一样会用照相机。”
而且它可以对
片生成说明、分类和分析。比如输入一张有鸡蛋、面粉和牛奶的图片,询问 GPT-4 可以使用这些原材料做什么,得到的结果如下:
GPT-4 可以实现从图片中提取文字信息并输出到 HTML,比如尝试手绘一个笑话网站模型,让 GPT-4 尝试自动生成网站的原型图:
GPT-4强大的考试能力
GPT-4的考试成绩超越了百分之九十的人类。
在SAT阅读考试中和SAT数学考试中,GPT-4的成绩都能达到领先的排名
,GPT-4在模拟律师考试中的成绩在所有考生中列于前10%,在SAT阅读考试中进入了前7%,在SAT数学考试中进入前11%。
这一点就非常强了,原来人类学霸最强的对手并不是人类而是“机器人”。
GPT-4仍然存在的缺点
OpenAI警告说,新模型还不够完美,在许多情况下它的能力不如人类
。
根据我上面所说,虽然GPT-4的能力进行了超大规模的升级,但之前ChatGPT会出现幻觉、胡说八道的毛病还是没能完全改掉,
如其仍然存在包括社会偏见、捏造事实、对抗生成等已知限制
仍然存在。OpenAI对此表示,随着社会对AI模型的接受,将增加透明度,鼓励并促进用户教育和更广泛的人工智能素养,并致力于扩大人们在培养AI模型方面的输入途径,而且在事实上并不可靠。当它犯错的时候,它仍然倾向于坚持自己是正确的。
OpenAI在博客文章中表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,如社交偏见、幻觉和敌意回复等。在一次随意的谈话中,GPT-3.5和GPT-4之间的区别很小。而当任务的复杂性达到足够的阈值时,差异就会显现出来:GPT-4比GPT-3.5更可靠、更有创造力,并且能够处理更多细微差别的指令。”
百度文心
3月16日下午,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。
百度创始人,董事长李彦宏出席并且进行了现场发布。他展示了
展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。
在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务:
多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力:
从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类AI还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。文心已经开始有了ChatGPT的雏形,但是还是有着难以逾越的鸿沟。
总结
短短四个月,OpenAI推出的这一款AI产品的进步无疑是巨大的。无论是GPT-4的计算能力,图片识别分析的能力以及关于情感上的进步都是远超我们以前对于AI的认知的。当然,GPT-4主要还是对于英文交流的场景拥有着强大的算法和能力,目前对于中文对话大概率还是“胡说八道的程度”。今天百度发布了“文心一言”,这款产品对于中文版的ChatGPT是一种开荒,虽然它还是和GPT-4拥有着很大的差距,希望国内的公司加油吧。
我不敢说GPT-4能否会在未来彻底取代人类,但是它一定会取代很多人类的职业。毕竟使用AI来进行工作有着更高的准确率和更低的成本,公司只需要付出更低的成本就能获得更高质量的工作成果。我们应该警醒AI技术的进步,虽然短时间内(我感觉这个时间会进一步缩短)他可能没办法抢走我们的工作,但是我们也应该考虑好未来的专业和工作的转型做好不被AI淘汰的准备。当未来AI被赋予情感能力的时候,或许我们将看到一场彻底改变世界的场景。
暂无评论内容