品玩

科技创新者的每日必读

打开APP
关闭
GPT-4

GPT-4创造力竟全面碾压人类!最新创造力测试GPT4排名前1%

最新研究发现,GPT-4的创造力全方位持平或碾压人类。

第三方认证作者

新智元

发布于 2023年6月25日

*转载文章不代表本站观点。

本文来自微信公众号“新智元”(AI_era)作者:新智元



最近,一项有关GPT-4的创造力思维测试火了。

来自蒙大拿大学和UM Western大学的研究团队发现,GPT-4在Torrance创造性思维测试(TTCT)中的得分直接排在了前1%。

不管是流畅性、灵活性,还是原创性,要不和人类势均力敌,要不直接碾压人类。

这项研究在南俄勒冈大学的创意会议上发表(Conference on Creativity)。

包括蒙大拿大学和西澳大学教授在内的一个研究小组发现:

OpenAI的GPT-4在托伦斯创造性思维测试(TTCT)中的得分在前1%,在流畅性、灵活性和原创性等创造性能力方面与人类相匹配或超过了人类。

这些发现在南俄勒冈大学的创意会议上发表。

GPT-4「头脑风暴」

主导这项研究的Guzik博士表示,这项研究对初创企业的建立和小企业的发展会有巨大影响,它将成为推动整体经济活动增长的重要力量。

Guzik进一步阐释,GPT-4所表现出的非凡创造力标志着AI驱动的头脑风暴和解决方案开发的全新阶段。

换句话说,以往初创企业和小企业基本都面临资源限制的典型问题,这限制了他们雇佣大型团队,对市场进行全面研究的能力。

而这一切,将会被AI的创造力扭转。

该研究团队的第一次会面,是在2013年Boise州立大学举办的创新和创造力研讨会上。

当时,Gilde博士和Guzik博士参加了由Byrge举办的主题研讨会。三人发现,他们都对和创造力有关的东西感兴趣。

他们共同认为,AI技术会对商业教育和商业发展有重大辅助作用。随着他们对AI的探索不断加深,更印证了他们的想法。

「尤其是ChatGPT。」

对于他们与GPT-4的最新研究项目,研究人员对评估其与人类创造力相比的创造能力感兴趣。

GPT-4通过ChatGPT使用TTCT的两个变体进行了八次测试,TTCT是研究人员评估创造力的黄金标准。

使用TTCT,研究人员要求GPT-4通过提问、猜测原因、考虑潜在的后果、产生产品改进的想法、设想现有产品的新的替代用途以及想象未来的情景来展示其创造能力。

TTCT的第三方评估机构Scholastic Testing Services将人工智能的反应与人类的反应进行了比较。

在所有八项测试中,GPT-4在流畅性方面的得分都在所有人类反应的前1%,即对每项活动展现出了大量反应的能力。

在灵活性方面,即产生各种想法的能力,以及从一种方法转向另一种方法的能力,有三项测试的得分在前1%,两项在前2%,其余三项在前7%。

而在Guzik博士眼中,评分里最重要的就是原创性了。

在所有八项测试中,GPT-4在原创性方面的得分都在前1%,即:产生不寻常或独特的反应的能力,也就是超出常规的能力。

Guzik博士表示,「这是第一项能够展现AI可以产生与人类创造能力的现有门槛相匹配或超过的原创反应的研究。」

研究小组预测,在未来五年内,创业过程的每一个组成部分,以及一般的商业,都将受到人工智能的影响。

这包括识别独特的机会和重要的问题,产生新颖的解决方案想法,改进产品,产生新的营销策略,以及想象未来的场景和结果等等。

该团队的研究结果,包括进一步研究训练GPT-4以提高其在商业创新和创业等特定领域的创造能力,计划在今年夏天晚些时候发表。

创造力稀释

其实,这并不是第一个研究GPT-4创造力的研究项目。

国外小哥Phil Bennett曾表示,他担心AI的创造力会让人类陷入困境。

创造力是独属于人类的工具,是区分人类和其它生物的关键点。

而AI生成的东西严格来讲并不是「创造」,而是类似一种「反刍」,将喂进去的东西通过不同的方式结合在一起,然后进行输出。

而这也是Bennett所担心的。他担心类似GPT-4、DALL-E等工具会稀释人类的创造力。

换句话说,不会再有真正新的东西被创造出来,产生的东西都是把既有的东西拆分重组。

下载品玩App,比99.9%的人更先知道关于「GPT-4」的新故事

下载品玩App

比99.9%的人更先知道关于「GPT-4」的新故事

iOS版本 Android版本
立即下载
新智元
第三方认证作者

重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测