客服电话:+8610 6803 2288

人工智能专题(七)-GPT-4带动多模态及多景落地,推动AIGC加速发展

2023年3月,OpenAI正式发布大型多模态模型GPT-4(输入图像和文本,输出文本输出),此前模型主要支持文本,现模型能支持识别和理解图像。多模态大模型GPT-4是OpenAI的里程碑之作,是目前最强的文本生成模型。GPT-4再次拓宽了大模型的能力边界,相比上一代,GPT-4可以更准确地解决难题,具有更广泛的常识和解决问题的能力:更具创造性和协作性;能够处理超过25,000个单词的文本,允许长文内容创建、扩展对话以及文档搜索和分析等用例。

ChatGPT是文字语言模态AIGC的具体应用,在技术、应用领域和商业化方面和传统AI产品均有所不同。ChatGPT已经具备了一定的对现实世界内容进行语义理解和属性操控的能力,并可以对其回以相应的反馈。ChatGPT是AIGC重要的产品化应用,意味着AIGC规模化、商业化的开始,同时GPT-4带动多模态及多场景落地,推动AIGC加速发展。

从技术层面上看,目前AIGC的相关算法已经具备了真实复刻和创造某类既定内容的能力,同时相关模型对简单场景的内容生成也取得了较好成果,但面对多样性变化和复杂场景内容生成的挑战,现有AIGC的算法能力仍需进一步提升,预计未来AIGC核心技术将持续演进。同时随着AIGC核心技术的不断发展,其内容孪生、内容编辑、内容创作三大基础能力将显著增强。此外,随着AIGC的不断成熟,以标准规范、技术研发、内容创作、行业应用、资产服务为核心的生态体系架构将日趋完善,无论是以AIGC赋能产业升级还是以AIGC自主释放价值都将在此框架下健康有序发展。