客服电话:+8610 6803 2288

人工智能专题(十)-多模态大模型持续升级,进一步推动产品快速落地

AI大模型支持的模态更加多样,从支持文本、图片、图像、语音单一模态下的单一任务,逐渐发展为支持多种模态下的多种任务。融合音视频、图片等的多模态更符合人类和自然界的交互习惯,在各大厂商积极布局下持续升级,有望成为下一代AI模型的差异化亮点。

以OpenAl的技术及产品进程为例,自聊天机器人ChatGPT发布以来,多模态大模型技术覆盖面已由文本拓展至图片、音频。多模态大模型技术的进步,进一步推动产品快速落地。其中,游戏领域,以AI文本互动为内核,新游戏不断发布;视频领域,AI配音结合了语音生成与AI翻译技术,通过短视频平台快速破圈。

截至目前,国内已有超过20个大模型获批。其中,第二批获批大模型中出现了两个教育垂类大模型网易有道(“子曰”大模型)与好未来(MathGPT大模型)。同时,获批的知乎知海图AI模型也被运用到了知乎教育业务中。此外,科大讯飞、百度、作业帮、读书郎等也纷纷推出了相关的教育领域垂类大模型,随着各个企业纷纷布局大模型领域,大模型技术将为教育行业带来前所未有的变革。

整体来看,大模型技术的发展和应用已经成为人工智能领域的重要分支。随着备案政策的逐步推进,同时上海等省市出台相关政策支持大模型技术的发展,为大模型产业的发展提供了更广阔的空间,使得更多的创新应用得以实现,推动整个行业的快速发展。在政府的大力支持下,大模型产业发展将进一步加速。各类大模型产品将不断涌现,为用户提供更加丰富多样的服务。同时,随着技术的不断进步,大模型的性能也将得到进一步提升,为人工智能领域的创新提供更多的可能性。