基于以身识人的新一代人工智能视觉认知方案

行业 : 消费电子
地区 : 福建省厦门市湖里区嘉禾路

项目简介

ChatGPT掀起了AIGC浪潮并开启了通用人工智能的大门,快速迭代出图像能力。但是其视频场景理解能力不足,是限制进一步发展的问题。该项目是一个基于跨模态视频转文本模型的商业应用,模型的独特核心能力是在视频结构化过程中可以准确输出同一身份下的人员行为数据。作用:1.输出可以衔接整合其他AIGC模型,可以在穿越信息层级中保持准确并创造价值。能够理解人为意图如自动驾驶。2.制作更大信息维度的视频标注数据,使AIGC模型更具备人类行为特点。使现有模型在交互中具备更强的人类行为逻辑如机器人。原理:1.以身识人算法

项目优势

项目进展

主要成员

负责人介绍

项目人名片

刘源