工业数字化需要物理世界的准确计算,目前的视觉模型需要持续场景数据迭代,大模型存在幻觉会给出错误结果,这些都极大影响工业数字化中的AI应用落地。
MaM模型合成引擎连接各类模型如视觉小模型、视觉大模型、语言大模型、多模态大模型、专家机理模型等,通过对模型调度及综合应用管理,实现物理世界100%准确计算。
MaM模型基座是MaM合成引擎的应用架构,通过MaM模型合成引擎,综合调度和管理加载的的视觉大/小模型、语言大模型、多模态大模型、专家机理模型等,形成MaM基座大模型。并经由VLA智能体平台,代理至相关智能体应用,更准确地连接物理世界。
VLA (Visual-Language-Agent) 视觉语言智能体 通过LLM将视觉识别模型代理至不同的智能体应用。具备边缘视觉能力、语言交互能力及智能决策能力,可实现识别一切/决策一切。
VLA智能体可云侧部署或边侧部署,其与端侧视觉边缘计算盒子联动,可以组成端云协同或端边协同的物理世界可靠AI应用。
VLA PaaS 是VLA智能体应用平台,通过API接口调用,使接入的任意端侧设备具备通过自然语言交互实现识别一切,决策一切的能力。