北京智源推出通用视觉AI模型SegGPT：可自动追踪并分割影音中的物体-中国金融网

中国金融网

加入收藏设为首页

您现在的位置：首页 > 商业 > 正文

北京智源推出通用视觉AI模型SegGPT：可自动追踪并分割影音中的物体

2023-05-31 11:45 来源：IT之家编辑：苏婉蓉阅读量：7017

，在2023年中关村论坛人工智能大模型发展论坛中，北京智源人工智能研究院推出了旗下通用分割模型 SegGPT。

图源 Arxiv

据称，SegGPT模型是智源通用视觉模型Painter的衍生模型，具备上下文推理能力，在训练完成后只需要提供示例即可推理并完成对应分割任务，包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等，都可以利用视觉提示词完成分割任务。

图源 Arxiv

SegGPT也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割，并且可以用掩码的颜色作为物体的 ID，进行自动追踪。

IT之家经过查询知悉，此前 Meta 也发布了其基于AI的SegmentAnythingModel模型，具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出SEEM 模型，通过不同的视觉提示和语言提示，一键分割图像、视频。IT之家的小伙伴们可以从这里访问模型的论文链接。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

上一篇： "保护地球关注生态环境”2023环球生态小姐浙江赛区正式开启！

下一篇：最后一页

栏目排行

栏目推荐

二手房“带押过户”启动满月成功尝鲜者寥寥无几

二手房“带押过户”启动满月成功尝鲜者寥寥无几

2022年营收78.61亿，汤臣倍健迎来VDS行业新

2022年营收78.61亿，汤臣倍健迎来VDS行业新周期

大兴国际氢能示范区兼顾产业发展和配套服务打造员工理想

大兴国际氢能示范区兼顾产业发展和配套服务打造员工理想生活蓝本

迪丽热巴穿军绿色也好美！和吴磊同框丝毫没有年龄

迪丽热巴穿军绿色也好美！和吴磊同框丝毫没有年龄

绿色塞罕坝不朽的奇迹

绿色塞罕坝不朽的奇迹