当前位置:首页 > > 视觉大模型拥有18亿参数 30亿的标注图像进行训练

预训练大模型是过去几年AI发展主旋律,但是主要集中于自然语言处理领域。视觉领域 在2021年开始迎来进展。谷歌构建了一个扩展的ViT模型,拥有18亿参数,并使用30亿的 标注图像进行训练,在ImageNet上取得了新的记录(90.45%)。这一工作还表明,在视觉领 域上,模型同样符合Scaling Lawo即:模型越大、性能越好。

SwinV2则进一步证明了视觉大模型(30亿参数)在广泛视觉问题上的有效性,其在图像 分类、物体检测、语义分割和视频分类等任务上均达到了 SoTA性能。这一工作也验证了自监 督学习对于驱动大模型训练的有效性,基于SimMIM方法,SwinV2用相比谷歌小40倍的标 注数据(7000万)达成了十亿级视觉模型的训练。


 
 
  机器人推荐
 
栏目导航
 
最新信息
 
 
 
隐私条款
隐私政策
使用条款
咨询热线
 
销售咨询
4006-935-088 / 4006-937-088
客服热线
4008-128-728
 

版权所有 @ 创泽智能机器人集团股份有限公司      鲁ICP备18039973号-2      运营中心 / 北京·清华科技园九号楼5层      生产中心 / 山东省日照市开发区太原路71号

消毒机器人   讲解机器人   迎宾机器人   机器人底盘   商用机器人   智能垃圾站   智能服务机器人   大屏机器人  雾化消毒机器人  紫外线消毒机器人  消毒机器人价格  消毒机器人厂家  服务机器人底盘  核酸采样机器人  雾化消毒机  机器人OEM代工厂  智能配送机器人  喷雾消毒机器人  图书馆机器人  酒店送物机器人  云迹科技润机器