最大CLIP!LAION发布CLIP的扩增定律
2022-12-29 10:29:43


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

猜你喜欢

最大CLIP!LAION发布CLIP的扩增定律

2022-12-29

22盛京银行CD187今日发布发行公告|即时

2022-12-28

天天简讯:2023你好说说 2023你好说说推荐

2022-12-28

丰收是最好的论文 大学青年教师下田助粮食增产-每日讯息

2022-12-28

康缘药业(600557)12月27日主力资金净卖出6174.15万元-全球快播报

2022-12-28

小期贷逾期6个月多久会上征信系统_全球热闻

2022-12-27

引力传媒(603598):股东减持股份计划_世界热头条

2022-12-27

当前视讯!炒黄金一手多少钱?怎么炒黄金?

2022-12-27

优信巴士逾期15年延迟还款影响征信吗 天天热点

2022-12-27

世界今亮点!8岁女孩吃布洛芬过敏肿成香肠嘴,爸爸:吃的是儿童版,不知道会过敏,专家:严重会危及生命

2022-12-26

存款飙升!不买房,银行慌了_世界视讯

2022-12-26

望变电气:12月23日获融资买入118.20万元

2022-12-26

【世界新视野】高雄市议长选举 民进党康裕成首轮过半胜出

2022-12-25

环球焦点!民法学典学生间非故意伤害怎么处理

2022-12-24

英国致函美贸易代表:抗议美政府危害自由贸易 损害全球多个经济体利益_重点聚焦

2022-12-23

热门推荐