timm库(CV利器)的入门教程
你是否想过用深度学习来解决一些视觉问题,比如图像分类、目标检测、人脸识别等?
你是否觉得深度学习的模型太多太复杂,不知道该如何选择和使用?
你是否曾经为了复现一篇论文的结果而苦苦寻找代码和权重,却发现官方没有提供或者提供的不完整?
如果你有以上的困惑,那么我要向你推荐一个神奇的库:timm。
啥是timm?
timm 是 PyTorch Image Models 的缩写
is a collection of SOTA computer vision models, layers, utilities, optimizers, schedulers, data-loaders, augmentations and also training/validating scripts with ability to reproduce ImageNet training results.
timm 库实现了最新的几乎所有的具有影响力的视觉模型,它不仅提供了模型的权重,还提供了一个很棒的分布式训练和评估的代码框架,方便后人开发。
timm 库是由 Ross Wightman 开发和维护的
项目地址:https://github.com/huggingface/pytorch-image-models
写文原因:
我之所以写这篇文章,主要是出于以下几点:
深度学习在各个领域都取得了令人惊叹的成就,比如自然语言处理、计算机视觉、AIGC等。作为一个对人工智能感兴趣并且想要从事相关工作或研究的人,我认为有必要掌握深度学习相关知识,并且跟进最新进展。
互联网是一个开放、自由、分享、进步 的平台。我非常欣赏并支持开源社区中那种无私奉献、相互帮助、共同成长的氛围。我也希望通过我的文章来分享我所学到或者感兴趣的东西,并且与读者们交流心得。
当我刚开始接触深度学习时,我遇到了很多困难和挫折。比如找不到合适的教程,网上信息良莠不齐,解决一个问题要搞好久。虽然我现在也还是菜鸡hh,但是我想把自己的学习经历和心得分享给那些想要入门CV的小白们,希望能够对你们有所帮助。同时,也欢迎各位大佬或者有兴趣的同学给我提出宝贵的意见和建议,让我们一起进步。
本来是想写完发,但是可能又会拖延,就先发出来一点,欢迎大家监督。可以加我的QQ:7914675,一起交流入门心得
还有一个原因,不过先容我卖个关子,等到这个timm的系列完结再说。
本系列的目录结构和跳转链接
如下:
0.引言
1.简单的使用
2.训练自己的
3.pth下载到哪里了
4.修改模型 获取特征
5.create _model代码解读以及创建自己的模型
5.create_transform以及resolve_data_config代码解读
后续更新计划: 1.简单的使用model 2.训练自己的model 3.pth下载到哪里了 4.修改model 获取中间特征 5.create _model代码解读以及创建自己的模型 6.create_transform以及resolve_data_config代码解读 7.及以后 更多的tricks
帖子代码基于 timm0.54
之后放出codebook
wx
https://github.com/huggingface/pytorch-image-models
https://huggingface.co/docs/hub/timm
https://huggingface.co/docs/timm/index