timm库（CV利器）的入门教程

你是否想过用深度学习来解决一些视觉问题，比如图像分类、目标检测、人脸识别等？

你是否觉得深度学习的模型太多太复杂，不知道该如何选择和使用？

你是否曾经为了复现一篇论文的结果而苦苦寻找代码和权重，却发现官方没有提供或者提供的不完整？

如果你有以上的困惑，那么我要向你推荐一个神奇的库：timm。

啥是timm？

timm 是 PyTorch Image Models 的缩写

is a collection of SOTA computer vision models, layers, utilities, optimizers, schedulers, data-loaders, augmentations and also training/validating scripts with ability to reproduce ImageNet training results.

timm 库实现了最新的几乎所有的具有影响力的视觉模型，它不仅提供了模型的权重，还提供了一个很棒的分布式训练和评估的代码框架，方便后人开发。

timm 库是由 Ross Wightman 开发和维护的

项目地址：https://github.com/huggingface/pytorch-image-models

写文原因：

我之所以写这篇文章，主要是出于以下几点：

深度学习在各个领域都取得了令人惊叹的成就，比如自然语言处理、计算机视觉、AIGC等。作为一个对人工智能感兴趣并且想要从事相关工作或研究的人，我认为有必要掌握深度学习相关知识，并且跟进最新进展。
互联网是一个开放、自由、分享、进步的平台。我非常欣赏并支持开源社区中那种无私奉献、相互帮助、共同成长的氛围。我也希望通过我的文章来分享我所学到或者感兴趣的东西，并且与读者们交流心得。
当我刚开始接触深度学习时，我遇到了很多困难和挫折。比如找不到合适的教程，网上信息良莠不齐，解决一个问题要搞好久。虽然我现在也还是菜鸡hh，但是我想把自己的学习经历和心得分享给那些想要入门CV的小白们，希望能够对你们有所帮助。同时，也欢迎各位大佬或者有兴趣的同学给我提出宝贵的意见和建议，让我们一起进步。
本来是想写完发，但是可能又会拖延，就先发出来一点，欢迎大家监督。可以加我的QQ：7914675，一起交流入门心得
还有一个原因，不过先容我卖个关子，等到这个timm的系列完结再说。

本系列的目录结构和跳转链接

如下：

0.引言

1.简单的使用

2.训练自己的

3.pth下载到哪里了

4.修改模型获取特征

5.create _model代码解读以及创建自己的模型

5.create_transform以及resolve_data_config代码解读

后续更新计划： 1.简单的使用model 2.训练自己的model 3.pth下载到哪里了 4.修改model 获取中间特征 5.create _model代码解读以及创建自己的模型 6.create_transform以及resolve_data_config代码解读 7.及以后更多的tricks

帖子代码基于 timm0.54

之后放出codebook