Home | 简体中文 | 繁体中文 | 杂文 | Github | 知乎专栏 | Facebook | Linkedin | Youtube | 打赏(Donations) | About
知乎专栏

第 13 章 Transformer

目录

13.1. Vision Transformer
13.2. Transformer 和 Vision Transformer 最大区别是什么?
13.3. Transformer 和 Transforms 区别
13.4. Swin Transformer
13.4.1. 配置权重
13.5. FAQ
13.5.1. AttributeError: '_MultiProcessingDataLoaderIter' object has no attribute 'next'

13.1. Vision Transformer

Transformer 最初提出是针对NLP领域的,并且在NLP领域大获成功。这篇论文也是受到其启发,尝试将Transformer应用到CV领域,研究发现Transformer应用于计算机视觉CV方面有着不输于卷积神经网络的强劲性能,一定程度上甚至比卷积神经网络更强。于是,初代Vision Transformer诞生了, 简称Vit。