CLIP:Constrastive Language-Image Pre-training
概念embedding:一种将高维数据(如文本或图像)转换为较低维度的向量表示的技术
结构
推理过程把需要分类的图片送入image encoder得
2024-04-26