Just write something here.
janus janus
conda create -n Janus python=3.10 -yconda activate Januspip install -e .pip install gradioexport HF_ENDPOINT="https://hf
2025-02-15
yolov7 yolov7
yolov7整体结构输入input、骨干网络backbone、颈部neck、头部head 图片经过input部分数据增强等一系列操作进行预处理后,被送入backbone backbone对处理后的图片提取特征 提取到的特征经过 Neck
2025-01-31
项目编译成pyc运行流程 项目编译成pyc运行流程
使用comileall编译oadp/dp下的所有文件 例如: import compileall as caca.compile_dir(r'oadp/dp') 需要删掉/移除到原本的py文件,并将dp/__pycache__下的所有文
2024-12-21
BARON BARON
论文BARON首先对上下文相关的区域进行采样,形成一个“袋子”。由于区域建议网络(RPN)被证明可以覆盖潜在的新对象,我们探索了一种邻域抽样策略,对 region proposals 周围的 box 进行抽样,以帮助建模一袋视觉概念的共同出
2024-11-12
OADP OADP
概念知识蒸馏把一个大的模型(教师模型)里面的知识萃取蒸馏出来,并浓缩到一个小的(学生)模型中。是一种用于模型压缩和迁移学习的技术,其主要思想是通过将一个大型模型的知识传递给一个小型模型来提高小型模型的性能。 软标签和硬标签 硬标签
2024-05-02
Transformer模型 Transformer模型
整体架构 图上全部为训练过程,去掉虚线框里的就是推理过程(没有正确答案输入的部分了) Word Embedding词嵌入将输入(输入句子有m个词)转化为向量,假设嵌入维度为n,则一个词对应一个n维向量,整个向量维度为m x n。 Posit
2024-04-27
CLIP CLIP
CLIP:Constrastive Language-Image Pre-training 概念embedding:一种将高维数据(如文本或图像)转换为较低维度的向量表示的技术 结构 推理过程把需要分类的图片送入image encoder得
2024-04-26
Faster RCNN Faster RCNN
概念bbox(Bouding Box边界框):包含物体的最小矩形 NMS(非极大值抑制Non-Maximum Suppression):选出IoU值最高的框,去掉与它的IoU值较高的框(即重复区域较大),然后再选出IoU次大的框,重复上述过
2024-04-21
视觉开发认知和检测 视觉开发认知和检测
概念zero-shot learning(零样本学习):让机器具有推理能力,例如在目标检测中,希望模型可以对从未见过的类别进行分类 开放世界目标检测:在每一个场景中检测每一个类别,应该有能力利用具有异构标签空间的多个来源的图像用于训练和推广
2024-04-20
yolov5训练总结 yolov5训练总结
yolov5前期配置和运行参考资料:Yolov5训练自己的数据集(详细完整版) 注:VOCData文件夹(可以自己命名)下的images和labels文件夹不能叫别的名字! 使用镜像源安装库:pip install -r requireme
2024-03-12
1 / 2