Category: deepLearning | CuberSugar's Blog

Post Categories
deepLearning 17 OS 6 OO 5 compiler 3 db 7 paper-reading 11
                            
                            janus
                        
                                conda create -n Janus python=3.10 -yconda activate Januspip install -e .pip install gradioexport HF_ENDPOINT="https://hf
                            
                                2025-02-15
                            
                                    deepLearning
                                
                            yolov7
                        
                                yolov7整体结构输入input、骨干网络backbone、颈部neck、头部head

图片经过input部分数据增强等一系列操作进行预处理后，被送入backbone
backbone对处理后的图片提取特征
提取到的特征经过 Neck
                            
                                2025-01-31
                            
                                    deepLearning
                                
                            项目编译成pyc运行流程
                        
使用comileall编译oadp/dp下的所有文件
例如：
import compileall as caca.compile_dir(r'oadp/dp')

需要删掉/移除到原本的py文件，并将dp/__pycache__下的所有文
                            
                                2024-12-21
                            
                                    deepLearning
                                
                            BARON
                        
                                论文BARON首先对上下文相关的区域进行采样，形成一个“袋子”。由于区域建议网络(RPN)被证明可以覆盖潜在的新对象，我们探索了一种邻域抽样策略，对 region proposals 周围的 box 进行抽样，以帮助建模一袋视觉概念的共同出
                            
                                2024-11-12
                            
                                    deepLearning
                                
                            OADP
                        
                                概念知识蒸馏把一个大的模型（教师模型）里面的知识萃取蒸馏出来，并浓缩到一个小的（学生）模型中。是一种用于模型压缩和迁移学习的技术，其主要思想是通过将一个大型模型的知识传递给一个小型模型来提高小型模型的性能。
软标签和硬标签

硬标签

                                2024-05-02
                            
                                    deepLearning
                                
                            Transformer模型
                        
                                整体架构
图上全部为训练过程，去掉虚线框里的就是推理过程（没有正确答案输入的部分了）
Word Embedding词嵌入将输入(输入句子有m个词)转化为向量，假设嵌入维度为n，则一个词对应一个n维向量，整个向量维度为m x n。
Posit
                            
                                2024-04-27
                            
                                    deepLearning
                                
                            CLIP
                        
                                CLIP:Constrastive Language-Image Pre-training
概念embedding：一种将高维数据(如文本或图像)转换为较低维度的向量表示的技术
结构
推理过程把需要分类的图片送入image encoder得
                            
                                2024-04-26
                            
                                    deepLearning
                                
                            Faster RCNN
                        
                                概念bbox(Bouding Box边界框)：包含物体的最小矩形
NMS(非极大值抑制Non-Maximum Suppression)：选出IoU值最高的框，去掉与它的IoU值较高的框（即重复区域较大），然后再选出IoU次大的框，重复上述过
                            
                                2024-04-21
                            
                                    deepLearning
                                
                            视觉开发认知和检测
                        
                                概念zero-shot learning(零样本学习)：让机器具有推理能力，例如在目标检测中，希望模型可以对从未见过的类别进行分类
开放世界目标检测：在每一个场景中检测每一个类别，应该有能力利用具有异构标签空间的多个来源的图像用于训练和推广
                            
                                2024-04-20
                            
                                    deepLearning
                                
                            yolov5训练总结
                        
                                yolov5前期配置和运行参考资料：Yolov5训练自己的数据集（详细完整版）
注：VOCData文件夹（可以自己命名）下的images和labels文件夹不能叫别的名字！
使用镜像源安装库：pip install -r requireme
                            
                                2024-03-12
                            
                                    deepLearning