Counterfactual Vision-and-Language Navigation: Unravelling the Unseen研究背景深度学习在计算机视觉和自然语言处理领域取得显著进展,但存在依赖数据集偏差和虚假相关性的问题,限
2025-05-14 CuberSugar
Counterfactual Vision-and-Language Navigation via Adversarial Path Sampler研究背景 视觉语言导航(VLN)任务概述:VLN 任务要求智能体理解自然语言指令,对周围环境
2025-05-13 CuberSugar
Visual Prompting for GFSS A Multi-scale Approach论文笔记 Visual Prompting for GFSS A Multi-scale Approach论文笔记
Visual Prompting for Generalized Few-shot Segmentation: A Multi-scale Approach 广义小样本学习,小样本学习的一种更现实的变体引入,允许从基类或新类中查询图像。 广
2025-02-17
janus-pro部署 janus-pro部署
conda create -n Janus python=3.10 -yconda activate Januspip install -e .pip install gradioexport HF_ENDPOINT="https://hf
2025-02-15
Zero-shot REC论文笔记 Zero-shot REC论文笔记
Zero-shot Referring Expression Comprehension via Structural Similarity Between Images and Captions概要通过图像和标题之间的结构相似性进行零样本
2025-02-11
FM-FSOD论文笔记 FM-FSOD论文笔记
Few-Shot Object Detection with Foundation Models 小样本目标检测(FSOD)的目的是通过一些训练样本(也叫做support image)来检测没见过的新目标。 视觉特征提取和支持查询的相似度
2025-02-01
yolov7 yolov7
yolov7整体结构输入input、骨干网络backbone、颈部neck、头部head 图片经过input部分数据增强等一系列操作进行预处理后,被送入backbone backbone对处理后的图片提取特征 提取到的特征经过 Neck
2025-01-31
ID-like Prompt Learning for Few-Shot Out-of-Distribution Detection论文笔记 ID-like Prompt Learning for Few-Shot Out-of-Distribution Detection论文笔记
ID-like Prompt Learning for Few-Shot Out-of-Distribution Detection介绍分布外(Out-of-Distribution, OOD)检测方法通常利用辅助离群值来训练识别分布外样本
2025-01-25
tmux常用指令 tmux常用指令
tmux ls:显示所有会话 tmux new -s <name>:新建一个会话并命名 tmux rename-session -t 0 <nem-name>:重命名 tmux kill-session -t
2025-01-21
MESED论文笔记 MESED论文笔记
MESEDA Multi-modal Entity Set Expansion Dataset with Fine-grained Semantic Classes and Hard Negative Entities 具有细粒度语义类和硬
2025-01-19
1 / 6