YuMioの世界へ
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

RynnVLA-001 Using Human Demonstrations to Improve Robot Manipulation

RynnVLA-001: Using Human Demonstrations to Improve Robot Manipulation image.png I. 核心思想与贡献 RynnVLA-001 的核心贡献在于提出了一套系统性的知识迁移方法论,旨在解决机器人领域长期存在的数据稀缺问题。它不直接创造一个全新的模型架构,而是通过一个精心设计的渐进式预训练流程,将海量、易于获取的人类
2025-09-24
#VLA #Robotics #World Models

Dreamer V3 Mastering Diverse Domains through World Models

Dreamer V3: Mastering Diverse Domains through World Models 深度学习笔记:解构DreamerV3——通用强化学习的基石 论文核心贡献: 本文提出了DreamerV3,一个基于世界模型的通用强化学习算法。其核心突破在于,使用单一固定超参数配置,在超过150个任务上展现了卓越的性能,超越了众多为特定领域精调的专家算法。其里程碑式的成就是,
2025-09-24
#VLA #模仿学习 #Robotic Manipulation

Flow matching训练时训练损失不降低的问题

Flow matching训练时训练损失不降低 今天尝试复现flow matching训练一个机器人操作任务,但是发现训练损失完全没有下降的趋势,排查之后发现问题在于网络初始化的时机不对。 在我的流匹配模型中(MLP based),一开始的网络初始化逻辑是这样的: 1234567891011121314151617181920# In FlowMatchingMLPdef __init__(.
2025-09-11
#algorithm #flow matching #diffusion #torch

Ubuntu远程服务器无法正常git pull

Ubuntu远程服务器无法正常git pull 问题 今天在服务器上运行git pull发现无法拉取,输出以下信息: 12345678910111213141516Missing or invalid credentials.Error: connect ECONNREFUSED /run/user/1028/vscode-git-363d95683a.sock at PipeConne
2025-09-11
#Ubuntu #git

Ubuntu根目录空间占用过高,通过清理系统日志文件进行清理

Ubuntu根目录空间占用过高,通过清理系统日志文件进行清理 问题发现 今天突然发现 / 目录占用达到了100%,需要清理一下磁盘,进入/ 目录一看,发现/var/log 占用了55G磁盘,再进log 中查看,发现syslog 就占用了50G。 处理方法 1.临时清空日志 1sudo truncate -s 0 /var/log/syslog 由于syslog是系统日志文件,不能直接删除。上述
2025-09-05
#Ubuntu #Linux

Open3D无头渲染失败:eglInitialize failed

Open3D无头渲染失败:eglInitialize failed 最近在尝试做点云,将点云特征作为机器人策略的输入。先是用RGBD图像构建点云数据,然后用Open3D渲染,由于我在服务器上渲染,没有显示设备,VcXsrv也莫名其妙不通,只好采用无头模式(headless)进行离线渲染,相关代码如下: 1234567891011121314151617181920212223242526272
2025-08-18
#Ubuntu #Open3D #EGL

Learning to Act Anywhere with Task-centric Latent Actions

论文地址:Learning to Act Anywhere with Task-centric Latent Actions 这篇论文的核心目标是解决当前机器人学习领域的一个重大挑战:如何创建一个通用(Generalist)的机器人策略,使其能够利用互联网上海量的、多样化的、无动作标签的视频(例如人类活动视频),并在不同的机器人(Embodiment)和不同的任务上高效工作。 一、核心问
2025-08-14
#VLA #模仿学习 #Robotic Manipulation

在humanoid-gym训练以及演示过程中记录的视频无法在Vscode中播放

用Humanoid-gym这套框架训练之后,运行其提供的play.py记录下的视频无法在Vscode中播放。由于我在远程服务器上训练,要想查看演示效果就得下载到本地再播放,十分不方便。 humanoid-gym原有的记录视频的代码如下: 123456789101112131415161718192021222324252627282930313233#------------相机初始化----
2025-08-14
#强化学习

Ubuntu安装不同版本的GCC/G++并切换

有时会遇到需要在同一台机器上使用不同版本的GCC/G++编译器的情况,比如在编译不同版本的项目时,或者在使用某些特定的库时。 假设系统中已经安装了gcc13和g++13,以安装gcc11、g++11为例: 1sudo apt install gcc-11 g++-11 顺利的话,系统中就会存在两个版本的gcc和g++。在终端中输入: 12ls /usr/bin/gcc*ls /usr/bin/
2025-04-29
#Linux

OpenVLA(An Open-Source Vision-Language-Action Model)

论文地址:OpenVLA: An Open-Source Vision-Language-Action Model 一、背景 1.机器人操作策略的弱点: 无法在训练数据之外泛化,即使有些方法能够将操作行为推广到不同的初始条件(比如对象位姿),但仍然缺少鲁棒性,难以应对数据集中不存在的情况 相比LVLM,机器人操作任务数据集的数据量较少,即使最大的机器人操作数据集也只有100k-1M个演示
2025-04-27
#VLA #机器人学习 #机器人操作
123

搜索

Hexo Fluid