Ubuntu安装不同版本的GCC/G++并切换 有时会遇到需要在同一台机器上使用不同版本的GCC/G++编译器的情况,比如在编译不同版本的项目时,或者在使用某些特定的库时。 假设系统中已经安装了gcc13和g++13,以安装gcc11、g++11为例: 1sudo apt install gcc-11 g++-11 顺利的话,系统中就会存在两个版本的gcc和g++。在终端中输入: 12ls /usr/bin/gcc*ls /usr/bin/ 2025-04-29 #Linux
OpenVLA(An Open-Source Vision-Language-Action Model) 论文地址:OpenVLA: An Open-Source Vision-Language-Action Model 一、背景 1.机器人操作策略的弱点: 无法在训练数据之外泛化,即使有些方法能够将操作行为推广到不同的初始条件(比如对象位姿),但仍然缺少鲁棒性,难以应对数据集中不存在的情况 相比LVLM,机器人操作任务数据集的数据量较少,即使最大的机器人操作数据集也只有100k-1M个演示(O 2025-04-27 #机器人学习 #机器人操作 #VLA
广义优势估计(Generalized Advantage Estimation,GAE) Warning:这是一篇GPT-based笔记 在强化学习中,广义优势估计(Generalized Advantage Estimation,GAE)是一种对优势函数进行平滑估计的方法,通过对不同步长的时序差分残差(TD residual)按指数加权累积,以在偏差-方差权衡上取得最佳效果。GAE引入了参数控制权重,当时退化为单步TD(0),可获得低方差、高偏差的估计;当时退化为蒙特卡洛回报, 2025-04-23 #强化学习
6D连续旋转表示(On the Continuity of Rotation Representations in Neural Networks) 出自论文:On the Continuity of Rotation Representations in Neural Networks 毕业设计用到机械臂,复现的论文提到采用6D旋转表示更适合神经网络学习。此前一直没弄清楚所谓的6D旋转表示是什么,为什么不直接用旋转矩阵或者四元数。今天查了些资料(其实是问了AI)简单总结一下,但其背后还涉及到更深层次的数学知识(例如群论)还远超出我的知 2025-04-21 #深度学习 #机器人学
记录一个在运行isaac gym时遇到的bug和修bug过程:cudaExternamMemoryGetMappedBuffer failed on… Bug的出现 今天在跑项目时,发现会报错: 1234Traceback (most recent call last): ... color_obs = torch.stack(color_obs)[..., :-1] #RGBA->RGBTypeError: expected Tensor as elment 0 in argument 0, but got NoneType 大概情况 2025-04-07 #Python #IsaacGym
通过SSH克隆Github仓库时报错The authenticity of host 'github.com' can't be established. 今天在服务器上git clone时出现错误: 12git@github.com: Permission denied (publickey).fatal: Could not read from remote repository. 一看不知道为什么之前配置的SSH Key被删掉了,正好借此机会记录一下这个问题的解决。 出现这个问题说明Git无法同通过SSH访问Github,很大的可能是因为S 2025-03-19 #Linux
强化学习中回报(Return)、价值(Value)、动作价值(Action-Value)和优势(Advantage)的联系 在做项目的过程中总是对这些概念有些模糊,如果不搞明白很容易在读论文和看代码的时候绕晕,因此写一篇笔记理清一下关系。 1.回报 Return 回报表示从时间步开始,经过未来所有时间步(或是有限步数)的折扣累积奖励。形式上可以写为: 其中: 是在时间步的即时奖励 是折扣因子,用于衡量未来奖励的重要性 是终止时间步(在无限时间步的情形下,使用极限) 回报代表了从时间步开始智能体可以获得的总收益 2025-03-14 #深度学习 #强化学习
Introduction to Robotics-Stanford 笔记 LEC4 LEC4 Manipulator Kinematics 机械臂运动学 正运动学是一种随动坐标系与基坐标系之间的关系 Link Description 连杆描述 1 对于一个连杆,其两端有两个关节轴,如何描述这两个轴的关系?为了去确定机械臂两个相邻关节轴的位置关系,可把连杆看作一个刚体。用空间中的直线来表示关节轴。显然,在描述连杆的运动时,一个连杆运动可用两个参数描述,这两个参数定义了空 2024-12-23 #Robotics
多智能体强化学习(MARL)值函数分解——从VDN到QMIX 一、MARL中的难点 1、部分可观察 当和环境进行交互时,无法看到和环境的全局状态,只能观察到自己视野范围内的局部信息。 比如StarCraft II: Partial observability is achieved by the introduction of unit sight range, which restricts the agents from receiving inf 2024-12-07 #强化学习 #多智能体
DDPM(Denoising Diffusion Probabilistic Models)论文阅读笔记 DDPM(Denoising Diffusion Probabilistic Models)论文阅读笔记 论文:Denoising Diffusion Probabilistic Models 前言 最近在研究Diffusion Policy,跟DDPM关系非常密切,于是读了下DDPM的文章,写篇笔记,顺便挖个坑,记录一些生成模型的研究。DDPM(以下简称扩散模型)不仅在图像生成方面有着非 2024-12-04 #深度学习 #Diffusion Model