基于事后筛选经验回放的机器人深度强化学习跟踪控制-计算机应用研究2025年03期

基于事后筛选经验回放的机器人深度强化学习跟踪控制

作者：易佳豪王福杰胡锦涛李醒罗俊轩字体：小中大

打印

摘要：

针对机械臂轨迹跟踪问题，提出了一种结合事后筛选经验回放（selective hindsight experience replay，SHER）的深度强化学习（deep reinforcement learning，DRL）控制方法。此算法将SHER与深度确定性策略（d（试读）...

计算机应用研究

2025年第03期

期刊目录

异构联邦学习在无人系统中的研究综述
基于生成对抗网络的人脸属性合成技术综述
基于深度学习的前沿视频异常检测方法综述
TSD-PBFT:基于信誉和标准差聚类的PBFT共识优化算法
S-Raft：一种增强拜占庭和崩溃容错的Raft算法
基于区块链的动态多用户可搜索加密方案
基于多粒度增强和答案验证的法律文书阅读理解模型
基于问题导向式提示调优小样本文本分类
一种面向知识图谱多跳问答的分层语义解析方法
结合对比学习和双流网络融合知识图谱摘要模型
多关系和时间增强的知识追踪模型
基于能量聚焦和改进变分模态分解的人体生命体征检测算法
背景图增强的社交网络重要节点自适应排序算法
基于自适应噪声和动态加权的联邦学习算法
基于序列图时空增强与地理关系的兴趣点推荐
基于判别增强大语言模型微调的医学影像报告生成
大规模符号网络划分的学习驱动型扩展变邻域搜索算法
基于Boosting优先经验重放的协同计算卸载方法
求解分布式约束优化问题的邻居忽略策略局部搜索算法
一种带有三重选择机制的多种群多策略差分进化算法
融合人工势场的改进RRT*机械臂料框分拣路径规划
融合Wi-Fi与激光的机器人室内大型环境SLAM
多目标双元闭环供应链回收连锁店选址模型及优化算法
考虑非邻近节点空间相关性的交通流预测模型
基于事后筛选经验回放的机器人深度强化学习跟踪控制
基于脉搏波信号相空间重构与时间序列预测的身份认证系统构建
基于小样本和随机化的跨域人体动作泛化识别模型
基于高效调优方法的统一高效微调架构及应用
以目的地为导向的基于成本优化的电动汽车充电导航策略
基于交通路网权重学习的城市机动车多样化轨迹生成
基于信任度累积的联邦协作频谱感知
高速飞行器自组网快速高效加权分簇算法
水声网络基于优先级与可Zigzag解码的在线喷泉码
基于改进3D ResNet18的多模态微表情识别
基于蝗虫视觉神经的人群汇流行为检测神经网络
一种改进的快速深度图像先验降噪模型
融合双向感知Transformer与频率分析策略的图像修复
联合时空差异注意力与层级细节增强的遥感影像变化检测
DepthMamba:多尺度VisionMamba架构的单目深度估计
基于韦伯定律的彼得森图局部人脸特征模式
复合因素影响下嫌疑人发型变化的深度模拟

南京图书馆电子阅览室

基于事后筛选经验回放的机器人深度强化学习跟踪控制

计算机应用研究

2025年第03期

期刊目录

南京图书馆电子阅览室

新用户注册

注册成功

修改电子邮件