摘要: 复杂的动力学特性及多变的海洋环境对无人水下航行器(UUV)控制器的设计提出了巨大挑战,在实际应用中,控制器的参数经人工调试后便固化,在控制过程中无法适应环境的变化。针对上述难题,该文借鉴自适应控制思想,提出一种基于强化学习的参数自适应S面控制方法,采用自适应控制方式实现不同环境下控制器参数的优化和自动整定。该方法采用Q学习算法进行训练,通过Q学习的自学习机制寻找输入状态和输出动作间的最优映射。仿真试验表明,所提方法能对控制器的参数进行实时在线调整,具备良好的控制效果和环境自适应能力。
                                                        
                            
                              
                             
                            
                            																								
								
																中图分类号: 
																 
								
								
																                            
                            
                                
                                    
                                
                                
                                    
                                        															张佩, 陆莫凡, 陈成, 徐昊, 苗川. 基于Q学习的参数自适应S面控制方法[J]. 船舶, 2022, 33(06): 55-62.	
																																									     												                                                                                                        	                                                                                                                      ZHANG Pei, LU Mofan, CHEN Cheng, XU Hao, MIAO Chuan. Parameter Adaptive S-Plane Control Algorithm Based on Q-Learning[J]. Ship & Boat, 2022, 33(06): 55-62.