이동 로봇의 군집 제어를 위한 PID 제어기의 적응 신경 회로망 보상기 설계

Design of PID Controller with Adaptive Neural Network Compensator for Formation Control of Mobile Robots

  • cc icon
  • ABSTRACT

    본 논문에서는 이동 로봇의 군집 제어를 위해 실시간 적응 신경 회로망 보상기를 갖는 PID 제어기를 제안한다. 전체 제어 시스템은 선도-추종 로봇 접근법에 의한 기구학 제어기와 이동 로봇의 동역학을 고려한 동적 제어기로 구성되어 있다. 동적 제어기는 PID 제어기에 동특성 변화를 보상하고 성능을 개선시키기 위해 실시간 학습 기능을 가진 신경 회로망 보상기로 구성하였다. 모의실험을 통해 원형 궤적과 직선 궤적에 대해 PID 제어기와 신경 회로망 보상기의 성능을 비교하였다. 이를 통해 실시간 학습 기능을 가진 신경 회로망 보상기가 PID 제어기의 성능을 향상시킴으로써 군집 제어에서 추종 로봇의 추종 성능을 향상시키는 것을 확인하였다.


    In this paper, a PID controller with adaptive neural network compensator is proposed to control the formations of mobile robot. The control system is composed of a kinematic controller based on the leader-following robot and dynamic controller for considering the dynamics of the mobile robot. The dynamic controller is constituted by a PID controller and the adaptive neural network compensator for improving the performance and compensating the change in dynamic characteristics. Simulation results show the performance of the PID controller and the neural network compensator for the circular trajectory and linear trajectory. And it is verified that by improving the performance of a PID controller via the adaptive neural network compensator, the following robot's tracking performance is improved.

  • KEYWORD

    군집 제어 , 선도-추종 로봇 , 신경 회로망 보상기 , PID 제어기

  • Ⅰ. 서 론

    오늘날 로봇 산업의 발달로 산업 현장뿐만 아니라 다양한 분야에서 로봇이 많이 활용되고 있다. 특히 한대의 로봇으로 해결하기 어려운 문제를 여러 개체의 로봇을 사용하여 해결하려 협력 제어에 대한 연구가 활발히 연구되었으며, 이동 로봇의 경우 군집 제어에 대한 연구가 널리 연구되어 왔다[1]. 이동 로봇의 군집 제어는 행동 기반(behavior-based) 방식, 선도 로봇 추종(leader-follower) 방식, 가상 구조(virtual structure) 방식 등 다양한 형태가 연구되었으며, 이중에서 추종로봇이 선도 로봇을 추종하는 방식이 개념이 간단하고 여러대의 로봇으로 확장성이 용이하여 많은 연구가 이루어졌다[2-5].

    일반적인 군집제어와 관련된 연구는 선도 로봇과 추종 로봇의 기구학적 관계만을 고려한 기구학적 제어기 설계가 주를 이루었으나[2-4], 실제 추종 로봇의 질량 및 관성 등의 동적 특성에 의해 추종 로봇의 선속도와 각속도를 완벽히 추종할 수 없다. 따라서 추종 로봇의 동역학적 특성이 고려된 제어기 설계에 관한 연구가 필요하다[6].

    일반적인 선형 PID 제어기는 구조가 단순하고 구현이 용이하여 각종 산업 현장에서 많이 사용되고 있으나, 부하 및 제어 동작 범위가 변화하거나 비선형 제어 시스템일 경우, 적절한 이득과 성능을 얻기가 어렵다. 따라서 추종 로봇의 동역학을 고려한 제어기를 단순한 PID 제어기로 설계 시 제어의 성능을 보장할 수 없다.

    본 논문에서는 군집제어와 관련된 연구로 추종 로봇이 선도 로봇과 일정 거리와 각도를 유지하며 추종하고자 한다. 추종 로봇이 선도 로봇을 정밀하게 추종하기 위하여 선도 로봇과 추종 로봇의 기구학적 관계로부터 기구학적 제어기를 설계하고 추종 로봇의 동역학을 고려한 동역학 제어기를 설계하고자 한다. 추종 로봇의 동역학 제어기는 적응적인 신경 회로망 보상기를 갖는 PID 제어기로 구성하였다[7]. 선형 PID 제어기의 이득은 인공 면역망 알고리즘에 의해 최적의 PID 제어기 이득을 설계하고, 설계된 최적 PID 제어기에 의해서도 발생하는 추종 오차는 비선형 시스템에 적합한 신경 회로망을 사용하여 보상하고자 한다. 모의실험을 통하여 실시간 학습 기능을 가진 신경 회로망 보상기를 갖는 PID 제어기가 일반적인 PID 제어기에 비하여 군집 제어에서 추종 로봇의 추종 성능을 향상시키는 것을 확인하였다.

    Ⅱ. 이동 로봇의 군집 제어

       2.1. 기구학적 제어기 설계

    그림 1은 선도 로봇과 추종 로봇 사이의 기구학적 관계를 표현하였다. 선도 로봇은 선속도 υi와 각속도 ωi가 정해져 있으며, 선도 로봇과 추종 로봇이 다른 위치에서 출발하여 각 로봇의 상대 거리 lij와 추종 각도 Ψij가 일정하게 유지되도록 제어하고자 한다.

    상대거리와 추종 각도에 대한 기구학 방정식은 식 (1)과 같이 표현할 수 있다[3].

    image

    여기서,i는 선도 로봇, j는 추종 로봇, Zij=[lijΨij]T은 두 로봇 사이의 거리와 각도, ui=[υiωi]T는 선도 로봇의 선속도와 각속도, uj=[υjωj]T는 추종 로봇의 선속도와 각속도를 나타내며, βij = θi - θj는 이동 로봇의 각도 오차, γij = βij + Ψij 이다.

    그림 2는 선도 로봇과 추종 로봇의 기구학적 관계만을 고려한 군집 로봇의 제어 블록선도를 나타낸다. 추종 로봇이 선도 로봇과 일정 거리 와 추종 각도 를 유지하며 추종하고자 한다. 추종 로봇의 동역학은 포함되지 않으며, 선도 로봇은 이상적인 기구학에 의해 동작한다고 가정하였다.

    추종 로봇의 속도 제어 입력 값 [υjωj]T을 구하기 위하여 입출력 피드백 선형화(input-output feedback linearization) 기법을 적용하면 식 (2)와 같이 나타낼 수 있다[3].

    image

    여기서, , k1,k2 >0 인 사용자 정의 상수이다.

    image
    image

    따라서 k1, k2가 양의 상수이면 안정함을 알 수 있다.

    식 (2)를 구체적으로 표현하면 추종 로봇의 속도 제어 입력은 식 (4)과 같이 구할 수 있다.

    image

    여기서 이다.

       2.2. 추종 로봇의 동역학 제어기 설계

    군집제어는 선도 로봇과 추종 로봇이 일정 거리 와 일정 각도 를 유지하는 것을 목적으로 하고 있다. 2.1절과 같이 두 로봇 사이의 기구학적 관계만을 고려하여 제어기를 설계할 경우, 정밀한 제어 성능을 보장할 수 없다. 이는 추종 로봇의 동역학으로 인해 식 (4)의 기구학 제어기에 의해 구한 선속도와 각속도 uj = [υj ωj]T를 완벽히 추종할 수 없기 때문이다. 그러므로 추종 로봇의 동역학을 고려한 제어 시스템을 새롭게 구성하여야 한다.

    본 논문에서 고려하는 비 홀로노믹(nonholonomic) 이동 로봇의 동역학 모델로 식 (5)와 같이 구성되어 있다[6].

    image

    여기서 q = [x y θ]T은 관성(inertia) 행렬, 은 원심력과 코리올리스 행렬, 은 마찰력(friction), G(q)는 중력(gravity), τd는 미지의 외란(disturbance), B(q)은 입력 변환 행렬, τ는 입력 토크, A(q)은 구속 조건 행렬, λ는 구속력 벡터를 나타낸다.

    본 논문에서 이동 로봇의 운동은 수평면에 제한되어 있으므로 중력 G(q) = 0, 마찰력과 외란은 무시할 수 있는 작은 값이라고 가정한다. 그림 3은 식 (5)의 추종 로봇 동역학을 고려한 전체 제어 시스템의 블록선도를 나타내었다.

    Ⅲ. 신경회로망 보상기와 학습 알고리즘

       3.1. 신경 회로망 보상기

    PID 제어기는 구조가 단순하고 이득 동조 과정이 비교적 간단하기 때문에 산업 현장에서 널리 사용되고 있으나 부하 및 제어 동작 범위가 변화하거나 비선형 제어 시스템일 경우 적절한 이득과 성능을 얻기가 어렵다.

    그림 4는 추종 로봇의 동역학 제어기로써 적응적인 신경 회로망 보상기를 갖는 PID 제어기의 구조를 나타내었다[7]. 선형 PID 제어기에 의해서도 발생하는 추종 로봇의 오차를 비선형 시스템에 적합한 신경 회로망 보상기가 줄이고자 한다.

    적응적 신경 회로망 보상기는 2개의 은닉층과 1개의 출력층으로 구성되어 있으며 2개의 입력과 2개의 출력으로 구성하였다.

       3.2. 신경 회로망 보상기의 학습 알고리즘

    기준 입력과 플랜트 출력의 에러를 줄이기 위한 적응적 신경 회로망 보상기는 식 (6)의 에러를 최소화하기 위한 오류 역전파(error back propagation) 알고리즘을 적용하여 신경 회로망의 가중치를 학습한다.

    image

    여기서 는 오른쪽 바퀴와 왼쪽 바퀴의 각속도 목표 값이고, qi(t) = [ωr ωl]T는 각속도 측정 값이다. 출력층에서 은닉층 2 사이의 신경 회로망 가중 치의 학습은 식 (7)을 사용하였다[7].

    image

    여기서 ξ1는 학습율이다.

    위 식 (7)에서 시스템의 응답 특성을 반영하기 위해서 E(t)대신에 E(t+1)이 사용되었다.

    image

    여기서, 이다.

    image
    image

    여기서 ckik = i인 경우에 양의 상수, ki인 경우에 0이다.

    샘플링 타임이 작다면 ϵk(t+1) ≈ ϵk(t)이므로 신경 회로망의 가중치에 대한 학습 규칙은 다음 식 (10)과 같다.

    image

    여기서, Hjl(t)는 은닉층 2와 은닉층 1 사이의 가중치, Vlk(t)는 은닉층 1과 입력층 사이의 가중치를 나타낸다.

    Ⅳ. 모의실험

    본 논문에서 제안한 적응 신경 회로망 보상기를 갖는 PID 제어기의 성능 검증을 위하여 선도 로봇이 원형 궤적과 직선 궤적으로 주행할 경우를 모의실험 하였다. 또한 제안된 제어기의 성능 비교 평가를 위해 PID 제어기를 사용하였다. PID 제어기는 이득 값에 따라 제어 성능에 크게 영향을 미치므로, 실험적으로 구한 적절한 이득 값과 인공 면역망 알고리즘(Artificial Immune Algorithm)을 이용하여 구한 최적의 이득 값을 사용한 경우에 대하여 비교 실험을 수행하였다.

    최적의 PID 제어기 이득 값을 찾기 위하여 인공 면역망 알고리즘을 사용하였으며, 평가함수는 식 (11)과 같이 정의하였다.

    image

    여기서, 은 상대 거리 오차, 는 상대 각도 오차이며, α, β는 평가 함수의 가중치로 α = 2/3,β = 1/3를 사용하였다.

    인공 면역망의 학습 조건은 세대수 50, 개체 수 10, 돌연변이 비율 0.1, 복제 비율은 0.5로 설정하여 PID 제어기의 최적 이득 값을 구하였다.

    인공 면역망에 의해 학습된 최적의 PID 이득 값은 Kp=2.886, Ki=0.049, Kd=0.068이다. 비교 평가를 위하여 적절한 PID 제어기의 이득 값은 실험을 통하여 구한 Kp=1.996, Ki=0.03, Kd=0.0426으로 선정하였다.

    비교 실험을 위해 다음의 4가지 경우에 대해 모의실험을 진행하였다.

    case 1: 적절한 이득을 가진 PID 제어기 case 2: 최적의 이득을 가진 PID 제어기 case 3: 적절한 이득을 가진 PID+신경 회로망 보상기 case 4: 최적의 이득을 가진 PID+신경 회로망 보상기

    군집 제어 모의실험을 위하여 선도 로봇과 추종 로봇들의 제원은 바퀴 사이 거리 2R = 1m, 바퀴 반지름 r = 0.05m , 로봇 길이 d = 0.1m이며, 로봇의 무게 m = 40kg , 관성 I = 20kgm2, 제어 샘플링 타임 t = 10msec로 설정하였다. 그리고 선도 로봇과 추 종 로봇간의 목표 상대 거리 = 1.5m , 추종 각도 = 3π/4rad이며, 선도 로봇과 추종 로봇의 초기 위치와 자세 각도는 각각(xi, yi, θi) = (0,0,π/2), (xj, yj, θj) = (3.5, -0.1, -π/2),로 선정하였다.

    추종 로봇의 추종 성능 평가를 위한 선도 로봇의 궤적을 두 가지로 설정하였다.

    원형 궤적 : υr =0.5m/sec와 wr=0.1rad/sec 직선 궤적 : υr =0.5m/sec와 wr=0.1rad/sec

    그림 5는 선도 로봇의 원형 궤적에 대해 4가지 제어 방법을 적용한 추종 로봇의 추종 결과이며, 그림 6은 각각의 거리 오차와 각도 오차를 표시하였다. 모의실험 결과 case 4, case 3, case 2, case 1의 순서로 성능이 좋음을 알 수 있다. 이는 신경 회로망 보상기를 갖는 PID 제어기가 최적의 이득을 갖는 PID 제어기에 비해서도 뛰어나며, 특히 case 3이 case 2보다 뛰어난 성능을 나타냄은 적절한 이득 값을 갖는 PID 제어기에 신경망 보상기를 첨가할 경우에도 성능이 향상됨을 알 수 있다.

    그림 7, 8은 선도 로봇의 직선 궤적에 대한 추종 로봇의 궤적과 추종 오차를 표시하였다. 직선 궤적 추종에 대한 성능 역시 신경 회로망 보상기를 갖는 제어방법인 case4, case3이 가장 뛰어난 성능을 보였다.

    본 논문에서 제안한 신경 회로망 보상기를 갖는 PID 제어기가 PID 제어기에 비해 최적의 PID 이득 값이 아니더라도 신경 회로망 보상기를 통해 최적의 성능을 발휘함을 알 수 있다.

    Ⅴ. 결 론

    본 논문에서 이동 로봇의 군집 제어를 위해 선도 로봇과 추종 로봇의 기구학적 관계로부터 기구학적 제어기를 설계하고 추종 로봇의 동역학을 고려한 동역학 제어기를 설계하였다. 추종 로봇의 동역학 제어기는 적응적인 신경 회로망 보상기를 갖는 PID 제어기로 구성하였다.

    또한 제안된 실시간 학습 기능을 가진 신경 회로망 보상기를 갖는 PID 제어기와 인공면역망 알고리즘을 통해 설계된 최적의 이득을 가진 PID 제어기를 모의실험을 통해 비교하였다. 고정 이득을 가지는 일반적인 선형 PID 제어기에 비해 실시간 학습을 통해 에러에 대해 추가적인 보상 기능을 가진 PID 제어기가 군집 제어에서 추종 로봇의 추종 성능을 향상시키는 것을 확인하였다. 향후 실제 이동로봇의 추종 제어에 적용하여 센서 노이즈, 외란 및 모델 불확실성에 대해 강인한 제어기에 대한 타당성 검증이 필요하다.

  • 1. Cao Y. U., Fukunaga A. S., Kahang A. B. 1997 “Cooperative mobile robotics: antecedents and directions,” [Auton. Robots] Vol.4 P.7-27 google doi
  • 2. Desai J. P., Ostrowski J., Kumar V. 2001 “Modeling and control of formations of nonholonomic mobile robots,” [IEEE Trans. Robotics and Automations] Vol.17 P.905-908 google doi
  • 3. Das A. K. 2002 “A vision-based formation control framework,? [IEEE Trans. on Robotics and Automaton] Vol.18 P.813-825 google doi
  • 4. Shao J., Xie G., Wang L. 2007 “Leader-following formation control of multiple mobile vehicles,” [IET Control Theory and Applications] Vol.1 P.545-552 google doi
  • 5. Chen Y. Q., Wang Z. 2005 “Formation control: a review and a new consideration,” [Proceeding of the IEEE International Conference on Intelligent Robots and systems] P.3181-3186 google
  • 6. E. R. Fierro, F. L. Lewis 1998 “Control of a nonholonomic mobile robot using neural networks,” [IEEE Trans on Neural Networks] Vol.9 google
  • 7. Choi Y. K., Lee M. J., Kim S. S. 2001 “Design and Implementation of an adaptive neural network compensator for control systems,” [IEEE Trans. on Industrial Electronics] Vol.48 google
  • [그림 1.] 선도 추종 방식의 군집 로봇들
    선도 추종 방식의 군집 로봇들
  • [] 
  • [그림 2.] 기구학적 군집 제어 시스템
    기구학적 군집 제어 시스템
  • [] 
  • [] 
  • [] 
  • [] 
  • [] 
  • [그림 3.] 전체 시스템 블록선도
    전체 시스템 블록선도
  • [그림 4.] 신경 회로망 보상기를 포함한 PID 제어기의 구조
    신경 회로망 보상기를 포함한 PID 제어기의 구조
  • [] 
  • [] 
  • [] 
  • [] 
  • [] 
  • [] 
  • [] 
  • [그림 5.] 선도 로봇과 추종 로봇의 원형 궤적
    선도 로봇과 추종 로봇의 원형 궤적
  • [그림 6.] 원형 궤적에 대한 추종 오차 (a) 거리 오차 (b) 각도 오차
    원형 궤적에 대한 추종 오차 (a) 거리 오차 (b) 각도 오차
  • [그림 7.] 선도 로봇과 추종 로봇의 직선 궤적
    선도 로봇과 추종 로봇의 직선 궤적
  • [그림 8.] 직선 궤적에 대한 추종 오차 (a) 거리 오차 (b) 각도 오차
    직선 궤적에 대한 추종 오차 (a) 거리 오차 (b) 각도 오차