TOF 센서용 3차원 깊이 영상 추출을 위한 차동 CORDIC 기반 고속 위상 연산기

doi:10.6109/jkiice.2014.18.3.643

OA학술지
Journal of the Korea Institute of Information and Communication Engineering

TOF 센서용 3차원 깊이 영상 추출을 위한 차동 CORDIC 기반 고속 위상 연산기 Differential CORDIC-based High-speed Phase Calculator for 3D Depth Image Extraction from TOF Sensor

DOI : 10.6109/jkiice.2014.18.3.643
Publish: Journal of the Korea Institute of Information and Communication Engineering Volume 18, Issue3, p643~650, 31 March 2014

ABSTRACT

TOF 센서용 3차원 깊이 영상 추출을 위한 차동 CORDIC 기반 고속 위상 연산기

A hardware implementation of phase calculator for extracting 3D depth image from TOF(Time-Of-Flight) sensor is described. The designed phase calculator adopts redundant binary number systems and a pipelined architecture to improve throughput and speed. It performs arctangent operation using vectoring mode of DCORDIC(Differential COordinate Rotation DIgital Computer) algorithm. Fixed-point MATLAB simulations are carried out to determine the optimal bit-widths and number of iteration. The phase calculator has ben verified by FPGA-in-the-loop verification using MATLAB/Simulink. A test chip has been fabricated using a TSMC 0.18-㎛ CMOS process, and test results show that the chip functions correctly. It has 82,000 gates and the estimated throughput is 400 MS/s at 400Mhz@1.8V.

KEYWORD

깊이 영상 , 위상 연산기 , Time-Of-Flight , CORDIC , DCORDIC

본문

Collapse all

Ⅰ. 서 론

3차원 영상을 얻기 위해 가장 기본적으로 사용되는 방법은 양안식 카메라를 사용하는 스테레오 비전 시스템이다. 이 방법은 레이저, 초음파와 같이 거리 측정을 위한 다른 장비 없이 고해상도의 거리 영상을 얻을 수 있는 장점을 갖는다. 그러나 스테레오 영상을 이용하여 깊이를 정확히 측정하기 위해서는 알고리듬이 복잡하고 시간이 오래 걸리는 단점이 있다. 또한 물체에 의해 가려져 한쪽에서만 보이거나 무늬가 없어 깊이를 찾기가 어려운 영역에서는 장면의 깊이를 추정하기 어렵다[1, 2].

지난 몇 년간 학계에서는 TOF(Time-Of-Flight) 센서를 이용한 거리 영상 획득 방법에 대해 관심이 점점 더 커져, 그에 따라 실시간 거리 영상 시스템에 대한 연구가 활발히 진행되고 있다[3-5]. TOF의 기본 원리는 센서에서 방출된 빛이 대상 물체에 반사되어 돌아오는 시간을 계산하여 각 화소별로 장면의 대응점까지의 깊이를 측정하는 것이다. 3차원 영상처리용 TOF 카메라는 장면의 깊이 정보를 직접 측정하여 기존 스테레오 정합방법의 취약점을 보완할 수 있다. 아직 TOF 비전 분야는 SV 시스템에 비하여 해상도가 낮고, 센서에 주로 사용되는 적외선 신호의 특성으로 인한 제약이 있지만, 로봇, 자동차, 의료, 제스처 인식 등 다양한 분야의 어플리케이션에 대해 TOF 카메라가 생산, 사용되고 있다. 특히 자동차 산업에서 안전에 대한 관심의 증가로 TOF시장은 더욱 커질 것으로 예상되며, TOF 시장이 발전하기 위해서는 센서에서 얻어지는 많은 정보를 실시간으로 처리할 수 있는 효율적인 하드웨어 연구가 동반되어야 할 것이다.

본 논문에서는 3D TOF 센서용 깊이 정보를 고속으로 계산하기 위한 하드웨어를 DCORDIC(Differential COordinate Rotation DIgital Computer) 알고리듬[6] 기반의 위상연산 회로로 구현하였다. 설계된 위상 연산기의 HDL 모델을 MATLAB/Simulink와 FPGA가 연동된 FPGA-in-the-loop 검증 환경을 통해 하드웨어 검증을 하였으며, TSMC 0.18-㎛ CMOS 공정으로 테스트 칩을 제작하고 성능을 평가 하였다.

본 논문은 다음과 같이 구성된다. Ⅱ장에서는 TOF 거리 연산의 기본원리를 간략히 설명하고, Ⅲ장에서 는 DCORDIC 알고리듬에 대해 소개한다. Ⅳ장에서는 DCORDIC 기반 위상 연산기의 하드웨어 구조와 회로 설계에 대해 설명하고, 설계된 위상 연산기의 설계 검증 및 성능 평가, 그리고 테스트 칩 평가에 대해 Ⅴ장에서 기술하며, Ⅵ장에서 결론을 맺는다.

Ⅱ. TOF 거리 연산의 기본원리

TOF 센서를 이용한 깊이 정보 추출의 기본원리는 다음과 같다. TOF 센서 시스템의 송신부에서 특정 주파수(f)의 신호로 변조된 빛을 보내고, 수신부에서는 물체에 반사되어 되돌아오는 빛을 감지한다. 빛이 물체까지 왕복하는 시간에 의한 위상 변화를 감지하여 식 (1)과 같이 센서와 물체 사이의 거리를 계산할 수 있다[3].

여기서 c는 빛의 속도, f는 변조된 신호의 주파수, n은 위상 주기가 반복되면서 생기는 상수, θ는 수신된 빛의 위상을 뜻한다. d의 최대 거리가 명백하게 정해져 있는 경우 종종 n은 0으로 가정하고 간단한 계산으로 식 (2)로 나타낼 수 있고, 이 때 변조 주파수와 최대 측정거리 d_u와의 관계는 식 (3)과 같다.

식 (2)에 따르면 장면의 깊이 정보를 얻기 위해서는 반드시 반사된 빛의 위상 변화를 알아야 한다. Jongenelen의 연구[3]를 참고하면, TOF 센서에서는 픽셀 강도 데이터가 들어오는데 이를 이용하여 위상 변화에 대한 싸인과 코사인 데이터를 얻을 수 있다. 이 두 가 지 데이터를 아크탄젠트(arctangent) 연산을 통해 위상을 계산할 수 있고, 그 후에는 간단한 연산을 통해 원하는 깊이 정보를 얻을 수 있다.

TOF 센서를 이용하여 깊이 정보를 얻기 위한 가장 중요한 연산은 아크탄젠트 연산이다. 아크탄젠트 연산을 하드웨어로 구현하기 위한 방법은 다양하게 연구되고 있는데, 대표적인 방법으로는 LUT(Look-Up Table) 을 이용한 방법과 그 응용들, 다항식 근사 방법, 그리고 CORDIC 방법 등이 있다[6-12]. 본 논문에서는 다양한 아크탄젠트 연산 방법 중에서 연산이 단순하고, 적은 하드웨어로 구현이 가능한 CORDIC 알고리듬을 변형하여 연산속도를 더 높인 DCORDIC 알고리듬 기반의 위상 연산기를 설계하였다.

Ⅲ. Differential CORDIC 알고리듬

CORDIC 알고리듬[9]의 기본 개념은 복소평면 상에 서 주어진 벡터에 대해 각(angle)을 적당히 회전시켜 삼각함수의 값을 얻는 것이다. 이 알고리듬은 디지털 시스템에서 초월함수를 빠르게 계산하기 위해 고안되었으며, 덧셈, 뺄셈, 시프트 그리고 작은 크기의 LUT 등 단순한 회로로 구현할 수 있다는 장점을 가져, 하드웨어 구현에 널리 사용된다.

CORDIC 알고리듬은 회전 모드와 벡터링 모드로 불리는 두 가지 모드로 동작하는데, 본 논문에서는 TOF 거리 연산을 위해 필요한 벡터링 모드에 대해서만 알고리듬을 적용하여 설계한다.

벡터링 모드를 이용한 기본 CORDIC 아크탄젠트 연산은 식 (4)와 같이 표현되며, 식 (4)는 i번째 회전 과정후의 값을 나타낸다.

복소평면 상에서 초기 입력 벡터는 실수부분 x₀와 허수부분 y₀로 주어지며, 반복적인 회전연산을 통해 허수부분을 0으로 만드는 과정이 진행되고, 그 결과 입력벡터의 위상 값에 해당하는 z 값이 얻어진다.

이와 같은 연산과정의 예를 그림 1에 나타내었다. 초기의 입력 벡터 (x₀, y₀)가 주어지면, 이에 해당하는 위 상 z를 찾아가는 반복 연산과정을 수행한다. 이는 허수 부분을 0으로 만드는 과정으로 초기의 위상 z₀는 0에서 부터 시작된다.

[그림 1.] CORDIC 벡터링 모드의 예

첫 번째 연산에서는 y₀가 양수이므로, 결정 변수 d₁는 -1이 된다. 따라서 z₁은 tan⁻¹(2⁻⁰)에 해당하는 값을 z₀에 더해주며 결정된다. 이와 같은 연산의 반복을 통해 입력벡터의 위상 z 를 찾아간다.

DCORDIC 알고리듬[6]에서는 기존의 식 (4)에서 새로운 임시 변수를 정의해서 새로운 식을 유도하여 사용한다. 식 (5)~(8)에서는 기존 CORDIC 식의 변수 x, y, z에 모두 적용이 가능하도록 일반화된 변수 g에 대해서 설명한다.

sign(g) = sign(g)⁻¹임을 이용하면, 식 (7)은 식 (8)과 같이 쓸 수 있다.

식 (8)은 기존 변수의 부호인 sign(g_i+1)이 이에 상응하는 새로운 변수의 부호인 로부터 재귀적으로 간단히 도출됨을 의미한다. 즉, 식 (7)을 통해, 의 부호가 별도로 인코딩된 g_i의 부호인 것으로 간주될 수 있으며, 식 (8)을 이용하여 의 부호를 g_i의 부호로 간단히 디코딩 할 수 있다.

CORDIC 벡터링 모드의 기본 원리는 반복적인 회전 연산을 통해 허수부분인 y의 성분을 0으로 만드는 것이 다. 이는 벡터의 회전 방향이 항상 y성분의 절대 값이 작아지는 방향으로 선택됨을 뜻한다. 기존 CORDIC의 식 (4)와 식 (5)~(8)의 성질을 이용하여 변환된 DCORDIC의 식을 유도하면 다음과 같다.[6]

식 (9)를 통해 DCORDIC에서 새로운 변수 의 절대 값을 이용하여 y의 부호와 상관없이 다음 x, y성분에 대한 반복 연산을 즉시 수행할 수 있음을 알 수 있다.

고정 소수점 CORDIC 아크탄젠트 연산의 정확성은 입력 벡터의 실수부와 허수부, 위상 LUT의 비트 폭과 CORDIC 회전의 반복 횟수에 의해 결정된다. CORDIC 알고리듬의 반복 횟수에 따른 연산시간과 계산된 위상의 정확도 사이에 교환조건이 존재하며, 또한 내부 연산의 비트 폭에 의한 하드웨어 면적과 연산 정밀도 사 이에도 교환조건이 존재한다. 따라서 비트 폭과 반복 횟수에 따라 연산 정확도가 결정되므로, CORDIC 알고리듬의 하드웨어 구현 시에 이를 고려해야 한다.

Ⅳ. 위상 연산기 하드웨어 설계

본 논문에서는 DCORDIC 기반으로 고정 소수점 연산을 수행하는 위상 연산기 하드웨어를 설계하기 위하여 기존의 연구[13]에서 도출해낸 설계사양을 이용하였다. 내부 연산의 비트 수를 16 비트 (부호 1 비트, 정수 부분 2 비트, 소수부분 13 비트), 반복 횟수 14회로 결정하였다. 결정된 설계사양을 적용한 MATLAB 시뮬레이션 결과는 그림 2와 같다. 왼쪽 그래프는 360개의 원본 데이터에 대해 DCORDIC으로 계산된 값과 일치하는 정도를 보인 것이며, 오른쪽은 각도 별 오차를 나타낸다. 최대 오차는 1.99%, 평균 오차는 0.67%로 나타나 목표 보다 우수한 정밀도가 얻어졌다.

[그림 2.] 위상연산기의 MATLAB 시뮬레이션 결과

DCORDIC 기반의 위상 연산기는 기존의 CORDIC 알고리듬에 비해 하드웨어 구조가 복잡해지고 면적이 커지는 단점이 있지만, 현재 단계의 y성분의 부호가 계산 되지 않은 상태에서도 연산을 계속해서 수행 할 수 있고, 내부 연산에 잉여 이진(redundant binary) 수체계를 적용하여 내부 가산/감산기를 캐리 보존 가산/ 감산기로 구현하고 캐리전파를 줄여 고속 동작이 가능하다.

설계된 전체 위상 연산기의 하드웨어 구조는 그림 3과 같다. 입력 데이터는 전처리 블록을 통해 전처리 과정을 거친 후, 파이프라인 DCORDIC 블록으로 들어간다.

[그림 3.] DCORDIC 기반 위상 연산기의 구조

CORDIC 연산은 -90°∼90° 범위의 입력 벡터에 대해서만 위상 연산이 가능하게 설계되어, 이를 보정해 주기 위해 우선 복소 평면상에서 입력 벡터가 존재하는 사분면의 위치를 x_in, y_in의 부호를 이용하여 알아낸다.

입력 벡터가 2 사분면 또는 3 사분면에 위치한 경우, 실수와 허수에 보수를 취해 각각 1 사분면과 4 사분면으로 이동시켜 CORDIC 연산을 한다. 입력 벡터의 사분면을 이동 시키는 경우에는 위상의 초기 값인 z₀의 값을 각각 π, −π로 두어 최종 위상 값에 오차가 없도록 보상하고, 초기 입력 벡터가 1 사분면 또는 4 사분면에 있는 일반적인 경우에는 z₀의 값은 0으로 둔다. 정해진 x₀, y₀, z₀은 파이프라인 구조로 미리 구현된 14 단의 DCORDIC 블록의 입력으로 들어가서 최종적으로는 연산된 위상 z_out이 라디안 형태로 출력된다.

내부 DCORDIC 스테이지의 하드웨어는 그림 4와 같이 구현하였다. 반복 횟수에 해당하는 14개의 연산 스테이지로 구성되며, 각 연산 스테이지는 식 (9)의 x_i+1, , z_i+1를 계산하는 회로들로 구성된다. x_i+1와 를 계산하는 회로는 절대 값 변환 블록, CS 가산/ 감산기, 파이프라인 레지스터로 구성되며, z_i+1 계산 회로는 tan⁻¹(2⁻ⁱ)를 저장하는 LUT와 CS 가산기, 파이프라인 레지스터로 구성된다.

[그림 4.] 파이프라인 DCORDIC의 하드웨어 구조

Ⅴ. 설계검증 및 성능평가

Verilog HDL로 설계된 DCORDIC 기반의 위상 연산기는 MATLAB을 이용한 입력 데이터 생성과 Modelsim을 이용한 시뮬레이션을 통해 기능 검증을 하였다. 설 계된 위상 연산기의 HDL 모델을 FPGA에 구현하고, MATLAB/Simulink와 연동시킨 FPGA-in- the-loop 환경을 통해 하드웨어 동작을 검증하였다. 그림 5(a)는 설계된 위상연산기의 FPGA 검증을 위한 FPGA-in-the-loop 환경이며, Xilinx Virtex5 XC5VSX- 50T FPGA 디바이스가 사용되었다. MATLAB에서 생성된 가상의 3차원 원본 데이터로부터 위상 연산기의 입력으로 사용 될 16 비트의 입력 벡터를 생성하였다. 생성된 벡터는 Simulink를 통해 위상 연산기가 구현된 FPGA에 인가되고, FPGA에서 출력되는 위상 데이터는 Simulink와 MATLAB을 이용하여 3차원 데이터로 복원된다. 그림 5(b)는 FPGA-in-the- loop 검증 결과를 보이고 있다.

[그림 5.] 위상연산기의 하드웨어 검증 (a) FPGA-in-the-loop 검증 환경 (b) FPGA 구현을 통한 3차원 데이터 복원

설계된 위상연산기가 구현된 FPGA 출력 결과가 원본 데이터와 매우 잘 일치함을 확인할 수 있다. 설계된 위상 연산기는 FPGA 합성 결과 1,502 슬라이스로 구현 되었으며, 469MHz로 동작하여 469 MS/s의 성능을 갖는 것으로 평가 되었다.

설계된 위상 연산기는 약 82,000 게이트로 구현되었으며, TSMC 0.18-㎛ CMOS 공정으로 테스트 칩을 제작하였다. 그림 6은 Cadence Virtuoso 툴을 이용하여 레이아웃 검증까지 완료된 테스트 칩의 레이아웃 도면이다. TSMC MPW로 제작된 칩을 그림 7의 테스트 시스템으로 테스트 하였다. 칩의 CORE 전압은 1.8V, IO 전압은 3.3V이고, FPGA 보드를 통해 클록과 리셋 신호가 포함된 테스트 벡터가 순차적으로 인가되도록 하였다. 24° 단위의 각도 데이터를 고정소수점 형식의 실수와 허수 값으로 생성하여 테스트 벡터로 사용하였다. Agilent 16702B 논리분석기를 사용하여 테스트 칩의 출력을 관찰하였으며, 칩 테스트 결과파형은 그림 8과 같다.

[그림 6.] 설계된 위상연산기의 레이아웃 도면

[그림 7.] 제작 칩의 테스트 시스템

[그림 8.] 칩 테스트 결과

테스트 결과파형에서 볼 수 있듯이, HEX 값 0D68, 1ACE, 2836, 359C의 순서로 라디안 형태의 데이터가 출력되고, 이를 도로 변환하면 24.00379825, 47.99360828, 71.99740653, 95.98721656에 해당한다. 이는 시뮬레이션 결과와 일치하는 값이며, 제작된 칩이 높은 정밀도를 가지고 정상 동작함을 확인하였다.

TSMC 0.18-㎛ CMOS 공정으로 설계된 DCORDIC 위상 연산기는 400MHz@1.8V로 동작하여 400 MS/s의 처리율을 갖는 것으로 평가되었다. 표 1은 타 문헌과 이전의 연구에서 구현한 CORDIC 프로세서와의 비교를 보이고 있다. 문헌 [11]은 rolled 방식으로 구현한 예이고, 문헌 [12], [13]과 본 논문의 경우는 unrolled 방식으로 구현하였다.

[표 1.] CORDIC 프로세서의 비교

CORDIC 프로세서의 비교

본 논문의 위상연산기와 다른 목적으로 구현되어 정확한 비교는 할 수 없으나, 이전의 연구[13]는 16 비트의 연산을 수행하는 다른 CORDIC 프로세서들과 비교 해 보았을 때, 사용되는 로직 대비 동작주파수와 처리량이 우수한 성능을 갖는 것으로 평가 되었다. 반면 본 논문의 경우는 다른 문헌에 비해 면적이 크지만 동작주 파수와 처리량이 뛰어난 것으로 평가되었다.

Ⅵ. 결 론

3차원 영상처리용 TOF 센서의 거리 측정을 위한 DCORDIC 기반 위상 연산기를 설계하였다. 설계된 위상 연산기는 16 비트(부호 1 비트, 정수부분 2 비트, 소수부분 13 비트)의 고정 소수점 연산으로 14회의 CORDIC 스테이지 반복을 통해 위상 값을 계산한다. 0° ∼360° 범위에서 1° 단위로 계산하는 경우에, 최대 오차 1.99%, 평균 오차 0.67%의 연산 정밀도를 갖는다. 설계된 위상 연산기는 MATLAB/Simulink와 FPGA 보드를 연동시킨 FPGA-in-the-loop 환경을 통해 하드웨어 동작을 검증하였다. TSMC 0.18-㎛ CMOS 공정으로 테스트 칩을 제작하고 평가하였으며, 400MHz @1.8V로 동작하여 400 MS/s의 성능을 갖는 것으로 평가되었다.

참고문헌

1. Hussmann S., Ringbeck T., Hagebeuker B. 2008 “A performance review of 3D TOF vision systems in comparison to stereo vision systems,” in Stereo Vision P.103-120
2. Ho Y.S. 2011 “3D realistic broadcasting content generation using multi-view camera and depth camera,” [The journal of Korea Institute of Electronics Engineers] Vol.38 P.44-49
3. Jongenelen A.P.P. 2010 “Development of a Compact, Configurable, Real-time Range Imaging System,” Ph.D dissertation
4. Hussmann S., Edeler T. 2010 “Pseudo 4-phase shift algorithm for performance enhancement of 3D-TOF vision systems,” [IEEE Trans. Instrum. Meas.] Vol.59 P.1175-1181
5. Gokturk S.B., Yalcin H., Bamji C. 2004 “A time-of-flight depth sensor, system description, issues and solutions,” [Proc. IEEE Conf. Computer Vision and Pattern Recognition]
6. Herbert Dawid, Heinrich Meyr 1996 "The Differential CORDIC Algorithm : Constant Scale Factor Redundant Implementation without Correcting Iterations" [Computers, IEEE Transactions] Vol.45
7. Gutierrez R., Torres V., Valls J. 2010 “FPGA-imple- mentation of atan(Y/X) based on logarithmic transformation and LUT-based techniques,” [Journal of Systems Architecture] Vol.56 P.588-596
8. Saber M., Jitsumatsu Y., Kohda T. 2009 “A low-power implementation of arctangent function for communication application using FPGA,” [Fourth International Workshop on Signal Design and its Applications in Communications (IWSDA'09)] P.60-63
9. Volder J. E. 1959 "The CORDIC trigonometric computing technique," [IRE Transactions on Electronic Computing] Vol.EC-8 P.330-334
10. Lakshmi B., Dhar A.S. 2010 “CORDIC Architectures: A Survey,” P.19
11. Raphael A., Camponogara Viera, Paulo Cesar C. de Aguirre 2011 "Iterative Mode Hardware Implementation of CORDIC Algorithm," [Proceeding of the 26th South Symposium on Microelectronics (SIM 2011)]
12. Ross D.-M., Miller S., Sima M., Crawford C. 2011 "Design Rules for Implementing CORDIC on FPGAs," [Proceedings of the 13th IEEE Pacific Rim Conference on Communications, Computers and Signal Processing (Pac Rim 2011)] P.797-802
13. Koo Jung-youn, Shin Kyung-Wook 2013 “A Design of Highspeed Phase Calculator for 3D Depth Image Extraction from TOF Sensor Data” [Journal of the Korea Institute of Information and Communication Engineering] Vol.17 P.355-362