[디지털경제뉴스 정현석 기자] 함유근 건국대학교 경영대학 교수가 5일 163회 영림원CEO포럼에서 ‘빅데이터 생태계로 창출되는 산업의 변화’를 주제로 강연했다.
함 교수는 이번 강연에서 자율주행차를 예로 들어 “테슬라는 전기차 제조 회사가 아니라 스마트 모빌리티 회사이며 이같은 변모는 빅데이터로 인한 것”이며, “데이터 기반의 비즈니스가 산업의 주류가 되면서 기존의 사업하는 방식 즉 비즈니스 모델을 변화시키고 있다”고 밝혔다. 다음은 강연내용
데이터 경제는 이제 시비를 걸 수 없는 대세가 됐다. 빅데이터 기업이란 무엇인가? 넷플릭스는 시청자의 이용 데이터를 알고리즘 개선에 활용하고 이를 통해 추천 영화의 정확도를 높여 시청자들에게 더 나은 사용자 경험을 제공하고, 이는 더 많은 시청자 데이터 증가로 이어지는 데이터 경제의 선순환 구조를 만들었다. 지금 잘 나가는 기업들 즉 구글, 페이스북, 아마존 등의 비즈니스 모델은 모두 이렇게 되어 있다.
기업의 데이터 분석 능력과 수익 증가 간의 관계는 이미 실증적으로 증명됐다. 데이터 분석에 집중하는 기업은 그렇지 않은 기업에 비해 주가를 64% 더 높이였으며, 경제 불황에서 회복하는 속도가 급격히 빨랐다는 연구 결과가 나와 있다.
맥킨지가 2019년에 내놓은 보고서에 따르면 경영성과가 높은 기업은 다른 일반 기업과 비교해 △분야별 최고 경영자 가운데 한 명은 데이터 관련자 △필요할 경우 현업 부서 직원들도 데이터에 쉽게 접근 △조직 문화가 데이터를 이용한 재빠른 실험이나 반복을 장려하고 도전적 실패를 용인 △비 관리자 역할 선발 기준에 데이터 관련 숙련도 항목이 있음 △관리자 역할 선발 기준에 데이터 관련 숙련도 항목이 있음 등에서 격차를 보였다.
그러면 어디서부터 이런 데이터 경제 선순환 구조를 만들까? 먼저 알고리즘의 개선부터 시작해야 하는가 아니면 고객 경험의 향상으로 데이터를 늘릴까 하는 데 그 절차는 기업마다 처한 상황에 따라 고려해야 할 것이다.
디지털화된 생활은 이제 나이와 무관하다. 예를 들어 스마트폰으로 계좌 이체를 하고 잔액 조회를 하고 상품을 문의하는 것이 연령대별로 별 차이가 없다.
빅데이터는 코로나19 대응도구로도 이용되고 있다. 곧 △접촉자 추적 △대중들의 이동 흐름 모델링 △사회적 접촉 파악 △격리조치 실행 △사회적·경제적 파급효과 분석 △전염병 대응 및 복구 계획 수립 등 6개 기능 영역에서 활용되고 있다.
접촉자 추적을 하려면 데이터가 필요한데 위치 관련 데이터 곧 공간 데이터가 가장 많다. 실제로 시장의 데이터 약 70%는 공간 데이터와 관련이 있다. 가장 많이 사용되고 있는 위치 관련 데이터는 이동통신 데이터와 CCTV 데이터이다.
아마존은 사무실 및 물류창고에서 사회적 거리를 유지하는 데 도움을 주는 '거리두기 도우미(Distance Assistant)'를 공개했는데 AI 및 AR 기술을 활용해 시각적인 피드백을 바로 전달한다. 거리두기 도우미는 50인치 모니터와 깊이 감지 카메라, 컴퓨터로 구성된다. 머신러닝 모델이 주변 환경과 직원을 구분하며, 깊이 감지 카메라가 직원 간의 거리를 측정해 증강현실로 화면에 사회적 거리를 보여주는 원을 표시한다. 예를 들어 안전거리(2m)를 유지하면 초록색 원이 뜨며, 만약 직원 간 거리가 안전거리보다 가까워진다면 붉은색 원이 즉각 나타나 실시간 알림을 준다.
우리나라의 질병관리본부는 이동통신 데이터를 활용해 코로나 확산을 추적한다. 확진자의 활동, 이동루트, 지역을 지도 위에 실시간으로 표시해 보여준다. 이러한 작업이 간단한 것 같지만 기존의 기술로는 불가능했다. 바로 빅데이터 기술에 힘입은 것이다.
지역적 요인과 관련해 높은 가치가 있는 데이터가 매우 많다. 그 예로 코로나19 여파에 따른 유동인구 감소율을 서울 지역 별로 보여주는 지도를 들 수 있다. 유동인구 감소율이 큰 업종은 키즈카페, 면세점, 미술관·박물관, 유아용품, 영화관 등의 순으로 나타났다.
이 데이터의 소스는 한국데이터거래소(KDX)와 로플랫이다. 이곳에서는 데이터를 만들어 판매한다. 로플랫은 전국 약 80만 곳의 와이파이 신호를 분석해 위치를 인식했다.
KDX가 오픈하고 처음으로 판매한 데이터는 무엇이었을까? MBN의 화재뉴스 동영상이었다. 그 첫번째 구매자는 소프트웨어 개발사인 씨이랩이었다. 화재 사고 동영상에 AI 알고리즘을 적용해 비슷한 영상이 뜨면 화재로 인식하도록 학습을 시킨 후 이를 CCTV의 화재 감시 인식 시스템에 적용했다.
해외에서는 스타십 테크놀로지(Starship Technologies), 키위봇(Kiwibot), 아마존 등이 로봇이나 드론으로 자동 배송을 하고 있다. 코로나가 심각한 영국의 한 중소도시에서는 사람들이 앱을 사용해 무인운반차 ‘스타십’으로 필요한 식료품, 음식을 배달받았다. 중국 바이두의 무인차인 아폴로는 병원 식자재와 소모품을 배송하고 있다.
테슬라 하면 떠오르는 기업은? 테슬라는 ‘전기차’ 제조사가 아니라 ‘스마트 모빌리티’ 회사이다. 테슬라는 왜 스마트 모빌리티 회사인가? 주가를 높이기 위한 포장술인가?라고 의문을 품을 수 있다.
테슬라는 2012년부터 지금까지 줄곧 전기차 시장에서 1위를 달려왔다. 올해 2분기 기준으로 2위는 닛산, 3위는 폭스바겐이며, 현대는 4위다.
국내의 경우 올해 상반기에 테슬라 모델 3은 6,888대를 판매, 전기차 시장점유율 1위를 기록했다. 현대 코나EV는 5,120대 판매로 2위였으며, 3위는 기아 니로EV였다.
빅데이터 생태계는 2012년에 그 범주가 몆 개 안되었지만 7년이 지난 2019년에는 그 수가 엄청나게 늘어나며 크게 변화했다. 전체 생태계 범주 가운데 데이터에 기반한 사업 영역이 절반을 차지했다. AI와 빅데이터가 결합한 애플리케이션이 크게 늘어났다. 데이터로 돈을 버는 것이 주류가 됐다.
빅데이터 생태계 범주 가운데 운송 분야에는 테슬라, 우버 등 다수의 기업이 포진돼 있다. 테슬라의 본질은 데이터 기업이다. 현대차는 “모빌리티 생태계 조성을 통해 차량과 사람에 관한 정보를 축적하고, 이를 통해 미래 자동차와 서비스를 진화시킬 것”이라고 했다
독일에서 올해 7월, 테슬라가 ‘오토파일럿(Tesla Autopilot)’ 기술로 사람의 개입 없이 자율주행이 가능하다고 광고한 것은 허위라고 판결했다. 우리나라의 공정위도 테슬라의 ‘자율주행 과장광고’ 논란에 내부 검토에 착수했다.
테슬라 오토파일럿은 차량이 도로에서 자동으로 핸들 조향을 하거나 가속, 제동할 수 있도록 하는 기술이다. 초당 320조번의 연산을 한다. 모두 4개 화면으로 이뤄진 내비게이션인 테슬라 ‘풀 셀프 드라이빙(Full Self-Driving)’은 900만원 이상의 옵션이며 현재는 운전자 개입이 필요하다. 테슬라는 다른 자율차 업체처럼 정밀(HD) 지도를 사용하지 않고 자체 제작한 지도를 쓴다.
대만에서는 하늘과 쓰러져 있는 흰색 대형트럭을 구분 못해 사고가 나기도 했는데 알랜 머스크 테슬라 CEO는 올해 안에 완전자율주행을 선언하고 10월에는 교차로 좌우 회전을 실현했다.
자율주행차량의 역사는 1939년 만국박람회에 지정 도로를 따라 달리는 무인차량 등장하면서 시작됐다. 2004년 미국 DARPA가 상금 100만 달러를 내걸고 자율주행차량이 240Km의 험지를 완주하는 대회를 개최했는데 완주한 차량은 전무했다. 그런데 이듬해 2005년에는 5개팀이 완주했다. 2006년에는 브라질 광산회사 리오 틴토(Rio Tinto)가 무인주행트럭을 운영했으며, 2009년에 구글이 무인주행차량 프로젝트를 시작하며 이 시장에 뛰어들었다. 2012년 미국 내 최초로 네바다주가 구글에게 무인주행차량 운행을 정식 허용하고, 2016년에 플로리다에서 테슬라 모델 S가 최초로 충돌 사고를 냈다. 2018년에 구글 웨이모(Waymo)가 애리조나 피닉스시에서 무인주행택시 제한적 시범 서비스에 들어갔는데 코로나19로 중단됐다.
자율주행차의 레벨은 6단계로 되어 있다. 레벨 0은 인간이 보조장치 없이 직접 운전하는 것이며, 레벨 1은 운전자가 발을 떼는, 레벨 2는 손을 떼는, 레벨 3은 눈을 떼는 단계이다. 레벨 4는 인간이 탑승하되 간섭하지 않아도 되는 완전 자동화 단계이며 레벨 5가 바로 기계가 직접 운전하는 완전 자율주행차이다. 테슬라의 오토파일럿은 레벨 2~3에 있다.
자율주행차량도 사람과 같이 상황을 인식(Perception)하고 이를 판단(Computing)해 행동(Control)에 옮기는 사이클을 반복한다. 자율주행차의 상황인식 도구는 카메라, 라이다(LIDAR), 레이더(RADAR)이다. 이들 상황인식 도구는 자율주행차량의 시스템 구성요소 가운데 하나인 센서에 해당한다.
자율주행차량에서 생성되는 빅데이터는 하루에 4,000GB이다. 시간당 발생량이 25,000MB로서, 비디오 및 음악 스트리밍, 웹 브라우징, 내비게이션 등 개인적인 온라인 활동에서 생성되는 데이터 규모와는 비교가 되지 않을 정도로 방대하다.
단순히 데이터의 양만 많은 것이 아니라 제공 가능한 정보도 엄청나다. 그 예로 △보다 정밀한 사람들의 위치 정보 △신축 건물들 진척도 파악 및 예측 △쓰레기 불법 투기 단속 △거의 모든 교통 사고의 포착 및 예측 등을 들 수 있다. 자율주행차량에서 생성되는 데이터가 차량의 주행에만 사용되는 것이 아니라 여러 분야에서 활용 가능하다는 얘기다.
우리나라의 자율주행자동차법에서는 익명처리한 개인정보를 활용할 경우에 개인정보보호법을 적용받지 않도록 하고 있다. 캐나다의 자율주행차량 관련 법체계는 매우 복잡하다.
사용자들이 구글 서비스를 이용할 때 구글에서는 더 나은 서비스를 제공하기 위해 데이터를 수집한다. 이 데이터에는 검색기록, 시청한 동영상, 클릭한 광고, 위치, 방문한 웹사이트 등의 정보가 포함된다. 또 구글 계정에 가입하면 개인정보를 제공하게 되는데 이름, 생일, 성별, 이메일, 저장한 사진 및 동영상, 드라이브에서 만든 문서, 유튜브에 남긴 댓글, 캘린더 일정이 포함된다. 구글은 “누구와도 사용자의 개인정보를 거래하지 않는다”고 명시하고 있다.
제가 기존의 구글 서비스 이용 정보를 싹 지우고 새롭게 구글 서비스를 이용해 봤는데 불과 한달 만에 나이, 성별, 개 키우는 것, 결혼 유무, 가계수입, 주택소유 여부, 학력, 회사규모 등을 정확하게 파악하더라.
자율주행에 필요한 요소는 △인프라 △법적 규제 △고객의 수용 △기술 등이다.
테슬라 자율주행차량의 데이터 저장 및 처리 구조는 즉각적인 조치가 필요한 부분은 엣지 서버가 직접 연산해 가까운 클라우드 서버로 보내고, 클라우드 컴퓨팅은 데이터를 종합해 전체 기기들 간의 조율이나 예측이 필요한 부분을 처리한다.
알고리즘을 개발하려면 데이터가 있어야 한다. 데이터마다 레이블링(labeling) 즉 이름표를 붙여 이를테면 그것이 차인지 오토바이인지를 빠르게 파악한다. 딥러닝은 답을 미리 알려주고 이를 찾는 방법을 모델링하는 것이다. 알고리즘 가운데 신경망을 활용해 정답(자동차)과 관련된 특징을 단계적으로 파악한다. 동영상 또는 이미지 데이터의 경우는 시각적 레이블링도 가능하다. 인공지능이 처음부터 길을 찾는 것이 아니라 여기가 차선이라는 것을 사람이 알려줘야 인공지능이 다음부터 파악을 한다. 이른바 지도학습이다.
테슬라의 자율주행차는 이런 지도학습을 엄청나게 했다. 올바른 레이블링 데이터가 많을수록 정확히 판단한다. 테슬라는 기본적으로 파악하는 사물들을 낮, 밤, 터널, 눈이나 비 올 때 등등 모든 상황에서 레이블링을 했다. 끼어들기 동영상 자동 레이블링 기술을 개발하기도 했다.
AI 프로젝트 시간의 80%는 데이터를 모으고 정리해 레이블링을 하는데 소비된다. 테슬라의 오토파일럿은 이런 작업을 하는데 다른 자율주행차 업체처럼 라이다를 쓰지 않고 카메라를 중심으로 레이더(전파), 소나(음성)에 의존한다.
라이다는 레이저 센서가 빛을 발사해 그 빛이 반사돼 돌아오는 것으로 주위 물체의 거리, 속도, 방향 등을 측정하고 주변 환경의 모습을 정밀하게 파악하는 장치다. 사물의 3차원 구조 파악이 가능하지만 고가이며 눈비에 취약하다.
테슬라는 자체적으로 3차원 기술을 개발해 라이다의 문제를 극복했다. 그 기술은 영상 속 사물들을 바로 2차원적으로 인식하는 것이 아니라 3차원 조감도 구조로 바뀌어 인식한다. 그러면 시험적 상황도 실험 가능하다. 테슬라는 물리적 공간에서의 사물 움직임을 디지털 공간에서 구현했다. 다시 말해 3차원 조감도 디지털 트윈(Digital Twin)을 구현했다.
테슬라 외 다른 자율주행차는 아직 시험용에 불과하다. 라이다의 가격이 더욱 저렴해지고 데이터 처리 능력이 향상되어야 실용화될 것이다.
자율주행차량의 완성도 면에서 테슬라는 가장 낮은 평가를 받았다. 반면 구글 웨이모, GM 크루즈 등은 최상위에 위치해 있다. 구글 웨이모는 가상의 3차원 HD 공간지도 및 객체를 구현해 주행한다. 반면 테슬라는 간단한 3차원 시뮬레이션으로 주행한다. 현대 앱티브는 라이다를 많이 탑재했으며 그만큼 안전도를 높였다.
자율주행 수준은 데이터 양에 비례한다. 자율주행을 향한 경쟁에서 데이터는 왕이다. 실제 세상은 예측할 수 없으며 사람들은 매우 비이성적으로 행동하고 교통 신호, 신호 등과 같은 교통 법규를 따르지 않는 경우가 많다. 따라서 이러한 예측 불가능성으로 인해 실제 데이터가 많을수록 컴퓨터 알고리즘의 성능이 향상된다.
웨이모는 엔지니어들이 직접 차를 몰면서 차가 다닐 수 있는 가상의 지도를 작성하는데 이는 돈이 많이 드는 작업이다. 웨이모는 현재 레벨 4에서 운영되고 있고, 테슬라는 공식적으로 레벨 2에서 운영하고 있다. 웨이모는 레벨 4에서 작동하기 때문에 게임에서 앞서 있는 것처럼 보일 수 있지만 이 레벨 4는 매우 비싼 센서를 사용해 매우 집중적으로 매핑된 지오 펜스 영역에서만 작동한다. 주요 도시의 모든 영역을 매핑하는 비용은 상당하다.
테슬라가 시각 데이터에 바탕을 둔 컴퓨터 비전 문제를 완성한다면, 이제는 스위치를 켜기만 하면 전체 차량이 자율화된다.
2019년 12월 현재 도로에서 자율주행하는 차량수는 테슬라가 60만대이며 웨이모는 600대이다. 중국 회사들은 미국 회사들과 다른 방식으로 자율주행차량을 개발 중이다.
테슬라의 시가 총액은 2020년 6월 1,800억 달러에서 11월에는 3,670억 달러로 2배 넘게 늘어났다.
테슬라의 비즈니스 모델은 클라우드 기반 소프트웨어 판매이다. 하드웨어를 일회성으로 거래해 마진을 남기는 모델에서 운전자에게 마일 당 플랫폼 사용료를 받는, 클라우드 소프트웨어 판매 모델로 변모하고 있다.
테슬라는 차량 판매 후 계속해서 성능 향상을 해주는 전세계 유일의 자동차 회사라는 평가도 받고 있다. 계속해서 소프트웨어를 무료로 업데이트해 최신의 기능을 유지하기 때문에 자율주행차량을 구입하고 3년이 지나도 가치가 떨어지지 않는다. 테슬라의 이러한 비즈니스 모델은 그간 전혀 보지 못한 것이다.
테슬라는 자율주행차량의 자동 주차를 넘어 자동 소환을 실현했다. 올해 4월 기존의 트럭보다 실용성을 높이고 가격대성능비가 우수한 ‘사이버트럭’을 출시했으며, 9월부터는 보험 사업을 시작했다.
자율주행차량의 보급으로 기존 자동차 보험 비즈니스 모델의 변화가 예상된다.
테슬라는 차량 및 주행, 운전자 빅데이터로 더욱 맞춤화된 서비스가 가능하다는 점을 강점으로 내세운다. 기존 보험사들이 테슬라에 높은 보험료를 책정하지만 테슬라는 이에 대해 빅데이터로 20~30% 낮출 수 있다고 주장한다. 테슬라는 보험료 산정을 사람이 하는 것이 아닌 빅데이터 기반 AI가 하는 시대를 열고 있다.
2013년부터 차량의 타이어에 센서를 부착해 유지보수 서비스를 하며 새로운 비즈니스 모델을 만든 미쉐린 타이어도 2020년 1월 프랑스의 보험사와 협력해 보험 사업을 시작했다.
빅데이터가 산업의 생태계를 바꾸는 장면이다. 차량 제조 및 판매업은 이미 빅데이터로 인해 스마트 모빌리티 산업으로 변모하고 있다.
기업 경영에서 현실적으로 인공지능과 빅데이터는 분리되는 실체가 아닌 데이터 기반의 혁신이라는 한 몸의 도구이다.
◆영림원CEO포럼
영림원 CEO포럼은 2005년 10월 첫 회를 시작하여 매달 개최되는 조찬 포럼으로, 중견 중소기업 CEO에게 필요한 경영, 경제, IT, 인문학 등을 주제로 해당분야 최고의 전문가들이 강연한다.