“데이터 분석의 힘은 협업과 공유에서 나온다”
“데이터 분석의 힘은 협업과 공유에서 나온다”
  • 박시현 기자
  • 승인 2020.05.11 09:35
  • 댓글 0
이 기사를 공유합니다

이학배 연세대 교수, 159회 영림원CEO포럼 강연
이학배 연세대학교 교수
이학배 연세대학교 교수

[디지털경제뉴스 박시현 기자] 이학배 연세대학교 응용통계학과 교수가 7일 159회 영림원CEO포럼에서 ‘COVID 19와 데이터 비즈니스’를 주제로 강연했다.

이 교수는 통계학 관점에서 빅데이터와 ‘눈에 보이지 않는 그 어떤 것(Something Invisible)’의 상관관계를 설명하면서, “빅데이터 시대의 기업 비즈니스에서 중요한 것은 기술적인 범주를 넘어서서 데이터를 분석하고 이해하는 힘 즉 ‘무엇을 인식할 것인가(what to perceive&recognize)’이며, 이는 혼자서는 할 수 없으며 인적자원 간의 협업과 공유가 필수적이다“라고 강조했다. 다음은 강연내용.

빅데이터 분야 발전 엄청 빠르게 진행 중 = 연세대와 IBM은 산학협력으로 마이크로바이옴, 약물재창출, 퀀텀컴퓨팅 등의 연구에 협력하고 있다.

‘세계 최고속 IBM 슈퍼컴퓨터, 코로나19 백신개발 길 여나’, ‘희귀질환 임상정보 등 국가 바이오 빅데이터 구축한다’...

최근 신문 기사 제목으로, 앞의 것은 코로나19의 해결에 IBM 수퍼컴퓨터가 엄청난 일을 수행 중이며, 뒤의 것은 바이오 빅데이터의 구축으로 정밀의료 기반의 의료서비스 제공 및 신약을 개발한다는 내용이다. 이 기사를 읽어보면 연세대와 IBM이 산학협력으로 무엇을 하겠다는 것인지를 쉽게 이해할 수 있을 것이다.

2017년에 일본의 경제학자 이토 고이치로 미국 시카고대학교 해리스스쿨 교수는 ‘데이터 분석의 힘’이라는 빅데이터 입문서를 내놓았다. 이 책의 한국판이 2018년에 나왔는데 제가 감수를 맡았다. 이 책이 나온 지 이제 3년 정도 되었는데 벌써 올드 패션이 되어 버렸다. 그만큼 빅데이터 분야의 발전은 엄청나게 빠르게 진행 중이다.

Z세대는 1990년대 중반~2000년대 초반 출생자들이다. 구글, 페이스북, 아마존, 넷플릭스 등의 회사와 아주 친근한 세대들이다. 이 Z세대는 요즘 COVID 19로 인한 온라인 강의에 아주 익숙하다. 연세대의 경우 2019년 온라인 강의 비중은 0.8%에 불과했는데 올해는 100%이다. 온라인 강의의 질이 떨어질 것으로 우려했지만 오프라인 강의와 큰 차이가 없다.

어느 신문기사에 따르면 우리나라의 세대별 하루 동영상 시청 시간이 10대는 2시간 35분으로 가장 많으며 20대는 2시간 6분으로 그 뒤를 이었다. 평균 시청 시간은 1시간 38분이었다. 온라인 강의에서 학생들의 사용 수준이 높은 편이며 교수들이 따라가지 못하는 상태이다.

Z세대가 주로 활용하는 화상회의 앱은 ‘줌’을 비롯해 MS 팀즈, 구글 행아웃, 아마존 차임, 시스코 웹엑스 등이 있다.

커뮤니케이션 툴이 완전히 바뀌었다. 이제는 온라인 미팅 및 화상외의 앱을 어쩔 수 없이 사용해야만 하는 상황이 됐다. 앞으로 대학에서 강의는 실험이나 실습 외에는 온라인으로 갈 것이다.

빅데이터에 대한 환상 = 향후 여러 산업 가운데 가장 유망한 분야는 바이오이다. 그 파생 산업이 매우 광범위하다. 바이오 산업의 발전에 커다란 역할을 하는 것이 빅데이터이다. 그리고 이 빅데이터 분석에 중추적인 역할을 하는 것이 슈퍼컴퓨터이다. 1993년 당시 PC가 3개월 걸쳐 처리해야할 일을 수퍼컴퓨터는 불과 10초만에 해결했다. 당시 MRI 데이터는 수퍼컴퓨터로 밖에 읽을 수 없었다.

제약회사 화이자는 1년에 신약개발 연구개발비로 2018년의 경우 74억달러(한화 약 8조원)를 투자했다.

빅데이터에 대한 환상이 있다. 방대한 정보를 수집하고 이를 분석 및 시각화 하는 것이 자동화로 가능하다는 것이다. 과연 그러한가?

COVID 19로 인해 세상은 변했다. 기업의 CEO들은 세상이 변화하면 이에 맞게 잘하는 사람을 뽑으면 된다고 생각한다. 하지만 이를테면 의사 전문의조차 전공별로 그 역량이 다르며, 아날로그 콘텐츠를 디지털로 만드는 것은 그 내용이 있어야만 가능하다. 그 만큼 쉬운 작업이 아니다.

사진, 영상, SMS 등의 데이터는 비정형 데이터이다. 이를 분석하려면 통계학 관점에서 높은 수학적인 지식이 필요하지만 인간의 감성적인 분석도 중요하다.

현존하는 IBM 수퍼컴퓨터 가운데 가장 성능이 뛰어난 것이 ‘서밋’인데, 이 조차도 약물재창출 작업을 하기에는 버거울 정도 아직까지 컴퓨터 성능에는 한계가 있다.

화이자는 개인별로 맞춤형의 신약 개발에 초점을 맞추고 있다. 사람마다 약의 효과가 다르기 때문이다. 마이크로바이옴이라는 기술이 등장한 것도 개인화 및 맞춤형의 신약을 개발하기 위해서다. 이를 실현하려면 상상을 초월하는 컴퓨팅 성능이 필요하다. 그래서 나온 것이 퀀텀 컴퓨팅이다.

퀀텀 컴퓨팅이 무엇인가? 식물과 동물의 종이 다르듯이 퀀텀컴퓨팅은 반도체를 쓰지 않으며 기존의 컴퓨팅 시스템과는 차원이 다르다.

◆빅데이터 핵심은 ‘무엇을 인식할 것인가?’ = 빅데이터 시대에 기업에서 데이터 비즈니스를 하려면 어떻게 측정하고 계산하며 예측하는지 등 기술적인 이슈를 넘어서 데이터를 분석하고 이해하는 힘 즉 ‘무엇을 인식할 것인가(what to perceive&recognize)’가 더욱 중요하다. 그리고 ‘그 무엇을 인식’하기 위해서는 인적자원들 간의 협업과 공유가 필수적이다.

빅데이터나 인더스트리 4.0, 블록체인 등 신기술을 전문가 수준으로 알 필요는 없다. 그 개념만 명확히 이해하면 된다. 어떻게 측정하고 계산하고 예측할 것인지는 기술 전문가에게 맡기면 된다. ‘무엇을 인식할 것인가’가 바로 빅데이터의 핵심이다.

인공지능 시대에 알아야 할 용어가 있는데 R, 파이썬, SQL, 자바 등이다. 이들은 인공지능 기본 툴이다. 또 깃(Git)이라는 분산버전관리 시스템이 있다. 이는 파일 변경사항을 추적하고 사용자 간의 해당 파일의 작업을 조율한다. 이 깃의 대표적인 것이 위키피디아라는 백과사전이다. 여기서 블록체인 기술을 제대로 느낄 수 있다.

◆‘눈에 보이지 않는 그 어떤 것’을 읽어 내려면 = COVID 19로 인해 재택근무가 많아졌다. 굳이 회사에 출근하지 않아도 되는 업무에서 더욱 그러하다. 앞으로 재택근무는 보편화될 것이며, 완전히 예전으로 돌아가기는 힘들 것이다. 돌이킬 수 없는 길을 건넌 셈이다. 인터넷과 컴퓨터만 있으면 어디서든지 일을 할 수 있는 시대가 된 것이다.

빅데이터에서 ‘눈에 보이지 않는 그 어떤 것(Something Invisible)’을 읽어내려면 개념적인 차원의 사고가 필요하며 혼자서는 안되며 협업을 해야 한다. 기술은 테크니션에게 맡기면 된다.

◆영림원CEO포럼
영림원 CEO포럼은 2005년 10월 첫 회를 시작하여 매달 개최되는 조찬 포럼으로, 중견 중소기업 CEO에게 필요한 경영, 경제, IT, 인문학 등을 주제로 해당분야 최고의 전문가들이 강연한다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.