표지
ㆍ서명 LH 빅데이터 활용모델 개발 연구
ㆍ저자 양동석, 기호영, 변완희, 이상훈, 임재빈, 최준영
ㆍ발행처 LH토지주택연구원
ㆍ발행년도 2015
ㆍ부서명 주택분야를 중심으로
ㆍ발행지 tjk
ㆍ형태사항 96 / 25cm
ㆍ총서명 연구지원
ㆍ총서번호 2015-60
ㆍ배가위치 자료실
ㆍ언어 한국어
ㆍ대출예약수
0 명 / 대출가능

 

 

 

 

 

 

빅 데이터를 활용한 부동산시장분석 및 예측모형 개발 기획.jpg
0.2MB

 

 

 

 

 

 

 

[데이터사이언티스트를 찾아서] 데이터 사이언티스트, 빅데이터를 논하다

 

 

빅데이터와 데이터 사이언티스트에 대한 15인 15색의 목소리

 

[컴퓨터월드]

 

 

‘빅데이터’라는 단어가 흔히 쓰이기 시작한 것은 2010년대에 들어와서다. 어느덧 2010년대의 한가운데로 접어들면서 세간의 관심은 빅데이터를 향해 더욱 쏠리고 있다. 하지만, 빅데이터 시장이 활성화되고, 그것이 IT 시장 전반에 새로운 성장의 기운을 불어넣을 것이라는 기대는 아직 현실화되지 않은 것도 사실이다. 빅데이터를 실질적인 가치로 전환시켜내는 것이 그 관건일 것이다.

 

 

이에 컴퓨터월드는 신년을 맞아, 국내 데이터 산업에서 핵심적인 역할을 수행중인 데이터 사이언티스트 15인으로부터 대한민국의 빅데이터와 데이터 사이언티스트의 현 주소 및 전망에 대해 지면을 통해 들어보는 자리를 마련했다.

 

 


<참여자> (가나다순)
- 금기돈 악사다이렉트 CRM팀장
- 김승욱 기상청 융합서비스팀 연구원
- 김정선 SK텔레콤(SKT) 인텔리전스사업팀 부장
- 문석현 쿠팡 PO
- 백승민 통계분석연구회(다음카페) 운영자
- 유충현 한화생명 빅데이터TF 차장
- 유혁 윌로우데이터스트레티지(WillowDataStrategy, 이하 윌로우DS) 대표
- 윤석용 포스코경영연구소(POSRI) 부장
- 이정현 한국데이터베이스진흥원 창의인재개발실장
- 이정훈 열정팩토리 대표
- 임상배 한국오라클 부장
- 전용준 리비젼컨설팅 대표
- 전희원 SK텔레콤(SKT) 데이터테크랩 매니저
- 정성원 데이타솔루션 이사
- 허명회 고려대학교 통계학 교수

 

 

   
 


빅데이터에 대한 관심에 비해 민간 기업의 투자가 활발하지 않은 이유는.

 

“과거의 데이터 분석 인프라 투자 관련 시행착오로부터 비롯된 소극적인 접근, 빅데이터에 대한 몰이해, 데이터 사이언티스트 부족 등이 겹쳐 빚어진 현상이다”

 


데이터 사이언티스트들 중 상당수는 2000년대 초반 데이터웨어하우스(DW) 및 CRM 등 분석 인프라에 대한 투자에서 실패한 경험으로 인해, 현재 많은 민간 기업들이 빅데이터 관련 ROI(투자수익률)에 대한 확신이 없는 상태라 투자가 활발하지 않다고 답했다.

 

 

금기돈 악사다이렉트 팀장은 전사적인 구축에 앞서 업무 부문별로 무엇을 개선할 수 있는지에 대한 실질적인 ROI를 고려해 바텀-업(Bottom-up) 방식으로 신중하게 접근하는 것이 이전과 달라진 점이라고 밝혔다.

 

 

백승민 통계분석연구회 운영자도 장기간의 충분한 투자를 통해 분석문화 형성에 따른 인식전환 등 유·무형의 결실을 보기까지 지켜볼 필요가 있다는 입장이다.

 

 

유충현 한화생명 차장은 이러한 현상이 기업 내부의 데이터 분석 기반의 의사결정 프로세스가 취약한 것에 기인한다고 분석했다. 데이터 분석 인력과 조직을 양성하는 것보다는 외부 업체의 용역을 통한 프로젝트를 경험하다보니 자생적으로 청사진을 그리는데 한계가 있었고, 외부의 벤더와 분석가들도 경험 부족으로 니즈에 부응하지 못했다는 것이다.

 

 

 

이와 같은 맥락으로 데이터 사이언티스트의 부족을 원인으로 꼽는 인원도 적지 않았다. 윤석용 POSRI 부장은 내부 전문인력의 부족으로 인해 선순환 모델이 만들어지지 못하고 있는 점을 짚었다. 나아가 허명회 고려대 교수는 사회와 기업에서 이런 고급인력에 상응하는 대우를 하지 않기 때문이라고 역설했다.

 

 

 

빅데이터에 대한 몰이해도 문제로 제기됐다. 전용준 리비젼컨설팅 대표는 기업들이 열심히 공부하거나 많은 사례를 깊이 검토하지 않아서 스스로 활용방안을 선명하게 그려내지 못하는 것이라고 꼬집었다. 전희원 SKT 매니저 또한 플랫폼 도입이나 특정 SNS 텍스트 데이터 분석만으로 큰 효과를 볼 것으로 예상하는 접근 방식을 문제 삼았다.

 

 

 

한편, 유혁 윌로우DS 대표는 어떤 식으로 데이터를 다루고 어디에 투자해야 실질적인 가치가 창출되는지에 대한 대답이 나와 있지 않기 때문이며, 더욱이 빅데이터에 대해 IT적으로 크고 빠르고 다양한 것만을 강조하다보니 투자가들이 쉽게 그 개념을 수익과 연관시키지 못하고 있다고 풀이했다.

 

 

 

빅데이터를 보유한 기관이 희소하기 때문이라는 의견도 있었다. 김정선 SKT 부장은 빅데이터라고 할 만한 데이터를 수집 및 분석 가능한 기업이 국내에 많지 않으며, 대개는 기존의 방식으로도 충분하기 때문이라고 설명했다. 이정현 한국DB진흥원 실장도 빅데이터라고 할 만한 데이터를 생산하거나 보유한 기관은 아직 많지 않으며, 그마저도 공공부문에 상당수 집중돼있다고 밝혔다. 이밖에도, 경기 침체 및 시장 상황 등 현실적인 어려움도 이유 중에 꼽혔다.

 

 

빅데이터가 실질적인 가치로 연결되기 위해서는 시장에 어떠한 변화가 필요한가.

“먼저 사람을 중심으로 투자해야 하고, 적극적으로 움직여야 된다”

 

 


인력의 육성과, 이를 뒷받침해줄 조직문화 등의 필요성이 가장 많은 공감을 얻었다. 빅데이터에 대한 회의적인 시각이 늘어감에도 혜택을 보는 기업들이 있는데, 이는 사람의 역량 차이라는 게 전희원 SKT 매니저의 설명이다.

 

 

 

정성원 데이타솔루션 이사는 빅데이터가 산업이나 기업에 따라 정의부터 업무영역과 효과까지 다양하고 공통점도 상대적으로 적어서 이를 실질적인 가치로 연결시키기 어려우며, 외부 전문가들이 이를 파악해 제안하기란 쉽지 않기에, 내부 분석인력을 키우는 것이 선행돼야 한다고 밝혔다.

 

 

 

문석현 쿠팡 PO는 국내 기업들이 데이터를 비즈니스에 활용하지 못하는 것은 시스템이나 인프라가 없어서가 아니라, 데이터로부터 나온 지식과 정보가 의사결정에 제대로 반영되지 않기 때문이라고 말했다. 데이터 분석은 시스템이 아니라 사람이 하는 것이기에, 사람에 먼저 투자해서 성과를 보여준 후, 이를 바탕으로 다시 시스템에 투자하는 선순환을 이끌어내야 된다는 것이다.

 

 

 

유충현 한화생명 차장은 빅데이터 투자는 미래 관점의 장기적인 계획에서 시작돼야 하므로, 반드시 성공할 수 있다는 신념 아래 시행착오를 거쳐 배워나간다는 마음가짐이 필요하다고 조언했다. 솔루션은 수단일 뿐, 데이터 분석 인력의 양성과 전문조직의 구성이 핵심으로, 공급자도 솔루션이 아니라 경험을 팔아야 한다고 부연했다.

 

 

보다 적극적인 움직임을 요청하는 주문도 이어졌다. 전용준 리비젼컨설팅 대표는 여전히 데이터만 대량으로 쌓아두거나 단순히 집계해서 눈으로 보는 수준에 머물러 있는 기업들이 많다고 지적했다. 분석은 빅데이터에 응당 포함되는 것으로, 분석을 통해 예측이든 개인화든 최적화든 해야 데이터가 가치로 변화될 수 있다는 것이다.

 

 

 

윤석용 POSRI 부장도 적극적인 공공데이터 개방 및 활용의 필요성을 제시하는 한편, 데이터 기반 의사결정문화가 자리 잡기 위해서는 데이터 품질과 신뢰도를 높이기 위한 데이터 거버넌스 체계의 구축도 필요하다고 주장했다.

 

 

 

임상배 한국오라클 부장은 더 이상 빅데이터에 대한 투자를 미루면 글로벌 시장에서 활발하게 이뤄지는 산업과 IT 간의 융복합 흐름에서 낙오돼, 글로벌 경쟁력을 잃을 수 있다는 위기감을 인지할 필요가 있다고 설명했다. 국내에만 눈을 두기보다는, 해외의 빅데이터를 활용한 비즈니스 성공사례를 검토해 벤치마킹하는 시도를 권했다.

 

 

 

이정훈 열정팩토리 대표는 어떤 데이터를 왜 수집하는지가 명확해야 하고, 그것을 바로 가설로 바꿔 실제로 시험할 수 있는 프로덕트가 먼저 준비돼야 할 필요성을 이야기했다. 이러한 구조가 생겨야 실제 시장에서 빅데이터를 사용자 및 소비자들이 체험할 수 있다는 이유에서다.

 

 

 

아울러, 적지 않은 인원이 국내의 개인정보 관련 제도에 대해 아쉬움을 표했다. 데이터 거래의 활성화 및 내·외부 데이터 융합의 필요성을 제시한 김승욱 기상청 연구원은 개인정보 비식별화 작업이 이뤄져야 한다고 강조했다. 시간이 갈수록 분석 가능한 데이터는 증가하고 있지만, 개인정보보호법을 의식해 데이터 분석이 원활하게 진행되지 못하고 있는 실정이기 때문이다.

 

 

 

해당 비즈니스에 대한 이해를 바탕으로 한 분석인재 확충과 분석문화의 정착을 주장한 백승민 통계분석연구회 운영자 또한 개인정보보호에 대한 빠른 교통정리를 통해 양질의 정보가 보다 전향적으로 사용되기를 바랐다. 통계청의 인구주택총조사나 가계금융·복지조사 등의 자료들이 법적 테두리 안에서 보다 세부적으로 공개된다면 다양한 영역에서 새로운 가치를 창출할 수 있으리라 예상했다. 이밖에도, 빅데이터 성공사례의 마련과 전파의 필요성이 거론됐다.

 

 

 

빅데이터 시장의 활성화와 관련해 공급자(벤더) 측에서 반성할 부분이 있다면.

“단기적인 마케팅 위주의 행태가 만연, 벤더도 자체적으로 충분한 역량 갖춰야”

 

 


벤더에 대한 불만으로는 단기적인 마케팅 위주의 행태를 가장 많이 택했다. 빅데이터 기술수용에서의 기술 이용자와 활용자 측면의 차이에 대한 논문으로 박사학위를 받은 김정선 SKT 부장은 공급자 측면이 보다 다양해져야 한다고 논했다. 고객사가 원하는 비즈니스적 가치까지 명확히 짚어줄 수 있어야 한다는 것이다.

 

 

유혁 윌로우DS 대표는 빅데이터를 요술방망이 같은 존재처럼 광고하고 다닌 것부터 반성해야 하며, 툴셋만 사면 데이터와 분석이 저절로 된다는 것은 마치 고급 악기만 들면 다 세계적 연주가라는 것과 같다고 꼬집었다. 벤더(vendor)와 전문가(data strategist / consultant)의 기본적인 차이는, 후자는 특정 상품의 판매와 상관없이 목적에 대한 해결책 자체를 제시하는 점이라고 덧붙였다.

 

 

 

전용준 리비젼컨설팅 대표도 벤더들이 오랫동안 과장된 이야기로 당장의 매출을 올리는데 급급해왔으나, 이미 그런 이야기를 믿어줄 시장도 사라져가고 있고, 설사 믿어준다고 해도 그렇게 얻어진 시장이 지속되거나 성장하지는 않을 것이라고 비판했다. 분석은 SW나 HW만으로 가치가 나오지 않기에 벤더들 스스로 사업모델을 변화해야 하며, 아니면 큰 위기를 맞을 수 있다는 견해다.

 

 

 

문석현 쿠팡 PO는 많은 벤더가 시스템 구축 후 검수 받고서 돈이 들어오면 이후는 나 몰라라 하는데, 결국 신뢰를 잃게 되고 장기적으로는 돌이킬 수 없는 결과가 될 것이라고 경고했다. 또 금기돈 악사다이렉트 팀장은 최근 빅데이터 세미나에 가보면 빅데이터를 위해선 시설 투자가 선결 조건인 듯 느낌을 받는 반면, 실질적인 사례들은 내부 자료의 고도화를 통한 프로세스 개선이 많다고 술회했다.

 

 

벤더도 자체적으로 충분한 역량을 갖춰야 한다는 주장에도 무게가 실렸다. 특히, 자체적인 전문인력 양성을 위한 노력이 요구된다고 입을 모았다. 정성원 데이타솔루션 이사는 벤더도 상당부분 연구개발에 투자해야 빅데이터를 도입하려는 기업에게 실질적인 가치를 일깨워줄 수 있다고 설명했다.

 

 

윤석용 POSRI 부장은 초기 시장에서 벤더들이 기업에게 빅데이터 솔루션이나 서비스의 일관된 방향성과 지속성에 대한 확신을 주고 감내할 수 있는 가격을 형성해줘야 하는데, 현재는 이러한 부분에서 의문스럽다고 밝혔다. 2013년에 이어 2014년에도 대기업 중심으로 빅데이터 PoC 과제가 다수 진행됐지만, 과제를 수행하는 유수의 전문업체들이 자체 전문인력 부재로 품질목표를 맞추지 못해 좋지 않은 평가를 받고 있다는 것이다.

 

 

유충현 한화생명 차장은 수많은 솔루션들과 데이터 관련 인력들이 빅데이터로 포장돼 난립하는 현 시장에서도 아직 뚜렷하게 리드하는 벤더가 없는 것을 두고, 아직 벤더가 시장을 열지 못한 것이라고 분석했다. 제각기 다른 그림으로 고객을 혼란스럽게 했으며, 이 또한 경험 및 인력의 부족에 기인한다는 지적이다.

 

 

한편, 전희원 SKT 매니저는 벤더 측에서 자승자박한 것이라고 평했다. 플랫폼만 있으면 빅데이터를 분석하고 활용하는데 충분하다는 인식을 고객사에 급하게 심어줘서, 그 효용성을 맛보기 위한 필수 조건인 데이터 분석가에 대한 가치를 폄하시켜버렸고, 이 때문에 충분히 숙련된 사람을 구하기 어려워져 분석 플랫폼이 있어도 충분히 활용하지 못하고 있다는 해석이다.

 

 

이밖에도, 백승민 통계분석연구회 운영자는 현재 빅데이터 관련 사례가 대부분 미국 등 외국 사례를 기반으로 소개되고 있지만 국내 시장과는 많은 차이가 있는 점을 짚으며, 공급자로서 장기적인 안목으로 시장을 바라보면서 정부와 기업 및 학계를 잇는 가교 역할을 수행해주기를 바랐다.

 

지난 2014년 국내 빅데이터 사례 중, 가장 성공적이라고 여겨지는 사업을 꼽는다면.

여러 사례가 선정됐지만 “딱히 눈에 띄지 않는다”, “잘 모르겠다” 등의 응답도 다수

 


금기돈 악사다이렉트 팀장은 새롭게 개발된 빅데이터 사례보다는 기존의 프로세스를 고도화해 적용된 사례들이 많은 것으로 봤으며, 특히 금융권의 사기적발 프로세스를 성공적이라고 평가했다.

 

 

김승욱 기상청 연구원은 서울시의 심야버스 노선 신설 건을 택했다. 자칫 이해관계가 복잡하게 얽혀 제대로 된 서비스를 못 할 수도 있었는데, 빅데이터 분석 결과를 근거로 철저하게 객관적인 결과물이 도출됐기 때문에 가능했던 일이라고 덧붙였다.

 

 

김정선 SKT 부장은 SKT와 정보화진흥원(NIA), 보건사회연구원이 함께 분석한 온라인 소셜 상에서의 청소년 자살 징후 분석 및 대응체계를 꼽았다. 이 프로젝트는 자살 징후 스코어링을 통해 예측모델을 개발 중에 있으며, 올해 실제 시스템 구축으로 이어질 예정이다.

 

 

윤석용 POSRI 부장은 발표되는 빅데이터 성공사례들이 일회성 또는 전시성인 것들이 많은 점에 우려를 표했다. 하지만, 경기도에서 추진했던 빅데이터 ISP과제는 비록 가시적으로 크게 노출되지는 않았지만 경기도의 빅파이 프로젝트의 일환으로, 빅데이터를 체계적으로 추진하려는 의지와 구체적인 실행계획을 제시했다는 측면에서 높은 점수를 주고 싶다고 밝혔다.

 

 

전용준 리비젼컨설팅 대표는 스타트업 왓챠를 지목했다. 네이버보다 많은 별점을 바탕으로 영화추천이라는 진정한 빅데이터성의 종목에서 지속운영 가능한 수준의 서비스가 등장한 것이 고무적이라는 평이다.

 

 

정성원 데이타솔루션 이사는 안전행정부가 주관의 빅데이터 공통기반 및 시범과제 구축사업 중 통계청 BPP 물가지수 산출 시스템 구축사례를 들었다. BPP물가지수는 통계청이 오프라인에서 조사해 산출한 기존 소비자물가지수의 한계를 보완하기 위해 개발된 온라인 물가지수로, 자동화된 시스템으로 매일 온라인 가격정보 수집을 통해 산출된다.

 

 


이 시스템에는 웹페이지 URL을 구성하는 HTML을 수집하는 웹 스크랩핑 기술이 적용됐다. 온라인상의 대표적인 쇼핑 웹사이트에 제시된 상품들의 가격정보 데이터를 수집, 이를 기반으로 신속하게 온라인 물가지수를 산출해 공표한다. 소비자의 구매패턴을 일일 단위로 반영해 소비자의 구매패턴 변화 형태도 파악할 수 있다.

 

 

한편, 백승민 통계분석연구회 운영자는 이색적으로 교육과 홍보 분야를 골랐다. 올해 다음카페 통계분석연구회가 15주년을 맞이하는데, 지난 2014년처럼 언론 매체와 사회 전반에서 데이터와 분석이라는 내용이 자연스럽게 회자된 것은 처음이라고 설명했다. 더불어, 분석 문화에 대한 관심이 한때의 유행이 아니라 끊임없이 지속되기를 희망했다.

 

2015년 데이터 사이언스 시장은 어떻게 달라질 것으로 보는가.

“중요한 갈림길이 될 한 해”

 

 


데이터 사이언티스트들은 2015년이 국내 데이터 사이언스 시장의 중요한 갈림길이 될 한 해로 인식하고 있다. 유혁 윌로우DS 대표는 빅데이터에 대한 질문을 새로 한다는 것 자체를 고무적이라고 평했다. 그간의 데이터 산업 전반을 일깨우는 과정을 지나, 이제는 의사결정자들과 공급자들이 보다 가까워져 함께 로드맵을 새로 짜면서 산업의 생태계를 마련해야 한다고 강조했다.

 

 

전용준 리비젼컨설팅 대표도 2015년이 데이터 사이언스가 시장의 주류로 부상하는 원년이 될 것으로 내다봤다. 빅데이터를 대신해 예측분석 중심의 데이터 사이언스에 관심이 집중될 것이고, 데이터 사이언티스트들이 데이터를 실제로 다각적으로 분석하기 시작한다면 분명 구체적인 변화가 보여질 것이라고 전망했다.

 

 

이정현 한국DB진흥원 실장 또한 데이터 사이언스의 대중화는 어느 정도 성공했다고 평가했다. 그러나 이제는 기술적으로도 산업적으로도 유의미한 결과들이 나와야 하는 시점인데 아직까지는 더딘 느낌이라며, 한국형 성공사례와 실패사례들이 더 많이 공론화돼야 한다고 덧붙였다.

 

 

경기가 좋지 않아도 데이터 사이언스 시장은 성장할 것이라는 의견도 나왔다. 유충현 한화생명 차장은 국내 기업들이 데이터 분석을 통해 돌파구를 찾으려는 시도는 늦추지 않을 것이며, IoT(사물인터넷)도 빅데이터와 함께 데이터 사이언스 시장의 재료가 될 것이라고 밝혔다. 또한 이를 위해 데이터 분석가의 수급 불균형, 시니어 분석가 등 경험 있는 분석가 부족, 프로젝트에서 데이터 분석가의 단가가 낮게 책정되는 문제 등이 개선돼야 한다고 강조했다.

 

 

윤석용 POSRI 부장도 2013년까지를 빅데이터 초기단계로 설정한다면 2014년은 진입단계고 2015년부터는 초기 성장단계라며, 대기업과 공공을 중심으로 빅데이터 과제들이 어느 정도 출현하고 일부 중견기업들의 성공사례도 발표되리라 예상했다. 2015년 경제 전망이 좋지 않은 상황에서 기업들이 도전적으로 빅데이터 과제를 오픈하기는 어렵겠지만, 빅데이터 시장은 2014년에 비해 진일보할 것으로 바라봤다.

 

 

올해의 데이터 사이언스 시장에 대해 조심스러운 시선도 있었다. 정성원 데이타솔루션 이사는 2015년에는 공공분야가 아닌 일반기업에서도 빅데이터 시범사업이 활발히 추진되길 바라지만, 여전히 기업은 조금 더 관망하는 자세이거나 오히려 빅데이터 추진을 포기하는 상황이 벌어지는 것을 우려했다.

 

 

전희원 SKT 매니저도 데이터 기반 의사결정의 가치를 아는 기업들이 많은 투자와 준비를 할 한 해가 되겠지만, 몇몇 PoC 실패와 플랫폼 도입만으로 그 가치를 얻지 못한 기업들은 데이터 사이언스에 대해 회의적인 시각에서 투자를 하지 않을 것이라고 봤다. 2015년은 이 두 가지 시각이 갈리는 시기가 될 것이며, 2016년에 이에 대한 결과가 산술적인 가치로 나타날 것으로 예측했다.

 

 

이와 함께 국내 데이터 사이언스의 발전을 기대하는 시선도 있었다. 김정선 SKT 부장은 데이터 엔지니어링 개념으로 기운 국내 데이터 사이언스에 있어 데이터 사이언티픽 리서치의 중요성을 언급했으며, 백승민 통계분석연구회 운영자는 많은 영역에서 내부 데이터와 외부 데이터의 만남 및 분석 관련 조직 등이 화두가 될 것이라고 내다봤다.

 

 

 

 

데이터 사이언티스트 부족이 심각한 문제라는 목소리에 대한 의견과, 이에 대한 해결책은.

대부분 데이터 사이언티스트 부족에 공감, 다양한 해결책 제시

 

 


대부분의 데이터 사이언티스트들은 현재 데이터 사이언티스트가 부족하다는데 공감했다. 그 해결책으로 허명회 고려대 교수는 범사회적 창의력의 배양, 수평적 지식소통의 문화, 지식시장의 거래질서를 꼽았다.

 

 

 

전용준 리비젼컨설팅 대표는 현재 국내 데이터 사이언티스트가 몇백명 수준으로, 경험 부족까지 고려하면 질적으로도 획기적인 향상이 요구되며, 이론과 실전을 겸비한 데이터 사이언티스트가 수천명은 필요할 것이라고 밝혔다. 이를 빠른 시간 내 조절하는 방법으로 고급수준의 체계적 교육훈련 시스템 도입과, 해외 인력 활용의 두 가지를 들면서, 현재 필요한 것은 데이터 사이언스의 결과물이라고 강조했다.

 

 

정성원 데이타솔루션 이사는 5,000명은 족히 필요하지만 현재 다 합쳐서 1,000명도 안 될 정도로 부족하다고 설명했다. 수적인 측면 못지않게 질적인 측면도 부족해 기존 고급인력의 경험을 어떻게 새롭게 사회로 진출하는 인력에게 전이시킬 것인가가 가장 큰 관건이라며, 정부기관 및 산하기관들이 보여주기 식의 빅데이터 시범사업보다는 데이터사이언티스트 양성에 주력할 것을 주문했다.

 

 

금기돈 악사다이렉트 팀장은 데이터 활용 위주의 업무중심 분석가와 수리 통계적 데이터 분석가 모두 부족하다며, 해외의 캐글(Kaggle) 등의 사례처럼 분석 커뮤니티 구축을 통해 산학협동으로 인력을 양성하는 것이 데이터 사이언티스트의 질과 양 모두 보다 좋은 결과를 얻을 것이라고 제안했다.

 

 

임상배 한국오라클 부장은 아직 국내 데이터 분석 시장이 규모도 작고 기술적으로도 발전이 더딘 만큼 관련 국제적 경쟁력을 갖춘 실력 있는 국내 데이터 사이언티스트의 육성을 위해서는 전 국가적인 노력과 지원이 필요하다고 주장했다. 또 무엇보다 전문 인력을 길러낼 교수진이 부족한 만큼 실력 있는 데이터 사이언티스트를 스카우트하는 것도 좋은 방법으로 꼽았다.

 

 

인력을 키울 수 있는 환경부터 마련해야 된다는 목소리도 높았다. 백승민 통계분석연구회 운영자는 분석 관련 사업 영역이 확대되고 기대에 걸맞은 혜택이 충족되면 자생적으로 인력 부분에 대한 문제는 해결될 것이라고 예상했다. 지금부터 준비해야 할 문제는 전통 조직 안에 분석 조직을 포용할 수 있는 문화적 토대와, 분석 문화 형성을 위한 경영진의 장기적인 지원 및 신뢰라는 설명이다.

 

 

유충현 한화생명 차장은 스스로 데이터를 추출·변형·가공할 수 있는 스킬이 있는가의 여부로 데이터 사이언티스트를 구분한다며, 수가 많고 적음의 문제보다는 데이터 사이언티스트를 키워낼 수 있는 환경이 부실한 것이 문제라고 지적했다. 부족한 시니어 데이터 사이언티스트만을 찾지 말고 육성에 힘써야 한다고 덧붙였다.

 

 

김정선 SKT 부장은 공공과 민간영역에서 보다 실질적인 사례 중심의 교육과정을 여는 것이 필요하다고 이야기했다. 학교에서는 여건상 빅데이터 수집·분석·활용 과정 전체를 경험할 수 있는 학습 환경을 제공하기 어려우므로, 민간·공공기관에서 이를 제공하는 제도 및 정책적 지원이 필요하다는 것이다.

 

 

반면, 데이터 사이언티스트의 수가 부족하지 않다거나, 지나치게 많아질 필요는 없다는 취지 등으로도 다양한 의견이 제시됐다. 김승욱 기상청 연구원은 여러 빅데이터 분석 대회에서 발군의 실력을 발휘하는 입상자와 참가자들 모두가 데이터 사이언티스트이므로 부족하지 않다고 설명했다. 스몰데이터조차 분석하지 않은 채 빅데이터만 바라보고 각종 장비와 솔루션을 도입 후, 그 도구들을 운용할 수 있는 경력자와 비정상적인 고스펙 신입사원을 뽑으려고 하는 현상이 더 문제라는 것이다.

 

 

 

문석현 쿠팡 PO 또한 실제로 비즈니스 현장에서 데이터 사이언티스트가 어떻게 일을 하는지조차 모르는 것부터 문제라고 말했다. 흔히들 고등수학을 자유자재로 구사하는 통계전문가를 상상하지만, 간단한 과정을 거쳐도 중요한 인사이트가 나올 수 있는 일들이 80%를 차지한다고 부연했다. 더 중요한 문제는 경영진이 궁금해 하는 것이 무엇인지를 이해하고 데이터로 어떻게 풀어낼 것인가로, 의사결정권자와 꾸준히 피드백을 주고받으며 전문성을 키워나갈 수 있도록 자체적으로 육성하는 것을 추천했다.

 

 

 

이와 달리 전희원 SKT 매니저는 가치 있는 결과물을 도출하는 데이터 사이언티스트가 되기 위해서는 데이터 기반 의사결정의 가치에 대한 충분한 고민과 경험, 분석도구를 다루는 능력, 통계적 지식 및 업무지식, 시행착오와 숙달과정 등이 필요한데, 성급한 교육과정만으로 인원수만 많아진다면 자승자박의 결과를 초래해 기업들이 데이터 사이언스에 투자하기를 꺼리게 될 수 있다고 우려했다. 아울러, 충분한 역량을 지닌 핵심 인재의 영입을 통해 구성원들이 도움을 받아 상향평준화를 이루는 것을 바람직한 육성 방향으로 제시했다.

 

 

 

한편, 유혁 윌로우DS 대표는 데이터 사이언티스트가 되기를 바라는 젊은이들을 대상으로, 일단 기본적인 지식을 갖춘 다음에 창업자나 소비자의 입장에서 세상을 볼 수 있도록 다양한 경험을 쌓으라고 권했다. 인문 서적도 많이 읽고, 영화도 많이 보며, 창업해서 돈 버는 방법에 대한 생각도 해보고, 여러 나라를 다녀보며 다른 환경에서 소비자가 돼보라는 것이다. 이러한 부분은 장기적 투자로 봐야 하며, 부모와 학계의 교육에 대한 발상 전환도 필요하다고 덧붙였다. 앞으로 데이터 가공과 관련해 많은 부분이 자동화될 수는 있어도, 질문을 제대로 하고 분석결과를 사업에 적용하는 것은 여전히 사람의 몫이기 때문이다.

 

  • 2014년 12월 31일(수) 23:49:59 팽동현 기자 dhppp@itdaily.kr

빅데이터 시대를 사는 젊은 감정평가사가 통계를 공부하는 이유|자유게시판(공통)

Lest I Forget | | 조회 347 |추천 0 | 2015.01.04. 11:49 http://cafe.daum.net/appraisal/6ol/31058 

 

 

시험합격과 동시에 취업시장에 뛰어들면서, 제한적으로나마 평가업계의 녹록치 않은 상황을 체감하게 됩니다.

기득권처럼 여겨지던 법령에 의해 보호되던 평가업무는 점차 비중이 감소하고, 부동산시장을 둘러싼 전방/후방 산업 모두 침체에서 벗어날 기미는 보이지 않습니다. 4천명에 육박하는 현직 평가사들의 신규진입자에 대한 경계어린 시선도 기우(杞憂)는 아닌거 같습니다.

 

이제 평가업계의 문을 두드리는 젊은 수습평가사의 고민은 커져만 갑니다.

수험계보다 생존경쟁이 치열할 평가업계에서, 향후 30년,40년어떻게 대응해야 할까요?

잔말 말고 수습평가사로서 주어진 업무나 열심히 하라고요? 네! 그렇게 하겠습니다.

하지만 수년을 기다려 감정평가사가 되기를 희망했다면, 수십년을 보내게 될 감정평가사로서의 삶을 예측하고 계획할 권리도 있습니다.

 

'부동산시장 패러다임'이라는 수험시절의 거창한 표현이 아니더라도, 이미 수험계 밖에는 '빅데이터' , '정부 3.0', '부동산종합공부' 등의 구체적인 정보화 바람이 확산되고 있습니다. 데이터가 보다 중요해질수록, 데이터가 보다 많아질수록, 이러한 데이터를 수집하고 수치화하여 이를 분석하고 합리적 의사결정을 이끌어내는 통계적 능력은 향후 30년,40년을 이끌어갈 젊은 감정평가사에게 중요한 덕목(?)이 아닐까 생각해봅니다.

 

한국부동산연구원 원장(조춘순)은 감정평가사를 위한 통계학 입문(2013)」 서문에서 이렇게 말하고 있습니다.

 

 "전통적인 감정평가 3방식 접근법은 실무에서 널리 활용되고 있지만 아쉽게도 시장자료에 근거한 실증분석이나 계량적 평가방식은 충분히 이루어지지 않고 있는 것이 현실이다. 또한 선진국에서는 평가 및 매매사례에 관한 정보를 쉽게 접근할 수 있어 계량적 평가기법을 통한 감정평가가 일반화되어 있으나, 우리는 현재 정보화 사회가 요구하는 패러다임에 맞출 수 있는 선진 평가기법에 대한 관심과 이를 뒷받침하는 감정평가 정보구축이 부족한 실정이다.

 

최근 들어 정부와 감정평가업계는 감정평가의 공정성과 신뢰성 제고를 위하여 감정평가정보체계를 구축하고 입체적 부동산 정보 및 통계의 선진화를 위해 노력하고 있다. 이제는 감정평가사도 방대한 자료를 평가에 활용할 수 있도록 통계적 지식을 갖추고 우리나라 실정에 맞는 계량적 평가기법을 연구하여 전문성과 독립성을 다져갈 준비를 해야 할 것이다.

 

미국 Appraisal Institute에서는 가치평가에 도움을 주는 수학 및 통계학 등과 같은 기초학문 책자를 발간하고 있으며, 실무에 계량적 평가방법을 다방면에서 활용할 수 있도록 '감정평가의, 감정평가에 의한, 감정평가를 위한' 통계학 연구 및 교육이 필요하다." (이하 생략) 

 

 

아래는 이용훈 평가사님께서 법률저널에 기고하신 '빅데이터 시대와 감정평가'라는 제목의 글입니다.^^

 

빅 데이터 시대와 감정평가(이용훈 감정평가사, 법률저널 2013.10.18)

 

 

자료가 불충분해 결론을 못 내리는 것보다 결론은 정해졌지만 이를 지지해 줄 데이터를 구할 수 없을 때가 실로 난감한 상황이다. 핵심적인 데이터가 보이지 않는다면 앞은 더 캄캄하다. 토지를 거래사례비교법으로 평가한다 치면, 이 핵심적인 데이터는 인근 지가 수준에 부합하는 적합한 ‘거래사례’라 말할 수 있다. 인근 지가 수준은 방매물건(팔려고 내 놓은 매도 희망가, 구입의사를 내비친 매수 희망가)을 통해 확인해 볼 수 있다. 또 경매로 나온 물건이 낙찰된 사례는 몇몇 유료 사이트를 통해 입수 가능하다. 확실한 건 거래될 수 있는 가격이 낙찰금액을 최하한선으로 볼 때 매수희망가와 매도희망가 사이 어디쯤인가 위치할 것이라는 점이다. 그러니 이 범위에 들어오는 적절한 거래사례만 있으면 이미 평가자의 맘에 정해진 결론을 도출할 마지막 퍼즐이 맞춰지는 셈이다.

 

한 철강회사가 인수하는 태국 현지 철강회사의 실사 및 감정평가를 진행한 적이 있다. 현지 평가법인과 공조하게 되었는데, 각국마다 평가기준이 달라 태국이라는 나라는 어떤 식으로 감정평가를 수행하는지 내심 호기심 반 기대 반 이었다. 현지 평가사와 이런저런 얘기를 나누던 중 최근 몇 년 간 큰 평수의 공장부지는 거의 매매가 되지 않았다는 사실을 알았다. 의아했던 건 태연히 그런 말을 하는 평가사의 표정이었다. 거래사례비교법으로 평가하려면 비교가능성이 높은 대형 평수 공장부지 매매사례를 포착해야 할 텐데 거래도 없었다면서 무슨 수로 평가하려고 저리 태평일까 내심 걱정됐다. 평가 과정을 가만히 살펴보니 그들은 매매가 완료된 사례가 없으면 팔려고 내놓은 매물가격을 유추해 거래 예정가격을 추정하는 것이었다. 평가자가 구하는 가치가 ‘거래가 있을 경우 성립될 가능성이 가장 높다고 인정되는 가액’이라면 1년째 방매중인 사례가격은 거래가 성사되려면 조금 더 하향해야 되고, 2~3년 째 매물상태라면 매도희망가를 더 낮춰서 거래 예정가격을 정하는 식이다.

 

가끔 참고할 만한 거래사례를 검색하다가 문득 방매사례를 활용하는 방법이 없을까 고민해 본 적이 있다. 어떤 시점에서 매물의 양이 얼마나 되는지, 방매기간에 따라 매물로 내놓은 매도 희망가가 어떻게 바뀌는지 전국적인 차원의 데이터가 축적되었다면 굳이 최근에 거래가 완료된 사례가 아니더라도, 계약 체결된 사례와 과거 계약이 이루어질 당시 방매 동향과의 연관성을 밝힌다면, 현재 방매 동향을 통해 거래가능가격을 유추해 볼 여지가 없을까 하는 고민이다. 그런데 이미 이런 고민은 여러 분야에서 현실화되었고 현실화 될 예정이다.

 

IT를 본적지로 삼고 있는 ‘빅 데이터’라는 용어는 기존의 분석도구나 관리체계를 활용해서는 감당해 낼 수 없을 정도의 막대한 양의 정보를 뜻하는 말이다. 트위터에서 매일 1억 개 이상의 트윗이 이뤄지고 유튜브에서는 40억 회 가까운 검색이 날마다 이뤄진다고 알려져 있는데, 트윗의 내용과 검색 동영상이 어떤 것인지와 참여자의 신상 정보를 연결시킬 수 있다면 우린 무얼 기대할 수 있을까. 최소한 현 시점 시장에서의 선호도, 구매력을 지닌 자들의 관심사 정도는 밝혀낼 수 있을 것이다. 그렇다면 부동산을 비롯한 자산 가치를 평가하는 감정평가 영역에도 분명 빅 데이터가 끼치는 영향이 있을 것이다.

 

10월 17일부터 19일까지 일본 나고야에서 개최되는 제1회 한·일·중 감정평가협력회의는 이런 대용량 정보 활용의 추세와 부합하는 주제를 선정한 듯하다. 모든 협력회의가 그렇듯이 같은 업을 영위하는 자들이 상호 간 친선을 도모하고 정보를 교환해 업계 발전을 도모하자는 취지의 모임이지만 여기서 다뤄지는 주제는 눈여겨 볼만하다. 본 회의에서 제1주제로 ‘인구와 부동산 시장가치’, 제2주제로 ‘지속가능한 경제에 있어 부동산 가격의 동향’이 발표된다. ‘지속가능’이란 테마 역시 현 시대 경제, 산업분야의 화두라 이를 부동산 가격 동향과 연결시킨 점은 시의적절하다. 그러나 무엇보다 인구의 변화에 부동산 시장가치가 어떻게 연동되는지를 분석하는 제 1주제는 철저히 빅 데이터의 조합이라고 말할 수 있다. 감정평가업계가 이런 빅 데이터를 활용하고 분석하려는 연구에까지 이르렀다면 이제 현 시점의 자산 가치 추계뿐만 아니라 향후 가치의 변동과 예측을 시도해 볼 수 있는 장(場)이 마련된 게 아닐까 조심스레 전망해 본다.

 

부동산통계에 관심있는 2,30대의 25기분들께서는 아래의 스터디모임 까페를 찾아주세요.^^

'좋은 감정평가사로 살아남기'

http://cafe.daum.net/excellent-appraiser

 

 

업계를 들어와보면 빅데이터를 감정평가에 활용하려는 움직임

 

 

행동경제학을 통한 부동산 가치에 대한 연구가 극소수의 감정평가사님들에 연구되고 있는 상황이라는 사실을 알게 될 것이다.

 

 

제발 부디 25기 감정평가사들은 통계학에 대한 지금의 관심을 끝까지 유지하여 통계의 전문가가 되기를 소망한다.

 

 

연수기간 2달동안은 집체교육이라 이런 열정가득한 행동이 가능할 수 있으나, 집체교육 후반기 쯤에는 서서히 초심을 잃어가는 경우를 많이 보았다.

 

 

3월부터 각자 법인으로 뿔뿔히 흩어지는 상황이 오고나면 더더욱 공부의 의지가 없어지게 된다.

 

공부를 하도록 법인이 시간을 주지도 않을 것이다.

 

 

위의 '좋은 감정평가사로 살아남기' 모임이 지속되길 기원한다.

 

 

 

 

시계열분석.pdf

 

시계열분석.pdf
0.7MB

국내외 분석 자격증 소개


* http://cafe.daum.net/statsas/KqTP/335


국내에도 통계 분석 관련 자격증이 새롭게 등장하고 있습니다. 새로운 자격증 도전에 관심있는 분들 참고하시기를 바랍니다.

 


통계 진로에 대한 추가 정보는 통계분석연구회(http://cafe.daum.net/statsas) 통계진로게시판을 참고해주시기를 바랍니다.

 



* 데이터 분석 전문가/준전문가 자격증(데이터베이스 진흥원)
http://www.dbguide.net/da.db?cmd=snb_adp_4


* 경영 빅데이터 분석사(한국경제)
http://www.bigtest.or.kr/

 


* CRM 자격증(CRM협회)
http://kcrma.org/
- CRM 전문가
- 마케팅통계전문가
- 데이터마이닝 전문가
- 고객DB분석가

 


* SAS 국제자격 인증 시험(SAS Korea)
http://www.sas.com/offices/asiapacific/korea/training/certification.html

 


* 통계 분석과 BI(Business Intelligence) 관련 인증 자격증 
http://www.statwith.pe.kr/STAT_FUT/STAT_LICENSE/STAT_LICENSE.htm

 


* '제 값 하는' 빅 데이터 자격증 11종 
http://www.ciokorea.com/t/2996/빅%20데이터/21859

 


- 인폼즈(INFORMS) - CAP(Certified Analytics Professional)

 

- 콜럼비아대 - 데이터 과학 전문성 인증시험

 

- 인소프(INSOFE) - 빅 데이터 애널리틱스, 최적화, 그리고 엔지니어링 자격증

 

- 스탠포드대 - 대용량 데이터 세트 마이닝 자격증 

 

- 델라웨어대 - 애널리틱스 자격증: 빅 데이터 최적화

 

- EMC - EMC 데이터 과학자 협회 자격증

 

- 클라우데라 - 클라우데라 데이터 과학 전문가 자격증

 

- 레볼루션 애널리틱스 - 레볼루션 R 엔터프라이즈 프로페셔널 

R Users Conference 2014

 

홈페이지 : http://rconference.itdaily.kr/

 

Agenda
Time 오전 강연(그레이스 홀)
~ 9:30 등록 및 접수 확인
9:30 ~ 9:40 정우준 - 개회사
9:40 ~ 10:00 윤종민 - History of GNU
10:00 ~ 11:15 Peter Dalgaard

Talk 1 - R Core Team: Development Principles and War Stories
Talk 2 - R Strengths and Weaknesses: The Two Sides of the Coin
11:15 ~ 12:00 Fernando Henrique Ferraz Pereira da Rosa, Jonathan Farinela da Silva, Raffael da Silva Nagel

Deploying R solutions in the Corporate World
12:00 ~ 13:00 점심시간
Time 오후 강연
메리골드 1 메리골드 2 엘하우스 엘가든
13:00 ~ 13:30 강원식
(Australian Customs and Border Protection Service)
장원철
(서울대학교 통계학과)
이동윤
(LG CNS)
최대우
(한국외국어대학교 통계학과)
Operationalisation of Machine Learning Techniques Reproducible Research with R 통계분석을 위한 신호의 전처리(Python) To People Who Is Allergic To R
13:30 ~ 13:40 이동
13:40 ~ 14:10 서 희
(LG 전자)
최재웅
(고려대학교 언어학과)
주재홍
(교통안전관리공단)
경성현
(국가수리과학연구소)
GPGPU(OpenCL)를 이용한 고성능 R package 개발하기 - oclRtools R을 활용한 언어자원 탐색 : clustering, topic Modelling R을 이용한 업무 효율성 향상 Topological Data Analysis
14:10 ~ 14:20 이동
14:20 ~ 14:50 전희원
(SK Telecom)
임상배
(한국 오라클)
Chel Hee Lee
(University of Saskatchewan)
허윤
(모니카 컨설팅)
Valuable Tips for Practical Data Analysis using R 빅데이터 분석을 위한 R과 Hadoop/RDBMS 시스템 통합 연계 방안 Imprecise Probabilities in Epidemiological Surveillance Using R R을 활용한 BI 분석 최적화
14:50 ~ 15:00 이동
15:00 ~ 15:30 양우성
(StaGen Co. Ltd.)
한정훈
(한국 오라클)
황승식
(인하대학교 의학전문대학원)
전용준
(리비젼 컨설팅)
Genetic statistics to learn from genome-wide association study R을 이용한 기존 분석 환경 변환 방법론 Spationtemporal Epidemiology Using R 랜덤포리스트를 활용한 다차원 시계열 예측: 아이디어와 산업계 응용 방안
15:30 ~ 16:00 Coffee Break
Time 마무리 강연
16:00 ~ 17:15 Duncan Murdoch

Talk 1 - Recent Developments in rgl
Talk 2 - Advanced Sweave Techniques
17:15 ~ 17:35 Lukazs Daniel & Chel Hee Lee
Future of R Localization Support
17:35 ~ 18:10 박종희(서울대 정치외교학과)
자료와 모형, 그리고 R: 사회과학 연구의 새로운 지평
18:10 ~ 폐회

 

행사보기

 

경제 통계의 이해.pdf

경제 통계의 이해.pdf
0.24MB

KOSPI200 선물의 양면, 투기와 위험분산 -EGARCH 모형을 통한 주식/선물 위험 예측 -위험 분산을 위한 최적 헤지비율 추정 -GARCH-M모형을 이용한 위험츠리미엄 추정

 

 

 

 

 

목차

 

 

 

I. 연구동기 및 주요개념

  1. 서론
  2. 주요 개념

 

 

 


II. 분석 개요
  1. 분석변수 1(종속변수)
  2. 분석변수 2(독립변수)
  3. 분석순서
  4. 변수 변환
  5. 분석변수의 시도표

 

 


III. KOSPI200지수의 위험 예측 모형
  1. 고전적 회귀모형(OLS 추정)
  2. 자기회귀 모형 : AR(p)
  3. 조건부 이분산 모형 : GARCH(p,q)
  4. 각 모형의 잔차 비교와 특이치 분석

 

 


IV. KOSPI200 선물의 위험 예측 모형 
  1. 고전전 회귀모형(OLS추정)
  2. 자기회귀 모형 : AR(p)
  3. 조건부 이분산 모형 : GARCH(p,q)
  4. 각 모형의 잔차 비교와 특이치 분석
  5. KOSPI200 지수 모형과 선물지수 모형의 비교

 

 


V. KOSPI200 지수와 선물의 최적 헤지비율 추정 및 성과 비교
  1. 최적 헤지비율(Optimal Hedge Ratio)
  2. 무헤지, 단순헤지, 불변헤지의 성과 비교

 

 


VI. KOSPI200 지수와 선물간의 시간변화 위험프리미엄 추정 모형
  1. 불편 기대가설 검증
  2. 시간변화 위험 프리미엄 추정
  3. 불편기대가설 및 시변 프리미엄 검증의 의미

 

 


VII. 최종 결론 및 후기

참고문헌
SAS PROGRAM

+ Recent posts