성균관대학교 웹진

연구실탐방 | 캠퍼스컬쳐

‘집단현상에 대한 구체적인 양적 기술을 반영하는 숫자’, 통계에 대한 사전적 정의이다. 하지만 현대의 통계는 단순히 수치에 대한 ‘기술’을 목적 그 자체로 하지 않는다. 우리는 통계를 통해 현재를 조망하고 미래를 추측한다. 대표적인 예시가 빅데이터의 활용. 대중의 생각부터 마케팅 전략까지, 너무나도 다양한 스펙트럼의 과업들을 수행할 수 있다. 성균관대학교에도 이러한 일을 전문으로 하는 곳이 있다. 거칠고 비정형적인 세상의 일들을 정성스레 가공해 눈부신 보석으로 바꾸는 일이 일어나는 곳, 성균관대학교 응용통계연구소에 성균웹진이 찾아가보았다.

Interviewee: 조진우, 박서영 연구원

Q. 응용통계연구소가 처음 세워진 계기가 무엇인가요?

A. 응용통계연구소는 통계와 다른 학문의 연계를 위하여 설립되었습니다. 인문/사회과학, 자연과학 등 모든 학문 분야에서는 통계적 기법을 사용합니다. 예를 들어 경영학에서도 ‘경영통계’라는 학문을 따로 배울 정도로 통계와 밀접한 관련을 맺고 있죠. 이렇게 다양한 요구에 더욱 체계적이고 효과적으로 대응하기 위해 1991년 성균관대학교 응용통계연구소가 설립된 것입니다.

Q. 현재 연구소의 규모가 어떻게 되나요?

A.현재 석사 과정 연구원 8명과 연구위원 9명이 재직 중입니다.

Q. 대표적 연구수행과제에는 어떤 것이 있는지 궁금합니다.

A.연구 성과에 대한 소개와 통계에 대한 토의가 이루어지는 세미나와 학술대회를 정기적으로 개최하고 있습니다. <통계연구>라는 정기 간행물을 2년마다 발행하고 있으며, 통계에 대한 기초를 닦고자 하는 사람들을 위해 통계 특강도 진행 중입니다. 마지막으로 통계 컨설팅 작업을 통해 다른 학문과의 연계를 도모하고 있습니다.


Q. 정기 간행물은 보통 어떤 내용으로 채워지는 편인가요?

A.정기 간행물 <통계연구>에서는 기존에 없었던 새로운 이론을 제시하기 보다는 응용방법에 관한 내용을 주로 다루고 있습니다. 즉, 기존에 있는 방법들을 발전시켰을 때에 어떠한 방향으로 연구가 가능한지에 대한 내용이죠. 예를 들어, 딥러닝 기술의 방법은 여러 가지입니다. 어떠한 유형의 데이터가 주어졌을 때, 이러한 내용 하에서는 딥러닝 기술에 어떠한 방법이 가장 적절한지에 대해 알아보는 것입니다.

Q. 빅데이터에 대한 시대적인 관심이 증대되면서, 통계에 대한 관심을 가지는 일반 시민이나 학생들이 많아지는 추세인데, 이들과 응용통계연구소의 연결점이 있을까요?

A.앞서 언급한 통계특강이 있습니다. 하계와 동계 두 차례 이루어지는데, 올해 1월에 열린 2018 겨울 통계특강에서는 각각 2~3차례에 걸쳐 ‘SAS 기초 및 통계자료 분석’, ‘R 기초 및 통계자료 분석’, ‘R 고급 빅데이터 분석’ 특강이 순차적으로 열린 바 있습니다. 통계학부생들과 회사원뿐만 아니라 통계학에 관심 있는 일반인들도 수강해서 기초부터 고급까지 천차만별의 난이도를 가지고 있습니다.

Q. ‘통계 컨설팅’이라는 말만 들어서는 구체적으로 어떠한 작업이 이루어지는지 감이 잘 오지 않습니다. 이는 통계자료를 기반으로 기업 컨설팅을 진행하는 것인가요?

A.보통 기업보다는 석·박사 과정을 밟는 분들을 대상으로 컨설팅을 진행합니다. 자신의 논문과 관련한 실험 데이터가 통계적으로 유의미한지 검증하거나, 어떠한 활동을 진행했을 때 이것이 효과를 가지는지의 여부를 알아내는 활동을 주로 진행합니다. 통계적 모형간의 비교를 통해 가장 좋은 통계자료 모형이 어떤 것인지 살펴보기도 합니다. 보통 한 달에 두 건 정도 컨설팅을 진행하며, 한 건당 2~3주 정도 소요되는 편입니다.


Q. 다른 학교의 통계연구소와도 자주 교류가 이루어지는 편인가요?

A.평상시에 잦은 교류가 있지는 않으나, 세미나와 학회에 다양한 학교의 통계 전공자가 의견을 나누기 때문에 이때 소통하는 편입니다.

Q. 가장 인상 깊었던 연구 활동이 있는지 궁금합니다.

A.최근 작업한 통계 컨설팅 활동이 가장 기억에 남습니다. 무용학과 석사과정을 밟고 있는 대학원생이 의뢰한 컨설팅이었는데, 무용 공연에 특정 프로그램을 추가하기 전과 후에 대한 설문조사를 각각 진행한 데이터를 토대로 이 프로그램이 긍정적 반응을 불러일으킨 것인지에 대한 분석 작업을 실시했습니다.

암기능력과 피드백 활동간의 상관관계를 규명하기 위한 연구에 도움이 되었던 기억도 납니다. 암기 테스트를 하고 이에 대한 피드백을 주었을 때와 그렇지 않았을 때의 결과 데이터를 토대로 했습니다. 피드백을 주는 것이 성적 향상에 영향을 주는지를 밝히기 위해 통계적 분석을 했죠.

꼭 둘 사이의 상관관계를 밝히는 것에만 통계가 사용되는 것은 아닙니다. 처음 보았을 때는 산발적으로 보이는 수많은 데이터를 통계에 기반해 분류하는 작업 역시 통계 컨설팅에 해당합니다.

Q. 4차 산업혁명과 관련해서 다양한 분야에 AI의 침투가 일어나고 있습니다. 통계학도 이러한 위협을 피할 수 없는데, 이와 관련해 통계학의 전망을 어떻게 보시는지 궁금합니다.

A.결론부터 말씀드리자면, 완전한 대체는 불가능하다고 생각합니다. AI가 온전한 판단을 한다고 생각할 수 있지만, 결국 AI가 판단하는 기준은 인간이 판단한 데이터를 토대로 하는 것입니다. 또한 활용의 토대가 되는 이론을 세울 수 있는 것은 오직 인간입니다. 응용과 활용의 몫은 AI에게 넘겨줄 수는 있어도, 학문에 대한 완전한 대체는 불가능하다고 생각합니다.

양윤식 기자
최윤서 기자

기사전체보기