목차
1. 빅데이터의 특징을 기존 데이터와 비교하여 설명하시오.
2. 네플릭스의 추천서비스와 관련한 원리로 협업필터링을 꼽을 수 있다. 협업필터링의 장점과 단점, 사용상 유의점에 대해 논하시오. (6점) 또한 교재의 사례 외에 협업필터링을 이용한 실제 업무사례에는 어떠한 것들이 있는지 조사하여 약술하시오.
3. 검색 데이터를 수집하여 이용하려고 한다. 데이터 수집절차를 약술하고 직접 수집해 보시오. 또한, 실제 수집한 데이터의 특징을 기술하고 이 데이터를 통해 어떠한 분석결과를 도출할 수 있을지 논하시오.
4. 교재 6장에서 제시한 시각화 도구 중 하나를 선택하여 본인이 선택한 임의의 데이터를 시각적으로 표현해 보시오. (데이터 시각화의 당위성이 드러나도록 적절한 데이터를 선택하였는지와 시각화 효과가 뚜렷하게 드러날 수 있도록 고려하여 충실하게 시각화를 하였는지 여부가 기준임)
5. 빅데이터 시대에 데이터 마이닝 기법의 중요성이 부각되는 이유를 설명하시오. 또한 데이터 마이닝이 가능한 기술적 동인은 무엇이었는지 설명하시오.
6. 최근 인공지능의 발전은 데이터과학의 미래에 대해 많은 논쟁을 불러일으키고 있다. 본인의 견지에서 인공지능을 통한 미래사회 모습을 논하고 부작용을 최소화할 수 있는 방법이 무엇인지 논하시오.
2. 네플릭스의 추천서비스와 관련한 원리로 협업필터링을 꼽을 수 있다. 협업필터링의 장점과 단점, 사용상 유의점에 대해 논하시오. (6점) 또한 교재의 사례 외에 협업필터링을 이용한 실제 업무사례에는 어떠한 것들이 있는지 조사하여 약술하시오.
3. 검색 데이터를 수집하여 이용하려고 한다. 데이터 수집절차를 약술하고 직접 수집해 보시오. 또한, 실제 수집한 데이터의 특징을 기술하고 이 데이터를 통해 어떠한 분석결과를 도출할 수 있을지 논하시오.
4. 교재 6장에서 제시한 시각화 도구 중 하나를 선택하여 본인이 선택한 임의의 데이터를 시각적으로 표현해 보시오. (데이터 시각화의 당위성이 드러나도록 적절한 데이터를 선택하였는지와 시각화 효과가 뚜렷하게 드러날 수 있도록 고려하여 충실하게 시각화를 하였는지 여부가 기준임)
5. 빅데이터 시대에 데이터 마이닝 기법의 중요성이 부각되는 이유를 설명하시오. 또한 데이터 마이닝이 가능한 기술적 동인은 무엇이었는지 설명하시오.
6. 최근 인공지능의 발전은 데이터과학의 미래에 대해 많은 논쟁을 불러일으키고 있다. 본인의 견지에서 인공지능을 통한 미래사회 모습을 논하고 부작용을 최소화할 수 있는 방법이 무엇인지 논하시오.
본문내용
양한 기법을 통해 시각적으로 도출 가능한 예측 모형을 구축하고 제공하는 작업을 이야기한다. 데이터마이닝의 중요성이 부각되는 이유는 다양한 사회적 발전을 통해 정보와 지식이 쌓여 포화상태에 다다르고 있지만 이러한 데이터에서 실질적으로 필요한 주요 정보를 찾는 것은 많은 시간과 정보를 요하고 이를 효율적으로 활용하기 위해서 데이터의 가치를 확인하는 것이 매우 중요하다.
데이터마이닝은 통계와 같은 수학적인 기법을 포함하여 다양한 기법으로 정보의 연관성이나 패턴, 경향성을 파악하고 이를 데이터 시각화를 통해 보여주는 전반적인 과정을 포함한다고 할 수 있다. 실질적으로 다양한 분야에서 데이터마이닝 과정을 통해서 주요 정보를 정리하고 패턴을 찾아 가치를 산정하고 상호 간의 소통을 통해 데이터 과학을 활용하여 함께 발전하고 있다. 데이터마이닝 기법은 컴퓨터과학이나 인공지능공학 같은 분야에서 개발되는 기계학습이론에서 시작되어 통계학에 기본을 두고 함께 발전하고 경영정보학, 생물정보학 등의 여러 학문에서도 연구가 진행되면서 빅데이터 시장에서 데이터마이닝의 필요성과 가치가 더욱더 높아지고 있다.
이렇게 데이터마이닝이 발전할 수 있었던 동력은 단연 컴퓨터 과학의 발전이라고 할 수 있다. 데이터를 수기로 적고 보관하던 것에서 발전하여 이진법으로 이뤄진 컴퓨터 정보로 남김으로써 그간에 정보의 효율적인 축적이 가능해졌다. 컴퓨터 프로그램의 개발과 더불어 데이터 처리와 관련한 능력의 활용으로 통계 처리 속도가 현저히 빨라지면서 기존의 분석 기법을 뛰어넘는 다양한 기법의 개발이 가능해졌다. 정보 처리 속도가 빨라지는 것과 함께 컴퓨터를 활용한 정보의 공유 또한 넓은 범위까지 빠르고 활발하게 진행 가능해지면서 다양한 분야에서 데이터를 활용한 연구 개발이 눈에 띄게 증가할 수 있었다.
6. 인공지능(AI; Artificial Intelligence)이란 제공된 데이터를 습득하고 지식을 학습하여 이해하고 이를 활용하는 인간을 모방하여 인간과 유사하거나 같은 수준의 능력을 발휘할 수 있도록 실현한 기술을 이야기한다. 인공지능은 인간처럼 추가적인 학습을 통해 지식을 늘리는 것과 더불어 축적된 데이터를 효율적으로 활용할 수 있게 자기학습 기능이 탑재된 컴퓨터 공학 및 정보기술로써 기계공학과 같은 과학 기술과 융합하여 4차 산업을 주도하는 분야로 성장하여 주목받고 있다.
인공지능 산업이 나날이 발전하는 배경에는 인공지능이 그 자체로만 기능하는 것이 아니라 다른 다양한 산업 분야에 도입되어 인공지능을 활용하려는 시도가 활발하게 일어나고 있기 때문이다. 인공지능은 추가적인 장치의 개발과 데이터의 입력을 통해 인간과 비슷한 기능을 할 수 있지만 인간과 달리 물리적으로 지치지 않고 인간이 꺼리거나 신체적으로 한계가 있는 일까지 역할을 수행할 수 있다는 장점이 분명히 있다. 이렇듯 산업 현장에서 무엇보다도 필요성과 적합성을 인정받는 인공지능이 실질적으로 실용화되기 위해서는 늘 제기되는 데이터의 편향성 문제를 뛰어넘는 데이터 공정성을 보여야만 한다.
빅데이터 사회에서 인공지능에 적용하는 데이터는 방대한 양이 주어지는 만큼 다양한 관점의 정보가 주어질 것으로 생각되지만 현실적으로는 그렇지 않다. 데이터 편향성이 발생할 수밖에 없는 것은 데이터를 제공하는 것이 인간이기 때문이다. 데이터의 객관성은 데이터를 축적하는 과정에서 데이터가 지향하는 대상과 데이터가 일치하는지를 비교하고 주관성을 배제하여 판단하지만 인공지능의 학습을 위해 제공되는 데이터가 공정성을 잃게 되면 윤리적인 상충이 발생해 데이터 편향성이 발생하게 된다. 변순용(2020). 데이터 윤리에서 인공지능 편향성 문제에 대한 연구.
현재 유럽에서는 인공지능이 가지는 절대적인 객관성, 중립성, 독립성, 일관성에 기대어 사법체계에서 발생하는 판단의 오류를 줄이기 위한 인공지능 기술 개발을 위해 노력하고 있어 미래에는 범죄를 예측하고 형사사법 절차를 담당하는 인공지능 로봇을 만날 수 있을 것으로 예상된다. 이러한 인공지능 역시 그 기반에는 빅데이터 정보를 이용하여 데이터 주도의 자동화된 의사결정이 인간의 판단을 대체하는 것이 목표지만 인공지능의 판단 결과가 인간에게 영향을 준다는 점에서 윤리적인 문제를 피할 수 없는 것이 현실이다.
우리 사회 문제는 인간이 살아가면서 삶의 기준이나 모습이 시시각각 변하지만 사회적인 문제를 판단하는 도덕적인 잣대나 윤리적 기준, 법은 쉽사리 변하지 않기 때문에 발생한다. 역사는 승자의 기록이라는 말이 있듯이 실질적으로 인공지능이 학습하는 내용에는 누군가에게만 유리한 정보가 담겨 있을 수 있어 그것이 윤리적인 문제에 직면했을 때에 인공지능의 판단 능력에 전적으로 기댈 수 없게 된다. 인공지능이 데이터 객관성과 더불어 데이터 공정성이 확보된 상태에서 기능해야 데이터 편향성 문제에서 벗어나 데이터 윤리 문제에서 벗어나게 될 수 있을 것이다.
인공지능이 활용되는 분야는 급속도로 확대되고 있지만 인공지능이 학습을 통해서도 인간의 윤리적 가치를 이해하지 못하는 문제는 해결이 요원한 상태이다. 인간과 같이 윤리적이고 도덕적인 가치를 내면화하여 스스로 판단하고 인간이 지키고자 하는 사회적인 규범을 지킬 수 있을 것인지가 인공지능 산업의 확대와 발전에 중요한 관건이 될 수 있을 것이다. 특히 인공지능의 활용 분야를 인간의 삶에 도움은 주되 윤리적인 가치에 미치는 영향력이 최대한 적게 발휘될 수 있도록 법적인 제도를 구체적이고 세부적으로 세울 수 있어야 할 것이다
참고문헌
네이버 데이터랩.
https://datalab.naver.com/
변순용(2020).
데이터 윤리에서 인공지능 편향성 문제에 대한 연구.
http://www.riss.kr/link?id=A106637585
『빅데이터 거버넌스 : 빅데이터 활용의 전제조건』, Sunil Soares 지음, 조완섭 등 옮김,
홍릉과학출판사, 2014.
손창환, 김진욱, 하귀룡(2010).
하이브리드 협업 필터링 알고리즘 개발에 관한 연구.
http://www.riss.kr/link?id=A82474125
코로나19(COVID-19) 실시간 상황판.
https://coronaboard.kr/
데이터마이닝은 통계와 같은 수학적인 기법을 포함하여 다양한 기법으로 정보의 연관성이나 패턴, 경향성을 파악하고 이를 데이터 시각화를 통해 보여주는 전반적인 과정을 포함한다고 할 수 있다. 실질적으로 다양한 분야에서 데이터마이닝 과정을 통해서 주요 정보를 정리하고 패턴을 찾아 가치를 산정하고 상호 간의 소통을 통해 데이터 과학을 활용하여 함께 발전하고 있다. 데이터마이닝 기법은 컴퓨터과학이나 인공지능공학 같은 분야에서 개발되는 기계학습이론에서 시작되어 통계학에 기본을 두고 함께 발전하고 경영정보학, 생물정보학 등의 여러 학문에서도 연구가 진행되면서 빅데이터 시장에서 데이터마이닝의 필요성과 가치가 더욱더 높아지고 있다.
이렇게 데이터마이닝이 발전할 수 있었던 동력은 단연 컴퓨터 과학의 발전이라고 할 수 있다. 데이터를 수기로 적고 보관하던 것에서 발전하여 이진법으로 이뤄진 컴퓨터 정보로 남김으로써 그간에 정보의 효율적인 축적이 가능해졌다. 컴퓨터 프로그램의 개발과 더불어 데이터 처리와 관련한 능력의 활용으로 통계 처리 속도가 현저히 빨라지면서 기존의 분석 기법을 뛰어넘는 다양한 기법의 개발이 가능해졌다. 정보 처리 속도가 빨라지는 것과 함께 컴퓨터를 활용한 정보의 공유 또한 넓은 범위까지 빠르고 활발하게 진행 가능해지면서 다양한 분야에서 데이터를 활용한 연구 개발이 눈에 띄게 증가할 수 있었다.
6. 인공지능(AI; Artificial Intelligence)이란 제공된 데이터를 습득하고 지식을 학습하여 이해하고 이를 활용하는 인간을 모방하여 인간과 유사하거나 같은 수준의 능력을 발휘할 수 있도록 실현한 기술을 이야기한다. 인공지능은 인간처럼 추가적인 학습을 통해 지식을 늘리는 것과 더불어 축적된 데이터를 효율적으로 활용할 수 있게 자기학습 기능이 탑재된 컴퓨터 공학 및 정보기술로써 기계공학과 같은 과학 기술과 융합하여 4차 산업을 주도하는 분야로 성장하여 주목받고 있다.
인공지능 산업이 나날이 발전하는 배경에는 인공지능이 그 자체로만 기능하는 것이 아니라 다른 다양한 산업 분야에 도입되어 인공지능을 활용하려는 시도가 활발하게 일어나고 있기 때문이다. 인공지능은 추가적인 장치의 개발과 데이터의 입력을 통해 인간과 비슷한 기능을 할 수 있지만 인간과 달리 물리적으로 지치지 않고 인간이 꺼리거나 신체적으로 한계가 있는 일까지 역할을 수행할 수 있다는 장점이 분명히 있다. 이렇듯 산업 현장에서 무엇보다도 필요성과 적합성을 인정받는 인공지능이 실질적으로 실용화되기 위해서는 늘 제기되는 데이터의 편향성 문제를 뛰어넘는 데이터 공정성을 보여야만 한다.
빅데이터 사회에서 인공지능에 적용하는 데이터는 방대한 양이 주어지는 만큼 다양한 관점의 정보가 주어질 것으로 생각되지만 현실적으로는 그렇지 않다. 데이터 편향성이 발생할 수밖에 없는 것은 데이터를 제공하는 것이 인간이기 때문이다. 데이터의 객관성은 데이터를 축적하는 과정에서 데이터가 지향하는 대상과 데이터가 일치하는지를 비교하고 주관성을 배제하여 판단하지만 인공지능의 학습을 위해 제공되는 데이터가 공정성을 잃게 되면 윤리적인 상충이 발생해 데이터 편향성이 발생하게 된다. 변순용(2020). 데이터 윤리에서 인공지능 편향성 문제에 대한 연구.
현재 유럽에서는 인공지능이 가지는 절대적인 객관성, 중립성, 독립성, 일관성에 기대어 사법체계에서 발생하는 판단의 오류를 줄이기 위한 인공지능 기술 개발을 위해 노력하고 있어 미래에는 범죄를 예측하고 형사사법 절차를 담당하는 인공지능 로봇을 만날 수 있을 것으로 예상된다. 이러한 인공지능 역시 그 기반에는 빅데이터 정보를 이용하여 데이터 주도의 자동화된 의사결정이 인간의 판단을 대체하는 것이 목표지만 인공지능의 판단 결과가 인간에게 영향을 준다는 점에서 윤리적인 문제를 피할 수 없는 것이 현실이다.
우리 사회 문제는 인간이 살아가면서 삶의 기준이나 모습이 시시각각 변하지만 사회적인 문제를 판단하는 도덕적인 잣대나 윤리적 기준, 법은 쉽사리 변하지 않기 때문에 발생한다. 역사는 승자의 기록이라는 말이 있듯이 실질적으로 인공지능이 학습하는 내용에는 누군가에게만 유리한 정보가 담겨 있을 수 있어 그것이 윤리적인 문제에 직면했을 때에 인공지능의 판단 능력에 전적으로 기댈 수 없게 된다. 인공지능이 데이터 객관성과 더불어 데이터 공정성이 확보된 상태에서 기능해야 데이터 편향성 문제에서 벗어나 데이터 윤리 문제에서 벗어나게 될 수 있을 것이다.
인공지능이 활용되는 분야는 급속도로 확대되고 있지만 인공지능이 학습을 통해서도 인간의 윤리적 가치를 이해하지 못하는 문제는 해결이 요원한 상태이다. 인간과 같이 윤리적이고 도덕적인 가치를 내면화하여 스스로 판단하고 인간이 지키고자 하는 사회적인 규범을 지킬 수 있을 것인지가 인공지능 산업의 확대와 발전에 중요한 관건이 될 수 있을 것이다. 특히 인공지능의 활용 분야를 인간의 삶에 도움은 주되 윤리적인 가치에 미치는 영향력이 최대한 적게 발휘될 수 있도록 법적인 제도를 구체적이고 세부적으로 세울 수 있어야 할 것이다
참고문헌
네이버 데이터랩.
https://datalab.naver.com/
변순용(2020).
데이터 윤리에서 인공지능 편향성 문제에 대한 연구.
http://www.riss.kr/link?id=A106637585
『빅데이터 거버넌스 : 빅데이터 활용의 전제조건』, Sunil Soares 지음, 조완섭 등 옮김,
홍릉과학출판사, 2014.
손창환, 김진욱, 하귀룡(2010).
하이브리드 협업 필터링 알고리즘 개발에 관한 연구.
http://www.riss.kr/link?id=A82474125
코로나19(COVID-19) 실시간 상황판.
https://coronaboard.kr/
소개글