** 글쓰기 **
제5차 정기세미나
정보의 홍수시대에서 정보를 판별하는 능력이 필요하다.
현대시대는 스마트폰이 지배하는 세상이 되었다. 10대들에게 영향력있는 인물 1~7위까지가 유튜브스타라는 것만 봐도 알 수 있는 대목이다.
사람들의 충족되지않은 욕구를 만족시켜주어야한다. 지하철에서 책을 보는 사람 그리고 신문 그다음 스마트폰 모든 공통점은 이동하는 시간동안 자신을 심심하지 않게해달라는 점이다. 스마트폰이나 이런 작은 것에 열광하는 것이아니다. 본질은 자신을 심심하게 하지 말아달라는 것이다.
사람들의 욕구를 파악하기위해서는 사람을 유심히 관찰해야한다.
데이터 과학이란(정기세미나)(삼성 SDS)
통계학 + 소프트웨어 역량 + 사회과학 이다.
데이터를 통해 현실의 문제를 해결하는 능력이 출중해야한다.
통계학,기계학습,소프트웨어공학을 충분히 이해하고있어야함
패턴 , 모형 , 알고리즘을 고안해햐야함.
데이터 주도 의사결정을 하는데 핵심역할!
데이터과학자들은 알고리즘을 개발하는 사람들이 아니다. 만들어져있는 알고리즘을 갖다 쓰는 것이다.
개발자들도 보통 개발을 할때 만들어져있는 것들을 가져다쓴다. 오픈소스사이트라든지 라이브러리에서 혹은 검증이 잘되지않을지라도 검색을 통해 copy해오기도한다. 그렇듯 문제를 해결하기위해 기존에있는 것들을 쓰는 것도 필요하다.
쉽게말하면 현실에 있는 문제를 해결하기 기존에 만들어진 것을 활용하는 것!! 이것도 매우 중요하다.
그렇다면 데이터과학자로서 역량을 증가시키기 위해서는 어떻게해야할까..?
개인적인 생각이지만 현실에 있는 사소한 문제부터 해결해보는 것이 괜찮다고 생각한다.
프로그래밍언어를 배울떄도 그랬고 항상 그랬듯 내가 만들고싶어하는 어떠한 프로그램이 있을때 실력향샹이 정말 많이 되었다.
그냥 교과서 읽듯 책을 정주행하면 재미도 없고 왜 배워야하는지 모르게 된다. 프로그래밍이란 수학과 비슷해서 기본적인 암기는 필요해도 그것을 활용해야 쓸모가 있다. 즉 어떤 문제를 해결하기위해서 고민해보고 배운 것을 응용해봐야한다. 실예로 최근 데이터과학관련 공모전 수상자의 경우 아버지가 치킨집 사장님이신데 그곳의 매출을 늘리기위해서 머신러닝을 사용하여 언제 사람이 많이 오고 적게오는지를 분석하여 훨씬 효율적으로 가게를 운영할 수 있도록 해서 수상을 했다. 머신러닝을 조금만 이해해도 풀 수 있는 문제다. 선형회귀분석(그냥 2차원에다가 직선긋는거다) 사용하면 정말 쉽다.