본문 바로가기

IT 기록/데이터 사이언스4

[강의정리] The RED : 데이터 사이언티스트 하용호 Ch.01 진짜 필요한 데이터가 제대로 남겨지게 만들기(01)가장 처음에 봐야 하는 데이터들은 무엇인가, 정말 데이터인가? 이 포스팅은 패스트캠퍼스의 강의 'The RED : 데이터 사이언티스트 하용호'를 수강하며, 공부를 위해 정리한 것과 개인적인 생각을 덧붙인 내용입니다. 자세한 내용이 궁금하신 분들은 강의를 수강하시기 바랍니다 : ) 많은 회사의 대표님을 만나면, 처음부터 데이터 기반으로 의사결정을 하고 싶어 하신다. 기업의 데이터는 2가지 형태로 존재한다. 없거나 or 존재하지 않거나. 대부분 처음 단계에서 하는 일 -데이터를 수집하는 것. 어떤 데이터를? 회사에서 제일 중요한 것 / 돈을 버는 것 / 돈을 벌기 위해서는 고객이 필요 / 고객에 대한 정보, 특히 돈을 내는 고객에 대한 정보가 제일 중요 사실 이 데이터들은 보통 이미 갖추어져 있음 -결제 데이터는 기업이 운영을 위해서 필수적이라, DB에 잘 보관하고 있.. 2022. 2. 18.
[강의정리] The RED : 데이터 사이언티스트 하용호 Ch.03 백투더 퓨처로 확인하는 데이터 사이언스의 역할 이 포스팅은 패스트캠퍼스의 강의 'The RED : 데이터 사이언티스트 하용호'를 수강하며, 공부를 위해 정리한 것과 개인적인 생각을 덧붙인 내용입니다. 자세한 내용이 궁금하신 분들은 강의를 수강하시기 바랍니다 : ) 데이터 사이언스가 어떤 문제들을 다루는지 분류해보자. 1.회사의 '과거'를 분석하는 것 2.회사의 '현재'를 개선하는 것 3.회사의 '미래'를 예측하는 것. 회사의 '과거'를 확인하는 것 존 워너메이커 : 현대적 마케팅의 아버지 → 내가 했던 광고의 절반은 낭비였다. 그런데 문제는 그 절반이 어느 쪽인지 모르겠다는 점이다. 업력이 쌓여갈수록, 오래된 궁금증과 확인되지 않은 가설이 누적된다. 의외로 많은 회사가 잘 모르고 있다. → 그래서 언제나, 회사를 Data Driven하게 만들고 싶다.. 2022. 2. 18.
[강의정리] The RED : 데이터 사이언티스트 하용호 Ch.02 데이터 사이언스는 도대체 왜 존재하는가? 이 포스팅은 패스트캠퍼스의 강의 'The RED : 데이터 사이언티스트 하용호'를 수강하며, 공부를 위해 정리한 것과 개인적인 생각을 덧붙인 내용입니다. 자세한 내용이 궁금하신 분들은 강의를 수강하시기 바랍니다 : ) 요즘들어 데이터 사이언스 영역이 많이 알려지고 각광을 받고 있다. 많은 회사에서 데이터 사이언티스트를 채용하기도 하고, 이에 따라 대학교에서도 데이터 사이언스 영역에 대한 수업이 확대되고 있다. 그런데 처음부터 데이터 사이언스 영역만을 보고 발을 들인 사람들은 오히려 자신의 정체성에 대해서 혼란스러워 할수도 있을 것 같다. 이번 강의는 그런 혼란을 줄여주고, 데이터 사이언티스트로서 어떤 역할을 해야하는가에 대한 방향성을 알려주는 강의이다. 나의 경우 데이터 사이언스 영역으로 바로 발을 들인.. 2022. 1. 19.
[강의정리] The RED : 데이터 사이언티스트 하용호 Ch.01 시작하는 사람들에게, 돌아보는 사람이 해주는 이야기 이 포스팅은 패스트캠퍼스의 강의 'The RED : 데이터 사이언티스트 하용호'를 수강하며, 공부를 위해 정리한 것과 개인적인 생각을 덧붙인 내용입니다. 자세한 내용이 궁금하신 분들은 강의를 수강하시기 바랍니다 : ) 데이터 사이언스라는 분야의 일을 해보니, 개별 기술이 아니라 실제로 일이 되도록 하는 것이 중요하다고 느꼈다. 데이터 사이언티스트 하용호님은 이를 '기술 바깥의 기술들'이라고 표현하셨다. 데이터 사이언스 또한 사람들과 일을 하는 것이기 때문에 개별 기술만 가지고서는 성과를 만들어낼 수 없다. 나는 IT회사에서 일을 하는 S/W 엔지니어다. 전문적으로 데이터 사이언스 영역에서 일을 하는 것은 아니다. 그런데 시대가 변하면서(알파고의 등장으로) 고객들도 데이터의 중요성을 알고, 데이터 사이언스.. 2022. 1. 17.