빅데이터 4

모두 거짓말을 한다, 세스 스티븐스 다비도위츠

모두 거짓말을 한다 Everybody Lies - 구글 트렌드로 밝혀낸 충격적인 인간의 욕망 세스 스티븐스 다비도위츠 Seth Stephens-Davidowitz(지음) 이영래(옮김), 더퀘스트 작년 말에 읽고 이제서야 리뷰를 올린다. 실은 기억이 가물가물하다. 예전엔 전체적인 내용을 대략 기억하곤 했는데, 이제는 노트를 한 다음 정리하지 않으면 쉽지 않다. 책을 읽으면서 다소 놀라웠던 사실들도 꽤 있었다. 이 책은 ‘빅데이터’에 대한 안내서다. ‘빅데이터’를 통해 우리는 무엇을 볼 수 있고 동시에 무엇을 알지 못하며 빅데이터가 가지고 올 유용함과 함께 그것의 우려스러운 점도 함께 언급된다. 나는 이 책을 통해 사람들이 ‘데이터과학’에 관해 가지고 있는 신화를 깨뜨리고 데이터과학이 무엇인지 확실하게 알리..

데이터 사이언티스트(Data Scientist)의 자질

출처: https://elu.nl/careers-in-data-science-data-analyst-vs-data-engineer-vs-data-scientist/ 간추려 보자면, 1. 통계학이나 수학 석사 학위 이상을 지니고 통계적 모델과 머신러닝 알고리듬을 만들 수 있는 능력, 2. 플랫폼에 상관없이 데이터를 자유자재로 추출해 가공할 수 있는 프로그램 실력, 3. 각종 데이터베이스의 구조에 관한 실전 지식, 4. 뛰어난 통찰력과 분석 능력, 5. 데이터 시각화를 구현할 수 있는 기술, 6. 해당 비즈니스와 산업에 관한 기본 지식, 7. 기술적인 콘셉트를 일반 언어로 쉽게 설명할 수 있는 소통능력 등이 있다. 더불어 이 분야에 대한 남다른 열정까지 거론된다. - , 유혁의 데이터 이야기 중에서(중앙일보..

빅 데이터(Big Data)는 결국 인간의 뇌로 진화할 것이다

며칠 전 Mckinsey Quarterly Website의 특집이 Big Data였다. 내가 몸 담고 있는 기업에서는 Big Data가 아니라, 기본적인 Data Design이나 Architecture 없이 모여진 Data을 어떻게 관리하고 변화시켜나갈 것인가 고민이지만, 이 고민의 가운데 Big Data로 진화할 것이라는, 좀 멀리 있는 관점이 필요할 것이다. Data에는 정형화된 Data와 비정형화된 Data가 있다. 최근 논의가 되고 있는 Big Data는, 그것이 정형화된 것이든, 아니든 상관없이 너무 덩치가 커서 어떻게 할 수 없는 Data를 말한다. 특히 기업에서 기존에 모아둔 분석 Data들과 최근에 다양한 고객들의 활동 정보 - SNS에 기반한 - 들은 대부분 비정형화 Data이거나 정형화..

읽을 만한 경영 잡지, IGM Business Review

이제 내년이면 내 나이도 마흔이니, 중년의 시작이다. 여러 번의 도전, 그리고 실패, 새로운 영역을 향한 모험으로, 다들 평온한 직장 생활로 보내는 30대를 질풍노도와 같이 보내고 이제 그간의 경험을 바탕으로 뭔가 기여해야 될 시간이라 여기지만, 생각만큼 쉬운 일이 아니었다. 경험했다고 모든 것을 알 수 있는 것도 아니고 알고 있다고 해서 그것을 실천할 수 있는 것도 아니다. 나이가 든다는 것은 무엇을 알고 있는가에 방점이 찍히는 것이 아니라, 주어진 환경과 그 제약 조건 속에서 무엇을 할 수 있는가에 방점이 찍히기 때문이다. 그리고 때로는 내가 무엇을 모르고 있었구나 하는 생각만 늘고 이것도 내가 못하는 거구나 하는 자괴감만 늘 가능성이 높다. 그러다 보니, 어떻게든 시간을 쪼개 회사 업무에, 그리고 ..