2017 The State of Data Science & Machine Learning

Kaggle 이용자 1만6천명을 대상으로 설문조사한 결과. 사이트에 직접 가서 보면 다른 결과들도 확인할 수 있다.

가장 많이 이용한다고 응답한 도구는 1위 파이썬, 2위 R, 3위 SQL, 4위 주피터, 5위 텐서플로이다. SQL이야 워낙 전통적인 도구라서 그렇다고 하더라도 요즘 많이 언급되는 것들이 상위에 올라온 것 같다. Tableau가 8번째 있다는게 좀 신기하달까.

제일 많이 사용하는건 logistic regression이나 decision tree라는 응답도 있었다. 전통적인 관계형 데이터 분석이 여전히 가장 많았지만 텍스트 데이터가 53%, 이미지 데이터 18.1% 응답도 나왔다. 앞으로 배우라고 추천하는건 역시 파이썬(63.1%). 2위는 R (24%)이다.