Kaggle 설문결과 1위 파이썬, 2위 R, 3위 SQL

2017 The State of Data Science & Machine Learning

Kaggle 이용자 1만6천명을 대상으로 설문조사한 결과. 사이트에 직접 가서 보면 다른 결과들도 확인할 수 있다.

가장 많이 이용한다고 응답한 도구는 1위 파이썬, 2위 R, 3위 SQL, 4위 주피터, 5위 텐서플로이다. SQL이야 워낙 전통적인 도구라서 그렇다고 하더라도 요즘 많이 언급되는 것들이 상위에 올라온 것 같다. Tableau가 8번째 있다는게 좀 신기하달까.

제일 많이 사용하는건 logistic regression이나 decision tree라는 응답도 있었다. 전통적인 관계형 데이터 분석이 여전히 가장 많았지만 텍스트 데이터가 53%, 이미지 데이터 18.1% 응답도 나왔다. 앞으로 배우라고 추천하는건 역시 파이썬(63.1%). 2위는 R (24%)이다.

By |11월 4th, 2017|Programming|Kaggle 설문결과 1위 파이썬, 2위 R, 3위 SQL에 댓글 닫힘

Waffle 패키지

Infographic-style charts using the R waffle package

인포그래픽 느낌의 차트를 그려주는 waffle이라는 패키지이다. 아직 나도 사용해보지는 않았다. 사실 시각화에 큰 관심이 없었는데 요즘 시각화 관련 패키지들을 좀 살펴보고 있다.

이 패키지를 위해서 설치해야하는 건 기본적으로는 ggplot2이고 폰트는 Font Awesome에서 무료버전을 다운받고 fonts/fontawesome-webfont.ttf를 설치해야 한다.

By |9월 13th, 2017|Programming|Waffle 패키지에 댓글 닫힘

엑셀 복사 후 클립보드에서 R로 불러오기

대충 엑셀에서 확인해도 상관없지만 간단하게 R에서 확인해보고 싶은 것들이 있는 경우가 가끔 있다. R에서 불러오는게 귀찮거나 굳이 전체 파일을 다 불러오지 않아도 되는 경우 필요한 부분만 엑셀에서 복사한 후 R로 불러올 수 있다.

Mac에서는 오류가 난다

X11 모듈을 설치하면 해결된다고는 한다. (참고: Mac용 X11에 관하여) 아래 코드처럼 쓰면 맥에서도 따로 설치 없이 불러올 수 있다.

By |3월 19th, 2017|Programming|엑셀 복사 후 클립보드에서 R로 불러오기에 댓글 닫힘