R을 배우게 되면 누구나 접하게 되는
시각화 패키지 ggplot2
전처리 패키지 dplyr
문자열처리 패키지 stringr 등
현재 R에서 빅데이터 분석을 위한 대부분의 툴을 만든 사람은
뉴질랜드 오클랜드 대학 출신의
해들리 위컴 Hadley Alexander Wickham 입니다.
뉴질랜드 오클랜드 대학 통계학 학사, 석사를 마치고,
2008년 아이오와 주립대학에서 통계학 박사학위를 취득했는데
박사학위 과정을 공부하면서 실제로 많은 데이터를 분석하다가
전처리를 위해 reshape을 만들었고,
시각화를 위해 ggplot을 만들었습니다.
그리고 이러한 경험을 모아서 박사학위 논문을 <>에 대해 씁니다.
이 논문이 바로 reshape, ggplot2, 분석모델 시각화를 위한 몇가지 패키지 개발에 대한 내용입니다.
2014년 tidy data라는 논문에서
데이터를 잘 분석하기 위해서는
데이터가 RDBMS나 엑셀처럼 행과 열의 형태로
잘 정리가 되어 있어야 함을 역설하였고,
tidy하게 데이터를 잘 분석하기 위해서
본인이 만든 패키지를 모으고, 추가 개발하여
tidyverse라는 데이터 분석용 패키지 시리즈를 발표합니다.
지금은 해들리 위컴이 만든 패키지가
빅데이터 분석툴인 R에서
거의 표준이 되어가고 있는 상황입니다.
해들리 위컴의 ggplot2는
시각화 패키지의 왕좌를 차지하고 있는데
이것은 2005년도 리랜드 윌킨슨 Leland Wilkinson 의
<<The grammar of Graphics>>의 시각화 철학을 R패키지로 구현한 것입니다.
해들리 위컴이 구현한 ggplot2 패키지는
누가 보아도 최고의 시각화툴입니다.
Python에서는 plotnine library를 통해
R문법 그대로 사용할 수 있습니다.
ggplot2에는 수많은 extension과 d3.js, plotly.js 등
수많은 자바스크립트 계열의 시각화패키지를
쉽게 인터페이스하게 해줌으로써
기존 상용 시각화툴을 뛰어넘어
빅데이터 분야의 최고지위를 가지게 됩니다.
더구나 이 모든 기능을 무료로 공개하여
빅데이터 분석을 대중화하는데 크게 기여하였습니다.
그는 최근 4권의 책을 기술하였는데
모두 웹 상에서 무료로 공개하여
빅데이터를 공부하기 위한 많은 분들께
큰 도움을 주고 있습니다.
현재는 R Studio의 최고 데이터 과학자로서 근무하고 있으며,
오클랜드 대학, 스탠포드 대학, 라이스 대학의 겸임교수를 맡고 있습니다.
(출처)
Hadley Wickham - Wikipedia
https://en.m.wikipedia.org/wiki/Hadley_Wickham
Practical tools for exploring data and models
http://had.co.nz/thesis/practical-tools-hadley-wickham.pdf
Pivot table - Wikipedia
https://en.m.wikipedia.org/wiki/Pivot_table
Tidyverse
https://www.tidyverse.org/packages
Leland Wilkinson - Wikipedia
https://en.m.wikipedia.org/wiki/Leland_Wilkinso
적송 권건우 redpine71@wedatalab.com
http://blog.naver.com/redpine71
공무원을 꿈꾸며 대학에 들어갔으나 동서양문화에 심취하여 수많은 사부님들을 찾아다녔고 기나긴 갈구끝에 서울 인사동과 중국 하남성 황토벌판 그리고 실리콘밸리에서 스승을 만났다. 지금은 산에서 내려와 많은 친구들과 동서문명을 융합시키는 새로운 도전의 여정에 있다.
前 삼성SDS technical architect
現 위데이터랩 대표이사
現 디랩아카데미 원장
現 성균관대, 한양대 겸임교수
現 세계진소왕태극권총회 서울분회장
#야만인 #동서양문화연구 #위데이터랩 #서예 #진소왕태극권
루나 허령
컴퓨터과학과 소프트웨어공학을 전공하고, 지금은 금융회사의 상품과 서비스를 분석, 설계, 구현하는 일을 하고 있다. 대학 초년생 시절 마인드맵을 접한 이후 즐겁게 생각하는 방법을 깨달았고, 소프트웨어공학의 모델링 사상을 이해하고부터는 마인드맵과 모델링을 아우르는 마인드맵모델링을 연구 중이다. 세상에 대한 공학적인 접근 이외에도 마음공부와 서예, 태극권 등으로 자신과 세상의 경계를 넘어 진리를 탐구하고 있다.
#야만인 #마음공부 #마인드맵 #모델링 #서예 #진소왕태극권 #천상병
'위데이터랩 도서 > 야사와 만화로 배우는 인공지능' 카테고리의 다른 글
[인공지능 만화] 42. 빅데이터 시대 세상을 바꾼 파이썬 라이브러리들 (0) | 2021.06.23 |
---|---|
[인공지능 만화] 41. 딥러닝을 보다 쉬게 케라스 창시자, 프랑소와 숄레 (0) | 2021.06.23 |
[인공지능 만화] 39. 데이터 분석의 슈퍼스타 (0) | 2021.06.22 |
[인공지능 만화] 38. 데이터 분석의 Hello World IRIS 데이터 (0) | 2021.06.22 |
[인공지능 만화] 37. 빅데이터 시대를 열다. 하둡을 창시한 더그 커팅 (0) | 2021.06.22 |