본문 바로가기

분류 전체보기

[인공지능 만화] 44. 주피터 노트북으로 세상을 이롭게, 페르난도 페레즈 페레즈는 대학원에서 물리학 연구를 할 때 기존 Python 명령어 쉘이 못내 불편하여 보다 더 개선된 대화형 쉘을 원했습니다.콜롬비아 출신 입자물리학 박사 2001년 미국 콜로라도 대학 박사과정 중 IPython 프로젝트 시작 2012년 프리소프트웨어상 수상 2014년 모든 환경을 웹으로 지원하는 Jupyter 프로젝트 시작 오픈소스 운동의 열렬한 지지자 페르난도 페리즈 Fernando Perez입니다. 페레즈는 대학원에서 물리학 연구를 할 때 기존 Python 명령어 쉘이 못내 불편하여 보다 더 개선된 대화형 쉘을 원했습니다. 그 아쉬움은 웹 브라우저에 터미널을 넣음으로써 해결할 수 있었습니다. 그 아이디어로 출발한 것이 IPython Notebook 프로젝트입니다. 그런데 그 좋은 걸 Python에만.. 더보기
[인공지능 만화] 43. 파이썬을 빅데이터 시대의 승자로 만든, 트라비스 올리펀트 파이썬으로 데이터과학 공부를 하는 초심자도 다들 한 번씩은 들어보셨을 NumPy, SciPy, Numba, Conda, XND, NumFOCUS, PyData를 한 사람이 다 만들었다면 믿어지실까요? 이번 주인공은 트라비스 올리펀트입니다. 그는 Brigham Young University에서 학사, 석사를 받고, Mayo Clinic에서 박사학위를 받았습니다. 2001~2007년까지 Brigham Young University에서 전기 컴퓨터공학 조교수를 맡아 확률이론, 전자기학, 인버스 문제, 신호처리 과정 등을 강의했습니다. 그리고 의생명 영상연구실의 책임자로서 위성원격감지, MRI, 초음파, 탄성 및 스캔 임피던스 영상을 연구합니다. 그러면서 그는 1997년부터 숫자 및 과학 프로그래밍, 특히 Nu.. 더보기
[인공지능 만화] 42. 빅데이터 시대 세상을 바꾼 파이썬 라이브러리들 빅데이터 시대 데이터분석의 가장 인기있는 툴이 되고있는 파이썬 Python을 있게 한 가장 큰 기여자를 뽑으라면 아마도 많은 분들이 파이썬을 만든 귀도 반 로섬 Guido van Rossum보다 넘파이 NumPy를 만든 트라비스 올리펀트 Travis E. Oliphant를 뽑지 않을까 싶습니다. 1995년 파이썬 커뮤니티에서는 matrix-sig라는 특별관심그룹 special interest group을 만듭니다. 다른 언어에는 다 있지만 파이썬에는 없는 배열 array 데이터타입을 만들기 위해서였습니다. 그 그룹의 일원이었던 MIT 대학원생 짐 허거닌 Jim Hugunin은 짐 펄톤 Jim Fulton의 matrix object를 기반으로 C로 구현한 Numeric이라는 모듈을 개발합니다. 1997년 .. 더보기
[인공지능 만화] 41. 딥러닝을 보다 쉬게 케라스 창시자, 프랑소와 숄레 딥러닝은 1986년 역전파 알고리즘의 발견과 1989년 얀 레쿤 Yann LeCun의 CNN(합성곱신경망) 알고리즘을 이용한 우편번호 인식 등의 진전으로 가능성을 보여주었지만 여전히 실제 활용은 불가능한 '연구실 안의 기술'로 기나긴 겨울을 통과하고 있었습니다. 2006년 제프리 힌튼 Geoffrey Everest Hinton 교수가 논문에서 RBM(Restricted Bolzman Machine)으로 초기화시켜 신경망을 깊게 구성하여 Vanishing Gradient 문제를 해결함으로써 딥러닝의 마지막 난제를 극복할 수 있는 가능성을 제시합니다. 이후 각 대학을 중심으로 딥러닝 신경망 구현을 위한 라이브러리들이 본격적으로 만들어지기 시작합니다. 그 첫 번째가 2010년 요슈아 벤지오 Yoshua Ben.. 더보기
[인공지능 만화] 40. 통계 툴이었던 R을 빅데이터 툴로 발전시킨, 해들리 위컴 R을 배우게 되면 누구나 접하게 되는 시각화 패키지 ggplot2 전처리 패키지 dplyr 문자열처리 패키지 stringr 등 현재 R에서 빅데이터 분석을 위한 대부분의 툴을 만든 사람은 뉴질랜드 오클랜드 대학 출신의 해들리 위컴 Hadley Alexander Wickham 입니다. 뉴질랜드 오클랜드 대학 통계학 학사, 석사를 마치고, 2008년 아이오와 주립대학에서 통계학 박사학위를 취득했는데 박사학위 과정을 공부하면서 실제로 많은 데이터를 분석하다가 전처리를 위해 reshape을 만들었고, 시각화를 위해 ggplot을 만들었습니다. 그리고 이러한 경험을 모아서 박사학위 논문을 에 대해 씁니다. 이 논문이 바로 reshape, ggplot2, 분석모델 시각화를 위한 몇가지 패키지 개발에 대한 내용입니다.. 더보기
[인공지능 만화] 39. 데이터 분석의 슈퍼스타 벨 연구소에서 1970년대 우리가 잘 아는 B언어(켄 톰슨 Kenneth Lane Tompson, 데니스 리치 Dennis MacAlistair Ritchie 가 만듦)와 C언어(데니스 리치, 브라이언 커니헨 Brian Wilson Kernighan 이 만듦)가 만들어졌고, C언어에 기반하여 UNIX가 만들어졌습니다 그리고 1970년대 후반 역시 벨 연구소에서 통계분석용 언어를 거의 최초로 만들었는데 그것을 B언어, C언어 명명법에 따라 Statistics의 S(존 챔버스 John Chambers, 릭 베커 Rick Becker, 앨런 윌크스 Allan Wilks 가 만듦)라고 지었습니다. 그러고 보니 데이터 시각화의 중요성을 일찍이 강조했던 프란시스 앤스콤 Francis Anscombe 도 벨 연구소 .. 더보기
[인공지능 만화] 38. 데이터 분석의 Hello World IRIS 데이터 더보기
[인공지능 만화] 37. 빅데이터 시대를 열다. 하둡을 창시한 더그 커팅 더그 커팅 Doug Cutting은 오픈소스 프로젝트의 최대 성공작 중 하나인 Hadoop을 시작한 분입니다. 2006년, 대학원생 마이크 카파렐라 Michael J. Cafarella와 오픈소스 검색엔진의 하부 프로젝트인 하둡 Hadoop을 시작할 때는 이렇게까지 대규모로 커질 줄 몰랐습니다. 소프트웨어에는 두 가지 흐름이 있는데 더그 커팅 자신은 해커 소프트웨어 흐름에 속해 있다고 말한 바 있습니다. 이러한 해커 소프트웨어는 일찌기 자유 소프트웨어 운동 Free Software Movement을 전개한 리차드 스톨만 Richard Stallman, 인터넷 혁명을 가져온 월드 와이드 웹 World Wide Web의 창시자 팀 버너스 리 Sir Tim Berners-Lee, 리눅스 Linux를 만들어 소.. 더보기
[인공지능 만화] 36. RDBMS의 역사를 이끈 시대의 천재, 밥 마이너 요즘 데이터베이스 업계에서 가장 핫한 단어는 빅데이터입니다. 하지만 지난 30년간은 누가 뭐래도 관계형 데이터베이스 관리 시스템 RDBMS의 시대였습니다. RDBMS의 선두기업인 오라클의 Larry Ellison 래리 앨리슨 회장은 세계 몇 째 가는 부자이며 오라클은 기업용 소프트웨어 시장의 선두를 지키고 있습니다. (물론 빅데이터 세상에서는 해당되지 않는 이야기입니다만) 이러한 오라클도 약 40년 전에는 실리콘벨리의 작은 스타트업 기업이었습니다. 이 오라클을 통해 RDBMS 시대를 열어제낀 시대의 천재가 있었습니다. 밥 마이너 Bob Miner가 그 주인공입니다. 아제르바이젠에서 이주한 이란계 이민가정에서 태어난 밥 마이너는 일리노이 대학에서 수학을 전공하고 AMPEX사에서 CIA 관련 프로젝트를 하면.. 더보기
[인공지능 만화] 35. 의사결정트리 알고리즘의 역사 램덤 포레스트와 X G BOOST 로스 퀸란이 만든 알고리즘은 반복이진분류법인 ID3(Iterative Dichotomizer 3)이며, 이후 C4.5에서 C5.0으로 발전합니다. 이 알고리즘들은 집합을 분류할 때 엔트로피 Entropy라는 '집합의 불확실성 정도'로 판단합니다. 이 엔트로피의 개념은 클로드 섀넌의 정보엔트로피에서 가져온 것입니다. 이런 집합의 분류법은 엔트로피 외에도 더 있습니다. 존 하티건 J. A. Hartigan이 만든 CHAID(Chi-squared Automatic Intersection Detection)에서는 카이제곱 χ2을 썼고, 레오 브라이먼 Leo Breiman의 CART(Classification And Regression Trees) 알고리즘에서는지니계수(Gini Index)를 썼습니다. 지니계수란.. 더보기