ch01. Python 개요
ch01-01. introduction 15:09
초격자 패키지 online
안녕하세요, 프로그래밍 기초 (python) 담당 강승현 입니다.
경력 / 학력
현) AI / 물류 스타트업 메쉬코리아 TMS AL/ML Engineer
전) 삼성SDS AI 선행연구 LAB
전) 삼성SDS 분석플랫폼 LAB
- 서울대학교 수리과학부 박사(stochastics 전공) 졸업
- 포항공대 수학과 학사 졸업
이력
현) 강화학습을 활용한 조합최적화 문제 연구개발
전) 딥러닝, NLP/NLU 등을 활용한 검색 엔진 연구개발
전) Image auto augmentation 연구개발
전) AI 분석 프로그램 Brightics AI 함수 개발
파이썬의 특징
"Life is too short, you need python"
1. 쉽고 간결
C언어에서는 "Hello world"를 출력하기 위해 6~8줄이나 써야하지만, python에서는 오직 한 줄, print("Hello world") 한 줄만 적으면 된다.
2. 라이브러리가 많고 활용이 쉽다.
BeautifulSoup, Numpy, Pandas, Scipy, Scikit-learn 등 데이터 수집 및 분석을 위한 라이브러리들이 많아 편리하고 단지 pip install numpy와 같이 간단한 명령어를 이용해서 이러한 라이브러리들을 설치할 수 있고 사용도 쉽다.
3. 대중적인 언어
최근 AI를 위한 대부분의 라이브러리들은 파이썬을 기반으로 하고 있고, 세계적으로 첫 프로그래밍 언어로 파이썬을 배우는 비율이 매우 높음
파이썬의 활용 분야
1. 데이터 분석
- Pandas라는 라이브러리를 활용하면 excel이나 csv 등 table 형태로 되어있는 data를 컨트롤하기 쉽고 scipy나 scikit-learn 등의 라이브러리를 활용하면 통계 관련 연산이나 머신러닝 등의 활용을 쉽게 할 수 있다.
- 또한 matplotlib 라이브러리 등을 활용한 각종 data의 시각화가 가능하여 시각적으로 data를 분석하는데도 용이하다.
2. 데이터 크롤링
- requests 모듈이나 BeautifulSoup, selenium 등을 활용하여 인터넷에서 data를 수집하고 저장하는 것을 쉽게 할 수 있다.
3. 데이터베이스 프로그래밍
- 파이썬은 Oracle, MySQL, PostgreSQL, Amazon S3 등의 데이터베이스에 접근하기 위한 도구를 갖고 있어서 이런 데이터베이스와 연계하여 프로그래밍 하는 것이 가능하다.
파이썬으로 하기에 안 좋은 일
1. 시스템과 밀접한 프로그래밍 영역
- 파이썬으로 리눅스 같은 운영체제, 엄청난 횟수의 반복과 연산이 필요한 프로그램은 어울리지 않다.
참고 : Numpy 등과 같은 모듈은 그 기반이 C언어이기 때문에 수치 연산을 빠르게 할 수 있다.
2. 모바일 프로그래밍
- 아직 안드로이드나 아이폰 앱 등 모바일에서 파이썬으로 만든 프로그램을 실행하기엔 부족한 점이 많다.
ch01-02. 설치 및 실행
아나콘다로 설치하기
-> 실제로 파이썬을 실행할 수 있는 프로그램은 굉장히 많지만 개발할 때 주피터를 제일 많이 쓴다.
-> 아나콘다를 설치하면 주피터도 같이 설치 된다.
anaconda 검색
https://www.anaconda.com/download
Free Download | Anaconda
Anaconda's open-source Distribution is the easiest way to perform Python/R data science and machine learning on a single machine.
www.anaconda.com
-> Jupiter를 실행하면 웹페이지가 뜨고 New 버튼 클릭 -> python 3을 누르면 빈 창이 뜬다.
-> untitled는 이름을 바꿀 수 있다. -> test
print("Life is short.")
-> shift + enter를 누르면 실행된다.
Google Colab 사용하기
-> 구글코랩은 주피터 노트북 기반으로 만들어져서 사용이 거의 비슷하다. 구글이라는 회사에서 만든 주피터를 웹에서 실행할 수 있다. 구글코랩의 장점은 설치할 필요가 없다.
google colab 검색 (구글 아이디가 있어야 한다)
https://research.google.com/colaboratory/
https://research.google.com/colaboratory/
research.google.com
ch01-03. 기초 실습
파이썬과 다른 언어의 주요 차이점
- 대부분의 프로그래밍 언어들은 특정 부분을 구분하기 위하여 ;이나 { 등의 기호로 시작과 끝을 표현하는 엄격한 구조를 따라야 했지만 파이썬은 이 대신 들여쓰기를 사용한다.
변수란?
- 변수는 데이터를 담는 메모리 공간
- 변수에는 숫자, 문자, 목록 등을 담을 수 있다.
변수의 규칙
- x = 3과 같은 식으로 왼쪽에 변수 이름을, 오른쪽에 변수에 저장될 값을 입력한다.
- 변수 명명 규칙
-- 유니코드 문자나 밑줄로 시작
-- 이름에 공백이 없어야 함
-- 아스키코드의 특수문자는 사용 못함
-- 한글도 가능하지만 잘 쓰지 않음
구글 코랩 실습하기
-> 주석은 #을 하고 적는다. 컴퓨터는 이를 인식하지 못한다. 만약 주석을 쓰려고 하는데 줄이 길다면 ''' ''' 를 붙인다. 정확히 엄밀히 말하면 주석은 아니다. 여러 줄의 문자열을 쓸 때 쓰는데 문자만 덜렁 써놓으면 컴퓨터는 그냥 이런 문자가 있구나 생각하지 실행은 하지 않는다.
https://colab.research.google.com/drive/1nQai2xs2cairp-P6ehdrBwF2drWFl8vn?usp=sharing
Google Colaboratory Notebook
Run, share, and edit Python notebooks
colab.research.google.com
print / 변수 선언 / 주석 / if문 / 기본 연산 / 대입과 출력