머신러닝 개념, numpy 알아보기 | 1주차 - 1 | 파이썬 머신러닝 완벽가이드

Notice

Recent Posts

Recent Comments

Link

옌숭이

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

열심히 코딩 하숭!

머신러닝 개념, numpy 알아보기 | 1주차 - 1 | 파이썬 머신러닝 완벽가이드 본문

프로그래밍 언어/python

머신러닝 개념, numpy 알아보기 | 1주차 - 1 | 파이썬 머신러닝 완벽가이드

채숭이 2023. 1. 3. 23:38

* 해당 글은 inflearn의 강의 '[개정판] 파이썬 머신러닝 완벽가이드'를 정리한 글입니다.

회색 - 강의 제목

노란색, 주황색 - 강조

민트색 - 발표할 때 짚고 넘어가면 좋을 것 같은 부분

1일

[0:07:49] 개정판 강의 소개

실제 업무에 머신러닝이 어떻게 적용되는지 애플리케이션을 작성해 보면서 익히는게 매우 중요하다

[0:07:49] 머신러닝의 개념

Machine Learning (머신러닝)

- 데이터를 기반으로 패턴을 학습하고 결과를 예측

- 숨겨진 패턴을 인지해 해결한다

- ex) 데이터마이닝, 영상 인식, 음성 인식, 자연어 처리

[0:11:45] 머신러닝의 유형과 데이터의 중요성

지도학습(Supervised Learning)

- 문제(feature)와 답(target, label)을 모두 학습

- ex) 분류, 회귀, 추천 시스템, 시각/음성 감지/ 인지, 텍스트 분석, NLP(자연어처리)

비지도학습(Un-Supervised Learning)

- 주어지는 문제만 학습

- ex) 군집화(클러스터링), 차원 축소, 강화학습

데이터의 중요성

- 머신러닝의 단점: 데이터에 매우 의존적, 과적합, 복잡한 논리구조, 최적화의 어려움

- > 데이터를 이해하고 효율적으로 가공, 처리, 추출하는 능력이 매우 중요하다

[0:10:57] 파이썬 기반 머신러닝의 특징및 장점과 구성요소

파이썬(python)의 특징

- 구글, 페이스북 등의 IT 업계에서도 파이썬의 높은 생산성으로 인해 활용도가 매우 높음

- 오픈 소스, 많은 라이브러리, 개발 시 높은 생산성 보장

- 속도는 느리지만, 뛰어난 확장성, 유연성, 호환성을 가짐

[0:10:34] 파이썬기반 머신러닝을 위한 SW의 설치

- Anaconda3 설치

패키지

- Scikit-Learn(사이킷런) : 머신러닝

- NumPy(넘파이) : 행렬/선형대수 | SciPy(사이파이) : 통계

- Pandas(판다스) : 데이터 처리, 2차원 데이터 처리에 특화되어 있음

- Matplotlib(맷플롯립), Seaborn(시본): 데이터 시각화

[0:12:00] 사이킷런 업그레이드 수행 및 XGBoost와 LightGBM 설치

- 4장 분류에 사용되는 LightGBM과 9장 추천 시스템에 사용되는 Surprise 패키지를 설치하기 위해서는 Visual Studio Build Tools가 먼저 설치되어 있어야 함

- 다운로드 완료

[0:19:45] 주피터 노트북 사용법과 넘파이/판다스의 필요성

jupyter notebook 간단한 사용 방법

- Cell 단위로 실행됨

- shift + enter : Run & Cell 추가

- ctrl+enter : Run은 하는데 Cell 추가는 하지 않음

- 가위모양: 삭제

- Edit > Undo Delete Cells : 삭제한 쎌 복구

- Cell > Current Outputs > Clear : 최근 output 값이 clear 됨 (실행까지 Clear 되지는 않음!)

- Kernel > Restart & Clear Output : 메모리에서 모든 실행이 사라짐. 다시 처음부터 실행시킬 수 있음

- Kernel > Interrupt : 오래 수행되는 Cell을 멈출 수 있음

- File > Make a copy => 현재까지의 내용과 같지만 이름은 다른, 새로운 파일이 생김

markdown

- ### -> 헤더 (#의 개수 1~6에 따라 크기 달라짐)

- ** -> 강조

- 1. 내용 / 2. 내용 -> 순서

- *, +, - -> 모두 •으로 표기된다

- 앞에 띄어쓰기, tab -> 들여쓰기

=> 더 자세한 내용은 그때그때 구글링을 하면서 참고하도록 하자

Numpy 기초 실습

import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline # <- 넣어줘야 함

array1 = np.array([1,2,3,4])
plt.hist(array1)

- %matplotlib inline

: 브라우저에서 바로 그림을 확인할 수 있게 해줌

: pycharm에서는 대신 plt.show()를 작성하여 그림 확인을 할 수 있다 (해당 코드는 Anaconda를 통해 Juptyer Notebook에서 사용되고 plt.show()가 자동호출 되는데, pycharm은 그렇지 않기 때문)

넘파이와 판다스의 중요성

- 사이킷런이 넘파이 기반에서 작성됨

- 넘파이와 판다스에 대한 이해가 부족하면 다른 데이터 분석 전문가가 만든 머신러닝 코드에 대한 맥락을 이해할 수 없는 경우가 많음

[0:02:42] 강의에 사용될 예제 소스 코드 다운로드 받기

다운로드 완료

2일

[0:10:58] 넘파이 배열 ndarray 소개

NumPy(Numerical Python)

- 선형대수 기반의 프로그램을 쉽게 만들 수 있도록 지원

- 루프를 사용하지 않고 대량 데이터의 배열 연산을 가능하게 함 -> 빠른 연산 속도

- C/C++과 같은 저수준 언어 기반의 호환 API를 제공 -> 타 프로그램과 쉽게 통합 가능

(수행 성능이 매우 중요한 부분은 C/C++로 작성하고 이를 넘파이에서 호출하는 식으로 하면 쉽게 통합 가능! -> 대박 신기하다... 나중에 도전해보고싶다)

- 판다스에 비해서는 다양한 가공, 변환, 통계용 함수 적용이 편리하지 못 함

- 넘파이를 상세하게 알 필요는 없으나 이해하고 있으면 파이썬 기반의 머신러닝에 큰 도움이 됨 -> 입력, 출력 데이터를 넘파이 배열 타입으로 사용하기 때문

[0:08:04] 넘파이 배열 ndarray 생성, shape, 차원, 타입 실습

ndarray - array, type, shape

- 넘파이의 기반 데이터 타입은 ndarray

- array() 함수 : 파이썬 리스트와 같은 인자를 받아서 ndarray로 변환함

- type() 함수 : 인자의 type을 반환

- shape 변수 : ndarray의 크기(행과 열 수)를 튜플로 가지고 있음

코드

분류, 결정트리, Overfitting \| 3주차 - 5 \| 파이썬 머신러닝 완벽가이드 (0)	2023.01.23
타이타닉 생존자 예측, 분류 성능 평가 지표(Accuracy, Confusion Matrix, Precision, Recall, F1 Score, ROC-AUC), 피마 인디언 당뇨병 예측 \| 3주차 - 3, 4 \| 파이썬 머신러닝 완벽가이드 (0)	2023.01.22
사이킷런, Iris data_K Fold 검증, 데이터 인코딩, 스케일링 \| 3주차 - 1, 2 \| 파이썬 머신러닝 완벽가이드 (0)	2023.01.21
데이터 시각화(Matplotlib, Seaborn) \| 2주차 \| 파이썬 머신러닝 완벽가이드 (0)	2023.01.08
pandas 알아보기 \| 1주차 - 2 \| 파이썬 머신러닝 완벽가이드 (0)	2023.01.05

열심히 코딩 하숭!

머신러닝 개념, numpy 알아보기 | 1주차 - 1 | 파이썬 머신러닝 완벽가이드 본문

머신러닝 개념, numpy 알아보기 | 1주차 - 1 | 파이썬 머신러닝 완벽가이드

1일

2일

3일

'프로그래밍 언어 > python' 카테고리의 다른 글

티스토리툴바