-
[스파르타]파이썬 데이터 분석 - 1주차(#파이썬, 주피터노트북, pandas, matplotlib)개발 일지/파이썬 데이터 분석 2022. 1. 3. 08:50
새로 알게 된 내용😁
1. 파이썬으로 데이터 분석하기 위한 환경 세팅 - 아나콘다 설치 후 주피터노트북 실행
- print(변수명)이 아니라 그냥 변수명 입력 후 Shift + Enter 누르면 값을 출력한다.
- In [ ] / Out [ ] 안의 라인넘버는 코드가 실행된 순서이다.
: 통상적으로 위에서 부터 아래로 코드 순서가 진행된다고 생각하는데, 주피터는 라인넘버를 따른다. 아래 사진을 예로 들면, 위쪽에 있는 In [82] 블록이 In [81] 블록보다 위쪽에 위치하지만 코드 실행 순서는 위쪽에 위치한 In [82] 블록이 뒤쪽에 있다.
2. 파이썬 기초 문법- 리스트 추가 방법
리스트명_list.append('컨텐츠')
- 딕셔너리 추가 방법
딕셔너리명_dir['KEY'] = 'VALUE'
- Set 형 : 중복을 제거해서 나타낸다.
group1 = set([1, 2, 3, 4, 2, 4]) group2 = set([1, 2, 3, 7, 1]) print(group1) # {1, 2, 3, 4} print(group2) # {1, 2, 3, 7}
(교집합 : group1 & group2 - {1, 2, 3} / 합집합 : group1 | group2 - {1, 2, 3, 4, 7})
3. Pandas로 기초 데이터 분석
# Pandas 불러오기 import pandas as pd # 파일 불러와서 변수에 집어넣기 val = pd.read_csv('./파일 경로')
※ 파일경로는 "./" 입력 후 Tab 키를 누르면 현재 경로 아래에 있는 폴더 및 파일을 나타내줘서 쉽게 선택 가능하다.
# 숫자가 있는 컬럼 요약(갯수, 평균, 최소/최대 값 등) val.describe # 특정 컬럼 중복 없이 나타내고 컬럼수 표시하기 set(val['column명']), len(set(val['column명'])) # 파일 합치기 pd.concat([파일1 변수명, 파일2 변수명]) # 인덱스 다시 정렬하기 whole val = whole val.reset_index(drop = True)
4. Matplotlib으로 그래프 그리기
matplotlib은 데이터를 시각화하는데 사용되는 라이브러리이다.
# matplotlib 불러오기 import matplotlib.pyplot as plt # 데이터 모아주기('column명'별로 'key'열만 데이터를 모아준다.) data.groupby('column명')['key'] # 데이터 정렬하기 데이터 변수명.sort_values(ascending=True) # 오름차순 정렬 데이터 변수명.sort_values(ascending=False) # 내림차순 정렬 # 데이터 한글 설정 plt.rcParams('font.family') = 'Malgun Gothic' # 그래프 그리기 plt.figure(figsize=(x축 크기, y축 크기)) # 그래프 사이즈 설정 plt.bar(데이터 변수명.index, 데이터 변수명) # bar 그래프에 x축, y축 설정 plt.xlaberl('라벨명') # x축 이름 설정 plt.xticks(rotation=기울기각도값) # x축 인덱스 각도 설정 plt.title('타이틀') # 그래프 타이틀 설정 plt.show() # 그래프 나타내기
개발 업무 내용📑
요일에 따른 피자 주문량 합계 구하기
구에 따른 피자 주문량 합계 구하기
요일별 피자&치킨 주문량 합계 구하기
마무리 소감😉
주피터 노트북은 처음 사용해보지만, 파이참보다 뭔가 직관적이고 코드 실행시 오류가 생겼을 때 어디서 오류가 생겼는지 쉽게 알 수 있고, 수정 후 다시 실행하는 것도 쉬워서 아주 마음에 들었다.
k-디지털 크렛딧이 남아서 앱개발을 들을까 파이썬 데이터 분석을 들을까 고민하다가 선택한 것이 파이썬 데이터 분석인데, 처음해보는 데이터 분석이지만 아직까지는 쉽게 따라할 수 있고, 바로바로 결과가 나오다보니 재밌게 강의를 듣고있다.
참고로 스파르타 코딩클럽은 기수제로 운영되서 같은 날 개강한 수강생들과 비교해서 진도별 랭킹을 나타내주는데, 지금까지는 내가 1등을 달리고있어서 이걸 유지하고 싶어서라도 매일 빼먹지 않고 강의를 듣는 중이다.😁'개발 일지 > 파이썬 데이터 분석' 카테고리의 다른 글
[스파르타]파이썬 데이터 분석 - 4주차(#주식 데이터, heatmap, 데이터 스튜디오) (0) 2022.01.06 [스파르타]파이썬 데이터 분석 - 3주차(#wordcloud, pivot table, 히트맵) (0) 2022.01.05 [스파르타]파이썬 데이터 분석 - 2주차(#folium) (0) 2022.01.04