ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [스파르타]파이썬 데이터 분석 - 1주차(#파이썬, 주피터노트북, pandas, matplotlib)
    개발 일지/파이썬 데이터 분석 2022. 1. 3. 08:50

    새로 알게 된 내용😁

    1. 파이썬으로 데이터 분석하기 위한 환경 세팅 - 아나콘다 설치 후 주피터노트북 실행

    - print(변수명)이 아니라 그냥 변수명 입력 후 Shift + Enter 누르면 값을 출력한다.

    - In [ ] / Out [ ] 안의 라인넘버는 코드가 실행된 순서이다.
      : 통상적으로 위에서 부터 아래로 코드 순서가 진행된다고 생각하는데, 주피터는 라인넘버를 따른다. 아래 사진을 예로 들면, 위쪽에 있는 In [82] 블록이 In [81] 블록보다 위쪽에 위치하지만 코드 실행 순서는 위쪽에 위치한 In [82] 블록이 뒤쪽에 있다.


    2. 파이썬 기초 문법

    - 리스트 추가 방법

    리스트명_list.append('컨텐츠')

    - 딕셔너리 추가 방법

    딕셔너리명_dir['KEY'] = 'VALUE'

    - Set 형 : 중복을 제거해서 나타낸다.

    group1 = set([1, 2, 3, 4, 2, 4])
    group2 = set([1, 2, 3, 7, 1])
    
    print(group1)
    # {1, 2, 3, 4}
    print(group2)
    # {1, 2, 3, 7}

    (교집합 : group1 & group2 - {1, 2, 3} / 합집합 : group1 | group2 - {1, 2, 3, 4, 7})

    3. Pandas로 기초 데이터 분석

    # Pandas 불러오기
    import pandas as pd
    
    # 파일 불러와서 변수에 집어넣기
    val = pd.read_csv('./파일 경로')

    ※ 파일경로는 "./" 입력 후 Tab 키를 누르면 현재 경로 아래에 있는 폴더 및 파일을 나타내줘서 쉽게 선택 가능하다.

    # 숫자가 있는 컬럼 요약(갯수, 평균, 최소/최대 값 등)
    val.describe
    
    # 특정 컬럼 중복 없이 나타내고 컬럼수 표시하기
    set(val['column명']), len(set(val['column명']))
    
    # 파일 합치기
    pd.concat([파일1 변수명, 파일2 변수명])
    
    # 인덱스 다시 정렬하기
    whole val = whole val.reset_index(drop = True)

     

    4. Matplotlib으로 그래프 그리기

    matplotlib은 데이터를 시각화하는데 사용되는 라이브러리이다.

    # matplotlib 불러오기
    import matplotlib.pyplot as plt
    
    # 데이터 모아주기('column명'별로 'key'열만 데이터를 모아준다.)
    data.groupby('column명')['key']
    
    # 데이터 정렬하기
    데이터 변수명.sort_values(ascending=True)	# 오름차순 정렬
    데이터 변수명.sort_values(ascending=False)	# 내림차순 정렬
    
    # 데이터 한글 설정
    plt.rcParams('font.family') = 'Malgun Gothic'
    
    # 그래프 그리기
    plt.figure(figsize=(x축 크기, y축 크기))		# 그래프 사이즈 설정
    plt.bar(데이터 변수명.index, 데이터 변수명)	# bar 그래프에 x축, y축 설정
    plt.xlaberl('라벨명')				# x축 이름 설정
    plt.xticks(rotation=기울기각도값)		# x축 인덱스 각도 설정
    plt.title('타이틀')				# 그래프 타이틀 설정
    plt.show()					# 그래프 나타내기

     

    개발 업무 내용📑

    요일에 따른 피자 주문량 합계 구하기

    구에 따른 피자 주문량 합계 구하기

    요일별 피자&치킨 주문량 합계 구하기

     

    마무리 소감😉

    주피터 노트북은 처음 사용해보지만, 파이참보다 뭔가 직관적이고 코드 실행시 오류가 생겼을 때 어디서 오류가 생겼는지 쉽게 알 수 있고, 수정 후 다시 실행하는 것도 쉬워서 아주 마음에 들었다.
    k-디지털 크렛딧이 남아서 앱개발을 들을까 파이썬 데이터 분석을 들을까 고민하다가 선택한 것이 파이썬 데이터 분석인데, 처음해보는 데이터 분석이지만 아직까지는 쉽게 따라할 수 있고, 바로바로 결과가 나오다보니 재밌게 강의를 듣고있다.

    참고로 스파르타 코딩클럽은 기수제로 운영되서 같은 날 개강한 수강생들과 비교해서 진도별 랭킹을 나타내주는데, 지금까지는 내가 1등을 달리고있어서 이걸 유지하고 싶어서라도 매일 빼먹지 않고 강의를 듣는 중이다.😁

    댓글