Lv1 | EDA | 데이터 확인하기 (head()) Pandas 라이브러리를 이용하여 데이터를 확인하는 방법 그 중 가장 대표적인 메서드: head() head() 메서드는 데이터를 전부 보여주지 않고 상단 부분만 출력하여 보인다. tail() 메서드는 하단 부분만 출력하여 보인다. import pandas as pd train=pd.read_csv("data/train.csv") train.head() train.tail() 빅데이터 관련 자료/Dacon 2021.07.24
Lv1 | EDA | 행열갯수 관찰하기 (shape) read_csv를 통해 csv파일을 pandas 라이브러리에서 제공하는 dataframe 객체로 변환했다면, 불러온 데이터의 행과 열의 갯수를 관찰할 수 있다. [DataFrame 변수명].shape df.shape 빅데이터 관련 자료/Dacon 2021.07.23
파이썬 기초-3 딕셔너리 참고자료: https://docs.python.org/3/tutorial/datastructures.html#dictionaries 5. Data Structures — Python 3.9.6 documentation 5. Data Structures This chapter describes some things you’ve learned about already in more detail, and adds some new things as well. 5.1. More on Lists The list data type has some more methods. Here are all of the methods of list objects: list.append(x) docs.python.org d.. 빅데이터 관련 자료/Python 2021.07.22
Lv1 | EDA | 파일 불러오기 (read_csv()) 파이썬에서 데이터 파일(csv 파일)을 불러오기 위해서는 pandas 라이브러리를 이용한다. pandas를 이용해 csv 파일을 불러오기 위해서는 아래와 같이 pandas를 먼저 import 해야한다. 그리고 약어로 지정한 pd를 사용하여 read_csv함수를 통해 csv 파일을 불러 올 수 있다. import [라이브러리] as [사용할이름] import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 빅데이터 관련 자료/Dacon 2021.07.22
파이썬 기초 - 2 리스트의 인덱싱 - car라는 변수에 담겨있는 '구급차'를 인덱싱을 통해 가져오기 car 리스트의 첫번째 원소는 0부터 시작하므로 구급차는 인덱싱 순서로 2번째에 있다. car=['경찰차','소방차','구급차','녹차'] car[2] - 1번째 인덱스 가져오기 car[1] - 마지막 인덱스 가져오기 car[-1] 문자열을 리스트로 만들기 - split(): address를 공백으로 문자열 분리 address=" 경기도 파주시 심학산로 000 1001동 " address_list=address.split() - len(): 문자열 길이 구하기 len(address) - len(): 리스트의 길이 구하기 총 리스트의 길이로 리스트 안의 원소 개수와 같다. len(address_list) - 인덱싱으로 '파주.. 빅데이터 관련 자료/Python 2021.07.21
파이썬 기초 - 1 현재 주피터 노트북이 있는 경로를 출력할 수 있다. %pwd Zen of Python - 파이썬의 철학이 잘 담겨있는 Zen of Python 을 출력할 수 있다. - import를 통해 파이썬의 라이브러리나 패키지를 가져올 수 있다. import this boolean 파이썬에는 명시적인 것이 암시적인 것보다 낫다라는 철학이 있다. True 나 False는 0과 1로도 표현할 수 있으나 명시적으로 표현하기 위해 True와 False를 사용한다. # True는 1과 같음을 표현하기 # 파이썬에서는 같음을 비교할 때 == 연산을 사용한다. print(True== 1) print(True=="1") True != "1" # 문자열 1과 True는 다르다. False != "1" # False 도 마찬가지이다.. 빅데이터 관련 자료/Python 2021.07.20
Lv1 | EDA | 라이브러리 불러오기 (import) 파이썬에서 데이터 파일(csv 파일)을 불러오기 위해서는 pandas 라이브러리를 이용한다. pandas를 이용해 csv 파일을 불러오기 위해서는 아래와 같이 pandas를 먼저 import 해야한다. import [라이브러리] as [사용할이름] import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 빅데이터 관련 자료/Dacon 2021.07.20