'빅데이터 관련 자료/Python' 카테고리의 글 목록
Data Analyst
300x250
300x250

빅데이터 관련 자료/Python 25

[예시 Python 코딩] RFM 분석을 통한 고객을 세분화

실제 파이썬 코드를 통해 예시를 공부해봤습니다. # 원본 데이터셋 복사 rfm_online_sales = online_sales.copy() # 날짜 형식 변환 rfm_online_sales['거래날짜'] = pd.to_datetime(rfm_online_sales['거래날짜']) # 데이터 내 마지막 날짜 계산 last_date = rfm_online_sales['거래날짜'].max() # Recency 계산 recency_data = rfm_online_sales.groupby('고객ID')['거래날짜'].max().reset_index() recency_data['Recency'] = (last_date - recency_data['거래날짜']).dt.days # Frequency 계산 freque..

파이썬에서 데이터 읽는 방법

파이썬은 데이터를 읽고 처리하는 데 매우 효과적인 도구입니다. 다양한 데이터 소스에서 데이터를 읽을 수 있는 방법이 있습니다. 이 글에서는 CSV, Excel, JSON, SQL 데이터베이스 및 웹에서 데이터를 읽는 방법을 알아보겠습니다. 1. CSV 파일 읽기 CSV(Comma-Separated Values) 파일은 쉼표로 구분된 텍스트 파일입니다. 파이썬에서 CSV 파일을 읽으려면 csv 모듈을 사용합니다. import csv # CSV 파일 열기 with open('data.csv', 'r') as file: reader = csv.reader(file) # 각 행 읽기 for row in reader: print(row) 2. Excel 파일 읽기 Excel 파일을 읽으려면 pandas 라이브러리..

Python 파이썬, 왜 다들 파이썬 파이썬 그러는가?

파이썬은 다양한 이유로 많은 사람들에게 인기가 있는 프로그래밍 언어입니다. 이런 이유 중 일부는 다음과 같습니다 읽기 쉬운 문법 파이썬은 간결하고 읽기 쉬운 문법을 가지고 있어 새로운 프로그래머들도 빠르게 배울 수 있으며, 코드를 이해하기 쉽습니다. 다양한 라이브러리와 프레임워크 파이썬은 다양한 라이브러리와 프레임워크를 지원하며, 데이터 분석, 인공지능, 웹 개발, 게임 개발, 과학 연구 등 다양한 분야에서 사용됩니다. 대표적으로 NumPy, pandas, TensorFlow, Django, Flask, 등이 있습니다. 크로스 플랫폼 지원 파이썬은 Windows, macOS, Linux와 같은 다양한 운영체제에서 동작합니다. 이는 다양한 환경에서 프로그램을 개발하고 실행할 수 있도록 도와줍니다. 커뮤니티..

Python 함수 group by, unstack() , transpose()

unstack() group by 를 사용하고 unstack() 을 이용하여 컬럼을 가져올 수 있다. group by 하는 컬럼 중 예를 들어, ["A","B"]라고 한다면, 끝에있는 index B를 컬럼으로 가지고 온다. 실제 데이터로 확인해보자 지역별 평당 분양가격 데이터이다. 여기서 지역명, 전용면적으로 평당분양가격의 평균을 구하고자 하면, 아래 코딩과 같다. df_last.groupby(["지역명","전용면적"])["평당분양가격"].mean() 하지만, 컬럼으로 된 데이터로 확인하고 싶을 때, unstack() 을 사용한다. df_last.groupby(["지역명","전용면적"])["평당분양가격"].mean().unstack() 더 깔끔하다. 아까 처음에 ["A","B"]라고 한다면, 끝에있는 i..

ValueError: invalid literal for int() with base 10: ' ' 주피터 파이썬 에러

ValueError: invalid literal for int() with base 10: ' ' df_last["컬럼명"].astype(int) 보통 특정 컬럼의 object (문자형) 타입을 변경하고자 할 때, astype 을 통해 수치형으로 변경할 수 있는데 해당 컬럼 안에 ' ' 공백 문자가 들어있으면 수치형으로 변경할 수 없다. 이를 해결하기 위해서는 pd.to_numeric 을 사용한다. import pandas as pd pd.to_numeric(df_last["~"]) 하지만 아래와 같이 에러가 발생한다. ValueError: Unable to parse string " " 이러면 강제적으로 빈공간을 무시해주기 위해 errors = 'corece' 를 사용한다. pd.to_numeric(..

Jupyter 주피터 파이썬 에러 Unicode Decode Error

간혹 주피터 노트북에서 코드를 실행하다가 Unicode Decode Error 에러가 발생하게 된다. 이 오류는 한글인코딩이 깨져서 읽어오지 못해서 발생한것인데요. import pandas as pd pd.read_csv("파일명.csv", encoding = "cp949") pd.read_csv("파일명.csv", encoding = "euc-kr") encoding 파라미터를 cp949 또는 euc-kr로 설정하면 오류가 해결된다. 관련 기사 한글인코딩 : ‘설믜를 설믜라 못 부르는’ 김설믜씨 “제 이름을 지켜주세요” : 사회일반 : 사회 : 뉴스 : 한겨레

WARNING: Python 2.7 is not recommended 해결, 맥에 파이썬 설치하기

이런 에러가 발생하면? WARNING: Python 2.7 is not recommended. This version is included in macOS for compatibility with legacy software. Future versions of macOS will not include Python 2.7. Instead, it is recommended that you transition to using 'python3' from within Terminal. 해결방법 1. 파이썬을 다운받습니다. https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.p..

pip 설치하기

pip 설치하기 파이썬의 다양한 모듈을 다운로드하기 위해서 pip도 다운로드해야 합니다. ​명령 프롬프트 창 열기 윈도우 : 윈도우 버튼 ▶ cmd 입력 맥 : Terminal 앱 실행 명령어 입력 열린 명령 프롬포트 창에 다음과 같은 명령어를 순서대로 입력하시면 됩니다. 윈도우 curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py ​py get-pip.py 또는 python get-pip.py 입력 Successfully insatlled pip-19.3.1이라는 메세지가 나오면 정상적으로 설치가 완료! 맥 sudo easy_install pip

파이썬 간편하게 설치하기

파이썬 간편하게 설치하기 ​ 파이썬 사이트 접속 https://www.python.org/ ​다운로드 Downloads 탭에 마우스를 대면 아래와 같은 창이 뜹니다. 빨간색 네모 안의 Python 3.9.0 (버전 변경 가능) 버튼을 클릭하면 사용하시는 운영환경에 맞는 파일이 다운로드됩니다. 창이 뜨면 밑에 Add Python 3.10 to PATH 를 체크하시면 됩니다. 이후에는 Install Now버튼을 누르신 후 계속 진행하시면 됩니다. 다운로드 확인 다운로드 후 명령 프롬프트를 열어서 python이라고 치면 확인할 수 있습니다. 명령 프롬프트를 여는 법 윈도우 : 윈도우 버튼 ▶ cmd 입력 ▶ python 엔터! 맥 : Terminal 앱 실행 ▶ python 엔터!

금융 데이터, 주식 관련 데이터 분석, 네이버 금융 개별종목 수집

라이브러리 로드 import pandas as pd 수집할 URL 정하기 # 종목번호와 상장사 이름을 item_code와 item_name으로 설정 item_code = "352820" item_name = "빅히트" # item_code = "326030" # item_name = "SK바이오팜" # 종목 URL 만들기 url="https://finance.naver.com/item/sise_day.nhn?code=352820&page=3" print(url) requests를 통한 HTTP 요청 Requests: HTTP for Humans™ — Requests documentation Quickstart — Requests documentation # custom-headers import requ..

300x250
300x250