'빅데이터 관련 자료/Python' 카테고리의 글 목록
Data Analyst
300x250
300x250

빅데이터 관련 자료/Python 27

상관관계와 회귀분석: 데이터의 관계를 탐구하는 여정

데이터 분석에서 변수 간의 관계를 이해하는 것은 매우 중요합니다. 상관관계와 회귀분석은 이러한 관계를 탐구하고 설명하는 데 유용한 두 가지 방법입니다. 이 글에서는 두 개념의 정의와 차이점, 그리고 실무에서의 활용 방법을 예제와 함께 살펴보겠습니다.1. 상관관계란 무엇인가?상관관계(Correlation)는 두 변수 간의 연관성을 나타내는 통계적 개념입니다. 이는 두 변수가 얼마나 함께 변하는지를 측정하며, 상관계수(Correlation Coefficient)를 사용해 그 크기와 방향을 나타냅니다.상관계수의 범위와 의미:+1: 완전한 양의 상관관계 (한 변수가 증가할 때 다른 변수도 비례적으로 증가)0: 상관관계 없음 (두 변수 간에 선형적 관계가 없음)-1: 완전한 음의 상관관계 (한 변수가 증가할 때 ..

Python: 혁신적인 프로그래밍 언어

1. 소개Python은 그 간결함과 다재다능함으로 인해 전 세계적으로 인기를 끌고 있는 프로그래밍 언어입니다. 1991년 네덜란드의 Guido van Rossum에 의해 처음 발표된 이후, Python은 웹 개발, 데이터 과학, 인공지능, 자동화 등 다양한 분야에서 널리 사용되고 있습니다. 이 블로그 글에서는 Python의 장점, 주요 특징, 그리고 활용 분야에 대해 자세히 살펴보겠습니다.2. Python의 장점2.1. 간결하고 읽기 쉬운 문법Python의 문법은 간결하고 직관적입니다. 이는 프로그래머가 코드 작성에 집중할 수 있게 하고, 유지보수를 쉽게 합니다. 또한, Python은 코드 블록을 중괄호가 아닌 들여쓰기로 구분하여 가독성을 높였습니다.python코드 복사def greet(name): ..

[예시 Python 코딩] RFM 분석을 통한 고객을 세분화

실제 파이썬 코드를 통해 예시를 공부해봤습니다. # 원본 데이터셋 복사 rfm_online_sales = online_sales.copy() # 날짜 형식 변환 rfm_online_sales['거래날짜'] = pd.to_datetime(rfm_online_sales['거래날짜']) # 데이터 내 마지막 날짜 계산 last_date = rfm_online_sales['거래날짜'].max() # Recency 계산 recency_data = rfm_online_sales.groupby('고객ID')['거래날짜'].max().reset_index() recency_data['Recency'] = (last_date - recency_data['거래날짜']).dt.days # Frequency 계산 freque..

파이썬에서 데이터 읽는 방법

파이썬은 데이터를 읽고 처리하는 데 매우 효과적인 도구입니다. 다양한 데이터 소스에서 데이터를 읽을 수 있는 방법이 있습니다. 이 글에서는 CSV, Excel, JSON, SQL 데이터베이스 및 웹에서 데이터를 읽는 방법을 알아보겠습니다. 1. CSV 파일 읽기 CSV(Comma-Separated Values) 파일은 쉼표로 구분된 텍스트 파일입니다. 파이썬에서 CSV 파일을 읽으려면 csv 모듈을 사용합니다. import csv # CSV 파일 열기 with open('data.csv', 'r') as file: reader = csv.reader(file) # 각 행 읽기 for row in reader: print(row) 2. Excel 파일 읽기 Excel 파일을 읽으려면 pandas 라이브러리..

Python 파이썬, 왜 다들 파이썬 파이썬 그러는가?

파이썬은 다양한 이유로 많은 사람들에게 인기가 있는 프로그래밍 언어입니다. 이런 이유 중 일부는 다음과 같습니다 읽기 쉬운 문법 파이썬은 간결하고 읽기 쉬운 문법을 가지고 있어 새로운 프로그래머들도 빠르게 배울 수 있으며, 코드를 이해하기 쉽습니다. 다양한 라이브러리와 프레임워크 파이썬은 다양한 라이브러리와 프레임워크를 지원하며, 데이터 분석, 인공지능, 웹 개발, 게임 개발, 과학 연구 등 다양한 분야에서 사용됩니다. 대표적으로 NumPy, pandas, TensorFlow, Django, Flask, 등이 있습니다. 크로스 플랫폼 지원 파이썬은 Windows, macOS, Linux와 같은 다양한 운영체제에서 동작합니다. 이는 다양한 환경에서 프로그램을 개발하고 실행할 수 있도록 도와줍니다. 커뮤니티..

Python 함수 group by, unstack() , transpose()

unstack() group by 를 사용하고 unstack() 을 이용하여 컬럼을 가져올 수 있다. group by 하는 컬럼 중 예를 들어, ["A","B"]라고 한다면, 끝에있는 index B를 컬럼으로 가지고 온다. 실제 데이터로 확인해보자 지역별 평당 분양가격 데이터이다. 여기서 지역명, 전용면적으로 평당분양가격의 평균을 구하고자 하면, 아래 코딩과 같다. df_last.groupby(["지역명","전용면적"])["평당분양가격"].mean() 하지만, 컬럼으로 된 데이터로 확인하고 싶을 때, unstack() 을 사용한다. df_last.groupby(["지역명","전용면적"])["평당분양가격"].mean().unstack() 더 깔끔하다. 아까 처음에 ["A","B"]라고 한다면, 끝에있는 i..

ValueError: invalid literal for int() with base 10: ' ' 주피터 파이썬 에러

ValueError: invalid literal for int() with base 10: ' ' df_last["컬럼명"].astype(int) 보통 특정 컬럼의 object (문자형) 타입을 변경하고자 할 때, astype 을 통해 수치형으로 변경할 수 있는데 해당 컬럼 안에 ' ' 공백 문자가 들어있으면 수치형으로 변경할 수 없다. 이를 해결하기 위해서는 pd.to_numeric 을 사용한다. import pandas as pd pd.to_numeric(df_last["~"]) 하지만 아래와 같이 에러가 발생한다. ValueError: Unable to parse string " " 이러면 강제적으로 빈공간을 무시해주기 위해 errors = 'corece' 를 사용한다. pd.to_numeric(..

Jupyter 주피터 파이썬 에러 Unicode Decode Error

간혹 주피터 노트북에서 코드를 실행하다가 Unicode Decode Error 에러가 발생하게 된다. 이 오류는 한글인코딩이 깨져서 읽어오지 못해서 발생한것인데요. import pandas as pd pd.read_csv("파일명.csv", encoding = "cp949") pd.read_csv("파일명.csv", encoding = "euc-kr") encoding 파라미터를 cp949 또는 euc-kr로 설정하면 오류가 해결된다. 관련 기사 한글인코딩 : ‘설믜를 설믜라 못 부르는’ 김설믜씨 “제 이름을 지켜주세요” : 사회일반 : 사회 : 뉴스 : 한겨레

WARNING: Python 2.7 is not recommended 해결, 맥에 파이썬 설치하기

이런 에러가 발생하면? WARNING: Python 2.7 is not recommended. This version is included in macOS for compatibility with legacy software. Future versions of macOS will not include Python 2.7. Instead, it is recommended that you transition to using 'python3' from within Terminal. 해결방법 1. 파이썬을 다운받습니다. https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.p..

pip 설치하기

pip 설치하기 파이썬의 다양한 모듈을 다운로드하기 위해서 pip도 다운로드해야 합니다. ​명령 프롬프트 창 열기 윈도우 : 윈도우 버튼 ▶ cmd 입력 맥 : Terminal 앱 실행 명령어 입력 열린 명령 프롬포트 창에 다음과 같은 명령어를 순서대로 입력하시면 됩니다. 윈도우 curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py ​py get-pip.py 또는 python get-pip.py 입력 Successfully insatlled pip-19.3.1이라는 메세지가 나오면 정상적으로 설치가 완료! 맥 sudo easy_install pip

300x250
300x250