이서
Data Analyst
300x250
300x250

전체 글 347

윈도우 함수 활용하기: SQL에서 데이터 분석을 위한 강력한 기능

데이터베이스에서 데이터를 분석하고 통계 정보를 추출할 때 윈도우 함수는 매우 유용한 도구입니다. 초보자들도 이해하기 쉽게 이 글에서는 윈도우 함수의 기본 개념부터 실제 예제를 통해 데이터 분석을 어떻게 수행하는지를 다루며, 윈도우 함수 활용의 중요성을 설명하겠습니다. 윈도우 함수 개요 윈도우 함수는 특정한 윈도우(또는 그룹) 내에서 계산되는 특별한 종류의 함수입니다. 각 행에 대해 별도로 결과를 반환하지만, 분석할 데이터를 윈도우로 지정하여 그룹에 대한 통계를 계산할 수 있습니다. 윈도우 함수 종류 ROW_NUMBER(): 결과 집합 내에서 행의 순서를 나타내는 번호를 반환합니다. RANK(), DENSE_RANK(): 행의 순위를 계산하며, 동일한 값이 있는 경우 RANK와 DENSE_RANK의 차이점..

CTE(Common Table Expressions) 활용: SQL 쿼리 간결화와 가독성 향상

SQL 쿼리를 작성하다 보면, 반복적인 서브쿼리나 중첩 쿼리로 인해 쿼리의 가독성이 떨어지는 경우가 있습니다. CTE(Common Table Expressions)는 이런 문제를 해결하고 쿼리를 더 간결하고 이해하기 쉽게 작성할 수 있는 강력한 기능입니다. 초보자도 이해하기 쉽게 CTE의 개념과 활용 방법을 다루며, 실제 예제를 통해 CTE를 활용한 SQL 쿼리를 살펴보겠습니다. CTE(Common Table Expressions)란? CTE는 임시적으로 정의되는 테이블로, 쿼리 안에서 서브쿼리처럼 사용되지만 중복 코드를 줄이고 가독성을 향상시키는 데 사용됩니다. WITH 키워드를 사용하여 CTE를 정의하며, 쿼리의 일부로 여러 번 참조할 수 있습니다. WITH cte_name (column1, colu..

연애나 썸 탈 때 참고하기! MBTI 별 선호하는 연애 및 커플 특징 (유머, 재미) - I

각 MBTI 유형은 연애에서 다양한 특징과 선호하는 접근 방식을 가지고 있습니다. 아래에서는 각 MBTI 유형별로 연애에 대한 간략한 소개를 제공해드리겠습니다. 우선 I 모여라~~ - E 인 경우에는 아래 링크로 바로 넘어가세요 ㅎㅎ - https://carpe08.tistory.com/318 ISTJ (현실주의자) 신중하고 조용한 ISTJ는 안정적이고 신뢰할 만한 관계를 선호합니다. 실용적이며 책임감이 강하여 일관성과 안정성을 중요시합니다. 연애에서도 신중하게 진전하며, 서로의 가치관과 목표를 공유하는 관계에 만족합니다. ISFJ (수호자) 관용적이고 현실적인 ISFJ는 진정한 애정과 보호를 제공하는 편입니다. 배려심이 깊고 상대방의 감정을 잘 이해합니다. 안정적인 환경과 신뢰를 중요시하며, 공감과 지..

연애나 썸 탈 때 참고하기! MBTI 별 선호하는 연애 및 커플 특징 (유머, 재미) - E

각 MBTI 유형은 연애에서 다양한 특징과 선호하는 접근 방식을 가지고 있습니다. 아래에서는 각 MBTI 유형별로 연애에 대한 간략한 소개를 제공해드리겠습니다. 우선 E 모여라~~ - I 인 경우에는 아래 링크로 바로 넘어가세요 ㅎㅎ - https://carpe08.tistory.com/317 ESTP (사업가) 활동적이고 모험을 추구하는 ESTP는 즉각적인 연결과 스릴을 중요시합니다. 새로운 경험과 자극을 즐기며, 자유로운 관계와 다양한 활동을 선호합니다. 관찰력이 뛰어나며, 상대방과의 자유로운 대화와 적극적인 사랑 표현을 중요시합니다. ESFP (연예인) 사교적이고 즐거운 분위기를 선호하는 ESFP는 친밀한 연결과 자발적인 상호 작용을 중요시합니다. 관심을 받고 주목받는 것을 즐기며, 로맨틱하고 감성..

카테고리 없음 2023.06.10

초보 강사 SQL 과외 강의 자료 목차 소개

1회 - 데이터베이스와 SQL 소개 데이터베이스의 개념과 중요성 SQL (Structured Query Language) 소개 SQL 문의 기본 구조와 데이터 조작 기능 2회 - 데이터베이스 생성과 테이블 작성 데이터베이스 생성과 관리 테이블의 생성과 구조 설계 데이터 유형과 제약 조건 설정 3회 - 데이터 삽입, 조회, 수정, 삭제 (CRUD) 데이터 삽입: INSERT 문 활용 데이터 조회: SELECT 문의 활용과 조건 지정 데이터 수정: UPDATE 문을 사용한 레코드 수정 데이터 삭제: DELETE 문을 사용한 레코드 삭제 4회 - 데이터 필터링과 정렬 WHERE 절을 사용한 데이터 필터링 여러 조건을 활용한 복합 필터링 ORDER BY 절을 사용한 데이터 정렬 5회 - 데이터 그룹화와 집계 함..

탈모 자세히 알아보자! 꼭 읽어보세요!! 원인, 증상, 예방 및 관리 방법

탈모는 많은 사람들에게 영향을 미치는 보편적인 문제입니다. 탈모는 머리카락의 비정상적인 손실로 인해 두피가 빈 곳이나 모발이 희박해지는 현상을 말합니다. 이 증상은 여성과 남성 모두에게 영향을 미치며, 심각한 자존감 문제와 심리적 고통을 야기할 수 있습니다. 이번 글에서는 탈모의 주요 원인, 증상, 예방 및 관리 방법에 대해 알아보겠습니다. 원인!! 탈모의 주요 원인은 유전적 요인, 호르몬 변화, 스트레스, 영양 부족, 약물 부작용 등이 있습니다. 유전적인 탈모는 가족력이 있을 경우 발생할 가능성이 높습니다. 호르몬 변화는 여성에서 임신, 출산, 폐경 등 여러 상황에서 발생할 수 있으며, 남성에서는 남성호르몬인 테스토스테론의 변화가 관련될 수 있습니다. 증상!! 탈모의 주요 증상은 두피의 모발이 점점 얇..

카테고리 없음 2023.06.10

[Chat GPT] 데이터 분석가가 되기 위해 무엇을 해야될까?

Chat GPT에게 질문을 해봤다. 데이터 분석가 직업을 갖기 위해 무엇을 해야될까? 답변 데이터 분석가가 되기 위해서는 다음과 같은 단계를 거쳐야 합니다. 1. 기초 지식 습득 데이터 분석에 필요한 기초 지식을 습득해야 합니다. 이에는 통계학, 데이터베이스, 프로그래밍 언어 등이 포함됩니다. 온라인 강의나 책을 통해 습득할 수 있습니다. 2. 실습 이론적인 지식만으로는 부족합니다. 실제 데이터를 다루어보고, 분석해보는 경험이 필요합니다. 이를 위해서는 데이터를 수집하고, 정제하며, 분석하는 과정을 반복적으로 수행해보는 것이 좋습니다. 3. 프로젝트 경험 실제 프로젝트를 수행하면서 데이터 분석 기술을 익히는 것이 좋습니다. 개인 프로젝트나 외부에서 제공하는 프로젝트 등을 수행하여 데이터 분석 능력을 향상..

추가! 신입이 이해 못 했던 자주 쓰는 10가지 직장용어

SEO(Search Engine Optimization) 검색 엔진 최적화를 의미하며, 웹사이트가 검색 결과 상위에 노출될 수 있도록 최적화하는 기술입니다. SEM(Search Engine Marketing) 검색 엔진 마케팅으로, 검색 광고를 활용하여 웹사이트를 홍보하는 기술입니다. PPC(Pay-Per-Click) 광고주가 광고 클릭당 수수료를 지불하는 광고 모델로, SEM에서 많이 사용됩니다. CPM(Cost per Mille) 광고주가 광고가 1,000회 노출될 때마다 지불하는 광고 모델입니다. CMS(Content Management System) 웹사이트나 애플리케이션 등의 콘텐츠를 관리하는 시스템으로, 콘텐츠의 작성, 편집, 배포 등을 쉽게 할 수 있습니다. API(Application Pr..

신입이 이해 못 했던 자주 쓰는 10가지 직장용어

KPI(Key Performance Indicator) 성과 지표를 의미하며, 조직의 목표 달성을 측정하는 데 사용됩니다. ROI(Return on Investment) 투자 수익률을 나타내는 지표로, 투자한 자본에 대한 수익을 나타냅니다. B2B(Business-to-Business) 기업간 거래를 의미합니다. B2C(Business-to-Consumer) 기업과 소비자 간 거래를 의미합니다. CRM(Customer Relationship Management) 고객과의 관계를 관리하는 시스템으로, 고객과의 상호작용 기록과 이력, 연락처 등을 관리합니다. ERP(Enterprise Resource Planning) 기업의 자원을 효율적으로 관리하기 위한 시스템으로, 재고, 생산, 인사 등 기업 전반의 업..

녹내장 예방에 좋은 식품

녹내장이란? 녹내장은 눈 안에 있는 눈알의 앞부분인 눈앞초점에 있는 렌즈와 안구내압이 상승하여 시신경을 손상시키는 질환입니다. 이를 예방하기 위해서는 적절한 식습관과 생활습관이 중요합니다. 녹색 채소 녹색 채소에는 루테인과 제오잔틴이라는 눈 건강에 좋은 영양소가 풍부하게 들어있습니다. 이들은 눈 안에 있는 황색체에서 발견되며, 안구내압을 낮추고 녹내장 예방에 도움을 줄 수 있습니다. 대표적인 녹색 채소로는 시금치, 콜라드, 브로콜리, 근대 등이 있습니다. 과일 과일에는 비타민 C와 E가 풍부하게 들어있습니다. 이들은 눈 건강에 좋은 항산화 작용을 하며, 안구내압을 낮추어 녹내장 예방에 도움을 줄 수 있습니다. 대표적인 과일로는 오렌지, 블루베리, 딸기, 토마토 등이 있습니다. 해산물 해산물에는 오메가-3..

두려움을 극복할 수 있는 방법 9가지

1. 두려움의 원인을 이해하기 두려움이 어떤 상황에서 나타나는지, 그 원인은 무엇인지 파악하고 이를 극복할 수 있는 방안을 모색한다. 2. 긍정적인 자기 이야기하기 자신을 포함한 모든 사람들은 가끔 실패하거나 어려움에 직면할 때가 있다. 하지만 긍정적인 자기 이야기를 하면 자신감을 회복하고 두려움을 극복할 수 있다. 3. 목표를 세우기 목표를 세우고 그것을 이루기 위해 노력하면 자신에게 도전을 제공하고, 자신의 능력과 자신감을 향상시키면서 두려움을 극복할 수 있다. 4. 상상력을 활용하기 자신이 두려움을 극복하는 모습을 상상하고, 긍정적인 결과를 상상하면 자신감을 키우고 두려움을 극복하는데 도움이 된다. 5. 규칙적인 운동 규칙적인 운동은 스트레스를 줄이고 건강을 유지하는데 좋다. 또한, 운동을 통해 자..

Python 함수 group by, unstack() , transpose()

unstack() group by 를 사용하고 unstack() 을 이용하여 컬럼을 가져올 수 있다. group by 하는 컬럼 중 예를 들어, ["A","B"]라고 한다면, 끝에있는 index B를 컬럼으로 가지고 온다. 실제 데이터로 확인해보자 지역별 평당 분양가격 데이터이다. 여기서 지역명, 전용면적으로 평당분양가격의 평균을 구하고자 하면, 아래 코딩과 같다. df_last.groupby(["지역명","전용면적"])["평당분양가격"].mean() 하지만, 컬럼으로 된 데이터로 확인하고 싶을 때, unstack() 을 사용한다. df_last.groupby(["지역명","전용면적"])["평당분양가격"].mean().unstack() 더 깔끔하다. 아까 처음에 ["A","B"]라고 한다면, 끝에있는 i..

ValueError: invalid literal for int() with base 10: ' ' 주피터 파이썬 에러

ValueError: invalid literal for int() with base 10: ' ' df_last["컬럼명"].astype(int) 보통 특정 컬럼의 object (문자형) 타입을 변경하고자 할 때, astype 을 통해 수치형으로 변경할 수 있는데 해당 컬럼 안에 ' ' 공백 문자가 들어있으면 수치형으로 변경할 수 없다. 이를 해결하기 위해서는 pd.to_numeric 을 사용한다. import pandas as pd pd.to_numeric(df_last["~"]) 하지만 아래와 같이 에러가 발생한다. ValueError: Unable to parse string " " 이러면 강제적으로 빈공간을 무시해주기 위해 errors = 'corece' 를 사용한다. pd.to_numeric(..

Jupyter 주피터 파이썬 에러 Unicode Decode Error

간혹 주피터 노트북에서 코드를 실행하다가 Unicode Decode Error 에러가 발생하게 된다. 이 오류는 한글인코딩이 깨져서 읽어오지 못해서 발생한것인데요. import pandas as pd pd.read_csv("파일명.csv", encoding = "cp949") pd.read_csv("파일명.csv", encoding = "euc-kr") encoding 파라미터를 cp949 또는 euc-kr로 설정하면 오류가 해결된다. 관련 기사 한글인코딩 : ‘설믜를 설믜라 못 부르는’ 김설믜씨 “제 이름을 지켜주세요” : 사회일반 : 사회 : 뉴스 : 한겨레

빠르게 찾기!! 쇼핑몰 사이트 모음집! 다 모아놓았다.

쿠팡 : https://bitl.bz/Q793xm 쿠팡 deg.kr 11번가 : https://bitl.bz/vV2lce 11번가 deg.kr G마켓 : https://bitl.bz/4xlwNW G마켓 deg.kr 알리익스프레스 : https://bitl.bz/w8SHi7 알리익스프레스 deg.kr 위메프 : https://bitl.bz/5OUqHz 위메프 deg.kr 옥션 : https://bitl.bz/WDPdFU 옥션 deg.kr 홈플러스 : https://bitl.bz/3Qq7xc 홈플러스 deg.kr 롯데홈쇼핑 : https://bitl.bz/Nd0Ojp 롯데홈쇼핑 deg.kr GS SHOP : https://bitl.bz/d3OkKx GS SHOP deg.kr 하이마트 : https://bit..

빠르게 찾기! 2023년 TOEIC 정기시험 일정 안내

2023년 토익시험 일정이 발표되었는데요. 한국 토익 위원회가 발표한 2023년도에는 총 26번의 시험을 진행합니다. 매월 평균 2회 시험이 예정되어있으며, 특이사항으로는 토익 시험이 2023년에는 총 3회에 걸쳐 토요일에 시험을 진행합니다. 이러한 이유는 일요일에 시험 응시가 어려운 수험생을 위해 마련하였다고 합니다. 토요일 정기 시험 일자 정보 2023년 1월 14일(479회) 2023년 4월 15일(486회) 2023년 10월 14일(499회) 2023년 시험 일정은 아래와 같습니다. 시험 일정, 접수기간, 성적 발표일 등 여러가지 변동사항이 발생할 수 있으니 정확한 정보는 한국토익위원회 홈페이지에서 확인하면 됩니다. 사진 출처: 한국토익위원회 홈페이지 링크로 보는게 더 정확하겠죠? 당연히 공유드립..

2023년도 토익 정답 및 성적 바로 빠르게 확인하기!! 스타벅스 치킨 쿠폰 쏜다!

안녕하세요~~ 여러분! 토익 시험 잘 보셨을까요?? 많이 궁금하시다면, 시험 끝나자마자 내가 선택한 답이 맞는지 너무 궁금할텐데요... 요번에는 편하게 토익 정답 확인할 수 있는 사이트를 공유드리려고 해요 우선 소개하기에 앞서 토익 답 무료 알림 신청을 한다면 치킨, 스타벅스, 바나나 우유까지 전부 받을 수 있다고 합니다...!!! 우와 그곳이 바로~~~~~~~ 해커스 토익입니다. https://deg.kr/3e3e065 (해당 링크는 광고용으로, 신뢰를 바탕으로 작성하는 제 블로그를 걸고 안전한 링크입니다.) 해커스 토익정답 실시간 확인 deg.kr 토익 자유게시판에서 토익정답 실시간 확인 서비스 & 이번 시험 난이도도 확인 할 수 있고, 논란되었던 문제까지 확인할 수 있다고 합니다! 문제에 대해서 스..

쉽게 접근하자! 자주 틀리는 맞춤법 정리

자주 틀리는 맞춤법 정리 틀린 말 맞는 말 틀린 말 맞는 말 안되 안돼 역활 역할 어의없다 어이없다 나중에 뵈요 나중에 봬요 금새 금세 건들이다 건드리다 왠만하면 웬만하면 애띠다 앳되다 왠 떡이야 웬 떡이야 설겆이 설거지 어따 대고 얻다 대고 일일히 일일이 할께요 할게요 어떻해 어떡해/어떻게 해 않되나요 안되나요 문안하다 무난하다 바램 바람 설레임 설렘 잠궜다 잠갔다 내 꺼 내 거 오랫만에 오랜만에 몇일, 몇 일 며칠

쉽게 접근하자! IT 용어 정리 - Redshift

Redshift - 안전하게 대규모 분석을 수행하는 데이터 웨어하우스 Redshift 특징 1. 완전 관리형 데이터 웨어하우스 2. TB ~ EB 까지의 데이터를 분석하고 복잡한 분석 쿼리 실행 3. 대량 병렬 처리 (MPP) 컴퓨팅 클러스터 4. 요건에 맞는 유연성 제공 1. Redshift Spectrum (S3에 저장된 데이터를 Redshift에서 쿼리) 2. Redshift Serverless (데이터 웨어하우징 경험이 없거나 예측할 수 없는 워크로드) • 통합 데이터 접근, 보안 및 거버넌스 • Materialized View

쉽게 접근하자! IT 용어 정리 - 인코딩(Encoding) 과 디코딩(Decoding) 뜻, 차이

인코딩(Encoding) code화 한다는 뜻으로 무언가를 코드로 바꾼다는 뜻이다. 디코딩(Decoding) 코드에서 원래 모습으로 되돌리는 것이다. Encoding이란 Symbol을 Code로 바꾸는 것이고, Decoding은 Code를 Symbol로 다시 바꾸는 과정이다. 여기서 Symbol은 뜻을 가진 것이고, Code는 뜻을 갖지 않은 것이다. 즉, Encoding은 의미(내용, 혹은 뜻)을 기호로 바꾸는 과정, Decoding은 그 반대의 과정이다.

쉽게 접근하자! 물류 용어 정리 SKU(Stock Keeping Unit)

SKU는 Stock Keeping Unit의 줄임말로 상품관리 또는 재고관리를 위한 최소 분류 단위를 말합니다. 여러분이 A제품과 B제품을 팔고 있다고 가정해봅시다. A제품은 하얀색 옷 3가지 사이즈(XL, L, M), B제품은 2가지 하얀색 옷 사이즈(L,M)을 판매한다면 SKU는 5개가 됩니다. 만약 A제품은 색상을 더해 검정색을 추가한다면 SKU는 6+2 로 총 8개입니다. A 제품: 하얀색 옷 3가지 사이즈(XL, L, M), 검정색 옷 3가지 사이즈(XL, L, M) = 6개 B 제품: 하얀색 옷 사이즈(L,M) = 2개

쉽게 접근하자! IT 용어 정리 - DMS 정의, 특징, 장단점

AWS Database Migration Service AWS에서 제공해 주는 RDB 마이그레이션 서비스로, 다시 말해 관계형 데이터베이스, 데이터 웨어하우스, NoSQL 데이터베이스 및 기타 유형의 데이터 저장소를 쉽게 마이그레이션할 수 있는 클라우드 서비스 DMS 특징 설정 및 마이그레이션 작업이 간단하다. 마이그레이션에서 사용한 리소스만큼 비용 과금된다. 이기종 간의 데이터 이전도 가능하다. 스키마 변환 도구도 제공한다. 적은 부하로 지속적인 레플리케이션 가능하다. DMS의 장점 사용이 간편하다. 속도가 빠르다 타켓 테이블을 만들지 않아도 자동으로 테이블 생성해주기 때문에 스키마, DB단위로 migration하기 편하다. 어플리케이션의 버전 upgrade시에 메타데이터 migration에 적합하다 ..

쉽게 접근하자! IT 용어 정리 - 연관 분석, 장바구니 분석, Association Analysis

유저별 구매 브랜드 리스트 Support 전체 거래 중 품목 A 와 품목 B 가 동시에 포함된 비율 프라다 → 루이비통 지지도 = 3 / 5 = 0.6 루이비통 → 프라다 지지도 = 3 / 5 = 0.6 Confience A→B 신뢰도는 품목 A를 구매했을 때, 품목 B를 추가로 구매할 확률 프라다 → 루이비통 신뢰도 = 3 / 3 = 1 루이비통 → 프라다 지지도 = 3 / 4 = 0.75 Lift 품목 A를 구매했을 때, 품목 B를 구매할 가능성 프라다 → 루이비통 향상도 = (3 X 5)/(3 X 4) = 15 / 12 = 1.25 루이비통 → 프라다 향상도 = (3 X 5)/(3 X 4) = 15 / 12 = 1.25 전체 거래 중에 루이비통와 프라다를 모두 구매한 비율은 60% 이며, 루이비통를..

300x250
300x250