본문 바로가기

분류 전체보기65

[Python] Pandas _ EDA _ 04 worldhappy(2) 어제의 자료에 인구 정보를 같이 넣어서 보자어제 행복도 지수 관련된 사이트/데이터에는 인구정보가 없음메인 데이터 : 기관에서 발표한 행복도 관련 데이터추가 데이터 : 나라별로 인구데이터를 같이 보자(외부 다른 소스에서 찾아서 ) https://data.worldbank.org/indicator/SP.POP.TOTL?end=2021&start=1960&view=chart# --> 인구 관련 데이터 가지고 옴..path = '/content/data/population/API_SP.POP.TOTL_DS2_en_excel_v2_4770385.xls'pop_df = pd.read_excel( path, skiprows=3)pop_df.head() 2021년도까지 행복도 지수가 있었던 데이터에 인구정보를 같이 보.. 2025. 8. 29.
[Python] Pandas _ EDA _ 04 worldhappy 목적 : 데이터 핸들링에 대해서 소개귀찮은 시즌을 골라서 진행을 하려고 함매년 스타일이 좀 달라서 귀찮은 작업이 필요함2022년도 보고서를 기준으로 작업을 하려고 함https://www.worldhappiness.report/ed/2022/ World Happiness Report 2022The World Happiness Report is published by the Wellbeing Research Centre at the University of Oxford, in partnership with Gallup, the UN Sustainable Development Solutions Network and an independent editorial board.www.worldhappiness.rep.. 2025. 8. 28.
[Python] Pandas _ EDA _ 03 gpt 코드 사용하는 과정에서 gpt와 함께 사용이 방법이나 접근이 내일 안 될 수도 있음사이트 UI도 변경될 수 있음모델로 갑자기 없어질 수 있고 변경될 수 있음openai API 관련해서 로그인이 필요함https://openai.com/ko-KR/api/ ⇒ API 플랫폼으로 로그인을 하시면 됨!!https://platform.openai.com/logingpt 기반으로 여러 pandas하고 연계한 패키지들이 있었는데,,gpt 계속 변경이 되니,,,,버전 이슈로 지금 안 되거나 하는 친구들이 좀 있어요!!⇒ 그 중에서,,,하나의 방식으로 진행을 하려고 함!!!!!langchain : LLM모델을 개발…오픈소스!pip install langchain!pip install openai!pip install la.. 2025. 8. 27.
[Python] Pandas _ EDA _ 02 titanic 데이터 처리하는 관점!gdown 1GUltwE6D9Cv90AP8nfO_kezO0d7TAtg7'''Downloading...From: To: /content/titanic_train.csv100% 60.3k/60.3k [00:00# csv 파일을 불러오시면 됨!!!!# ==> 혹시 특정 칼럼이 가로 인덱스로 사용할 수 있는게 보장이 되어있다면# 불러들이면서, 가로 인덱스를 지정하는 경우! set_index ~~# ==> 파일을 불러올 때 필요한 기능이 있어서 편히 할 수 있으면 파라미터 메뉴얼path = '/content/titanic_train.csv'data = pd.read_csv(path, index_col="PassengerId") #set_index 대신 불러올 때 지정 가data.hea.. 2025. 8. 27.
[Python] Pandas _ EDA _ 01 telecom import numpy as npimport pandas as pd!gdown 1Tjuu1ODRSuQ1H0V6XVrjDRDXNDQkXpsA'''Downloading...From: To: /content/telecom_churn.csv100% 280k/280k [00:00# 일반적인 csv 파일!!!path = '/content/telecom_churn.csv'data = pd.read_csv(path, sep=",")data.head()지역 + 코드day, eve, night(사용량, 통화, 요금)+ 국제통화관련고객센터에 전화건 횟수이탈할지data.tail() #뒤에까지 제대로 들어왔는지 체크해야함#내가 불러들인 데이터가 숫자가 맞는지 체크data.shape'''(3333, 20)'''len(data)'.. 2025. 8. 26.
[Python] Pandas _ matplotlib, seaborn을 활용한 데이터 시각화 # 노트북 계열 장점 : 코드 + 문서 + 결과(그래프)# ==> 명시적으로 아래 결과창에 그래프를 보여주세요! 옵션!!!%matplotlib inline# --> 개인 pc 하실 때 ,,,그래프 팝업창으로 나타나면서,,이 옵션을 실행!!import numpy as npimport pandas as pd참고) 아래 옵션을 수행하면 아래에 그래프가 나타나고, 아니면 창으로 나타남!!# y = X^2의 그래프 생성을 위해서. --> 10개 구간으로 하기 위해서는 11로 처리해야 함! 구간이므로!!!x = np.linspace(start = 0, stop = 10, num=11)y = x ** 2print(x)print(y)'''[ 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.].. 2025. 8. 26.