본문 바로가기

Data_Analytics

(3)
[Data Analytics] 데이터 분석이란? 데이터 분석 데이터 분석이란 유용한 정보를 발견하고 결론을 유추하거나, 의사 결정을 돕기 위해 데이터를 조사, 정제, 변환, 모델링 하는 과정을 의미합니다. 데이터 분석과 세트인 단어로는 데이터 사이언스가 있죠! 데이터 사이언스란, 통계학, 데이터 분석, 머신러닝, 데이터 마이닝 등을 포괄하는 큰 개념으로 볼 수 있습니다. 데이터 분석은 의사결정을 돕기 위한 통찰을 얻는 것에, 데이터 사이언스는 더 나아가 문제해결을 위한 솔루션을 만드는 것에 초점을 맞춥니다. 데이터 분석의 단계 데이터 분석을 통계적 관점에서 보면 3단계로 나눌 수 있습니다. 1. 기술 통계(Descriptive Statics) : 수집한 데이터를 정량화/ 요약하는 기법 2. 탐색적 데이터 분석 (EDA: Exploartory data ..
[Data_Analytics] Plotly 패키지 import plotly.express as px df = px.data.tips() fig = px.histogram(data_frame=df, x="tip", nbins=10, color="smoker") fig.show() fig = px.box(df, x="day", y="tip", color="smoker", notched=True) fig.show() import pandas as pd df = pd.DataFrame([ dict(Task="Job A", Start='2009-01-01', Finish='2009-02-28', Resource="Alex"), dict(Task="Job B", Start='2009-03-05', Finish='2009-04-15', Resource="Alex")..
[Data_Analytics] Seaborn plot seaborn 패키지 불러오기 import seaborn as sns sns.set_theme(style='whitegrid') penguins = sns.load_dataset("penguins") LinePlot sns.lineplot(data=penguins, x="body_mass_g", y="flipper_length_mm", ci=None, hue="species") Point Plot sns.pointplot(data=penguins, x="species", y="body_mass_g", hue="sex", palette="winter") Hist Plot sns.histplot(data=penguins, x="bill_depth_mm", bins=30, hue="species", multi..

반응형