
텍스트 테이블* 데이터 형태행과 열로 이루어진다. 쉽게 엑셀의 피벗 테이블을 떠올리면 된다.데이터 구조화 형식에는 대표적으로 2가지 형식의 wide format table과 long format table이 있다. 태블로의 표현 방식에서 텍스트 테이블로 표현해서 활용할 수 있다. 행과 열 바꾸기 : [분석탭]에서 활용할 수 있다. - wide format table 옆으로 넓은 형태로 데이터가 쌓인다. 하나의 열에 여러 개의 데이터를 나란히 나열하는 형태. 데이터 분석을 할 때 많이 사용되는 형태로 표를 비교하거나 그래프 시각화 하기 쉽다. 상관관계를 분석하거나 각 변수의 분포를 비교할 때 적합하다. - long format table아래로 쌓이는 긴 데이터셋. 특징은 한 개의 특성을 나타내는 열을 가진..

BI 란 무엇일까?비즈니스 인텔리전스(Business Intelligence)란?비즈니스 인텔리전스는 조직이 좀 더 데이터 기반의 의사결정을 빠르게 할 수 있도록 서포트하는 비즈니스 분석, 데이터 마이닝, 데이터 시각화, 데이터 도구를 말한다. BI 도구를 활용해서 SQL, Python 언어보다 드래그앤 드랍으로 손쉽게 데이터를 분석하고 시각화 할 수 있다. BI 워크 플로우데이터 인프라 : 데이터 레이크 -> 데이터 웨어하우스 -> 데이터 마트 -> BI 툴데이터 레이크 : 모든 Raw data(정형 데이터, 로그 데이터, 테이블 등) 저장할 수 있는 스토리지데이터 웨어하우스 (DW) : 데이터를 장기적으로 보존용으로 통합, 정제, 분석하여 정리한 저장소데이터 마트 (DM) : 부서별, 목적별 분석용으..

⊙ 데이터 병합 * concat - 데이터를 위아래로 합쳐보기concat() 함수는 데이터프레임을 위아래 혹은 좌우로 연결할 수 있다. axis : 연결하고자 하는 축(방향)을 지정한다. 기본값은 0으로, 위아래로 연결하는 경우에 해당한다. 1로 설정하면 좌우로 연결ignore_index : 기본값은 False 이며 연결된 결과 데이터 프레임의 인덱스를 유지한다. True로 설정하면 새로운 인덱스를 생성df1 = pd.DataFrame({ 'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3'], })df2 =..

⊙ 데이터 선택iloc : 정수 기반의 인덱스 사용loc : 레이블 기반의 인덱스 사용 * .iloc[로우, 컬럼] : 인덱스 번호로 선택하기# iloc을 사용하여 특정 행과 열 선택selected_data = df.iloc[1:4, 0:2] # 인덱스 1부터 3까지의 행과 0부터 1까지의 열 선택print(selected_data) * .loc[로우, 컬럼] : 이름으로 선택하기data.loc['행이름', '컬럼명']# 행 이름과 컬럼명을 통해서도 특정 데이터를 선택할 수 있음# 1개의 컬럼 전체를 선택할 경우data.loc[: , '칼럼명']data['칼럼명']# 여러개의 컬럼을 선택할 경우에도 리스트를 활용해서 선택할 수 있다.data[['칼럼명1', '칼럼명2', '칼럼명3']]# 내가 원하는 ..

⊙ 데이터셋 불러오기파일 경로 찾는 방법 - 노션 참고import seaborn as sns# tips 데이터셋 불러오기tips_data = sns.load_dataset('tips')# 데이터셋 확인print(tips_data.head()) 파이썬 3.8로 해야 seaborn 모듈 설치가 되는 듯 하다.. 3.9로 하다가 도저히 안되길래 버전을 바꿨더니 바로 해결되는 매직 index = False 를 하지 않으면 기존 인덱스가 컬럼이 되어 새롭게 인덱스가 출력된다. # pd.read_excel('파일경로/파일명.확장자')# 엑셀 불러오기pd.read_excel('./파일명.xlsx') # ./ ==> 현재 내가 있는 위치라는 의미# csv 파일 불러오기pd.read_csv('./파일명.xlsx') te..

데이터 전처리는 어떻게 해야할까? - 데이터 전처리 할 때 꼭 방향성을 가지고 해야 한다. 데이터를 통해 무엇을 확인할 것인지?어떤 의사결정을 위해 필요한지?데이터로 무엇을 얻고자 하는지, 그 목적을 달성하기 위해 전처리가 필요하다. ⊙ 데이터셋 불러오기1. iris 데이터셋 : 붓꽃의 꽃잎과 꽃받침의 길이와 너비를 포함한 데이터셋2. tips 데이터셋 : 음식점에서의 팁과 관련된 정보를 담고 있는 데이터셋3. titanic 데이터셋: 타이타닉 호 승객들의 정보를 포함한 데이터셋4. flights 데이터셋: 연도별 항공편 정보를 담고 있는 데이터셋5. planets 데이터셋: 외계 행성 발견에 대한 정보를 담고 있는 데이터셋 import seaborn as sns# 'tips' 데이터셋 불러오기 tips..

* 롯데손해보험https://lotteins.recruiter.co.kr/career/jobs/38988?utm_source=jasoseol&utm_medium=career&utm_campaign=2412lotteins 신입사원 채용공고롯데손해보험에서 신입사원 채용공고 지원자를 모집하고 있어요.lotteins.recruiter.co.kr * 와디즈https://www.jobkorea.co.kr/Recruit/GI_Read/46107666?Oem_Code=C1&logpath=1&stext=crm마케터&listno=4 와디즈 채용 - CRM 마케터(경력) 채용 | 잡코리아경력 : 경력3년이상, 학력 : 학력무관, 급여 : 회사내규에 따름, 마감일 : 2024.12.31www.jobkorea.co.kr 참고 ..
1. 데이터 분석가란? Business Analyst 비즈니스 분석가비즈니스 프로세스 및 요구 사항을 파악하고, 데이터 기반으로 의사 결정을 지원업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행 Product Analyst제품이나 서비스의 성과를 평가하고 개선하기 위해 데이터를 분석사용자 행동 및 제품 성능과 관련된 데이터를 분석하여 제품 개선에 기여제품 경험과 사용자 행동에 대한 분석을 수행하며 A/B 테스트, 사용자 경로 분석을 담당 BI Analyst기업의 비즈니스 인텔리전스 플랫폼과 도구를 사용하여 데이터를 시각화하고 보고서를 작성주로 기업 내부 데이터를 시각화하고 이를 통해 의사 결정에 필요한 정보를 제공한다BI 도구를 사용하여 대시보드를 구축하고 데이터 시각화 및 보고서 작..