문과생의 데이터 연습

[K-디지털 기초역량훈련] 태블로 데이터 시각화 첫걸음 시작하기 : [패스트캠퍼스] 데이터시각화 강의 (3주차 학습 정리) 본문

Tableau/Tableau K-Digital Credit (Feat 패스트 캠퍼스)

[K-디지털 기초역량훈련] 태블로 데이터 시각화 첫걸음 시작하기 : [패스트캠퍼스] 데이터시각화 강의 (3주차 학습 정리)

의인은 믿음으로 2022. 10. 4. 18:44
728x90

 

▶ [KDC] 태블로 데이터 시각화 첫걸음 시작하기_3주차_데이터 시각화 (1)

       [국비지원교육]

 

1️⃣ CH1-1 Tableau 기본 계산 

계산된 필드 

 

기존 데이터 컬럼들 말고 추가적인 컬럼들을 생성할 떄 사용 

새로운 데이터를 분류하거나, 유형을 변경하거나, 집계하거나, 필터링 등등 

 

테블로 계산의 종류 

-> 기본계산 (숫자, 문자) 

-> 테이블 계산 (Lookup 함수, last 함수, 등) 

-> LOD 표현식 (fix, Include, Exclude) 

 

2️⃣ CH1-2 기본계산 

숫자 함수 

ABS() : 절대값 반환 

CEILING() : 근접한 정수로 반올림 

ROUND() : 반올림 

 

텍스트 함수

SPLIT() : 문자 분리

LEN() : 문자 개수 세기 

LEFT() : 왼쪽 부터 문자를 반환

RIGHT() : 오른쪽 부터 문자를 반환 

REPLACE() : 다른 문자로 대체 

 

날짜 함수 

DATETRUNC(): 지정한 날짜 기준에 따라서 새 날짜를 반환

ex) DATETRUNC('month',[배송 날짜]) 

DATEDIFF(): 날짜 차이를 계산 

 

유형변환 

계산된 필드를 할 때 서로 유형이 맞지 못해서 생기는 오류를 방지할 때 사용하기도 함 

STR() : 문자로 바꾸기 

INT(): 정수로 바꾸기 

 

논리함수 

CASE WHEN 

IF, ELSEIF

세그먼트의 [일반 소비자]의 수익만 계산하고 싶을 때 계산된 필드 

 

집계함수 

COUNT() : 항목수  

COUNTED() : 고유 항목수 

AVG() : 평균 

MIN() : 최소

SUM() : 합계 

User ID의 중복 행이 어러개 있다면  COUNT() 함수와 COUNTED() 함수

고유는 다 1로 찍히고 항목수는 온전하게 찍힘을 확인

 

계산된 필드 주의점! 

 

오류방지를 위해서 함수 인자를 올바르게 적어야함 

가장 많이 나오는 오류 방지법 ATTR() 함수 사용하기 [집계 되지 않는 비교 또는 결과를 혼합할 수 없습니다] 의 오류를 방지 

 

차원을 집계하는 경우

 

- 최대값

- 최소값 

- 카운트

- 카운트 (고유)

- 특성 (ATTR) 

 

측정값 집계

- 합계

- 평균

- 중앙값

- 표준편차

- 분산 

 

3️⃣ CH1-3 테이블 계산 

현재 테이블 계산 상태에서 값 변경 

 

파티션 관련된 함수 

INDEX() : 현재 인덱스 반환 

FIRST() : 현재 행 부터 첫번 쨰 

LAST() : 현재 행 부터 마지막 

LOOKUP() : 현재 행으로부터 타겟 위치만큼 집계 값을 반환 

PREVIOUS_VALUE() : 이전 행 값을 반환 

 

RUNNING 관련 함수

RUNNING_SUM(): 파티션 부터 현재 행까지의 합계 

RUNNING_AVG(): 파티션 부터 현재 행까지의 평균 

RUNNING_MIN(): 나온 숫자중 가장 최소 

RUNNING_MAX(): 나온 숫자중 가장 최대 

 

WINDOW 관련 함수 

WINDOW_SUM(): 범위 내의 합계 

WINDOW_AVG(): 범위 내의 평균 

WINDOW_MAX(): 범위 최대값 

WINDOW_MIN(): 범위 내의 최소값 

 

Rank 관련 함수 

 

RANK(): 

RANK_DENSE():

RANK_UNIQUE():  

 

4️⃣ CH1-4 LOD 표현식  

세부수준 계산을 가능하게 해주는 식 (차원) 

LOD 표현식은 차원을 기준으로 세분화 기준을 정하게 해준다. 

 

FIXED(): 선택한 차원에 고정 

INCLUDE(): 선택한 차원을 추가함 

EXCLUDE(): 선택한 차원을 제외 

 

주의사항: 

 

-> FIXED 같은 경우는 차원필터보다 상위에 있어서 [컨텍스트 필터] 기능을 사용해야함 

-> LOD를 선언하지 않으면 전체 값으로 반환됨 

   ex) sum(매출) 이면 전체 매출로 반환 

 

심화

-> LOD 표현식에 LOD를 넣을 수있음

-> LOD 표현식에 추가 표현식을 적을 수 있음 

▶ [KDC] 태블로 데이터 시각화 첫걸음 시작하기_3주차_데이터 시각화 (2)

 

1️⃣ CH2-1 비즈니스 대시보드 제작 (Weekly Sale KPI) 

✅ 지도제작 

-> 위도와 경도를 올리기

-> [Sales] 컬럼과 [Region] 컬럼을 마크에 올림 

 

하이라이트 테이블 제작 

-> [Order Date] 컬럼을 행(Year) 과 열(Month)에 각각 올림 

-> [Sales] 컬럼을 마크에다 올리고 마크 유형을 사각형으로 변경하고 색상도 추가해서 올림 

-> 행에대한 레이블 열에대한 레이블을 숨긴다.

-> 레이블을 클릭하고 텍스트를 가장 최근으로 설정한다. 

 

 세그먼트 필터링 제작 

-> [Segement] 컬럼을 텍스트에 넣는다. 

 

 KPI 제작 

-> LOD표현식과  IF문을 활용해서 만든다. 

나온 결과값 NULL값은 제거한다.

-> [Sales] 값을 올리고 [Sales] 비율차이도 올린다. 

-> Previous 7 days를 숨겨준다. 

-> [Sales Target] 이라는 매개변수를 만들어서 Target Sales 에 따라 증가 감소 색상이 바뀌는 기능을 만들어 본다. 

 

-> Sales Target 에 숫자를 입력하면 색상이 달라진다. 

 

  트랜드 제작 

IF [Order Date] >= ({MAX([Order Date])}-365) then "Last 1 Year"
ELSEIF [Order Date] >= ({MAX([Order Date])}-730) then "Previous 1 Year"
end

Year 계산된 필드를 만든다. 

IF [Period (Year)] = "Last 1 Year" then [Sales]
END
IF [Period (Year)] = "Previous 1 Year" then [Sales]
END

-> [Last Year] 컬럼과 [Previous 1 year] 컬럼을 만들고 이중축으로 올린다. 

-> 열은 [Order Date] 주 컬럼을 올린다.

 

TIP: 여기서 [Order Date]를 주 기준으로 올리기 때문에 전체 데이터에 해당되는 Sales 기준으로 색상을 맞추기 위해서 

       LOD 표현식을 사용한다. 

if {SUM(Last 7 Days Sales])} >= [[2]] Sales Target ] then "above"
else "below"
END

[Sales] 컬럼말고 다른 컬럼들은 변수명만 바꿔서 똑같이 진행한다. 

 

  대시보드 동작 적용 제작 

 

-> [워크시트] -> [선택한 워크시트] -> 세그먼트 필터를 제외하고 모두 선택 

-> 세그먼트 필터 동작 클릭시 값과 그래프들이 움직이도록 설정  

728x90
Comments