문과생의 데이터 연습

[Gephi] 데이터 준비하기 본문

Gephi/Gephi

[Gephi] 데이터 준비하기

의인은 믿음으로 2022. 10. 8. 20:12
728x90

Gephi 시각화를 위한 데이터 만들기

Gephi로 멋있는 시각화를 하고 싶어도 데이터가 없다면, 또 데이터가 있어도 Gepthi형식으로 데이터를 만들어줘야만 편하게 Gephi에서 작업할 수 있습니다. 사실 Gephi를 배우는 것보다 더 중요할 수도 있는 데이터를 작업하는 법을 포스팅 하고자 합니다.

 

                                                                         GO GO~ 

1.) 데이터 만드는 방법 2가지

두 가지 방법이 있는데요

1️⃣ 하나의 파일로 Gephi를 불러오는 방법

 장점: 가장 쉬운방법 ㅎ

 단점: 추가적인 정보를 컬럼에 적재할 수가 없다.  

2️⃣ Node 파일, Edges 파일 만들고 Gephi 불러오는 방법

 장점: 가장 정석적인 방법이자 추가적인 컬럼을 적재할 수 있다.

 단점: 어렵다? 

이번 포스팅에서는 2번째 방법으로 해볼겁니다.

이유는 아래에서 설명할게요!

1.) 실습 데이터

Makeover Monday 해외 사이트에 들어가시면 데이터를 보실 수 있습니다.

유명한 드라마죠 (저는 안봤지만….ㅎ) 왕좌의 게임 죽음에 관한 데이터 세트가 있습니다.

데이터를 다운받아서 까봅시다^^

컬럼 정의서

  • Name
  • Allegiance
  • Season
  • Episode
  • Location
  • Killer
  • Location
  • Killers House
  • Method
  • Death No.

빨강색 컬럼들은 Name, Killer 희생자와 살인자 명으로 이것들로 네트워크 그래프를 만들면 좋을 것 같습니다.

나머지 초록색 컬럼들로는 Edges 데이터에 추가적인 정보를 제공하는 용도로 사용하면 좋을 것 같아요! 이 이유 때문에! 위에서 설명했던 2번째 방법으로 하는 겁니다.

2.) Edge 파일 만들기

Edge 데이터 부터 만들겠습니다.

Edge 데이터는 SourceTarget 컬럼으로 구성되어합니다. (대문자 필수! Gephi가 대문자로 인식)

쉽게 이해하자면

 

Source: 나가는 것

Target: 당하는 것

 

 

따라서 Killer를 Source Name은 희생자임으로 Target으로 하겠습니다. (반대로 하면…)

이렇게 만들었고요 추가로 Season을 추가했습니다. 아무래도 왕자의 게임 드라마를 본 적이 없어서(맙소사..😅) 저에게는 Season으로 추가해서 보는게 무난할 것 같습니다.

3.) Node 파일 만들기

Node 파일은 IDLabel 컬럼으로 구성되어야 합니다. (대문자 필수! Gephi가 대문자로 인식)

Edge 파일에서 만든 Source와 Target을 ID 한열로 복사넣기 다음에

중복을 제거합니다.

🔍 Edge 파일 → 중복 O

🔍 Node 파일 → 중복 X

 

굳이 외운다면 이렇게 생각합시다 😋

이렇게 해서 기초적인 준비는 끝났습니다.

4.) Gephi로 불러오기

Edge 파일부터 불러옵니다. Gephi가 Edge 파일로 정상적으로 인식하고 있습니다.

 

왕자의 게임 데이터는 가해자와 피해자가 있기 때문에 Directed(방향성이 있는) 로 설정합니다.

(죽여!😆)

 

 

Node 파일도 불러옵니다.

 

 

이미 edge 파일을 먼저 불러왔음으로 새로운 Workspace가 아니라 기존 Workspace로 가봅시다.

 

 

무사히(?) 잘 불러왔습니다. 이제 여기서부터 Gephi 작업이 들어갑니다.

다음 포스팅은 이어서 Gephi로 작업하는 법을 올려볼까 합니다.(절때로 Gephi 할줄 몰라서 멈추는거 아님 😆)

 

 

728x90
Comments