본문 바로가기
생산성

판다스(Pandas)로 키크론 기계식 키보드 배송비 분석해보기

by rhodia 2019. 10. 8.

기계식 키보드에 관심있는 분이라면 키크론(Keychron)이란 이름을 들어 보셨을 겁니다. 최근 Keychron K1이 애플 리셀러 샵을 통해 판매가 시작되기도 했지요. 얼마 전 키크론은 킥스타터를 통해 K4 모델에 대한 크라우드 펀딩을 시작했습니다. 지금 보니 몇 개 남지 않았네요. 우리나라 뿐만 아니라 세계 각지로 배송이 되니 관심있으신 분들은 이 기회를 놓치지 마세요. 기계식 키보드임에도 $64라는 경쟁력있는 가격으로 올라와 있습니다. 아쉽게도 우리나라는 배송비 $17가 추가되어 총 $81가 듭니다.

 

그런데 배송 가능 지역 목록에 있는 나라들의 배송비를 보니 무려 $55인 나라도 많네요. 우리나라는 상대적으로 저렴한 축에 속하나 봅니다. 다시 감사하는 마음이 듭니다. 그런데 무슨 기준으로 배송비가 이렇게 차이가 나는 걸까요? 대충 보니 세네갈, 사우디 아라비아, 슬로바키아, 남아프리카 등이 보이네요. 

 

 

Keychron K4 크라우드 펀딩 사이트의 배송지 별 배송비

 

그래서 "GDP가 높은 국가이면 배송비가 싸다"는 가설을 세우고 배송비가 어떻게 분포해 있는지 한번 살펴보기로 했습니다.


배송지 목록 긁어오기

BeautifulSoup을 이용해 킥스타터 펀딩 페이지의 배송지 목록을 긁어왔습니다. 그러니 아래와 같은 목록이 나옵니다. 264개 국가에 배송이 되고 있습니다.

Afghanistan (+$55)
Aland Islands (+$55)
Albania (+$55)
Algeria (+$55)
American Samoa (+$55)
Andorra (+$55)
Angola (+$55)
Anguilla (+$55)
Antarctica (+$55)
Antigua and Barbuda (+$55)
Holy See (Vatican City State) (+$55)
"Saint Helena, Ascension and Tristan da Cunha (+$55)"
United States Minor Outlying Islands (+$55)

쭉 훓어보니 나라 이름이 단어 하나 두 개로 이뤄져있지 않네요. 콤마도 있고 괄호도 있고 쌍따옴표도 보입니다. 대충 아래와 같이 국가명과 배송비를 나누고 불필요한 문자를 없애줍니다.

 

def extract_country(x):
    idx = x.find('(')
    return x[0: idx].replace("\"", "").replace("\'", "").strip()

def extract_cost(x):
    p = "\(?\+\$\d+\)?"
    results = re.findall(p, x)
    result = results[0] if results is not None and len(results) > 0 else None
    
    return result.replace('(', '').replace('+', '').replace('$', '').replace(')', '').strip() 

df['country'] = df['nations'].apply(extract_country)
df['cost'] = df['nations'].apply(extract_cost).astype('int')

 

그리고 히스토그램으로 배송비가 어떻게 분포하는지 살펴봤습니다. 와우, 우리나라는 싼 편에 속하는군요. $50 이상인 국가가 200개가 넘습니다. 감사한 마음에 확신이 생깁니다.

 

배송비에 따른 나라 수 히스토그램


배송비 상위 10% 분석

이제 배송비로 정렬해 어디가 싸고, 비싼지 한 번 보겠습니다. 싼 나라에 중국, 홍콩, 타이완이 눈에 띕니다. $10 미만입니다. 비싼 나라는 $55 나 합니다. 에리트레아, 에스토니아, 에티오피아가 그런 나라입니다. 

 

배송비가 싼 나라, 비싼 나라 상위 10%


상관관계 분석

혹시 GDP와 관련이 있을까 하는 생각이 듭니다. 그냥 위 나라 목록을 대충 보면 상대적으로 잘 사는 나라, 그렇지 못한 나라로 나눠지는 것 아닌가 하는 생각이 들었거든요. 그런데 킥스타터에는 GDP 정보가 없습니다. 어떻게 할까 하다가 세계 GDP 데이터가 있는지 구글링 해 봅니다. Worldbank의 자료를 찾았습니다. 저는 이 데이터를 다운받았습니다. 2018년 데이터가 많고 2017년도 있었습니다. 저는 이 정도면 충분하니 그냥 이걸로 해보기로 했습니다. 데이터를 불러와 GDP 정보를 1억으로 나눈 값을 얻었습니다. 산포도 그래프를 그려보니 뭔가 싼 배송비 국가는 GDP가 높은 편에 속한다는 느낌도 듭니다.

 

배송비와 GDP와의 관계

그런데 Correlation을 분석해보니 -0.42 정도가 나옵니다. 거의 관련 없다는 말이네요.

배송비와 GDP와의 관계

이상합니다. 그래서 대륙 정보를 붙여 보기로 합니다. 대륙 정보는 아까 Worldbank에서 받은 데이터에서 국가 코드로 머지(아웃터 조인)했습니다. 그리고 대륙별 배송비 평균을 뽑아봤습니다. 북미가 제일 싸고, 유럽/중앙아시아, 동아시아/태평양 지역이 그 다음입니다. 

 

대륙 별 평균 배송비

그럼 대륙 별 평균 배송비 말고, 배송비가 가장 낮은 국가의 가격은 어떻게 되어 있을까요?

대륙 별 가장 싼 국가의 배송비
대륙 별 배송비가 가장 낮은 국가의 가격

 

대륙 별 GDP의 z-score와 normalization 값을 구해봤습니다.

대륙 별 GDP의 z-score와 normalization

그리고 다시 correlation을 구해봅니다. 상관관계가 없습니다..

배송비와 GDP에 따른 대륙 분포


새로운 가설

GDP와는 별 상관관계가 없나 봅니다. 제조사로 부터의 거리는 어떨까요? 키크론(Keychron) 사이트에서 제조사를 찾아보니 Dongguan Chuand Science and Technology Co., Ltd.라는 중국 회사였습니다. 주소는 Xihe Industrial Area, Sijia Village, Shijie Town, Dongguan City, Guangdong Province, China 여기네요.

 

구글 지도에서 보면 이렇습니다. 거리가 가깝거나 무역이 많아 배송 인프라가 좋은 나라들은 물류비가 낮기 때문에 배송비가 낮게 책정되었을 것이다라는 가설이 다시 만들어 집니다. 또, 그런 경로에 존재하는 나라들은 GDP가 낮더라도 낮은 물류비가 가능할수도 있을 것 같구요. 초기에 중화권 국가들의 배송비가 상대적으로 크게 낮았던 것이 이런 이유인지도 모르겠습니다. seaborn으로 세계지도에 배송비를 맵핑해보고 싶었지만 이건 어떻게 하는지 아직 잘 모르겠네요. 

 

반응형

댓글