지난 UBER 포스트 에서는 각 Ride event에 대한 데이터를 살펴보았다. 그 이후에 시간에 따른 위치를 트래킹하는 GPS 데이터를 한 번 분석해보고 싶었다.
GPS 데이터를 찾아보다가 독일에 어느 언어학 박사님이 올려놓은 러닝 데이터를 발견했다. 혹시 데이터를 이용해 분석 내용을 포스팅해도 되는지 정중히 여쭤봤고, 바로 다음날 사용해도 좋다고 연락을 받았다. HUGE thanks to Sascha Wolfer! 아래는 받은 이메일이다.
========================================================================================================================
GPS 데이터 형식 (GPX) 으로 설계된 XML 스키마 파일을 필요한 컬럼들 (거리, 시간, 속도 등)을 추가해 데이터프레임으로 변환해주었다. 자세한 코드는 여기를 참고하면 된다.
시간 time에 따라 해발고도 elevation, 위치 lat long와 속도 speed_km_per_hour가 있는 데이터이다.
========================================================================================================================
========================================================================================================================
========================================================================================================================
초록선은 평균 값을 나타낸다.
평지에서는 속도가 평균을 웃도는 것을 확인할 수 있다.
마지막 오르막길에서 속도가 급격히 떨어졌다가 마지막 스퍼트를 낸 것을 알 수 있다.
마지막 평지에서는 아마 체력저하로 인해 속도가 평균을 밑도는 것을 확인할 수 있다.
GPS 데이터는 처음 살펴보았는데 UBER나 SOCAR 같은 모빌리티 회사에서는 GPS 데이터를 어떤 용도로 활용할지 궁금해졌다. SOCAR의 경우:
나만의 GPS 데이터를 분석해보고 싶었다. 요즘 친구들이 NIKE 앱을 통해서 자신의 한강 Running Time을 공유하던데 나도 몸이 회복되면 직접 데이터를 모아 분석해보고 싶다. 풋살이나 축구를 할 때 데이터를 모아서 heatmap이나 내 속도 및 뛴 거리 등을 측정해보는 것도 재미있을 것 같다.
재미있는 상식: GPS는 1970년대 미국 국방부에서 개발되어 미사일 타격 정확도를 높이기 위해 사용되었다고 한다. 1984년에 민간에 공개돼 선박과 비행기의 항로 개선에 이용되었고, 2000년 대에 들어서야 차량용 내비게이션 등에 쓰이기 시작했다. 개발에 든 비용이 연간 약 7.5억 달러라는데 이를 무료로 배포한 갓아메리카. 무력의 용도로 개발된 기술이 현재 우리 삶에 큰 도움을 준다는 것이 아이러니하다.