GPSデータの解析支援ソフトを公開します!
Mt. Whitney Lotteryも締め切られました!
今年のMt. Whitney Lotteryも先日(3月15日)締め切らられて、結果は3月24日に発表されるようです。今年は13,638のアプリケーション、合計64,939人の登山者の応募があったようです。サイトの統計によれば、66%のアプリケーションがオーバーナイトの許可を希望していて、19%の日帰り、17%のオーバーナイトが当選したようで、残りは残念ながら落選になったようです。詳細は、Inyo National
Forestのサイトに載っています。
GPSのトラッキングデータの解析支援ソフトを公開しました!
先日より、過去のMt.Whitney登山のGPSトラッキングデータの詳細を分析していますが、今日は、分析に使っているプログラムを公開しようと思います。現在、Java版とPython版の両方を使っていますが、セキュリティの観点から、このような個人のブログからのダウンロードは抵抗があるという方も多いと思いますので、Python版の全てのソースコードを公開します。(GNU GPLv3ベースのライセンスです)
コードのダウンロードや改変は自由ですが、各個人の責任において使用してください。万が一何らかの損害、障害が起きても当方は一切責任を負いませんので予めその旨を了解の上使用してください。プログラムは、Python
3.4.3でWindows 8.1(64bit)上で動作確認をしていますが、あくまで個人の限られた使用での確認で動作を保証するものではありません。
サンプルは、BOX.COMにおいてあります。上記をご理解の上ご自由に使用してください。
サンプルプログラム
サンプル「waypoint」ファイル
特にドキュメントは用意していませんが、ブログで簡単に紹介しておきます。
使用環境
公開しているソフトウエアは、Python 3.xで書かれていますので、このプログラムを実行するには、Pythonの実行環境をお使いのPCにダウンロードしてインストールする必要があります。実行環境はインターネットから無料でダウンロードできます。Windows,Mac,Linuxなど一般的なOSはサポートされています。
読み込めるファイル
確認しているのは、私のGarmin Connectのアカウントからダウンロードした、GPXとTCX形式のファイルです。他のソースからのGPXファイルは試していません。プログラムは、各記録レコードに、位置情報と時間情報があるのを前提にしており、位置情報が抜けたレコードは無視されるようになっています。これは、時折GPSが位置データを衛星から取得できない場合、心拍数などのデータのみを記録する可能性があるので、その場合はそのレコードは無視しています。GPXファイルの場合、位置情報は必須の様なので問題ないと思いますが、TCXファイルの場合は、インドアアクティビティもサポートするようにしているためか、位置情報が抜けたレコードが存在する可能性はあります。
Waypointファイル
ハイキングなどで、ある特定の地点のラベルをデータレコードにつけたい場合に使用します。サンプルファイルがプログラムと同様にBOX.COMからダウンロードできるようになっています。基本的に、登山口や、山の頂上などの地点を選んで使用できます。データは、地図などから緯度と経度を、「度」、「分」の形式で調べて、その地点のラベル情報を入れるだけです。サンプルのファイルには標高も入っていますがこのバージョンのプログラムでは使用していません。プログラムを起動すると、ウインドウが立ち上がって、「Maximum
Location Error」というフィールドがありますが、入力した位置と、GPSの位置情報がここで指定した以下の距離の場合は、その点とみなしてラベルを付けるようになっています。サンプルは、Mt.
Whitney Trailの場合を想定していて、登山口の「Whitney Portal」、「North
Forkへの分岐」、「Lone Pine Lakeへの分岐」、「Outpost Camp」、「Trail
Camp」、「Trail Crest」、「John Muir Trailの分岐」そして、「頂上」になっています。
基本機能
GPSのトラッキングファイルを読み込むと、各レコードのリストが表示されて、右側に各レコードの基本情報が表示されます。範囲を限定したい場合は、「Sampling
Range」で秒単位のタイムスタンプを指定すると指定された範囲内のレコードが表示されます。
「Maximum Moving Distance for a rest」のフィールドでは、休憩の定義を指定できます。これは、1分辺りの移動距離の上限値をメートルで入れると、それ以下の移動距離のレコードを休憩とみなしてラベルをつけます。また、表示されているレコードの休憩の合計時間を、「Total
Resting time」として、分単位で表示しています。あとは、GPSのトラッキングデータの基本情報から幾つかのデータを計算して表示しています。主な物は、前のレコードとの差を計算して、区間のスピード、斜度(三角関数の「tan」の値、標高差/移動距離)、などを表示しています。
通常のレコードは数秒ごとに記録されていますが、実際のハイキングでは数秒ごとのデータは必要ないので、もう少し大まかな記録に再構成することができます。これは、「Sampling
period」のフィールドで秒で指定すると、だいたいその時間でデータを抜き出して、データは平均値を計算して、表示しています。これにより、時折ある特異点(恐らく衛星の切り替えやカバレッジの変化による測定エラー)の影響を低減できます。
そして、表示されているレコードを、CSVファイルで保存する事ができます。このファイルはMicrosoft Excelなどの表計算ソフトで読み込むことができて、さらに詳細のデータ処理や、グラフの作成をする事ができます。
こうした基本機能は、Garmin Connectでもみる事が出来ますが、範囲を絞って分析したりする場合は、このツールを使うとより詳しく見る事ができるようになります。また、先に紹介したWaypointの機能を使えば、登山の記録をある程度正確に抜き出すことも可能です。
その他
「Sampling period」、「Maximum Location Error」、「Maximum Moving distance for a rest」などの数値を変更した場合は、ファイルの読み込みや、再構成の処理を再実行する必要があります。公開されているバージョンは自動で表示の更新は行いません。距離の計算は、TCXファイルの場合は、TCXファイルの中の距離情報を使っています。このデータはどのように計算された物かは不明です。GPXファイルの場合は緯度、経度の位置情報から計算しています。地球を回転楕円体と仮定して計算する方法をインターネットから入手して実装しています。(Vincentry’s
Formula、日本語のサイトではヒュベニの式と表記されているサイトが多いです)計算には、WGS84(World
Geodetic System 1984)で定義されている値を使って計算しています。しかし、この距離はTCXの中の距離とは一致していません。短い区間での差は少ないですが、長い区間では十数パーセントの違いが出ています。恐らく、TCXの値の方が正確だと思われます。サンプルによる再構成の計算では基本的に、各レコード間の差をレコード間の時間差で割って正規化してその値の区間平均を計算しています。(つまり各区間の平均変化利率=時間微分の値)これによりある程度、測定エラーの影響を取り除くことができます。実際の位置情報や標高の誤差は結構大きいようです。位置情報は100m前後ばらつく事もあって、標高も毎回違う値になっています。(気圧ベースの高度計の値を使っているためと考えられます)必要に応じて、地図の標高などを合わせて処理する必要があると思われます。Mt.
Whitney Trailの場合、距離が長いので、100m程度の差は余り問題にならないかと思います。誤差は使用している衛星が切り替わると、値が全体的にシフトするので補正するのは簡単ではありませんので、プログラムでは特にエラー補正の機能は入れていません。
基本的には、GPXやTCXのXMLファイルの読み込み部は、Pythonに標準でサポートされているモジュールを使って読んでいます。従って、ネームスペースの部分を変更すれば、若干形式が異なるファイルでも最小限の変更で読めるようになると思います。
大したプログラムではありませんが、これでも、GPSのトラッキングデータの詳細を見るのには、一般的なWebサイトの表示よりは細かく調べる事が可能になります。
一応、使用されてご意見や、不具合の情報があればお知らせいただけると助かります。
この先、このツールを使ってデータの解析やツールの機能向上を行っていきます。取りあえず、Ver.0.1でベータ版のリリースで、若干手直しをして再度お知らせします。
今回は、このツールの紹介でした。
なお、プログラムは予告なしに削除する事もあるかと思います。予めご了承ください。
コメント
コメントを投稿