2015年5月31日日曜日

GeoGigでGISデータのバージョン管理をする (2)データ更新

今回はデータを更新してみます。

前回、3つのフィーチャーを持つshapefileを登録しました。
C:\work\geogig>geogig ls parks
parks/
    3
    2
    1

フィーチャーの追加

新しいshapefileでデータを更新します。更新するshapefileは、以前登録したものにフィーチャーを1個追加したものです。

まずは、前回同様importします。
C:\work\geogig>geogig shp import c:\work\tutorial_data\snapshot2\parks.shp
Importing from shapefile c:\work\tutorial_data\snapshot2\parks.shp

Importing parks            (1/1)...
25%
4 distinct features inserted in 100.8 ms

Building final tree...

4 features tree built in 6.239 ms
100%
c:\work\tutorial_data\snapshot2\parks.shp imported successfully.

statusコマンドで、リポジトリ内のデータに対してどのような変更がかかるのかがわかります。
C:\work\geogig>geogig status
# On branch master
# Changes not staged for commit:
#   (use "geogig add <path/to/fid>..." to update what will be committed
#   (use "geogig checkout -- <path/to/fid>..." to discard changes in working dir
ectory
#
#      modified  parks
#      added  parks/4
# 2 total.
ここで、parks/4というフィーチャーが追加されることがわかります。

さらに、diffコマンドで、より具体的な差分がわかるようです。
C:\work\geogig>geogig diff
000000... c202e4... 000000... 628763...   A  parks/4
the_geom    MULTIPOLYGON (((-122.8673652884942 42.331042804943124, -122.86738814251632 42.32974514244516, <途中省略>  -122.8673652884942 42.331042804943124)))
owner    City Of Medford
agency    City Of Medford
name    Hawthorne Park / Pool
usage    Public
parktype    Park
area    54662.815673828125
perimeter    1020.6679216977345

addとcommitを使って、フィーチャーの追加をコミットします。
C:\work\geogig>geogig add
Counting unstaged elements...2
Staging changes...
100%
1 features and 1 trees staged for commit
0 features and 0 trees not staged for commit

C:\work\geogig>geogig commit -m "first modification"
100%
[2819d13a8419a1186a44f71f46cbb89a37806d2d] first modification
Committed, counting objects...1 features added, 0 changed, 0 deleted.

logコマンドで、リポジトリに対するコミットのログが見られるようです。
C:\work\geogig>geogig log
Commit:  2819d13a8419a1186a44f71f46cbb89a37806d2d
Author:  testuser <testuser@test.com>
Date:    (4 minutes ago) 2015-05-31 01:57:08 +0900
Subject: first modification

Commit:  f157afde4e55026608733c1d50ab4935db33fb17
Author:  testuser <testuser@test.com>
Date:    (9 hours ago) 2015-05-30 16:04:54 +0900
Subject: first version

logコマンドに-pオプションを指定することで、特定のフィーチャーに対する変更のみを表示することができるようです。
C:\work\geogig>geogig log -p parks/4
Commit:  2819d13a8419a1186a44f71f46cbb89a37806d2d
Author:  testuser <testuser@test.com>
Date:    (7 minutes ago) 2015-05-31 01:57:08 +0900
Subject: first modification

diffコマンドで2つのコミットIDを指定することで、コミット時点どうしの比較もできます。
C:\work\geogig>geogig diff f157afde4e55026608733c1d50ab4935db33fb17 2819d13a8419a1186a44f71f46cbb89a37806d2d
000000... c202e4... 000000... 628763...   A  parks/4

<以下省略>

フィーチャーの変更


次に、既存のジオメトリと属性値を変更してみます。park/1は、ポリゴンの頂点を一つ動かして、さらにownerの属性値を変更し、park/3は、属性値のみ変更しました(チュートリアルにはこのようなデータはないので、自分で加工して作りました)。
これをimportで取り込みます。
C:\work\geogig>geogig shp import c:\work\tutorial_data\snapshot2a\parks.shp
Importing from shapefile c:\work\tutorial_data\snapshot2a\parks.shp

Importing parks            (1/1)...
25%
3 distinct features inserted in 261.7 ms

Building final tree...

4 features tree built in 5.612 ms
100%
c:\work\tutorial_data\snapshot2a\parks.shp imported successfully.

差分をdiffで確認します(parks/3のperimeterとareaの属性値が勝手に変わってるのが気になります…)。
C:\work\geogig>geogig diff
c202e4... c202e4... af4c5f... 9a6b21...   M  parks/3
owner: Medford School District -> test
perimeter: 572.1249849079909 -> 572.124984907991
area: 17345.00048828125 -> 17345.0004882812

c202e4... c202e4... 75a0cb... d3e4f5...   M  parks/1
owner: Jackson County -> test
the_geom: MultiPolygon -122.87290806613127,42.335410926692404 -122.87265408473853,42.335482522206775 -122.87253735255466,42.33526317433605 [-122.87279895095871,42.3351865382066] (-122.87280229470025,42.33512635085884) -122.87290806613127,42.335410926692404
最後にaddとcommitで変更をコミットします。
C:\work\geogig>geogig add
Counting unstaged elements...3
Staging changes...
100%
2 features and 1 trees staged for commit
0 features and 0 trees not staged for commit

C:\work\geogig>geogig commit -m "second modification"
100%
[26efb5b977761415689a88e5a3493e5c19f8cec8] second modification
Committed, counting objects...0 features added, 2 changed, 0 deleted.

変更の確認

logコマンドでフィーチャーの変更履歴をみてみます。
C:\work\geogig>geogig log -p parks/1
Commit:  26efb5b977761415689a88e5a3493e5c19f8cec8
Author:  testuser <testuser@test.com>
Date:    (1 minutes ago) 2015-05-31 13:49:25 +0900
Subject: second modification

Commit:  f157afde4e55026608733c1d50ab4935db33fb17
Author:  testuser <testuser@test.com>
Date:    (21 hours ago) 2015-05-30 16:04:54 +0900
Subject: first version

blameコマンドでフィーチャーを確認すると、the_geom(ジオメトリ)とowner属性値の変更日時が新しくなっているのがわかります。
C:\work\geogig>geogig blame parks/1
parktype: Riparian f157afd testuser testuser@test.com 2015-05-31 01:04:54
area: 600.217529296875 f157afd testuser testuser@test.com 2015-05-31 01:04:54
perimeter: 98.3058889120852 f157afd testuser testuser@test.com 2015-05-31 01:04:54
name: Bear Creek Channel f157afd testuser testuser@test.com 2015-05-31 01:04:54
the_geom: MULTIPOLYGON (((-122.87290806613127 42.335410926692404, -122.87265408473853 42.335482522206775, -122.87253735255466 42.33526317433605, -122.87280229470025 42.33512635085884, -122.87290806613127 42.335410926692404))) 26efb5b testuser testuser@test.com 2015-05-31 10:49:25
owner: test 26efb5b testuser testuser@test.com 2015-05-31 10:49:25
usage: Public f157afd testuser testuser@test.com 2015-05-31 01:04:54
agency: Jackson County f157afd testuser testuser@test.com 2015-05-31 01:04:54
 今回はここまで。

2015年5月30日土曜日

GeoGigでGISデータのバージョン管理をする (1)データ登録


shapefileなどのGISデータをバージョン管理するとき、ふつうにgitやsvnなどでファイルそのものをバージョン管理するという方法もありますが、GeoGigという、GISデータに特化したバージョン管理プログラムがあるということで、試してみます。

環境


今回は次の環境を使用します。GeoGigの本体はjarファイルですので、Javaの動作環境を用意します。
  • OS…Windows 8.1 Pro
  • Java…Java SE Development Kit 8u45

事前準備


まず、GeoGigのサイトからzipファイルをダウンロードし、任意の場所に展開します。中にbinというフォルダーがあるので、このフォルダーをPATH環境変数に追加しておきます。

実行


GeoGigのチュートリアルが用意されているので、それを参考にしながら実行していきます。サンプルデータとなるshapefileもチュートリアルのページからダウンロードできます。

リポジトリ作成

まずはgeogig用のリポジトリを作る必要があります。任意の場所に空のフォルダーを作成し(今回はC:\work\geogigというフォルダーを作りました)、コマンドプロンプトでgeogig initと打ちます。
C:\work\geogig>geogig init
Initialized empty Geogig repository in C:\work\geogig\.geogig

ユーザー情報の設定

ユーザーの名前とemailを設定しておかないと、あとでファイルをデータをする際にエラーになるので、先に設定しておきます。
C:\work\geogig>geogig config user.name testuser
C:\work\geogig>geogig config user.email testuser@test.com

shapefileの登録

いよいよデータを登録してみます。
チュートリアルのサンプルデータは、ポリゴンが3個のshapefileになっています。

登録するには、まずimportコマンドでデータをGeoGig内にインポートし、それからadd⇒commitの順番でコマンドを実行します。
C:\work\geogig>geogig shp import c:\work\tutorial_data\snapshot1\parks.shp
Importing from shapefile c:\work\tutorial_data\snapshot1\parks.shp

Importing parks            (1/1)...
33%
3 distinct features inserted in 296.7 ms

Building final tree...

3 features tree built in 16.85 ms
100%
c:\work\tutorial_data\snapshot1\parks.shp imported successfully.

C:\work\geogig>geogig add
Counting unstaged elements...4
Staging changes...
100%
3 features and 1 trees staged for commit
0 features and 0 trees not staged for commit
C:\work\geogig>geogig commit -m "first version"
100%
[f157afde4e55026608733c1d50ab4935db33fb17] first version
Committed, counting objects...3 features added, 0 changed, 0 deleted.

内容の確認

lsコマンドを実行すると、parksというディレクトリ?の中に、3つのフィーチャーが作られていることがわかります。

C:\work\geogig>geogig ls
Root tree/
    parks/

C:\work\geogig>geogig ls parks
parks/
    3
    2
    1
 showコマンドで、データの中身を見ることができます。

まずはparksの定義を見てみます。

C:\work\geogig>geogig show parks
TREE ID:  cfe448b15b03dc1f9fe687643f16fb9f01aa2a5a
SIZE:  3
NUMBER Of SUBTREES:  0
DEFAULT FEATURE TYPE ID:  c202e4dc0bbeaf2cbb068a5f0b168099832455da

DEFAULT FEATURE TYPE ATTRIBUTES
the_geom: <MULTIPOLYGON>
owner: <STRING>
agency: <STRING>
name: <STRING>
usage: <STRING>
parktype: <STRING>
area: <DOUBLE>
perimeter: <DOUBLE>

次に、1つのフィーチャーを見てみます。座標と属性値が見られます。
C:\work\geogig>geogig show parks/1

ID:  75a0cbf170714fb1b60f0bd80fddeac8fbfb2429
FEATURE TYPE ID:  c202e4dc0bbeaf2cbb068a5f0b168099832455da

ATTRIBUTES
----------
the_geom: MULTIPOLYGON (((-122.87290806613127 42.335410926692404, -122.87265408473853 42.335482522206775, -122.87253735255466 42.33526317433605, -122.87279895095871 42.3351865382066, -122.87290806613127 42.335410926692404)))
owner: Jackson County
agency: Jackson County
name: Bear Creek Channel
usage: Public
parktype: Riparian
area: 600.217529296875
perimeter: 98.3058889120852

blameコマンドで、フィーチャーのジオメトリや属性値をいつ誰が更新したかがわかるようです。
C:\work\geogig>geogig blame parks/1
parktype: Riparian f157afd testuser testuser@test.com 2015-05-31 01:04:54
area: 600.217529296875 f157afd testuser testuser@test.com 2015-05-31 01:04:54
perimeter: 98.3058889120852 f157afd testuser testuser@test.com 2015-05-31 01:04:54
name: Bear Creek Channel f157afd testuser testuser@test.com 2015-05-31 01:04:54
the_geom: MULTIPOLYGON (((-122.87290806613127 42.335410926692404, -122.87265408473853 42.335482522206775, -122.87253735255466 42.33526317433605, -122.87279895095871 42.3351865382066, -122.87290806613127 42.335410926692404))) f157afd testuser testuser@test.com 2015-05-31 01:04:54
owner: Jackson County f157afd testuser testuser@test.com 2015-05-31 01:04:54
usage: Public f157afd testuser testuser@test.com 2015-05-31 01:04:54
agency: Jackson County f157afd testuser testuser@test.com 2015-05-31 01:04:54
とりあえず今回はここまで。