トップ «前の日記(2009-02-25) 最新 次の日記(2009-02-28)» 編集
1941|04|05|06|07|08|09|10|11|12|
1942|01|02|03|04|05|06|07|08|09|10|11|12|
1943|01|02|03|04|05|06|07|08|09|10|
2005|09|10|11|12|
2006|01|02|03|04|05|06|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|02|03|04|05|06|07|08|09|10|11|12|
2013|01|02|03|04|05|06|07|08|09|10|11|12|
2014|01|02|03|04|05|06|07|08|09|10|11|12|
2015|01|02|03|04|05|06|07|08|09|10|11|12|
2016|01|02|03|04|05|06|07|08|09|10|11|12|
2017|01|02|03|04|05|06|07|08|09|10|11|12|
2018|01|02|03|04|05|06|07|08|09|10|11|12|
2019|01|02|03|04|05|06|07|08|09|10|11|12|
2020|01|02|03|04|05|06|07|08|09|10|11|12|
2021|01|02|03|04|05|06|07|08|09|10|11|12|
2022|01|02|03|04|05|06|07|08|09|10|11|12|
2023|01|02|03|04|05|06|07|08|09|10|11|12|
2024|01|02|03|04|

旧道倶樂部録"

nagajis不定記。
本日のアクセス数:0|昨日のアクセス数:0
ad

独言 | bdb | C60 | D | KINIAS | NDL | OFF-uploader | ORJ | pdb | pdf | ph | ph. | tdb | ToDo | ToRead | Web | web | きたく | | なぞ | ふむ | アジ歴 | キノコ | コアダンプ | | ネタ | ハチ | バックナンバーCD | メモ | 乞御教示 | 企画 | 偽補完 | 力尽きた | 南天 | 危機 | 原稿 | 古レール | 土木デジタルアーカイブス | 土木構造物 | 大日本窯業協会雑誌 | 奇妙なポテンシャル | 奈良近遺調 | 宣伝 | 帰宅 | 廃道とは | 廃道巡 | 廃道本 | 懐古 | 戦前特許 | 挾物 | 文芸 | 料理 | 新聞読 | 既出 | 未消化 | 標識 | 橋梁 | | 滋賀県道元標 | 煉瓦 | 煉瓦刻印 | 煉瓦展 | 煉瓦工場 | 物欲 | 独言 | 現代本邦築城史 | 産業遺産 | 由良要塞 | 発行 | 看板 | 石垣 | | 竹筋 | 納得がいかない | 索道 | 絵葉書 | | | 資料 | 近世以前土木 | 近代デジタルライブラリー | 近代化遺産 | 近遺調 | 道路元標 | 道路考古学 | 道路遺産 | 都計 | 醤油 | 陸幼日記 | | | 鯖復旧 | 鳴門要塞

2009-02-26 [長年日記]

[pdb] 腐ったデータを修復

はるか以前に作っていた峠データベースが完全死亡する前に抽出しておいたテキストと格闘している。Robinhood on BeOSしかもBFSのAttribute上に構築という奇妙稀天劣なデータベースで、まともに動いていたのは数カ月くらいだったろうと思うが、ともかくそのデータ部分だけを抽出してテキストファイルにしたものが残っている。約3MB。

峠、越、坂など峠地名7315を収録。データはおもにうおっちずから貰ったが峠本から拾って入力したものも数百あるはず。98%くらいは経緯度データと行政区データと2.5万図図版番号がある。70%くらいには標高も入っている(国土地理院が50mメッシュを無償公開していた頃にそのデータからおおよその標高を算出したもの。精度はあまりよくない)。5%くらいには関連情報もある。これを復活させたい。

ちょっとした長年の夢である。しかし場当たり的に積み上げ作り上げたデータであるうえに5年も前の代物だから思ったようにいかない。まずもって行政区が腐っている。市町村合併が進行中の頃だったため新旧入り交じっているうえ、妙な具合に略記してしまっていた。

山梨県大月市梁川町塩瀬/南都留郡秋山村寺下

山口県豊浦郡豊北町北宇賀/豊浦町宇賀

山口県玖珂郡周東町川上/岩国市相ノ谷

とかなっている。新旧市町村名は市町村コードと合併リストを使って正規化(だったっけ)すれば何とかなりそうだが、そのためには県名郡名を補完してやらなければならぬ(市町村コードは「○○市」または「△△郡××町(村)」のセットに振られている)。この補完作業が大きな障壁になっていたのだった。いきなり胸突八丁の急坂から始まる峠道のようなもの。

もともとこの表記は峠の経緯度の東西南北の4点のフル地名から都|道|府|県|市|区|郡|町|村でsplitして組み立てたものだ。この方向なら何とかならないでもない。しかしその仕組みを作ったのはもう5年も前の話であって、しかもperlは忘れてしまった。chimeisplit.plのソースを読んでもちんぷんかんぷんだしその逆などもってのほか。

泣きながら解読して、phpに書き直して(弱)、何とか4点フル地名に戻すことができた。仕組み的には至極単純だったのがそれを思い付くまでに1/4日かかった。寝ながら考えてふと思い立って目が冴えてしまい、わしわし書き直してようやく今に至。

これをテーブルに放り込めばとりあえずモノになる。tdbを流用すれば検索と詳細表示くらいは一気に出来る。経緯度→航空写真のテーブルもアルゴリズムもすでにphpで作ってあるしな。課題は市町村コードを使った正規化。まずそのデータを作るところから始めなければ。そうして正規化の下手糞なnagajisはどうやっていいやら想像もついてない(ばく


トップ «前の日記(2009-02-25) 最新 次の日記(2009-02-28)» 編集