トップ «前の日記(2016-07-20) 最新 次の日記(2016-07-23)» 編集
1941|04|05|06|07|08|09|10|11|12|
1942|01|02|03|04|05|06|07|08|09|10|11|12|
1943|01|02|03|04|05|06|07|08|09|10|
2005|09|10|11|12|
2006|01|02|03|04|05|06|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|02|03|04|05|06|07|08|09|10|11|12|
2013|01|02|03|04|05|06|07|08|09|10|11|12|
2014|01|02|03|04|05|06|07|08|09|10|11|12|
2015|01|02|03|04|05|06|07|08|09|10|11|12|
2016|01|02|03|04|05|06|07|08|09|10|11|12|
2017|01|02|03|04|05|06|07|08|09|10|11|12|
2018|01|02|03|04|05|06|07|08|09|10|11|12|
2019|01|02|03|04|05|06|07|08|09|10|11|12|
2020|01|02|03|04|05|06|07|08|09|10|11|12|
2021|01|02|03|04|05|06|07|08|09|10|11|12|
2022|01|02|03|04|05|06|07|08|09|10|11|12|
2023|01|02|03|04|05|06|07|08|09|10|11|12|
2024|01|02|03|04|

旧道倶樂部録"

nagajis不定記。
本日のアクセス数:0|昨日のアクセス数:0
ad

独言 | bdb | C60 | D | KINIAS | NDL | OFF-uploader | ORJ | pdb | pdf | ph | ph. | tdb | ToDo | ToRead | Web | web | きたく | | なぞ | ふむ | アジ歴 | キノコ | コアダンプ | | ネタ | ハチ | バックナンバーCD | メモ | 乞御教示 | 企画 | 偽補完 | 力尽きた | 南天 | 危機 | 原稿 | 古レール | 土木デジタルアーカイブス | 土木構造物 | 大日本窯業協会雑誌 | 奇妙なポテンシャル | 奈良近遺調 | 宣伝 | 帰宅 | 廃道とは | 廃道巡 | 廃道本 | 懐古 | 戦前特許 | 挾物 | 文芸 | 料理 | 新聞読 | 既出 | 未消化 | 標識 | 橋梁 | | 滋賀県道元標 | 煉瓦 | 煉瓦刻印 | 煉瓦展 | 煉瓦工場 | 物欲 | 独言 | 現代本邦築城史 | 産業遺産 | 由良要塞 | 発行 | 看板 | 石垣 | | 竹筋 | 納得がいかない | 索道 | 絵葉書 | | | 資料 | 近世以前土木 | 近代デジタルライブラリー | 近代化遺産 | 近遺調 | 道路元標 | 道路考古学 | 道路遺産 | 都計 | 醤油 | 陸幼日記 | | | 鯖復旧 | 鳴門要塞

2016-07-21 [長年日記]

[web] SJISで与えられた住所の環境依存文字をUTF-8のプログラムでいらう

という苦行をしている。

・最初からUTF-8で投げられたやつならサンプルコードが有る

・しかし元データとしてSJISのCSVが不動

・これをUTF-8なphpでなんとかしようとしている

時点でダメダメ。いらおうとしてmb_convert_encodingした時点でアウト。コード情報が失われて「?」になっちまう。

fgetcsvで読み込んだ直後に\x\xで置換したらいいんじゃね、と思ったら余計なところまで置換されてしまうのだった。三島郡島本町が三?莉」)S島本町になったり福島県福島市が福?莉」)ァ福島市になったり。故にmb_regex_encodingとか使って、そのうえ(株)の株をコード記述せにゃならんかったり。

自身の覚書として汚いコードのまま載せとく。㊤とか荒巻胚⑬とかは無視。


function ill_letter($in1)
{
  //おまえら環境依存なんじゃぼけー
  mb_regex_encoding('sjis-win');
  $arr = array(
  "\x87\x54" => 'I',
  "\x87\x55" => 'II',
  "\x87\x56" => 'III',
  "\x87\x57" => 'IV',
  "\x87\x58" => 'V',
  "\x87\x59" => 'VI',
  "\x87\x5a" => 'VII',
  "\x87\x5b" => 'VIII',
  "\x87\x5c" => 'IX',
  "\x87\x8a" => "(\x8a\x94)",
  "\x87\x8b" => "(\x97\x4d)",
  "\x87\x8c" => "(\x91\xd5)",
  "\x87\x83" => "K.K.",
  "\x87\x41" => "(1)",
  "\x87\x42" => "(2)",
  "\x87\x43" => "(3)",
  "\x87\x44" => "(4)",
  "\x87\x45" => "(5)",
  "\x87\x46" => "(6)",
  "\x87\x47" => "(7)",
  "\x87\x48" => "(8)",
  "\x87\x49" => "(9)",
  "\x87\x4a" => "(10)"
  );
  foreach(array_keys($arr) as $t)
  {
    $in1=mb_ereg_replace( $t, $arr[$t], $in1);
  }
  mb_regex_encoding('utf-8');
  return $in1;
}

あと番地のハイフンを半角に揃えたいのだが何故か置換がうまくいかない。ハイフンに間違われやすい記号が山のようにあるせいか。-―‐-全部やってるつもりなんだけどな。


トップ «前の日記(2016-07-20) 最新 次の日記(2016-07-23)» 編集