先週から本格的に新しいプロジェクトが始まった。
自分の担当は古いユーザーマスタを新しいユーザーマスタにつくり直すという、いわゆるバッチジョブを作るというもの。
ただし、古いユーザーマスタといってもRDBではなく紙ベース(!)当然データもむちゃくちゃなわけで・・・。
移行の際には、データを分析し、標準化して、綺麗なフォーマットになおしてあげる必要がある。一般的には名寄せっていうみたいですけど。
古いマスタだけだと、情報が足りないので、国土地理院がだいしている「町字ファイル」(全国の地理情報)と帝国データバンクの「企業データベース(TDB)」をつかって、住所フォーマットの統一や郵便番号を付与したり、住所から企業をわりだして、TDBの企業コードをつけてあげたりします。
これだけ見ると結構面倒なコーディングが必要そうなんですけど、
特殊なソフトをつかって、GUIで作成できてしまいます。
基本的にはコーディングなしなのです。
このソフト優れもので、データの頻度分析や、名寄せ、複数のリソース(DB、テキスト、XML、etc..)を編集や結合して、新しいテーブルに書き出すなど、いろんなことができます。
是非プライベートでも欲しいところですが、市販されてないみたいなんですよね・・・。
聞くところによると、すっごい高価らしいんですが・・。
カテゴリ
仕事トラックバック(0)
このブログ記事を参照しているブログ一覧: バッチジョブをGUIで作成
このブログ記事に対するトラックバックURL: http://hackmylife.net/mt/mt-tb.cgi/240
















興味深いソフト使ってますね。
「IBM WebSphere」という冠がついてるけど、WebSphereとは関係ない単体のパッケージなのかな!?
tatsuさん、こんにちは。
特にData Stageはすっごく便利ですよ。
たとえば、「DB2のデータベースをOracleに移行する」なんてジョブも10分もあれば出来てしまいます。
ちなみに、
「IBM WebSphere」という名前が付いていますけど、これはそもそも開発元の会社が「Ascential」という会社で、そこをIBMが買収したんです。
まったく別のパッケージですね。