先週から本格的に新しいプロジェクトが始まった。

自分の担当は古いユーザーマスタを新しいユーザーマスタにつくり直すという、いわゆるバッチジョブを作るというもの。
ただし、古いユーザーマスタといってもRDBではなく紙ベース(!)当然データもむちゃくちゃなわけで・・・。

移行の際には、データを分析し、標準化して、綺麗なフォーマットになおしてあげる必要がある。一般的には名寄せっていうみたいですけど。

古いマスタだけだと、情報が足りないので、国土地理院がだいしている「町字ファイル」(全国の地理情報)と帝国データバンクの「企業データベース(TDB)」をつかって、住所フォーマットの統一や郵便番号を付与したり、住所から企業をわりだして、TDBの企業コードをつけてあげたりします。

これだけ見ると結構面倒なコーディングが必要そうなんですけど、
特殊なソフトをつかって、GUIで作成できてしまいます。
基本的にはコーディングなしなのです。

このソフト優れもので、データの頻度分析や、名寄せ、複数のリソース(DB、テキスト、XML、etc..)を編集や結合して、新しいテーブルに書き出すなど、いろんなことができます。

是非プライベートでも欲しいところですが、市販されてないみたいなんですよね・・・。
聞くところによると、すっごい高価らしいんですが・・。

『Data Stage』

『Quality Stage』

カテゴリ

トラックバック(0)

このブログ記事を参照しているブログ一覧: バッチジョブをGUIで作成

このブログ記事に対するトラックバックURL: http://hackmylife.net/mt/mt-tb.cgi/240

コメント(2)

tatsu :

興味深いソフト使ってますね。

「IBM WebSphere」という冠がついてるけど、WebSphereとは関係ない単体のパッケージなのかな!?

C&P :

tatsuさん、こんにちは。

特にData Stageはすっごく便利ですよ。

たとえば、「DB2のデータベースをOracleに移行する」なんてジョブも10分もあれば出来てしまいます。

ちなみに、
「IBM WebSphere」という名前が付いていますけど、これはそもそも開発元の会社が「Ascential」という会社で、そこをIBMが買収したんです。

まったく別のパッケージですね。

コメントする

このブログ記事について

このページは、hackmylifeが2005年10月31日 23:05に書いたブログ記事です。

ひとつ前のブログ記事は「風呂場で・・・」です。

次のブログ記事は「Post it 「フラッグ」」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 4.0

アドセンス

MoMAstore MoMAstore
MoMAstore MoMAstore
MoMAstore MoMAstore
MoMAstore MoMAstore
MoMAstore MoMAstore
MoMAstore
MoMAstore
MoMAstore
MoMAstore