Kapowマッシュアップサーバ - データモジュール

データ、コンテンツに関するマッシュアップは複数のソース(ウェブ上にあるものも含む)から 、コンテンツを加えたり、データを新しいデータレポジトリに取り込んだり、新しいウェブサイトや アプリケーションに取り込んだりすることが可能です。
Kapowマッシュアップサーバのデータモジュールの特徴的なところは、ウェブ上にある情報( コンテンツ、データ、ログインしないと閲覧できない情報など)に自発的にアクセスして、 データを検証し、そのデータをターゲットとなるソース(データベース、XML、Excel、CMS、その他 ウェブシステム)に取り込みます。
データ、コンテンツに関するマッシュアップには多くのウェブデータソースからの抽出、収集プロセス が関係し、またソースデータモデルが、移行する側のデータモデルに対応していない場合も多々ある ため、データの移行、検証作業には効率性が求められます。 このプロセスは“コンテンツインテグレーション“と呼ばれています。

コンテンツマッシュアップを利用可能シナリオは以下の通りです。:

  • データ移行 — コンテンツマネジメントシステムを導入し、レガシーウェブサイトからのデータを取り込みます
  • 競合他社に関する情報収集 — 競合他社のウェブサイトから、製品情報、プレスリリース、特許情報などを収集します。
  • マーケットに関する情報収集 — 多くのウェブサイトから製品情報、価格、あるいはこれらに類する情報を集めます。

データ収集は一度設定するだけで、継続的に行われます。 Kapowマッシュアップサーバは一時的にデータソースにアクセスできない、ウェブインターフェースが変更されているデータソース、データの整合性や移行に起因する インテグレーションの問題に対して包括的なソリューションを提供します。
コンテンツのインテグレーションにおいて、下記に示すたくさんのフォーマットを利用 することが可能です。 特にデータは、データベース、XMLなどで保存可能であり、コンテンツマネジメントシステム に沿った形でも保存可能です。

特徴

利点

データの自動収集

ブラウザで利用可能なあらゆるデータやコンテンツを自動的に収集

ウェブコンテンツのヴィジュアルマッピング(1ページ、または複数ページ)

従来の方法と比較して10分の1以下の時間で、迅速にビジネスに必要なコンテンツを収集

コンテンツ移行

コンテンツマネジメントシステムへ移行するためのあらゆるコンテンツの抽出、変更、挿入

コンテンツの同期と変更の検知

継続的な移行作業をしないための、変更されたコンテンツの抽出、比較、更新

ダイナミックなコンテンツ収集

最新のウェブサイト再利用による、コンテンツや情報のパーソナライズ、更新

パスワードで保護されているコンテンツへのログイン

リサーチのようなログインが必要なコンテンツの利用

変換、組成、検証

データベースに格納するために、断片化されているか否かに関係なく あらゆるコンテンツを変換、標準化する機能を提供します。

大規模サイトの収集

収集するサイトやページは無制限です。

PDFコンテンツの収集

PDFのコンテンツを自動的に抽出します。

エラーハンドリング

サイトやコンテンツに変更があると、すぐに是正を行う通知が行われます。
高い品質を維持するために、コンテンツのエラーチェックをターゲットデータに対して行います。

XLSの生成

収集したあらゆるコンテンツに対して、拡張スタイルシートを適用する機能を提供します。

データベース、XML、テキスト、CSV、EXCEL、ウェブ形式のサポート
 

多様なフォーマットに対応したデータベースへの簡単な保存機能を提供します。

データベーススキーマの自動生成
 

データベーススキーマの自動生成により抽出されたデータを、ソリューションとなるデータモデルに即した形でエクスポートします。

ダイナミックイノベーションオプション

バッチやプログラムによる収集のスケジュール機能を提供します。

企業におけるマッシュアップ開発に関するホワイトペーパーはこちら