データ処理

高速かつ効率的なレビューを可能にする処理テクノロジーとサービス

非構造化データのプロダクションの品質は、それを処理するチームにかかっています。Consilioのデータ処理サービスは、高速、正確、そして完全なメタデータの抽出、選択除去および重複除去を必要としている企業や法律事務所のために用意されたものです。これまでに10ペタバイトを超えるデータを処理してきた当社は、どんなに複雑なデータコーパスでも処理できるツールと最適手法を持っています。優れたテクノロジーを独自に開発したソフトウェアで拡張することで、Bloomberg®チャットに代表されるオーディオやマルチパーティチャットの転写など、従来とは異なるタイプのデータの数々を処理します。Consilioのデータ処理サービスは、高いコンサルティング能力と豊富な経験を持つプロジェクト管理チームとオペレーションチームによって支えられています。このサービスは、当社の専門のセンターでも、お客様ご指定の場所でもご利用いただけます。

特徴

  • 世界中で10ペタバイトを超えるデータを処理
  • 1プロジェクトにつき1日に1テラバイト以上を処理可能
  • 実質上どんな言語のファイルでも処理できる技術
  • オーディオ、チャットおよびカスタマイズされた独自ファイルをサポート

データ処理サービスの概要

当社のデータ処理サービスは、関連性が最も高いと考えられるファイルに焦点を絞り、重複するファイルと無関係のファイルを排除することによって、効率的なレビューを行うよう構成されています。データ処理サービスには、次の内容が含まれています。

  • メディアの受け取りと検証: データ収集の後、Consilioは当社の処理施設で、標準書式のお客様伝票と一緒にメディアを受け取ります。
  • カタログ化: オブジェクトの抽出を最下位の子レベルまで行います。同時にデータの親子関係の作成とメタデータの抽出を行います。カタログ化には、既知のシステムファイルとソフトウェアファイルで抽出されたコンテンツのdeNIST(不要なファイルを取り除く作業)とメタデータの選択除去が含まれます。
  • 重複除去: 重複除去プロトコルでは、ドキュメントごとに一意の重複キーを、プロジェクトコーパス全体に対して(グローバルプロジェクトレベルの重複除去)、またはカストディアンコーパス(コーパスレベルの重複除去)内で比較します。一意のドキュメントには、データベースに保持されるようにフラグが付けられます。重複するドキュメントは、管理する全体のボリュームを減らすためにレビューソフトウェア内へのインポートから除外されます。重複するドキュメントには、マスターのネイティブドキュメントへのポインターが付加されます。
  • レポートと分析: お客様は、例外処理およびデータ構成のレポートに加えて、データセットをさらに選択除去するための分析と提案を受け取ります。
  • レビューソフトウェアへのインポート: Consilioは、選択除去された重複処理データをeDiscoveryレビュープラットフォームにインポートします。