社内データ活用の不満、解消できます! 不毛なデータ処理作業を委託で解決 » データ活用でこんな悩みはありませんか。 » データの精度が悪い、データが汚れている

データの精度が悪い、データが汚れている

データの中に含まれるダブりや誤入力、表記の揺れや不要な値…。データ作成(入力)ルールがなかったり、ルールが守られていなかったりして作成(入力)されたデータは「汚れ」ています。このままでは分析や集計に使えませんが、きれいに整えるには大変手間がかかります。

データがこんな状態に…

データは日々作成されるにつれ、汚れていきます。こんな状態になっていませんか。

  • 数値型のセルに文字列がある(10個…1万円…)
  • 桁の過不足
  • ありえない日付が入っている(4月31日…)
  • 使用禁止文字が入っている
  • ユニークキーが重複
  • 不要なスペースや記号が入っている
  • 正式名称と通称が混在

クレンジングが必要な場面

上記のような状態になっているデータを活用したいなら、クレンジングが必要です。例えば、

  • システムのリプレース時、旧システムのデータを新システムへ移行する
  • 新しくシステムを導入する時、各種データを取り込む
  • イベントなどでDMを発送する時、住所データを整備する

など、データクレンジングは様々な場面で必要な作業になります。

データクレンジングは自社でやらない

データクレンジングをするには、まず、現状のデータがどのような状態になっているか、あるべき姿との差異を調べます。次に、どのようにクレンジングするかルールをつくり、それに従いきれいに整えていきます。

ただし、データクレンジングを自社で進めるのは本当に骨が折れる作業です。データクレンジングを専門に行っている業者に委託しましょう。精度の高いデータにクレンジングされてきます。