そのデータ、AIにとっては「ゴミ」です。AI分析の精度を劇的に上げるExcelデータ「5つの鉄則」
こんにちは!
「AIを導入してみたものの、期待した結果が出ない...」
「分析を頼んだら、間違った数字が返ってきた...」
ビジネスの現場でAI活用が進む中、こうした声を耳にすることが増えてきました。
高性能なAIを使っているはずなのに、なぜ精度が低いのか。
その原因の多くは、実は「AIに与えるデータの品質(データの作り方)」にあります。
AIの文脈でよく言われる原則に「ガベージイン・ガベージアウト(ゴミを入れるとゴミしか出てこない)」というものがあります。
どんなに優秀なAIでも、読み込ませるExcelデータが整理されていなければ、その能力を発揮することはできません。
今回は、SBC&S株式会社 津川の講義動画『そのデータ、AIにとっては「ゴミ」です。5つの鉄則で劇的改善!』から、AIが正しく理解できる「最強のデータベース」をExcelで作るための5つの鉄則をご紹介します。
なぜAIはあなたのExcelデータを理解できないのか?
人間が見て「見やすい」と感じる表と、AI(機械)が「理解しやすい」データは全く異なります。 動画では、以下のようなデータが「AIにとってのゴミ(理解不能なデータ)」として挙げられています。
-
セルの結合: 見た目には綺麗ですが、AIはデータの構造を見失います。
-
表記のバラつき: 「¥」「円」などの単位が混在している。
-
構造の不統一: 支店ごとに表の形が違う、集計行が混ざっている。
こうしたデータをそのままAIに渡すと、エラーが出るだけでなく、「もっともらしい顔をして間違った集計結果を返す」という一番恐ろしい事態を招きます。
では、どうすればよいのでしょうか?
ここからは、動画で解説されている「5つの鉄則」を具体的なExcelテクニックとして解説します。
AIに正しく分析させるための「5つの鉄則」
【鉄則 1】「テーブル化」機能で一貫性を保つ
まず最初に行うべきは、Excelの標準機能である「テーブル機能」の設定です。
-
問題点: 単なるセル入力では、AIは「どこからどこまでがデータの範囲か」を正確に認識できません。
-
解決策: データ範囲を選択し、ショートカットキー [ Ctrl + T ] を押すだけ。
-
効果: これだけで、ヘッダー(列名)が固定され、AIがデータの範囲と構造を正しく認識できるようになります。データが増えても自動で範囲が拡張されるため、メンテナンスも楽になります。
【鉄則 2】「1行1レコード」の原則を守る
データベースの基本中の基本です。横方向に記録を広げるのではなく、縦方向に積み上げます。
-
問題点: 「1月~3月売上」のように期間をまとめたり、共通項目(支店名など)を省略して空欄にしたりする。
-
解決策: 扱いたい最小単位(例:1月、2月、3月)ごとに行を分けます。また、「東京支店」などの共通項目も省略せず、全ての行に入力します。
-
効果: 冗長に見えますが、AIにとってはこれが最も理解しやすい形です。この形にすることで、自在な集計が可能になります。
【鉄則 3】列名は明確かつ一意(ユニーク)にする
1行目の列名(ヘッダー)は、AIにとっての「名札」です。
-
問題点: 「値」「月」といった曖昧な名前や、同じ列名が複数ある状態。
-
解決策: 「売上金額(円)」「売上月」のように、具体的かつ単位を含めた名前にします。
-
効果: AIがその列に何が入っているかを正確に推論できるようになります。特に単位(円、千円など)を列名に明記することで、桁数の間違いを防げます。
【鉄則 4】データ型を統一する
1つの列には、同じ種類のデータだけを入れます。
-
問題点: 金額列に「100万円」(数値と漢字の混在)や「未定」(文字列)などが混ざっている。
-
解決策: 金額列は数値のみ(例:1000000)にします。「円」などの単位はデータ内には入れず、列名で管理します。日付も「2024/1/1」のように書式を統一します。
-
効果: データ型が統一されることで、AIは計算処理を迷わず行えるようになります。
【鉄則 5】空白セルとステータスを適切に処理する
空白はAIにとって「データがない(Null)」のか「0」なのか判別できません。
-
問題点: 売上がない月を空欄にする、未確定の数字を空欄にする。
-
解決策: 売上がないなら「0」を入力します。「未確定」や「見積中」などの情報は、金額列に文字で書くのではなく、別に「ステータス列」を作って管理します。
-
効果: 数値計算と状態管理を分離することで、正確な集計が可能になります。
劇的改善!AI分析のBefore / After
動画では、これらの鉄則を守って整形したデータをChatGPTに読み込ませた結果、正しく変化が見られました。
-
Before(修正前の汚いデータ):
-
支店別の売上合計すら計算ミスが発生。
-
データの構造を誤解し、頓珍漢な回答が返ってくる。
-
-
After(修正後の綺麗なデータ):
-
正確な売上集計が一瞬で完了。
-
「支店ごとの月次売上推移グラフを作って」という指示に対し、完璧なグラフを一発で作成。
-
データの形を整えるだけで、AIは「信頼できないアシスタント」から「超優秀なデータアナリスト」へと変貌したのです。
まとめ:AI活用の第一歩は「Excelの整備」から
AIがその真価を発揮するためには、土台となる「良質なデータ」が不可欠です。
-
バックアップをとる(まずは既存データのコピーを作成)
-
5つの鉄則で整形する(テーブル化、1行1レコード、列名、データ型、空白処理)
-
AIに読み込ませてテストする
これらのステップを踏むことで、あなたの手元にあるExcelデータはAIにとっての「宝の山」に変わります。
AIの精度に課題を感じている方は、ぜひ今日から実践してみてください。
今回の動画では、実際の画面を見ながらより詳しく解説しています。ぜひ動画本編もご視聴ください!
著者紹介
SB C&S株式会社
ICT事業本部 技術本部 先端技術統括部 DXコンサルティング部 デジタルイノベーション課
津川 聡
