SB C&Sの最新技術情報 発信サイト

C&S ENGINEER VOICE

SB C&S

【C&S公式Youtube】そのデータ、AIにとっては「ゴミ」です。AI分析の精度を劇的に上げるExcelデータ「5つの鉄則」【第4回データ講義】

AI
2025.12.25

そのデータ、AIにとっては「ゴミ」です。AI分析の精度を劇的に上げるExcelデータ「5つの鉄則」

こんにちは!
「AIを導入してみたものの、期待した結果が出ない...」
「分析を頼んだら、間違った数字が返ってきた...」
ビジネスの現場でAI活用が進む中、こうした声を耳にすることが増えてきました。

高性能なAIを使っているはずなのに、なぜ精度が低いのか。
その原因の多くは、実は「AIに与えるデータの品質(データの作り方)」にあります。

AIの文脈でよく言われる原則に「ガベージイン・ガベージアウト(ゴミを入れるとゴミしか出てこない)」というものがあります。
どんなに優秀なAIでも、読み込ませるExcelデータが整理されていなければ、その能力を発揮することはできません。

今回は、SBC&S株式会社 津川の講義動画『そのデータ、AIにとっては「ゴミ」です。5つの鉄則で劇的改善!』から、AIが正しく理解できる「最強のデータベース」をExcelで作るための5つの鉄則をご紹介します。


なぜAIはあなたのExcelデータを理解できないのか?

人間が見て「見やすい」と感じる表と、AI(機械)が「理解しやすい」データは全く異なります。 動画では、以下のようなデータが「AIにとってのゴミ(理解不能なデータ)」として挙げられています。

  • セルの結合: 見た目には綺麗ですが、AIはデータの構造を見失います。

  • 表記のバラつき: 「¥」「円」などの単位が混在している。

  • 構造の不統一: 支店ごとに表の形が違う、集計行が混ざっている。

こうしたデータをそのままAIに渡すと、エラーが出るだけでなく、「もっともらしい顔をして間違った集計結果を返す」という一番恐ろしい事態を招きます。

では、どうすればよいのでしょうか?
ここからは、動画で解説されている「5つの鉄則」を具体的なExcelテクニックとして解説します。


AIに正しく分析させるための「5つの鉄則」

【鉄則 1】「テーブル化」機能で一貫性を保つ

まず最初に行うべきは、Excelの標準機能である「テーブル機能」の設定です。

  • 問題点: 単なるセル入力では、AIは「どこからどこまでがデータの範囲か」を正確に認識できません。

  • 解決策: データ範囲を選択し、ショートカットキー [ Ctrl + T ] を押すだけ。

  • 効果: これだけで、ヘッダー(列名)が固定され、AIがデータの範囲と構造を正しく認識できるようになります。データが増えても自動で範囲が拡張されるため、メンテナンスも楽になります。

【鉄則 2】「1行1レコード」の原則を守る

データベースの基本中の基本です。横方向に記録を広げるのではなく、縦方向に積み上げます。

  • 問題点: 「1月~3月売上」のように期間をまとめたり、共通項目(支店名など)を省略して空欄にしたりする。

  • 解決策: 扱いたい最小単位(例:1月、2月、3月)ごとに行を分けます。また、「東京支店」などの共通項目も省略せず、全ての行に入力します。

  • 効果: 冗長に見えますが、AIにとってはこれが最も理解しやすい形です。この形にすることで、自在な集計が可能になります。

【鉄則 3】列名は明確かつ一意(ユニーク)にする

1行目の列名(ヘッダー)は、AIにとっての「名札」です。

  • 問題点: 「値」「月」といった曖昧な名前や、同じ列名が複数ある状態。

  • 解決策: 「売上金額(円)」「売上月」のように、具体的かつ単位を含めた名前にします。

  • 効果: AIがその列に何が入っているかを正確に推論できるようになります。特に単位(円、千円など)を列名に明記することで、桁数の間違いを防げます。

【鉄則 4】データ型を統一する

1つの列には、同じ種類のデータだけを入れます。

  • 問題点: 金額列に「100万円」(数値と漢字の混在)や「未定」(文字列)などが混ざっている。

  • 解決策: 金額列は数値のみ(例:1000000)にします。「円」などの単位はデータ内には入れず、列名で管理します。日付も「2024/1/1」のように書式を統一します。

  • 効果: データ型が統一されることで、AIは計算処理を迷わず行えるようになります。

【鉄則 5】空白セルとステータスを適切に処理する

空白はAIにとって「データがない(Null)」のか「0」なのか判別できません。

  • 問題点: 売上がない月を空欄にする、未確定の数字を空欄にする。

  • 解決策: 売上がないなら「0」を入力します。「未確定」や「見積中」などの情報は、金額列に文字で書くのではなく、別に「ステータス列」を作って管理します。

  • 効果: 数値計算と状態管理を分離することで、正確な集計が可能になります。


劇的改善!AI分析のBefore / After

動画では、これらの鉄則を守って整形したデータをChatGPTに読み込ませた結果、正しく変化が見られました。

  • Before(修正前の汚いデータ):

    • 支店別の売上合計すら計算ミスが発生。

    • データの構造を誤解し、頓珍漢な回答が返ってくる。

  • After(修正後の綺麗なデータ):

    • 正確な売上集計が一瞬で完了。

    • 「支店ごとの月次売上推移グラフを作って」という指示に対し、完璧なグラフを一発で作成。

データの形を整えるだけで、AIは「信頼できないアシスタント」から「超優秀なデータアナリスト」へと変貌したのです。


まとめ:AI活用の第一歩は「Excelの整備」から

AIがその真価を発揮するためには、土台となる「良質なデータ」が不可欠です。

  1. バックアップをとる(まずは既存データのコピーを作成)

  2. 5つの鉄則で整形する(テーブル化、1行1レコード、列名、データ型、空白処理)

  3. AIに読み込ませてテストする

これらのステップを踏むことで、あなたの手元にあるExcelデータはAIにとっての「宝の山」に変わります。
AIの精度に課題を感じている方は、ぜひ今日から実践してみてください。

今回の動画では、実際の画面を見ながらより詳しく解説しています。ぜひ動画本編もご視聴ください!

著者紹介

SB C&S株式会社
ICT事業本部 技術本部 先端技術統括部 DXコンサルティング部 デジタルイノベーション課
津川 聡