AIが動かない本当の理由はデータにある｜HubSpotで実現するAI-Ready基盤の作り方

作成者: 田村慶｜2026/05/19

「AIを導入すれば生産性が10倍になる」という言葉を耳にする機会が増えました。経営層からのトップダウンで「AIを活用しなさい」という指示が現場に下り、各種ツールを導入した企業は少なくありません。しかし、実際に導入してみると期待したような成果が出ない、という声も同様に多く聞かれます。

この状況の原因は、AIそのものの能力にあるわけではありません。現代のAIモデルは、GoogleのGemini、OpenAIのChatGPT、AnthropicのClaude、XのGrokなど、各社が日々進化させており、すでに十分な知的能力を持っています。問題はAIに渡しているデータの状態にあります。

本記事では、AI活用が停滞する根本原因を「データ品質」の観点から掘り下げ、HubSpotを活用してAI-Readyなデータ基盤をどのように構築するか、具体的なアプローチを解説します。

なぜ「AIを使え」というトップダウンが現場を停滞させるのか

多くの企業がぶつかる5つの壁

AI活用を推進しようとする企業が直面する課題は、実は共通しています。表面上は別々の問題に見えますが、その根本原因は同じところにあります。

壁1：何から手をつければいいかわからない

「AI活用してください」という号令が下りても、現場には判断材料がありません。どのデータをAIに渡すべきか、どの業務から自動化すべきか、優先順位を決める基準がないため、現場は動くことができません。AIの導入はツールを入れることではなく、活用できる状態をつくることですが、多くの企業でその設計が欠落しています。

壁2：CRMのデータが信頼できない

CRMに登録されているデータの重複、表記ゆれ、欠損が多く、AIの判断材料として使えない状態になっています。同一企業が「ABC株式会社」「ABC Ltd.」「ABC」と複数のレコードに分かれていたり、必須であるはずの業種や従業員数が空欄だったりします。こうした「汚れたデータ」をAIに渡しても、AIは正しい判断を下せません。

壁3：部署間で見ている情報がバラバラ

営業、マーケティング、カスタマーサクセスがそれぞれ異なるシステム・異なるデータを参照しています。同じお客様に対して部署ごとに異なる顧客像を持っているため、組織全体として一貫したアプローチができません。AIがデータを統合しようとしても、前提となるデータが統一されていなければ機能しません。

壁4：CRMが単なる入力ツールになっている

HubSpotをはじめとするCRMは、本来データを蓄積・活用するためのプラットフォームです。しかし実態は「上司に入力しろと言われるから入れる」という単なる記録ツールになっており、AIが活用できる状態には程遠い使われ方をしています。

壁5：運用が定着せず、データ品質が時間とともに劣化する

CRM移行直後は整理された状態であっても、日常的なメンテナンスが行われなければデータ品質は確実に劣化していきます。担当者が変わるたびに入力ルールが崩れ、気づけば「使えないデータ」の山が積み上がっていきます。

これらの5つの壁は、それぞれ独立した問題ではなく、「データ基盤が整備されていない」という共通の根本原因から生まれています。

トップダウンと現場のすれ違いが生む停滞

経営層がAI活用を推進したい背景には、「他社が導入しているから」「生産性向上のニュースを見た」「ベンダーから提案を受けた」といった理由が多くあります。AIがこれまでできなかったことを可能にする賢いエンジンであることは、多くの人が感覚的に理解しています。

一方で現場の実態はどうでしょうか。ChatGPTのような個人の質問応答ツールとしてはAIを活用できていても、企業全体の業務や顧客サービスに組み込もうとすると、途端に壁にぶつかります。CRMにデータが入っていない、重複や表記ゆれが多い、AIの回答が一般論になって使えない、入力を増やすと現場が疲弊する——こうした現実がAI活用の前進を妨げています。

AIは確かに賢いですが、「賢さだけでは成果は出ない」のです。AIに自社独自のデータを渡し、その文脈で動かせるようにすることが、企業におけるAI活用の本質です。

AIに渡すべきデータの3つの条件

AIが正しく機能するためには、渡すデータが以下の3つの条件を満たしている必要があります。

1. クリーンであること

重複がない、書式が統一されている、必須項目がすべて埋まっている——これがデータの「清潔さ」です。一見当たり前に思えますが、多くの企業でこの基本条件が満たされていません。

特に表記ゆれの問題は深刻です。マーケティング部署の名称ひとつとっても、「マーケティング部」「マーケ部」「Marketing」など複数の表記が混在することがあります。DX推進に関わる部署であれば、「DX推進部」「デジタル変革推進室」「デジタル戦略部」など、企業によって呼び名はさらに多様です。これらを統一してカテゴライズする作業は、AIが正しく処理するための前提条件となります。

2. リッチであること

単純なデータベースを作るだけでなく、業種・規模・行動・関係性など、自社ビジネスで活用できる情報が豊富に含まれているデータが「リッチなデータ」です。

たとえば、顧客企業の業種や従業員数だけでなく、直近の業績トレンド、採用状況、プレスリリースの内容、自社との過去の商談履歴、購入実績などが紐づいて蓄積されていると、AIはその情報を文脈として活用し、はるかに精度の高い判断を下せるようになります。

3. 継続的に監視されていること

データ整備は一度やれば終わりではありません。時間とともにデータは必ず劣化します。オフィスと同じで、一度きれいにしても定期的に掃除をしなければ元の状態に戻ります。

退社時に机の上を片付ける、週一回フロアを掃除するといった習慣が清潔なオフィスを維持するように、データも「いつ、誰が、どのような基準で更新するか」という運用ルールと監視体制がなければ、品質は必ず劣化します。

HubSpotとは何か——AI-Readyなプラットフォームへの進化

CRM・MAツールを超えた存在へ

HubSpotはもともとMAツール（マーケティングオートメーション）として出発しましたが、現在はCRMを中心としたカスタマープラットフォームへと進化しています。2024年以降は特にAIへのコミットが顕著で、「エージェント型のカスタマープラットフォーム」という表現を使うようになっています。

AIをプラットフォームに後から組み込むのではなく、AIを前提として機能そのものを刷新していくという姿勢が、他のCRMとの大きな差別化となっています。現在、130カ国・約28万社が利用しています。

HubSpotの製品構成

HubSpotは以下の6つのハブで構成されています。

Marketing Hub（マーケティングハブ）：リード獲得・育成・メール配信
Sales Hub （セールスハブ）：商談管理・パイプライン
Service Hub（サービスハブ）：カスタマーサポート・チケット管理
Content Hub（コンテンツハブ）：CMS・ウェブサイト管理
Date Hub（データハブ）：データ統合・品質管理
Commerce Hub（コマーサーブ）：見積もり・請求書・決済

これらのハブを支える基盤が「スマートCRM」であり、その上でAI機能群「Breeze（ブリーズ）」が動作します。本記事で中心的に取り上げるのは、スマートCRM、Breeze、そしてデータハブの機能です。

HubSpotはマーケティングから営業、契約後のカスタマーサクセス、さらには見積もり・請求・決済まで、フロントオフィスのすべての業務を一元管理できるプラットフォームです。この一元化こそが、SSOT（後述）を実現するための土台になります。

データのデトックス——CRMの汚れを可視化して整える

4種類のデータの「汚れ」

AI-Readyな状態をつくるには、まず現在のデータの状態を把握し、整える必要があります。CRMデータに潜む「汚れ」は主に4種類あります。

①重複データ

同一企業や同一人物が複数のレコードに分かれている状態です。「ABC株式会社」「ABC Co., Ltd.」「ABC」が別々のレコードとして存在し、それぞれに異なる担当者の活動履歴が紐づいている——こうした状況では、AIは「このお客様には過去にどんなアプローチをしたか」を正確に把握できません。

②欠損項目

業種、従業員数、役職、部署名など、本来埋まっているべき項目が空欄になっている状態です。AIが「製造業かつ従業員1000名以上の企業に絞ってアプローチリストを作成する」という処理をしようとしても、それらの項目が欠損していれば正しい結果が返りません。

③表記ゆれ

同じ意味を持つデータが異なる表現で混在している状態です。「製造業」「Manufacturing」「メーカー」が同じフィールドに混在していれば、セグメントを切ることができません。役職や部署名の表記ゆれも同様で、「マーケティング部長」「Marketing Director」「マーケ部長」がすべて別の値として扱われてしまいます。

④関連付け漏れ

コンタクト（人）、会社（組織）、取引、チケット、アクティビティといったオブジェクト間のリレーションが設定されていない状態です。「この担当者はどの会社に所属していて、どんな商談を経て、現在はどういう顧客ステータスか」という情報が一つの文脈として繋がっていなければ、AIは顧客全体像を把握できません。

これらの問題を整備する前に、まず「どこが最もボトルネックになっているか」を可視化することが出発点となります。

SSOT（シングルソースオブトゥルース）の構築

データの汚れを整えるだけでなく、「正しいデータがどこにあるか」を組織全体で統一することが必要です。これが「SSOT（Single Source of Truth）＝単一の正しいデータ源」の考え方です。

現状、多くの企業では顧客データが以下のように分散しています。

営業担当者が管理するExcelやスプレッドシートの顧客リスト
マーケティングが利用するMAツール内のリード一覧
カスタマーサポートが保持する名刺管理ツールやメールリスト
経理・財務が使う会計システムの取引先マスタ

これらが別々に存在するため、「どのデータが正しいのか」が誰にもわからない状態に陥っています。

SSOTの実現とは、これらを一つの場所に集約し、営業・マーケティング・カスタマーサクセスが同じデータを参照できる状態をつくることです。HubSpotを中心に据える場合、HubSpotが「正のデータ源」となり、外部システムはHubSpotと常に同期される構成になります。

大企業においてすべてのデータを一元化するのは難易度が高い作業です。しかし理想の形として「一つのマスターデータが各部門に流れる」状態を目指し、段階的に実装していくことが、AI活用に向けた最も重要な取り組みとなります。

HubSpotが実現するAI-Readyの三層モデル

HubSpotを活用してAI-Readyなデータ基盤を構築するためのフレームワークとして、「三層モデル」があります。下から順に積み上げる構造で、各レイヤーが次のレイヤーを支えます。

レイヤー	目的	主な機能
Layer 1	データの整備（クレンジング）	データ品質コマンドセンター、ワークフロー
Layer 2	データの拡充（エンリッチメント）	スマートプロパティ、データエージェント
Layer 3	継続監視（ガバナンス）	監査ログ、継続モニタリング、KPIダッシュボード

Layer 1：データ品質コマンドセンターによるクレンジング

HubSpotのデータ品質コマンドセンターは、CRMデータの「汚れ」を可視化して是正するための標準機能です。このツールを使うと、以下の問題を一覧表示で把握できます。

重複の検出と統合

同一と思われるコンタクトや会社を自動検出し、マージ（統合）する機能があります。同一ドメインを使用している会社や、氏名・メールアドレスが一致するコンタクトを検知し、管理者がレビューした上でマージできます。どのような条件で重複を判断するかのルールも設定可能です。

書式問題の洗い出し

電話番号の形式、URLの形式など、入力フォーマットが乱れているレコードを一覧表示します。「090-0000-0000」「09000000000」「+81-90-0000-0000」が混在している場合も検出できます。

欠損プロパティの可視化

各プロパティの入力率（フィル率）をレポートとして確認できます。「業種の入力率が37%しかない」「役職フィールドが65%空欄」といった状況が定量的に把握でき、どの項目の整備を優先すべきかの判断材料になります。

未使用プロパティの管理

過去に作成されたが現在は使われていないプロパティを検出します。不要なプロパティが蓄積されるとCRMの複雑性が増すため、定期的なクリーンアップに活用できます。

ワークフロー機能との組み合わせでさらなる自動化も可能です。フォームからデータが入力された際に書式チェックを自動実行したり、特定のステータスに変化したタイミングで必須項目の入力チェックを走らせたりできます。

Layer 2：スマートプロパティとデータエージェントによるエンリッチメント

データをクリーンにした後は、不足している情報を「エンリッチメント（補強）」する必要があります。

スマートプロパティ

HubSpotのスマートプロパティは、プロパティにプロンプトを設定しウェブを自動調査して値を入力してくれる機能です。たとえば、会社のウェブサイトや公開情報を調査して業種・事業内容の要約・評判情報などをプロパティに自動で書き込むことができます。

HubSpotが標準で提供するデータエンリッチメント機能（HubSpotが保有するデータベースからの自動補完）は、日本企業向けには情報が少ない・精度が低いという課題があります。その点でスマートプロパティは、ウェブ上の情報を自律的に調査してくれるため、日本の中小企業から大企業まで幅広く活用できます。

実際の活用例として、顧客企業の「最近のニュース・報道に基づく評判（ポジティブ/ネガティブ）」をスマートプロパティとして設定すると、企業規模をを問わず、ウェブ上の情報を調査してポジティブ/ネガティブのフラグを自動で立てることができます。これにより、ニュースが良い企業への優先アプローチや、ネガティブな状況にある企業への慎重な対応判断が自動化されます。

AIによるワークフロー（AI is Crow）

HubSpotのワークフロー内でプロンプトを使った処理も可能です。法人番号の自動取得、ウェブサイトの調査、業種の自動判定など、AIモデルを組み込んだカスタムワークフローを構築できます。

OpenAI（ChatGPT）、Microsoft Azure OpenAI、Microsoft Copilotなど、HubSpotが標準で提供するAI以外のモデルも選択・連携できるため、日本企業特有の要件に合わせたカスタマイズが可能です。

このLayer 2の取り組みにより、「人が手動で調べて入力する」という労力のかかる作業をAIに委譲し、常に最新・充実したデータ状態を維持できるようになります。

Layer 3：監査ログと継続モニタリングによるガバナンス

整えたデータを維持するための仕組みが、Layer 3のガバナンスです。

監査ログ（タイムスタンプ付き変更履歴）

AIが変更したプロパティはタイムスタンプ付きで監査できます。「いつ、どのAI機能が、どのプロパティを、どの値に変更したか」が記録に残るため、データの信頼性を担保しながらAIによる自動更新を活用できます。

継続モニタリングとアラート

データ品質の劣化を早期検知してアラートを発報する機能があります。「無効なメールアドレスが入っているレコードが増えています」「欠損率が先月比で5%上昇しました」といった通知を受け取ることで、問題が大きくなる前に対処できます。

データ品質KPIのダッシュボード化

欠損率、重複率、更新頻度などをKPIとしてダッシュボードに表示し、社内の定例会議のアジェンダに組み込むことを推奨します。「欠損率5%以内」「重複率2%以内」といった具体的な目標値を設定することで、データ品質の維持が組織の習慣になります。

部署横断のデータガバナンスを設計する

データを整えた状態を「維持」するためには、技術的な仕組みだけでなく、組織的なルールが不可欠です。

命名規則の統一

プロパティ、リスト、セグメント、ビューなどの命名を組織全体で統一します。たとえば、リスト名に「01_MKT_リード候補_製造業」のように番号・部署・内容・属性を含めるルールを設けることで、誰がどの目的で作ったものかが一目でわかります。

部署名のプレフィックスを義務付けることで、「自分の部署が活用できるリストかどうか」の判断も容易になります。

入力タイミングと検証フロー

「どのタイミングで何を入力するか」を明確にします。たとえば、商談発生時・受注時・失注時など、ステータスが変わるタイミングごとに必須項目をワークフローでチェックし、未入力の場合は担当者に通知する仕組みを設けます。

一括入力させようとすると現場への負担が集中しますが、ステージ変化ごとに分割入力する設計にすることで、負担を分散しながら必要な情報を確実に収集できます。

データオーナーの明確化

「業種はマーケティング部が管理する」「役職は営業担当が入力する」「決算情報はデータ管理チームが更新する」というように、プロパティごとに更新責任を持つ部署・担当者を定義します。

オーナーが決まっていないフィールドは、誰も責任を持たないまま放置されます。データの正確性を維持するためには、「誰がこのデータに責任を持つか」の明確化が最も重要なルール設計の一つです。

必須・任意の線引き

AIが処理に使うプロパティは必須化します。必須でない項目を任意としてそのままにしておくと、AIの処理でエラーや誤った判断につながります。一方で、現場の負担を増やしすぎないよう、入力フォームはシンプルに保つことも重要です。「AIが使うかどうか」を基準に必須化を判断する視点が有効です。

権限設計

CRMデータを「誰でも自由に編集できる状態」にしておくと、善意の変更がデータの整合性を崩すリスクがあります。役割別に「閲覧のみ」「特定フィールドのみ編集可」「全項目編集可」と権限を分け、意図しない上書きを防ぐ設計が必要です。

月次レビューの仕組み化

月次または週次で、データ品質KPIを確認するレビュー会議を設定します。ダッシュボードを定例会議のアジェンダに組み込み、更新漏れがあればその場で対処するサイクルを習慣化します。

オフィスの清掃が「定期的に行うことで清潔を維持する」ように、データも「定期的に見直すことで品質を維持する」という習慣化が、運用の定着に向けた最大のポイントです。

実装ロードマップ：診断→整備→活用の3ステップ

AI-Readyな基盤を構築するためのロードマップは、大きく3つのフェーズで進めます。

ステップ1：診断

現状のデータ品質を把握することから始めます。

データ品質コマンドセンターで重複・欠損・書式問題を可視化する
現在のプロパティとワークフローを棚卸しし、業務フローを整理する
AIで何を実現したいかを明確にする
AI機能の設定権限を確認する
改善対象の優先順位付けを行う

この段階では「どこが最も問題か」を定量的に把握することが目的です。

ステップ2：整備・拡充

優先順位をつけながらデータを整備していきます。

重複企業・重複コンタクトのマージ（ワークフローによる自動統一も活用）
欠損項目の補完（手動入力 + スマートプロパティによる自動補完を組み合わせる）
必要なエンリッチメントデータの定義（業種だけか、従業員数・決算・求人情報まで必要か）
必須プロパティの設定とガバナンスルールの整備

この段階では、スマートプロパティやAIワークフローの活用により、これまで人が手動で行っていた入力作業を大幅に削減できます。議事録の内容から自動でプロパティを抽出・更新する機能なども活用することで、営業担当者の入力負担を最小化しながらデータを充実させられます。

ステップ3：活用・継続監視

整備されたデータ基盤の上で、AI機能を本格活用します。

スマートプロパティによるプロパティの個別自動補完
データ品質KPIのダッシュボードを社内公開・運用
監査ログによる継続監視と月次レビューの習慣化
データ品質の状態を年間通じてモニタリングし、目標値を維持する

実行のチェックリスト

[ ] データ品質コマンドセンターで現在の重複・欠損・書式問題の件数を確認する
[ ] 部署横断で「どのデータが正の情報源か（SSOT）」を定義・合意する
[ ] AIが使用するプロパティをすべて必須化し、入力タイミングをワークフローで設定する
[ ] プロパティごとのオーナー（更新責任者・部署）を定義したドキュメントを作成する
[ ] スマートプロパティを最低1つ設定し、自動エンリッチメントの動作を確認する
[ ] データ品質KPI（欠損率・重複率・更新頻度）をダッシュボード化して定例会議に組み込む
[ ] 月次データレビューの会議体を設置し、オーナーを決めて運用を開始する

よくある質問（FAQ）

Q1：HubSpotのデータエンリッチメント機能は日本企業に使えますか？

A1：HubSpotが標準で提供するデータエンリッチメント（HubSpotが保有するデータベースからの自動補完）は、米国のデータを中心に構築されているため、日本企業に対しては情報が少ない・精度が低いというケースが確認されています。日本企業向けには、スマートプロパティを使ってウェブ上の情報を調査・補完する方法が現実的です。スマートプロパティは大企業から中小企業まで幅広く活用でき、業種・評判・事業概要などを自動で取得できます。

Q2：データ品質の改善はどのくらいの期間がかかりますか？

A2：データの量と汚れの程度によって異なりますが、一般的には診断フェーズに2〜4週間、整備フェーズに1〜3ヶ月程度を想定します。ただし「一度整備すれば完了」ではなく、その後の継続運用が品質維持の本質です。ワークフローとスマートプロパティを組み合わせることで、整備後の再劣化を防ぐ仕組みをセットで構築することが重要です。

Q3：SSOTの構築はHubSpotだけで完結しますか？

A3：多くの企業では、基幹システムや会計システムなど外部のシステムとHubSpotを連携させる必要があります。HubSpotのデータスタジオ・データセット機能を使うことで、スプレッドシートのデータ取り込みや他システムとのデータ結合が可能です。HubSpotをSSOTの中心に置きながら、外部システムとの同期を設計することが現実的なアプローチです。

AI-Readyの次の段階——「Context（コンテキストレディ）」へ

本記事で解説したAI-Readyの取り組みは、「AIが活用できるマスターデータを整備する」ことに焦点を当てています。しかしこれはAI活用の基盤となる第一段階であり、次の段階として「コンテキストレディ」の構築が待っています。

コンテキストレディとは、構造化されたマスターデータの整備に加えて、「非構造データ」をAIに読み込ませられる状態を指します。商談の音声データ、プレゼン資料、カタログ、カスタマーサポートのやり取りなど、フォーマットが定まっていない情報をHubSpotに取り込み、AIが参照できる状態にすることです。

AIが自社の文脈——「何を販売していて、どんなお客様に対して、どんなベネフィットを提供しているか」——を理解するためには、構造化データだけでは不十分です。営業担当者の感覚や、顧客とのコミュニケーションの中に蓄積された知識が、AIの判断精度を決定的に高めます。

HubSpotはこの方向性に向けて「Breeze（ブリーズ）アシスタント」の高度化と「自律実行エージェント」の拡充を進めています。Breezeアシスタントは、CRMに蓄積されたデータを文脈として理解した上で、「このお客様にどんな提案をすべきか」「過去の商談から最適な提案金額はいくらか」といった質問に回答できるチャット型のAIアシスタントです。

さらに「案件発掘エージェント」などの自律実行エージェントは、CRMに登録されている見込み客の中から、提案すべき顧客をエージェントが自律的に判断し、メール本文を自動作成・送信するところまでを人の確認なしで実行できる段階に近づいています。

エージェントネイティブなプラットフォームとして外部エージェントからHubSpotのデータを活用できるAPIの整備も進んでおり、「データ整備こそがAI活用の最重要インフラ」という位置付けが、HubSpotの方向性からも明確に読み取れます。

まとめ

「AIを使え」というトップダウンの号令が現場を停滞させる根本原因は、AIの能力不足ではなくデータの状態にあります。重複・欠損・表記ゆれ・関連付け漏れという「4つの汚れ」が蓄積したCRMデータは、どれほど高性能なAIに渡しても期待した成果を生みません。

AI-Readyな基盤を構築するためには、まず現状のデータを可視化して整備（デトックス）し、不足情報を補完（エンリッチメント）しながら、その品質を継続的に維持する仕組み（ガバナンス）を整えることが必要です。

HubSpotはデータ品質コマンドセンター、スマートプロパティ、監査ログというツール群を備えており、この三層のアプローチを一つのプラットフォーム上で実現できます。加えて、命名規則・入力フロー・データオーナー・権限設計・月次レビューといった組織的なルール作りが、整備した品質を維持する鍵となります。

データ整備は一度完了する「プロジェクト」ではなく、組織に根付かせる「習慣」です。今日から一つ目のアクションとして、HubSpotのデータ品質コマンドセンターを開き、自社のCRMデータの現状を数値で把握することから始めてみてください。その一歩が、AI時代に競争優位を築くためのデータ基盤への確実な第一歩となります。

完全な記事を表示