Works
Blog Recruit Contact 無料でAI診断する
NLWeb 2026.03.18 [NLWeb:Webサイトと会話する時代 Vol.1]

NLWeb:Webサイトと会話する時代 — 第1回:NLWebとは何か — RSS・Schema.orgの生みの親が描くAI時代のWeb

RSS、RDF、Schema.orgを生み出したR.V. GuhaがMicrosoftで構想したNLWeb。Webサイトに自然言語で問い合わせ可能にし、すべてのインスタンスがMCPサーバーになる。llms.txtとの根本的な違いとともに解説します。

NLWeb:Webサイトと会話する時代 — 第1回:NLWebとは何か — RSS・Schema.orgの生みの親が描くAI時代のWeb

はじめに

TripAdvisorで「ローマの家族向けホテルで朝食無料のところは?」と検索したいとき、従来のキーワード検索ではどうなるでしょうか。「ローマ ホテル 家族向け 朝食無料」とフィルタを組み合わせ、表示された結果を一つずつ確認する。条件を変えたければフィルタをやり直し、また結果を一覧する。

NLWebが実装されたサイトでは、まさに上の文章をそのまま入力できます。サイトが自然言語を理解し、構造化されたデータの中から条件に合う結果を返す。さらに「その中で駅に近いのは?」と続ければ、前の質問の文脈を保持したまま絞り込んでくれる。

これがNLWeb(Natural Language Web)の世界です。

本連載「NLWeb:Webサイトと会話する時代」では、全5回にわたり、このプロトコルの概念から実装、Schema.org最適化、エンタープライズ戦略までを解説します。並行連載中の「WebMCPシリーズ」がWebサイトの「アクション」を公開するプロトコルであるのに対し、本シリーズはWebサイトの「コンテンツ」に自然言語で問い合わせるプロトコルを扱います。

第1回の今回は、「NLWebとは何か」「なぜ今重要なのか」を概念レベルで理解いただくことを目指します。

NLWebとは何か — Webサイトに「会話窓口」を設ける

NLWebは、Microsoftが2025年5月のBuild 2025カンファレンスで発表したオープンプロジェクトです。Webサイトに自然言語による会話型インターフェースを追加し、人間とAIエージェントの両方がサイトのコンテンツに自然言語で問い合わせられるようにする仕組みです。

NLWebの核心的なアイデアは3つです。

第一に、既存のSchema.orgデータを再利用する。 NLWebは新しいデータフォーマットを要求しません。多くのWebサイトがすでに実装しているJSON-LD形式のSchema.org構造化データをそのまま取り込み、ベクトルデータベースに格納します。RSSフィードなどJSON-LD以外のデータもSchema.orgタイプに変換して取り込めます。Schema.orgとRSSは1億以上のWebサイトで使われている既存のセマンティックレイヤーであり、NLWebはその蓄積の上に構築されています。

第二に、ベクトルDBによるセマンティック検索を実現する。 取り込まれた構造化データはベクトルデータベースに格納されます。従来のキーワードベースの検索と異なり、ベクトルデータベースはテキストを数学的ベクトルとして表現し、完全一致ではなく「意味の類似性」に基づいた検索を可能にします。たとえば「structured data」で検索すると「schema markup」に関するコンテンツもヒットする。キーワードではなく概念で検索できるため、自然言語での問い合わせが成立するのです。

第三に、すべてのNLWebインスタンスが自動的にMCPサーバーになる。 NLWebを導入した瞬間、そのサイトはMCP(Model Context Protocol)対応のAIアシスタント——Claude、ChatGPT、Geminiなど——から直接クエリ可能になります。Microsoftは公式ドキュメントで次のように述べています。すべてのNLWebインスタンスはMCPサーバーでもあり、Webサイトがコンテンツをエージェントやその他のMCPエコシステムの参加者に発見可能かつアクセス可能にすることができる、と。

R.V. Guhaという人物 — Web標準の系譜

NLWebを語る上で、その構想者の系譜を知ることは不可欠です。

R.V. Guhaは、2025年にMicrosoftのCVP(Corporate Vice President)兼テクニカルフェローとして入社し、NLWebを構想・開発しました。しかしその経歴はNLWebよりはるかに以前に始まっています。

RSS。 Webサイトの更新情報を標準化されたフォーマットで配信する仕組み。2000年代のブログ文化を支え、ポッドキャストの基盤にもなった技術です。GuhaはこのRSSの原型となるRDF Site Summary(RSS 0.9)の共同開発者です(RSSの名称はバージョンにより異なり、0.9はRDF Site Summary、2.0はReally Simple Syndicationと呼ばれます)。

RDF(Resource Description Framework)。 Web上のデータを「主語-述語-目的語」の三つ組(トリプル)で記述するためのW3C標準。セマンティックWebの基盤技術です。GuhaはW3C在籍時にRDFの設計に携わりました。

Schema.org。 2011年6月にGoogle・Microsoft(Bing)・Yahoo!の3社が共同で設立した、Webコンテンツの構造化データ標準(同年11月にYandexが参加し4社体制に)。商品、レビュー、イベント、組織など、800以上のデータタイプを定義しています。GuhaはSchema.orgの共同創設者であり、アーキテクトです。

RSS → RDF → Schema.org → NLWeb。この系譜を見れば、NLWebが「唐突に現れた新プロジェクト」ではなく、Webの意味的構造化を30年近く推進してきた人物による、その延長線上の仕事であることがわかります。

RSSが「サイトの更新を配信可能にした」ように、RDFが「データの意味を機械可読にした」ように、Schema.orgが「コンテンツの構造を標準化した」ように、NLWebは「サイトのコンテンツを自然言語で問い合わせ可能にする」。一貫して「Webをより構造的に、より意味的に、より機械にとってアクセスしやすく」するという思想が流れています。

Microsoftの戦略的意図 — 「NLWebは新しいHTML」

NLWebの発表に際し、Microsoftは明確な戦略的位置づけを示しました。

NLWebのGitHubリポジトリには、端的にこう記されています。「NLWebはMCP/A2Aに対して、HTMLがHTTPに対するのと同じ関係にある」と。

この比喩の意味を整理しましょう。HTTPはWebの通信プロトコル(データをどう運ぶか)であり、HTMLはそのプロトコル上で運ばれるコンテンツフォーマット(データをどう構造化するか)です。同様に、MCP(Model Context Protocol)とA2A(Agent-to-Agent Protocol)がエージェンティックWebの「通信層」だとすれば、NLWebはその上で動く「コンテンツ層」だというわけです。

Microsoftの公式発表では、NLWebがRSS、RDF、Schema.orgといったWebサイトが既に公開している半構造化データを活用し、LLM(大規模言語モデル)を組み合わせて、人間とAIエージェントの両方が使える自然言語インターフェースを構築する、と説明されています。

技術中立性も重要なポイントです。NLWebはオープンプロジェクトとして公開されており、特定のクラウドプラットフォームやLLMに依存しません。対応するベクトルDBはQdrant、Snowflake、Milvus、Azure AI Search、Elasticsearch、PostgreSQL(pgvector)、Cloudflare AutoRAG。対応するLLMはOpenAI、DeepSeek、Gemini、Anthropic(Claude)、Inception、HuggingFaceモデル。Windows、macOS、Linuxのいずれでも動作し、クラウドからノートPC、将来的にはスマートフォンまでスケールする設計です。

ForresterのSenior AnalystであるWill McKeon-Whiteは、VentureBeatの取材に対し、NLWebの主な利点として、AIシステムがWebサイトの構成要素を「見る」方法をより良く制御できることで、ナビゲーションの理解やツールの全体像の把握が改善される点を挙げています。

NLWebインスタンス = MCPサーバー

NLWebの最も戦略的に重要な特徴が、すべてのNLWebインスタンスが自動的にMCPサーバーになるという点です。

MCPはWebMCPシリーズ第1回で解説したとおり、Anthropicが2024年11月に発表し、OpenAI、Google DeepMind、Microsoftなど主要AIプラットフォームが採用した、AIとツール・データソースを接続するための業界標準プロトコルです。

NLWebがMCPサーバーとして機能するということは、NLWebを導入したWebサイトのコンテンツが、MCP対応のあらゆるAIアシスタントやエージェントから直接問い合わせ可能になることを意味します。

具体的には、NLWebはaskというコアメソッドを持つMCPサーバーとして動作します。外部のAIエージェントは、このメソッドを通じてWebサイトに自然言語で質問を投げ、Schema.org形式のJSONレスポンスを受け取ります。

たとえば、Claude DesktopからNLWebが導入されたサイトにMCPで接続し、「家族向けで朝食無料のローマのホテルは?」と質問すると、NLWebがベクトルDB検索とLLMランキングを経て構造化された回答を返す——というワークフローが実現します。

これはllms.txtやWebMCPとは根本的に異なるインタラクションモデルです。llms.txtは「AIにサイトの全体像を伝える」静的ファイルであり、AIがそれを「読む」ことはできても「問い合わせる」ことはできません。WebMCPは「サイトのアクションを公開する」ブラウザ内プロトコルであり、AIが操作を「実行する」ためのものです。NLWebは、その間を埋める「AIがサイトのコンテンツに問い合わせる」動的プロトコルです。

llms.txtとの根本的な違い — 「読む」から「問い合わせる」へ

弊社のllms.txt記事で解説したとおり、llms.txtはサイトの最も重要なコンテンツをMarkdownで一覧化し、AIクローラーに効率的なサイト理解を提供する静的ファイルです(正式なWeb標準ではなく、コミュニティが推進するベストプラクティスとして普及が進んでいる段階です)。

NLWebとllms.txtは、どちらも「AIにサイトのコンテンツを伝える」ことを目的としていますが、そのアプローチは根本的に異なります。

llms.txtは「パンフレット」。 サイトの全体像をまとめた静的なドキュメントで、AIクローラーがサイトを訪問した際に「このサイトにはこういうコンテンツがあります」と一覧を提示します。AIはそれを読んで理解しますが、追加の質問や絞り込みはできません。

NLWebは「コンシェルジュ」。 AIからの自然言語の質問を受け付け、ベクトルDBでセマンティック検索を行い、LLMでランキングした結果をSchema.org形式で返す動的なエンドポイントです。マルチターンの会話にも対応し、「その中で駅に近いのは?」のような文脈を保持した絞り込みが可能です。

両者の関係を整理すると次のようになります。

特性llms.txtNLWeb
種類静的ファイル動的エンドポイント(REST API + MCP)
AIとの関係AIがファイルを「読む」AIがサーバーに「問い合わせる」
対話性なし(一方向)あり(マルチターン会話対応)
データソースMarkdown手動記述Schema.org + ベクトルDB + LLM
更新タイミングファイル更新時リアルタイム(DB更新に追随)
導入コスト極めて低い中程度(サーバー構築が必要)
標準化状況コミュニティ推進のベストプラクティスMicrosoftのオープンプロジェクト

重要なのは、llms.txtとNLWebは競合ではなく補完関係にあるということです。llms.txtはAIクローラーがサイトを初めて訪問した際の「入口」として機能し、NLWebはその先の「深い対話」を担います。さらにWebMCPが「アクションの実行」を担うことで、3つのプロトコルが層を成します。

  • llms.txt = サイトの「地図」(全体像をAIに伝える)
  • NLWeb = サイトの「コンシェルジュ」(コンテンツに問い合わせる)
  • WebMCP = サイトの「サービスカウンター」(アクションを実行する)

早期採用企業 — すでに動き始めている

NLWebは発表と同時に、実際のWebサイトでのテストが始まっています。Microsoftの公式発表によれば、初期のパブリッシングおよびエコシステムコラボレーターには12社が名を連ねています。ここではコンテンツパブリッシャーを中心に紹介します。

  • Common Sense Media — 子供向けメディアのレビューサイト
  • Eventbrite — イベント発見・チケット販売プラットフォーム
  • O'Reilly Media — 技術書・教育コンテンツパブリッシャー
  • Shopify — Eコマースプラットフォーム
  • Tripadvisor — 旅行レビュー・予約プラットフォーム
  • DDM(Allrecipes / Serious Eats)、Hearst(Delish) — レシピ・ライフスタイルメディア

テクノロジーパートナーとしては、ベクトルDBのQdrant・Milvus、データプラットフォームのSnowflake、AI推論のInception Labsも参加しています。

これらはいずれも構造化データ(Schema.org)への投資実績が豊富なコンテンツリッチサイトです。すでに整備されたSchema.orgデータがNLWebの「燃料」になるため、導入の初期コストが低く、効果が即座に現れやすい特性を持っています。

この点は、unTypeのクライアントにとっても示唆に富みます。これまでSEO対策として実装してきたSchema.org構造化データは、NLWeb導入の際にそのまま活用できる資産です。構造化データへの過去の投資が、エージェンティックWeb時代に大きなリターンをもたらす可能性があるのです。

Web制作会社にとっての意味

NLWebの登場は、Web制作に求められるスキルセットの拡張を意味します。

従来のWeb制作では、「人間が見て使いやすいUI」と「検索エンジンが理解しやすい構造」の2つを設計すればよかった。NLWebが加わると、ここに「AIが問い合わせ可能なコンテンツ構造」という第3の軸が追加されます。

具体的には次のようなスキルが求められます。

Schema.orgの設計品質。 NLWebの性能はSchema.orgデータの品質に直結します。エンティティ間の関係性(Author↔Organization↔Article)、プロパティの充実度、sameAsリンクによる外部参照など、「AIに正しく理解されるデータ設計」が新しい専門性になります。(第4回で詳しく解説します。)

ベクトルDBの選定と運用。 NLWebはQdrant、PostgreSQL+pgvector、Milvus、Elasticsearchなど複数のベクトルDBに対応しています。サイトの規模、更新頻度、既存インフラに応じた選定が必要です。(第2回・第3回で解説します。)

会話型UXの設計。 NLWebはWebサイトに会話型インターフェースを追加します。どんな質問に答えるべきか、どんなレスポンスフォーマットが最適か、マルチターン会話でのコンテキスト管理をどう設計するか——これはUIデザインとも情報アーキテクチャとも異なる、新しいデザイン領域です。

並行連載中のWebMCPシリーズで論じている「ツール設計」「エージェント体験設計」「二重インターフェース設計」と合わせると、エージェンティックWeb時代のWeb制作は、人間向けUI・AI問い合わせ対応・AIアクション対応という三重の設計を一つのサイト内で統合する仕事になります。これはまさに「コミュニケーションデザイン」の領域です。

まとめ — 「読まれる」サイトから「会話できる」サイトへ

NLWebが実現するのは、Webの根本的な対話モデルの転換です。

従来のWebは「人間が訪問して読む」ものでした。検索エンジンは「クロールして索引する」ものでした。NLWebは、そこに「AIが問い合わせて回答を得る」という新しいインタラクションモデルを追加します。

その基盤を設計したのが、RSS、RDF、Schema.orgという過去のWeb標準を生み出してきたR.V. Guha。NLWebは「突然現れた新技術」ではなく、Webの意味的構造化を30年近く推進してきた一貫した思想の延長線上にあります。

そして、すべてのNLWebインスタンスがMCPサーバーになるという設計により、NLWebは孤立したプロジェクトではなく、エージェンティックWebの基盤層として機能します。

次回の第2回では、NLWebの技術的なアーキテクチャに踏み込みます。Schema.orgデータがどのようにベクトルDBに取り込まれ、自然言語クエリがどのようなパイプラインで処理され、マルチターン会話がどう実現されるのか。その仕組みを詳しく解説します。

参考情報

この記事は「NLWeb:Webサイトと会話する時代」シリーズの第1回です。

AI技術のビジネス活用やWebサイトのAIエージェント対応について、具体的なご相談はunTypeまでお気軽にお問い合わせください。

山下 太郎

山下 太郎

代表取締役 / CEO

2000年、Webデザイナーとしてこの世界に飛び込み、フリーランスを経て2007年に株式会社アンタイプを創業。AI時代の到来とともに、効率だけを追うAI活用に違和感を覚えながら、それでも最前線でツールを使い続ける。企業のWebとコミュニケーションを設計する仕事を通じて、「人間らしさとは何か」を問い直す視点を発信し続けている。

View Profile arrow_outward

Related

あわせて読みたい

AIエージェント時代の「セマンティックセグメンテーション」 第3回:AIエージェントが「見て」「動く」ためのWebセマンティクス
セマンティックセグメンテーション
セマンティックセグメンテーション

AIエージェント時代の「セマンティックセグメンテーション」 第3回:AIエージェントが「見て」「動く」ためのWebセマンティクス

セマンティックHTML、llms.txt、WebMCP。AIエージェントがWebサイトを「読み」「理解し」「操作する」ための三層構造を解説。2026年2月発表のWebMCPがもたらすWebの構造的転換点とは。