NLWeb：Webサイトと会話する時代 — 第1回：NLWebとは何か — RSS・Schema.orgの生みの親が描くAI時代のWeb - Blog - unType Inc. | 株式会社アンタイプ

はじめに

TripAdvisorで「ローマの家族向けホテルで朝食無料のところは？」と検索したいとき、従来のキーワード検索ではどうなるでしょうか。「ローマホテル家族向け朝食無料」とフィルタを組み合わせ、表示された結果を一つずつ確認する。条件を変えたければフィルタをやり直し、また結果を一覧する。

NLWebが実装されたサイトでは、まさに上の文章をそのまま入力できます。サイトが自然言語を理解し、構造化されたデータの中から条件に合う結果を返す。さらに「その中で駅に近いのは？」と続ければ、前の質問の文脈を保持したまま絞り込んでくれる。

これがNLWeb（Natural Language Web）の世界です。

本連載「NLWeb：Webサイトと会話する時代」では、全5回にわたり、このプロトコルの概念から実装、Schema.org最適化、エンタープライズ戦略までを解説します。並行連載中の「WebMCPシリーズ」がWebサイトの「アクション」を公開するプロトコルであるのに対し、本シリーズはWebサイトの「コンテンツ」に自然言語で問い合わせるプロトコルを扱います。

第1回の今回は、「NLWebとは何か」「なぜ今重要なのか」を概念レベルで理解いただくことを目指します。

NLWebとは何か — Webサイトに「会話窓口」を設ける

NLWebは、Microsoftが2025年5月のBuild 2025カンファレンスで発表したオープンプロジェクトです。Webサイトに自然言語による会話型インターフェースを追加し、人間とAIエージェントの両方がサイトのコンテンツに自然言語で問い合わせられるようにする仕組みです。

NLWebの核心的なアイデアは3つです。

第一に、既存のSchema.orgデータを再利用する。 NLWebは新しいデータフォーマットを要求しません。多くのWebサイトがすでに実装しているJSON-LD形式のSchema.org構造化データをそのまま取り込み、ベクトルデータベースに格納します。RSSフィードなどJSON-LD以外のデータもSchema.orgタイプに変換して取り込めます。Schema.orgとRSSは1億以上のWebサイトで使われている既存のセマンティックレイヤーであり、NLWebはその蓄積の上に構築されています。

第二に、ベクトルDBによるセマンティック検索を実現する。 取り込まれた構造化データはベクトルデータベースに格納されます。従来のキーワードベースの検索と異なり、ベクトルデータベースはテキストを数学的ベクトルとして表現し、完全一致ではなく「意味の類似性」に基づいた検索を可能にします。たとえば「structured data」で検索すると「schema markup」に関するコンテンツもヒットする。キーワードではなく概念で検索できるため、自然言語での問い合わせが成立するのです。

第三に、すべてのNLWebインスタンスが自動的にMCPサーバーになる。 NLWebを導入した瞬間、そのサイトはMCP（Model Context Protocol）対応のAIアシスタント——Claude、ChatGPT、Geminiなど——から直接クエリ可能になります。Microsoftは公式ドキュメントで次のように述べています。すべてのNLWebインスタンスはMCPサーバーでもあり、Webサイトがコンテンツをエージェントやその他のMCPエコシステムの参加者に発見可能かつアクセス可能にすることができる、と。

R.V. Guhaという人物 — Web標準の系譜

NLWebを語る上で、その構想者の系譜を知ることは不可欠です。

R.V. Guhaは、2025年にMicrosoftのCVP（Corporate Vice President）兼テクニカルフェローとして入社し、NLWebを構想・開発しました。しかしその経歴はNLWebよりはるかに以前に始まっています。

RSS。 Webサイトの更新情報を標準化されたフォーマットで配信する仕組み。2000年代のブログ文化を支え、ポッドキャストの基盤にもなった技術です。GuhaはこのRSSの原型となるRDF Site Summary（RSS 0.9）の共同開発者です（RSSの名称はバージョンにより異なり、0.9はRDF Site Summary、2.0はReally Simple Syndicationと呼ばれます）。

RDF（Resource Description Framework）。 Web上のデータを「主語-述語-目的語」の三つ組（トリプル）で記述するためのW3C標準。セマンティックWebの基盤技術です。GuhaはW3C在籍時にRDFの設計に携わりました。

Schema.org。 2011年6月にGoogle・Microsoft（Bing）・Yahoo!の3社が共同で設立した、Webコンテンツの構造化データ標準（同年11月にYandexが参加し4社体制に）。商品、レビュー、イベント、組織など、800以上のデータタイプを定義しています。GuhaはSchema.orgの共同創設者であり、アーキテクトです。

RSS → RDF → Schema.org → NLWeb。この系譜を見れば、NLWebが「唐突に現れた新プロジェクト」ではなく、Webの意味的構造化を30年近く推進してきた人物による、その延長線上の仕事であることがわかります。

RSSが「サイトの更新を配信可能にした」ように、RDFが「データの意味を機械可読にした」ように、Schema.orgが「コンテンツの構造を標準化した」ように、NLWebは「サイトのコンテンツを自然言語で問い合わせ可能にする」。一貫して「Webをより構造的に、より意味的に、より機械にとってアクセスしやすく」するという思想が流れています。

Microsoftの戦略的意図 — 「NLWebは新しいHTML」

NLWebの発表に際し、Microsoftは明確な戦略的位置づけを示しました。

NLWebのGitHubリポジトリには、端的にこう記されています。「NLWebはMCP/A2Aに対して、HTMLがHTTPに対するのと同じ関係にある」と。

この比喩の意味を整理しましょう。HTTPはWebの通信プロトコル（データをどう運ぶか）であり、HTMLはそのプロトコル上で運ばれるコンテンツフォーマット（データをどう構造化するか）です。同様に、MCP（Model Context Protocol）とA2A（Agent-to-Agent Protocol）がエージェンティックWebの「通信層」だとすれば、NLWebはその上で動く「コンテンツ層」だというわけです。

Microsoftの公式発表では、NLWebがRSS、RDF、Schema.orgといったWebサイトが既に公開している半構造化データを活用し、LLM（大規模言語モデル）を組み合わせて、人間とAIエージェントの両方が使える自然言語インターフェースを構築する、と説明されています。

技術中立性も重要なポイントです。NLWebはオープンプロジェクトとして公開されており、特定のクラウドプラットフォームやLLMに依存しません。対応するベクトルDBはQdrant、Snowflake、Milvus、Azure AI Search、Elasticsearch、PostgreSQL（pgvector）、Cloudflare AutoRAG。対応するLLMはOpenAI、DeepSeek、Gemini、Anthropic（Claude）、Inception、HuggingFaceモデル。Windows、macOS、Linuxのいずれでも動作し、クラウドからノートPC、将来的にはスマートフォンまでスケールする設計です。

ForresterのSenior AnalystであるWill McKeon-Whiteは、VentureBeatの取材に対し、NLWebの主な利点として、AIシステムがWebサイトの構成要素を「見る」方法をより良く制御できることで、ナビゲーションの理解やツールの全体像の把握が改善される点を挙げています。

NLWebインスタンス = MCPサーバー

NLWebの最も戦略的に重要な特徴が、すべてのNLWebインスタンスが自動的にMCPサーバーになるという点です。

MCPはWebMCPシリーズ第1回で解説したとおり、Anthropicが2024年11月に発表し、OpenAI、Google DeepMind、Microsoftなど主要AIプラットフォームが採用した、AIとツール・データソースを接続するための業界標準プロトコルです。

NLWebがMCPサーバーとして機能するということは、NLWebを導入したWebサイトのコンテンツが、MCP対応のあらゆるAIアシスタントやエージェントから直接問い合わせ可能になることを意味します。

具体的には、NLWebはaskというコアメソッドを持つMCPサーバーとして動作します。外部のAIエージェントは、このメソッドを通じてWebサイトに自然言語で質問を投げ、Schema.org形式のJSONレスポンスを受け取ります。

たとえば、Claude DesktopからNLWebが導入されたサイトにMCPで接続し、「家族向けで朝食無料のローマのホテルは？」と質問すると、NLWebがベクトルDB検索とLLMランキングを経て構造化された回答を返す——というワークフローが実現します。

これはllms.txtやWebMCPとは根本的に異なるインタラクションモデルです。llms.txtは「AIにサイトの全体像を伝える」静的ファイルであり、AIがそれを「読む」ことはできても「問い合わせる」ことはできません。WebMCPは「サイトのアクションを公開する」ブラウザ内プロトコルであり、AIが操作を「実行する」ためのものです。NLWebは、その間を埋める「AIがサイトのコンテンツに問い合わせる」動的プロトコルです。

llms.txtとの根本的な違い — 「読む」から「問い合わせる」へ

弊社のllms.txt記事で解説したとおり、llms.txtはサイトの最も重要なコンテンツをMarkdownで一覧化し、AIクローラーに効率的なサイト理解を提供する静的ファイルです（正式なWeb標準ではなく、コミュニティが推進するベストプラクティスとして普及が進んでいる段階です）。

NLWebとllms.txtは、どちらも「AIにサイトのコンテンツを伝える」ことを目的としていますが、そのアプローチは根本的に異なります。

llms.txtは「パンフレット」。 サイトの全体像をまとめた静的なドキュメントで、AIクローラーがサイトを訪問した際に「このサイトにはこういうコンテンツがあります」と一覧を提示します。AIはそれを読んで理解しますが、追加の質問や絞り込みはできません。

NLWebは「コンシェルジュ」。 AIからの自然言語の質問を受け付け、ベクトルDBでセマンティック検索を行い、LLMでランキングした結果をSchema.org形式で返す動的なエンドポイントです。マルチターンの会話にも対応し、「その中で駅に近いのは？」のような文脈を保持した絞り込みが可能です。

両者の関係を整理すると次のようになります。

特性	llms.txt	NLWeb
種類	静的ファイル	動的エンドポイント（REST API + MCP）
AIとの関係	AIがファイルを「読む」	AIがサーバーに「問い合わせる」
対話性	なし（一方向）	あり（マルチターン会話対応）
データソース	Markdown手動記述	Schema.org + ベクトルDB + LLM
更新タイミング	ファイル更新時	リアルタイム（DB更新に追随）
導入コスト	極めて低い	中程度（サーバー構築が必要）
標準化状況	コミュニティ推進のベストプラクティス	Microsoftのオープンプロジェクト

重要なのは、llms.txtとNLWebは競合ではなく補完関係にあるということです。llms.txtはAIクローラーがサイトを初めて訪問した際の「入口」として機能し、NLWebはその先の「深い対話」を担います。さらにWebMCPが「アクションの実行」を担うことで、3つのプロトコルが層を成します。

llms.txt = サイトの「地図」（全体像をAIに伝える）
NLWeb = サイトの「コンシェルジュ」（コンテンツに問い合わせる）
WebMCP = サイトの「サービスカウンター」（アクションを実行する）

早期採用企業 — すでに動き始めている

NLWebは発表と同時に、実際のWebサイトでのテストが始まっています。Microsoftの公式発表によれば、初期のパブリッシングおよびエコシステムコラボレーターには12社が名を連ねています。ここではコンテンツパブリッシャーを中心に紹介します。

Common Sense Media — 子供向けメディアのレビューサイト
Eventbrite — イベント発見・チケット販売プラットフォーム
O'Reilly Media — 技術書・教育コンテンツパブリッシャー
Shopify — Eコマースプラットフォーム
Tripadvisor — 旅行レビュー・予約プラットフォーム
DDM（Allrecipes / Serious Eats）、Hearst（Delish） — レシピ・ライフスタイルメディア

テクノロジーパートナーとしては、ベクトルDBのQdrant・Milvus、データプラットフォームのSnowflake、AI推論のInception Labsも参加しています。

これらはいずれも構造化データ（Schema.org）への投資実績が豊富なコンテンツリッチサイトです。すでに整備されたSchema.orgデータがNLWebの「燃料」になるため、導入の初期コストが低く、効果が即座に現れやすい特性を持っています。

この点は、unTypeのクライアントにとっても示唆に富みます。これまでSEO対策として実装してきたSchema.org構造化データは、NLWeb導入の際にそのまま活用できる資産です。構造化データへの過去の投資が、エージェンティックWeb時代に大きなリターンをもたらす可能性があるのです。

Web制作会社にとっての意味

NLWebの登場は、Web制作に求められるスキルセットの拡張を意味します。

従来のWeb制作では、「人間が見て使いやすいUI」と「検索エンジンが理解しやすい構造」の2つを設計すればよかった。NLWebが加わると、ここに「AIが問い合わせ可能なコンテンツ構造」という第3の軸が追加されます。

具体的には次のようなスキルが求められます。

Schema.orgの設計品質。 NLWebの性能はSchema.orgデータの品質に直結します。エンティティ間の関係性（Author↔Organization↔Article）、プロパティの充実度、sameAsリンクによる外部参照など、「AIに正しく理解されるデータ設計」が新しい専門性になります。（第4回で詳しく解説します。）

ベクトルDBの選定と運用。 NLWebはQdrant、PostgreSQL+pgvector、Milvus、Elasticsearchなど複数のベクトルDBに対応しています。サイトの規模、更新頻度、既存インフラに応じた選定が必要です。（第2回・第3回で解説します。）

会話型UXの設計。 NLWebはWebサイトに会話型インターフェースを追加します。どんな質問に答えるべきか、どんなレスポンスフォーマットが最適か、マルチターン会話でのコンテキスト管理をどう設計するか——これはUIデザインとも情報アーキテクチャとも異なる、新しいデザイン領域です。

並行連載中のWebMCPシリーズで論じている「ツール設計」「エージェント体験設計」「二重インターフェース設計」と合わせると、エージェンティックWeb時代のWeb制作は、人間向けUI・AI問い合わせ対応・AIアクション対応という三重の設計を一つのサイト内で統合する仕事になります。これはまさに「コミュニケーションデザイン」の領域です。

まとめ — 「読まれる」サイトから「会話できる」サイトへ

NLWebが実現するのは、Webの根本的な対話モデルの転換です。

従来のWebは「人間が訪問して読む」ものでした。検索エンジンは「クロールして索引する」ものでした。NLWebは、そこに「AIが問い合わせて回答を得る」という新しいインタラクションモデルを追加します。

その基盤を設計したのが、RSS、RDF、Schema.orgという過去のWeb標準を生み出してきたR.V. Guha。NLWebは「突然現れた新技術」ではなく、Webの意味的構造化を30年近く推進してきた一貫した思想の延長線上にあります。

そして、すべてのNLWebインスタンスがMCPサーバーになるという設計により、NLWebは孤立したプロジェクトではなく、エージェンティックWebの基盤層として機能します。

次回の第2回では、NLWebの技術的なアーキテクチャに踏み込みます。Schema.orgデータがどのようにベクトルDBに取り込まれ、自然言語クエリがどのようなパイプラインで処理され、マルチターン会話がどう実現されるのか。その仕組みを詳しく解説します。

参考情報

Microsoft「Introducing NLWeb: Bringing conversational interfaces directly to the web」（2025年5月）
GitHub「nlweb-ai/NLWeb（リファレンス実装）」
Computerworld「Why is Microsoft offering to turn websites into AI apps with NLWeb?」（2025年5月）
Neowin「Microsoft unveils NLWeb letting web publishers participate in the agentic web」（2025年5月）
VentureBeat「The battle to AI-enable the web: NLWeb and what enterprises need to know」（2025年12月）
Search Engine Land「The agentic web is here: Why NLWeb makes schema your greatest SEO asset」（2025年10月）
Schema App「What is NLWeb? Consuming Schema Markup for AI Applications」（2025年12月）
FPT Software「The Rise of NLWeb」（2025年11月）
Microsoft Tech Community「Fueling the Agentic Web Revolution with NLWeb and PostgreSQL」（2025年7月）
Glama「What is NLWeb」（2025年6月）
Joe El Khoury (Medium)「Microsoft's NLWeb: The Future of Conversational Websites?」（2025年5月）
Wikipedia「NLWeb」
Anthropic「Introducing the Model Context Protocol」（2024年11月）

この記事は「NLWeb：Webサイトと会話する時代」シリーズの第1回です。

AI技術のビジネス活用やWebサイトのAIエージェント対応について、具体的なご相談はunTypeまでお気軽にお問い合わせください。

この記事をシェアする

X (Twitter) LinkedIn Facebook Bluesky Threads

NLWeb：Webサイトと会話する時代 — 第1回：NLWebとは何か — RSS・Schema.orgの生みの親が描くAI時代のWeb

はじめに

NLWebとは何か — Webサイトに「会話窓口」を設ける

R.V. Guhaという人物 — Web標準の系譜

Microsoftの戦略的意図 — 「NLWebは新しいHTML」

NLWebインスタンス = MCPサーバー

llms.txtとの根本的な違い — 「読む」から「問い合わせる」へ

早期採用企業 — すでに動き始めている

Web制作会社にとっての意味

まとめ — 「読まれる」サイトから「会話できる」サイトへ

参考情報

山下太郎

Categories

あわせて読みたい

WebMCP：Webサイトがアクションを話す時代 ― 第1回：なぜWebMCPか ― スクレイピング時代の終焉とブラウザネイティブAIの幕開け

AIエージェント時代の「セマンティックセグメンテーション」第3回：AIエージェントが「見て」「動く」ためのWebセマンティクス

Googleの新規格UCPとは？AIエージェント時代のEC開発に備える

NLWeb：Webサイトと会話する時代 — 第1回：NLWebとは何か — RSS・Schema.orgの生みの親が描くAI時代のWeb

はじめに

NLWebとは何か — Webサイトに「会話窓口」を設ける

R.V. Guhaという人物 — Web標準の系譜

Microsoftの戦略的意図 — 「NLWebは新しいHTML」

NLWebインスタンス = MCPサーバー

llms.txtとの根本的な違い — 「読む」から「問い合わせる」へ

早期採用企業 — すでに動き始めている

Web制作会社にとっての意味

まとめ — 「読まれる」サイトから「会話できる」サイトへ

参考情報

山下 太郎

Categories

あわせて読みたい

WebMCP：Webサイトがアクションを話す時代 ― 第1回：なぜWebMCPか ― スクレイピング時代の終焉とブラウザネイティブAIの幕開け

AIエージェント時代の「セマンティックセグメンテーション」 第3回：AIエージェントが「見て」「動く」ためのWebセマンティクス

Googleの新規格UCPとは？AIエージェント時代のEC開発に備える

山下太郎

AIエージェント時代の「セマンティックセグメンテーション」第3回：AIエージェントが「見て」「動く」ためのWebセマンティクス