AMTロゴ

お役立ち情報BLOG

2020.02.06Web制作

最終更新日:2024年2月2日

構造化データ と セマンティックウェブ

構造化データ と セマンティックウェブ

構造化データ の必要性がさかんに言われるようになりました。
構造化データとは、ホームページの特定の情報をGoogle・Yahoo・Bingといった検索エンジンに伝えるために追加する、ヘッダーコードのひとつです。

どういうことかというと、そのホームページに書かれている内容が、何を意味するのか、を検索エンジンやウェブサーバーが判断するために、ページの意味や機能を理解するための情報をあらかじめ書き込んでおこう、ということです。

ホームページの情報と意味の違い

HTMLファイルに記述するホームページの情報は、文字通り、見たまま・読んだままの情報です。
で、厳密にいえば、書かれている情報と、そのページの持つ意味は、違います。

「株式会社エー・エム・ティーは、静岡市のデザイン会社です。」

という内容のホームページ(ページとしては、短すぎますが)があるとしまして、そのホームページの持つ情報は、下記のように幾つかあります。

例えば、
・エーエムティーという会社は株式会社だ
・静岡市にある
・デザイン会社だ
などなど。

しかしこの情報だけだと、このページがどういう意味を持つのか、が分かりません。

 

構造化データとセマンティックウェブ:このページの意味は何?
:このページの意味は何?のヴィジュアルイメージ

 

仮にこれが「株式会社エー・エム・ティーは、静岡市のデザイン会社でした。」
という記述だった場合は、読み手の経験と洞察力で、今は違うのかな?と推測することができますが、「です。」の場合は、今もそうなのか、が曖昧ではっきりしません。
ホームページの場合は、新旧の情報がごちゃ混ぜになっていますので、なおさらです。

「静岡市のデザイン会社」も、前後の文脈が無い状態では、静岡市が運営・所有するデザイン会社とも読み取れますし、所在地が静岡市のデザイン会社、とも読み取れます。

別の観点から見れば、このホームページの意味もまた違ってきます。

静岡市の、ウェブやグラフィック制作を発注したいとお考えの方にとっては、地元の業者ですが、他のデザイン会社さんから見れば、競合するライバルという意味を持ちます。

そうすると、このホームページは、ユーザーにとっての意味からすれば、検索にヒットしてきてほしいページであったり、そうでなかったりすることになります。

つまり、ホームページに書かれた情報だけでは、ユーザーにとってどのような意味を持つホームページなのか、が、検索エンジンやウェブサーバーには、判断できないのです。

何より、一般的な検索のためのキーワードに分割してしまうと、「株式会社 エー・エム・ティー 静岡市 デザイン会社」になってしまいますので、検査語を含むホームページを、片っ端からリストアップしていくほかに手はありません。
意味のある情報なのかどうかに関わりなく。

昔の(今はあまり意味がなくなってしまった)情報を載せたホームページが検索上位に入ってきてしまう、という事例は、こういうことも原因と言えそうです。

 

セマンティックウェブ

そこで、ユーザーにとっての「意味」を中心としたウェブ構築を提唱しているのが「セマンティックウェブ - semanthic web -」と呼ばれるウェブの世界です。

セマンティックウェブ世界では、ホームページに書かれた「意味を理解するための情報 = 構造化データ」を頼りに、検索エンジンやウェブサーバー(などのシステム)が、自動的に補足情報を収集して、そのホームページに書かれた情報の意味を学習し、蓄積していく…..のだそうです。

 

→ 参考:Wikipedia「セマンティックウェブ」
→ 参考:IT用語辞典e-words「セマンティックWeb」

 

「意味」を理解するセマンティックウェブでの検索エンジンでは、質問に対して、意訳された解答が返ってくることになります。

これはセマンティックウェブの実例ではありませんが、現在、iPadなどに搭載されているAppleの人工知能「Siri」に、「OK,Google」と言ってみると、いろいろ変な答えが返ってきます。
もっとも、これが意訳なのかどうかは微妙なところです。

「代わりにSiriがお答えします」

だったら、意訳に近いかもしれませんね。

一方で、「ダースベイダーの息子は?」と聞いてみると、「ルークとレイア」という答えが返ってきます(自分調べ)。
これは使っていないキーワードに対する答えという意味で、ある程度複雑な経路で返ってきている例と言えそうです。
まあ、レイアは娘なので、解答としては不完全です。

ただ、セマンティックウェブも、案外すぐそこにあるのかな?という気になります。
TVドラマ「ナイトライダー」のようなことも、近い将来には、実用化するのかもしれません。

 

結構役立ってくれるSiri:結構役立ってくれるSiri

 

構造化データのなかみ

さて、「構造化データ」などというと何だか難しそうでカッコいいですが、実際の中身は結構単純で、

ページの種類:ブログ
ページタイトル:構造化データとは
書かれた日時:2020年2月6日
修正日時:2020年2月6日
ロゴ画像:画像のアドレス
記述者:TS
組織:株式会社エー・エム・ティー
詳細:構造化データとはどんなものなのかという説明をしてみたりなんかしています。

などと、ページの内容とは必ずしも直接関わりの少ない、ブラウザ上では表示されない情報の箇条書き…だったりします。

この程度の量の構造化データだけでは、それほどの影響はないような感じがしますが、将来的には、どこでどうなっちゃったのか、うっかりすると、株式会社エー・エム・ティーは、人類の敵だという意味になってしまうかもしれません。
最近、仕事中のパソコンの画面に何やら英語で警告が出てくるんだよな、などという時期が来たら、気を付けないといけませんね。

ちなみにこの構造化データは、Googleが支援する秘密結社「schema.org」により、記述すべき項目や記述方法といったガイドラインが定義されています。
おっと失礼、決して秘密結社ではありません。ちゃんとした団体です。

使い方としては、各ホームページの「ヘッダー」内に、上の例のような内容を、schema.orgのガイドラインに従って属性値をいろいろ追加しておきます。

 

schema.orgの公式サイト
schema.orgの公式サイト。予想外に地味

 

SEOとの関係は

ちなみに、Googleのえらい人の話では、構造化データは、今のところ、検索の順位に直接影響を与えるものではない、とのことです。

しかしその一方で、構造化データを含んでいる、という点は検索エンジンに認識されて、書き方が間違っていなければ、ご褒美に「クローラビリティの高いウェブページ」として、ほんの少しだけ、ホームページの評価を高くしてくれるのだそうです。

クローラビリティというのは、Googlebot(グーグルボット:Googleが検索エンジン用にデータを取得する昆虫型のプログラムロボット)が、そのウェブページを発見しやすい度合 というようなもので、クローラビリティが高いほど、Googleのインデックスに掲載されやすい、と言われています。
要はGoogleに好まれるホームページだ、ということですね。
それが間接的に、検索順位が上がるかもしれないということに繋がる、とされています。

まあこういう「検索順位が上がる(かもしれない)からやっとけ」的な殺し文句は、SEO関連ではちょいちょい使われますが、どうなんでしょうかね。

いらないものをどんどん、くっ付けていって肥大化。
で、最終的には切り捨てて新しいのに代えるよう強制。
くれぐれもWindowsのことを言っているのではありませんよ。

おっと、セマンティックウェブからすれば、こんな批判めいたことを書いてあるページは、気に食わないと除外されちゃうかもしれませんね。
以上、TSでした。

お問い合わせCONTACT

株式会社エー・エム・ティーは
印刷物からホームページ制作・更新運用管理までトータルサポート。
企業様の課題解決や企業価値向上のお手伝いをいたします。

受付9:00~18:00 ※土日祝除く