2013年10月19日土曜日

Googleがおこなうウェブ検索の基本

Googleがおこなうウェブ検索の基本が動画で見ることができます。

リンクは下記に掲載しておりますので、興味のある方は是非ご覧下さい。

サイトをどのように登録して、検索結果に表示させるのかなど・・・

この動画を見るとリンクとPageRankの重要性が言われています。

動画の文字を起こしてみました。



Googleのエンジニアでサーチクオリティー担当しているMatt Cuttsです。

今日はウェブ検索の裏側を紹介します。

Google検索が行われる時、ユーザーはウェブを検索しているのではなく、Googleが持つウェブのインデックス、つまりGoogleがウェブ上でみつけることができたものの中から検索しているのです。

ウェブ上から情報を集めるとき、スパイダーというプログラムが使われています。

スパイダーは最初にいつくつかのウェブページの情報を取得し、次にそれらのページのリンクからリンク先のページの情報を取得します。そして、さらにそのページのリンク先のページをめぐり情報を取得していき、これを繰り返します。

こうしてとても大きなウェブのかたまりをインデックスします。

数十億ものウェブページは何千ものマシンに保存されています。

たとえば、チーターの走る速さを知りたいとします。

「チーター 走る 速さ」と検索ボックスに入力して実行すると、Googleのソフトウェアはインデックスを検索して、これらの検索クエリを含むすべてのページを探します。

この場合、何十万ものページが該当するかも知れません。

では、Googleはどうやって、ユーザーが本当に求めているページがどれかを判断しているのでしょう。 Googleでは200以上の「問い」を立てて、そこから判断しています。

たとえばキーワードがそのページに何回含まれているのか、そのキーワードはタイトルに現れているのか、それともURLか、またキーワード同士隣接して現れているのか、キーワードの類義語が含まれているのか

そのページを所有するウェブサイトの品質は高いか、低いか、スパムかどうか、PageRankはどれくらいか、などを問い立てて、各Pageを評価しています。

ちなみにPageRankとは、Googleの創立者LarryPageとSeergeyBrinが発明したアルゴリズムでどれくらい多くの、そしてどれくらい重要な外部からのリンクが存在するかによって各サイトを評価する仕組みです。

最終的に、わたしたちはこれらすべての要因を組み合わせて、各ページの総合得点を算出して検索結果をユーザーに返します。その間わずか0.5秒ほどです。

Googleは、公平で役に立つ検索結果を届けることに真剣に取り組んでいます。

お金をもらって、あるサイトをインデックスに追加することや、より頻繁にさのサイトのインデックス上の情報を更新すること、またそのサイトの順位を上げることは決してありません。では、検索結果の一例を見てみましょう。

各エントリにはタイトル、URL、スニペットがあり、そのページが探していたページかどうかを判断できるようになっています。

他にも、類以ページへのリンクやGoogleが保存しているそのページの最新バージョンへのリンク、次に検索するかもしれない、関連する検索キーワードが表示されます。

検索結果の右側や上に広告が表示されることもあります。

Googleは広告事業にも積極的に取り組んでいますが、広告主のためにより適した閲覧者に広告を配信し、ユーザーのためには見たい広告だけを表示するように努力しています。

広告を通常の検索結果と区別できるように表示することにわたしたちはとても気をつけています。

探している情報をみつけるのに役に立つ広告が見つからないときは広告は一切表示しません。

ちなみに、チーターが走るときの最高速度は時速100㎞以上です。
https://www.youtube.com/watch?v=BNHR6IQJGZs