Quantcast
Viewing all articles
Browse latest Browse all 106

「検索ランキングシステムの解像度が上がるGoogleによる情報開示を解説じゃ」の巻【蔵前教授の白熱!検索教室3】

Image may be NSFW.
Clik here to view.

この物語について

2024年春。ここ、東京・秋葉原はインバウンド観光が再開され海外の観光客が多く訪れるようになり、街全体が活気を取り戻しつつある。

その片隅に校舎を構えるJADE大学は、検索エンジンの過去・現在・未来及びそれを活用したビジネスの在り方を研究している「検索教養学部」が設置され6度目の新学期を迎えた。

この物語は、検索教養学部で繰り広げられる教授と生徒たちの白熱の議論をお伝えするものである。

登場人物紹介:

蔵前教授

Image may be NSFW.
Clik here to view.

検索エンジンなど社会へ大きなインパクトを与えるプラットフォームを長年研究。特にスパム検出のアルゴリズム開発については複数の企業で実務者としても関わってきた経験を持つ。
趣味はスプラトゥーンと、イギリス製ミニチュアゲーム製作。長期休みがあると旧街道を歩き回るクセがある。めっちゃ歩いたけどまだ膝は大丈夫。JADE大学は本当は蔵前エリアにキャンパスを開設したかったけど教授会で「ピンとこない」という理由で却下された。せめてとの思いで苗字を改名。

一堂スパム(いちどう・すぱむ)

Image may be NSFW.
Clik here to view.

検索教養学部の学生。根はとてもいい奴だが、考えることがついつい脱法的になってしまうクセがある。.xyzドメインを108個持っている。

冷越タブロー(れいえつ・たぶろう)

Image may be NSFW.
Clik here to view.

検索教養学部の学生。検索結果を眺めるのが趣味。最近ビジュアライゼーションにはまり出している。目立つのが好きではないため言葉少な目だが、主張したいときはグラフで論破する。

外神田唯(そとかんだ・ゆい)

Image may be NSFW.
Clik here to view.

教育学部の学生。夢いっぱいにJADE大学に入学。将来は地元の図書館で司書をしたいとの思いがあり図書館学を専攻しているが、その単位取得の一環で検索教養学部の授業に参加している。活字中毒で、検索エンジンのことは実はあまりよく知らない。正義感が強い。趣味は豚角煮を週末に作り置きすること。

 

冷越、パソコンの画面を凝視してる。目をこすっているが、楽しそうだ。

 

Image may be NSFW.
Clik here to view.

ふむぅ。。。

 

Image may be NSFW.
Clik here to view.

冷越君どうしたの?

 

Image may be NSFW.
Clik here to view.

長い

 

Image may be NSFW.
Clik here to view.

えっ

 

Image may be NSFW.
Clik here to view.

いや、長かった

 

Image may be NSFW.
Clik here to view.

(すっかり勘違いして)え、今年のゴールデンウィーク、そんなに日の並びはそんなに良くはないわよ…

 

Image may be NSFW.
Clik here to view.

唯ちゃん、ちがうよ。コアアップデート。Googleのコアアルゴリズムアップデートだよ。

 

Image may be NSFW.
Clik here to view.

あ、そっちね。。。って、まだ続いていたの!!?ちょっと長すぎるわ。

 

Image may be NSFW.
Clik here to view.

いや、そちらは一応完了していて、5/6からは寄生サイト対策が始まっているんだ。今は、手動対応中心のようだけど、今後アルゴリズムを用いた対応も行われるらしい。

検索結果を眺めるのが趣味の僕にとっては、寝る暇もない状況だよ。さあ、今日はどの検索クエリをチェックしようかな。

 

冷越、目の下にクマを作りながら、目を輝かせている。

そこへ、一堂スパムが入室してくる。

 

Image may be NSFW.
Clik here to view.

いやぁぁぁ~、みなさまおはようございまする~。お元気ですかぁ?

 

Image may be NSFW.
Clik here to view.

あ、一堂君、今日はいつもより早いわね。おはよう。

 

Image may be NSFW.
Clik here to view.

唯ちゃ~~~ん。先週、授業ノートを貸してくれてありがとうー。あのノートのおかげで先週のレポート提出はなんとか乗り切れたましたぁ。唯ちゃんは、本当に僕にとっての恩人。神様ですぅ。

 

外神田、いつもとノリが違う一堂にとまどいながら、

 

Image may be NSFW.
Clik here to view.

あ、いえ、あの、どういたしまして。

 

Image may be NSFW.
Clik here to view.

そんな救世主の唯ちゃんへ、せめてものお礼にセブンプレミアムの「金の豚角煮」をプレゼントしましょうー。

 

と、かばんから「金の豚角煮」を取り出す。

 

Image may be NSFW.
Clik here to view.

え!私が角煮大好きなの知ってたなんて?うれしい、ありがとうーー。

 

と、遠慮なく「金の豚角煮」を受け取ろうとする。

 

Image may be NSFW.
Clik here to view.

唯ちゃん!

 

Image may be NSFW.
Clik here to view.

 

冷越の大きな声に驚く。

 

Image may be NSFW.
Clik here to view.

あれぇ、冷越君も「金の豚角煮」欲しいですかぁ。とても美味しいですよねぇ。分かりました。冷越君にも差し上げます。お礼?いらない、いらなーい。ただの僕の好意ですから。

 

Image may be NSFW.
Clik here to view.

唯ちゃん、だまされちゃいけないよ。おい、一堂!

 

一堂、ハッと冷越を見つめる。

 

Image may be NSFW.
Clik here to view.

一見、相手に見返りを求めない好意を与えているように見えて、その実、相手からの自発的な好評価をひそかに期待する返報性の原理を悪用したその手口。

 

Image may be NSFW.
Clik here to view.

…….。

 

Image may be NSFW.
Clik here to view.

お前こそ、歩く「サイト・レピュテーション・アビューズ(Site Reputation Abuse=サイト評判の濫用)」だぁ!

 

Image may be NSFW.
Clik here to view.

ギクゥゥゥ!グァァ……(と教室後方へふっとぶ)。何を、何を、根拠もないことを。

 

Image may be NSFW.
Clik here to view.

これが証拠だぁ!

 

と、自分のパソコンの画面を一堂に見せつける。

さまざまなサイトのドメイン単位での検索順位状況を一覧できる美しいTableauのUIだ。

 

Image may be NSFW.
Clik here to view.

あ、あ、俺のサイトの情報がぁぁぁぁ。

 

Image may be NSFW.
Clik here to view.

さっそく手動対策の対象になったようだな。評判を人工的に作り出そうとしたって、そんなものは無駄なんだ。

蔵前教授の授業に出ているのに、いつになったらこのことを理解するんだ!

 

と、そこへ蔵前教授が入室してくる。

冷越、一堂、外神田は席に着く。

 

Image may be NSFW.
Clik here to view.

みなさん、おはよう。ゴールデンウィークはみな楽しんだかな。

 

Image may be NSFW.
Clik here to view.
Image may be NSFW.
Clik here to view.

はい!

 

Image may be NSFW.
Clik here to view.

お、一堂君。手に持っているのはセブンプレミアムの豚角煮か。なかなかの美味よのう。

ファミマの豚角煮もおすすめじゃよ。

 

一堂、バツがわるそうに角煮を鞄にしまう。

 

Image may be NSFW.
Clik here to view.

さて、今日の授業はゴールデンウィーク明け特別編じゃ。Googleの検索システムについてこれまでDCIRのことや、組織としてみる視点などをお話ししてきたが、今回はランキングシステムのことについて深ぼってお話をしよう。

 

Image may be NSFW.
Clik here to view.

それは大変興味深いです。この記事の第一回で、確かランキングインフラチームは秘密主義の傾向が強いとお伺いしました。

 

Image may be NSFW.
Clik here to view.

そうじゃ。なにせ、Google検索のランキングがどのように決定されているかに関わるわけじゃからな。社会とのコミュニケーションを一歩誤ると、スパマーたちの…

 

Image may be NSFW.
Clik here to view.

呼んだ?

 

Image may be NSFW.
Clik here to view.

お前じゃない、アビューズ!

 

Image may be NSFW.
Clik here to view.

アビューズじゃない!スパムだ!

 

Image may be NSFW.
Clik here to view.

どっちもひどいわ!

 

Image may be NSFW.
Clik here to view.

コホン。スパマーたちによるシグナル濫用を手助けすることになる。彼らは悪知恵を働かせることにおいては天下一品じゃからな。Googleもさんざん悩まされてきたわけじゃし、今もイタチごっこは続いておる。ところがじゃ、

 

Image may be NSFW.
Clik here to view.
Image may be NSFW.
Clik here to view.
Image may be NSFW.
Clik here to view.

ところが?

 

Image may be NSFW.
Clik here to view.

日本ではなかなか実感がわきづらいが、「米国政府 vs. Google」という図式ともいえる法廷闘争が行われておる。訴えているのはなんと政府じゃ。

 

Image may be NSFW.
Clik here to view.

すごい…自宅に、日本政府の代表の方が「訴えます」って訪問してきたら、私死んでしまいます。

 

Image may be NSFW.
Clik here to view.

Googleは長らく市場独占の文脈で非難を受け続けておる。ヨーロッパでは制裁金を課される始末じゃ。米国内でもカリフォルニア州で「ジャーナリズム保護法案」が審議されておる。

その訴訟でのGoogle側の証言内容や、それらをもとにした解説記事が米国内では色々と紹介されておる。

それらを見ていると、Googleの検索ランキングシステムについて過去に例を見ないほどに踏み込んだ内容をGoogleエンジニアが証言しとるんじゃ。

今日の授業素材はこれじゃ。

 

Image may be NSFW.
Clik here to view.

なんと。。

 

Image may be NSFW.
Clik here to view.

法廷じゃからな、Googleも問われれば誠実に回答せなばならん。

 

Image may be NSFW.
Clik here to view.

その前フリだけで、き、緊張します。。

 

Image may be NSFW.
Clik here to view.

では始めよう。

 

ランキングシステムの説明

Image may be NSFW.
Clik here to view.

まずはこれを見てもらう。法廷で提出された資料の中にあるスライドのひとつじゃ。

 

と、蔵前、スクリーンにスライドを映し出す。

 

Image may be NSFW.
Clik here to view.

出典:Antitrust Division | U.S. and Plaintiff States v. Google LLC [2020] - Trial Exhibits

Image may be NSFW.
Clik here to view.

ベーシック・コントロール・フロー(Basic Control Flow)?

 

Image may be NSFW.
Clik here to view.

フローの最後がウェブ検索結果(Web Search Results)、ウェブ検索結果という結果を生み出す手順なので、まさに検索”アルゴリズム”の概要でしょうか。

 

Image may be NSFW.
Clik here to view.

そうじゃ。

 

Image may be NSFW.
Clik here to view.

(過去の授業ノートを見ながら)右上の言葉はみたことがあります。クロール・アンド・インデキシング(Crawl & Indexing)。Googleのロボットが、インターネット上で発見したURLにアクセスして、分析→格納するんですよね。

 

Image may be NSFW.
Clik here to view.

外神田君、グッドじゃ!よろしい。これまでの学びが生きておるな。

 

Image may be NSFW.
Clik here to view.

でも、左上の表現は見たことがありません。。クエリー・リライター?ライター?

 

Image may be NSFW.
Clik here to view.

リライター、リライト=書き換えるということだよ、きっと。教授、検索クエリを書き換えるとはどういうことですか?あ、Interprets Queryって書いてある。クエリを解釈する…。

 

Image may be NSFW.
Clik here to view.

まず、向かって右側は、Googlebotとインターネット上の文書(URL)との接触の流れじゃが、左側は検索ユーザーによる検索クエリ入力を起点とした処理の流れじゃ。このようにフローが示されたのはちょっと珍しいかもしれんのぉ。

さて、リライトするということはどういうことなのか。文字通り、書き換えるということなのじゃよ。

 

Image may be NSFW.
Clik here to view.

えっ!入力された検索キーワードそのままでシステムへ問い合わせをしないのです?

 

Image may be NSFW.
Clik here to view.

しないのじゃ。書き換える。この仕組みによって、入力された検索キーワードの「類義語」や「表記ゆれ」などに対してまで対象範囲を拡張するのじゃ。

 

Image may be NSFW.
Clik here to view.

表記ゆれ?

 

Image may be NSFW.
Clik here to view.

Googleのことを「Google」と検索する人もいるし、「グーグル」「ぐーぐる」、あるいは「ぐぐーる」と検索されることもあり得る。表記は違うけど、検索意図は同じだから、そこをGoogleはちゃんと解釈して検索結果に反映させるということだよ。

 

外神田、メモる

 

Image may be NSFW.
Clik here to view.

検索結果のタイトルリンクには、検索クエリに使った言葉の記載はないけど上位表示しているページに出会うことはあるじゃろう。

 

Image may be NSFW.
Clik here to view.

よくあります。

 

Image may be NSFW.
Clik here to view.

あ、そういえば、少し前に公開されたGoogleのHow Search Worksで、同社のゲイリーさんの動画で同じような話を聞いたような…。しまった、適当に聞き流していた…。

この動画です。

www.youtube.com

 

Image may be NSFW.
Clik here to view.

とても有益な情報提供じゃな。

 

Image may be NSFW.
Clik here to view.

見ます!

Muppet、AscorerとSuperroot

Image may be NSFW.
Clik here to view.

次は、えーと、まぺっと?エー、スコア、ラー。すーぱー、るーと?何と呼ぶのが正しいのかな?そこから分からないや。

 

Image may be NSFW.
Clik here to view.

グットじゃ。合っておる。マペット(Muppet)、エースコアラー(Ascorer)とスーパールート(Superroot)じゃ。読めないのも無理はない。Googleとしてはほぼ初出の情報じゃろうな。

 

Image may be NSFW.
Clik here to view.

ゴクリ…

 

Image may be NSFW.
Clik here to view.

ゴクリ…

 

Image may be NSFW.
Clik here to view.

Muppet/Ascorer、Superrootもともにランキングを決定するためのシステムに当たることはこの図から分かるじゃろう。

この二つのうち、Muppet/Ascorerのほうがよりコアなランク付けな仕組みにあたり、Superrootはランキング調整システムのようじゃ。Googleにとっての秘伝のタレは、Muppet/Ascorerのほうと言えるじゃろうな。

 

Image may be NSFW.
Clik here to view.

秘伝のタレ…?

 

Image may be NSFW.
Clik here to view.

唯ちゃん、そんなこともわからないの、Googleは焼鳥屋ってことだよ。

 

外神田、おなかが鳴る

 

Image may be NSFW.
Clik here to view.

ぜんぜんちがーーーーう!(気を取り直して)教授、もう少し分かりやすく教えいただけませんか?

 

Image may be NSFW.
Clik here to view.

うむ。図中の文章から推察するに、Muppet/Ascorerは、いわゆる Information Retrieval 、情報検索が行われる部分じゃろうな。インデックスに入っているすべてのドキュメントを対象にするアルゴリズムじゃ。あらゆるタイプの検索クエリ、通常のものから、YMYL、ポルノ系などにいたるまで、それらに対してすべてのドキュメントを対象に、関連性の判断を行ってアウトプットを出すのがMuppet/Ascorerだと考えられる。

 

Image may be NSFW.
Clik here to view.

まさに核になる仕組みですね。

 

Image may be NSFW.
Clik here to view.

角煮?

 

Image may be NSFW.
Clik here to view.

唯ちゃん、おなかすいたなら生協いったほうが良いよ。

 

Image may be NSFW.
Clik here to view.

我慢します…。

 

Image may be NSFW.
Clik here to view.

教授、でも….「すべてのドキュメント」を対象にするって、計算量がものすごく、費用がかさむような気がします。パフォーマンスも遅くなりそうな。

 

Image may be NSFW.
Clik here to view.

さすがじゃな、冷越君。コストという観点はとても大事じゃ。だからこそ、Googleは2段階の調整をしていると考えられる。Superroot システムの登場じゃ。

 

Image may be NSFW.
Clik here to view.

えっ……(ひらめいて)なるほど、切り分けるのですね!

 

Image may be NSFW.
Clik here to view.

そう。まず大まかなスコア付けはMuppet/Ascorerで行い、その上で、検索クエリの意図に応じて、Superrootで調整を行うと考えられるのじゃ。その際は対象となるドキュメント(URL)もかなり限定される。Muppet/Ascorerから返ってきた情報のみを対象にするからのぉ。

 

Image may be NSFW.
Clik here to view.

調整というと、サイトの信頼性を用いた足切りとか、細やかなランキングの変更とかが行われるんでしょうか。

 

Image may be NSFW.
Clik here to view.

そうじゃな。ほれ、たまにクエリで検索結果が数件しか表示されないことなどがあるじゃろう。それも、Superrootの処理の結果の可能性があると言えよう。

 

Image may be NSFW.
Clik here to view.

いくつか思い当たります。。。

 

Image may be NSFW.
Clik here to view.

これまでじゃと、URL達がインデックスされたのかどうか?がこの問題における調査の切り分けになっていただろうが、このBasic Control Flowを理解することによって、仮説立ての幅が広がるじゃろう。

 

Image may be NSFW.
Clik here to view.

Superrootは対症療法、Muppet/Ascorerは根本治療、そのようなイメージでしょうか。

 

Image may be NSFW.
Clik here to view.

グッドじゃ。まさにそのようなイメージで理解するとよろしいじゃろう。

 

Image may be NSFW.
Clik here to view.

なるほど、そういうことか!完全に理解した!オラは完全に理解したぞぉ!!

 

Image may be NSFW.
Clik here to view.

ほほぉ、一堂君、グッドじゃ。

 

Image may be NSFW.
Clik here to view.

キーマンはMuppet/Ascorer氏ってことだな。よおし、セブンプレミアムの豚角煮プレゼント大作戦はこいつに向けて展開でぜぇ!

マウンテンビューに電話しよう。タウンページ、タウンページ…。

 

Image may be NSFW.
Clik here to view.

理解が歪んでる…お前の頭の構造は一体どうなってるんだ!それから、タウンページとかに電話番号なんか載ってないから!

 

Image may be NSFW.
Clik here to view.

一堂君!

 

突然の声に三人が外神田唯のほうに振り向く

 

Image may be NSFW.
Clik here to view.

一堂君

 

Image may be NSFW.
Clik here to view.

な、なんだよ…唯…角煮はあげねぇぜ

 

Image may be NSFW.
Clik here to view.

一堂君にも根本治療が必要ね!

 

間。

 

Image may be NSFW.
Clik here to view.

(後悔する)

 

Image may be NSFW.
Clik here to view.

唯ちゃん…

 

Image may be NSFW.
Clik here to view.

え?

 

Image may be NSFW.
Clik here to view.
Image may be NSFW.
Clik here to view.

うまい、グッドじゃ!

 

後編に続く。

 

蔵前教授から読者のみなさんへ:

今回紹介したGoogleのプレゼンテーション資料はこちらから確認できるぞ。かなり長大な資料じゃが、自分自身の検索マーケティングの経験と照らし合わせながら読み込むと得るものも多いじゃろう。

ぜひ、時間があれば目を通してみてほしい。

www.justice.gov

蔵前教授の過去の授業はこちら:

blog.ja.dev

blog.ja.dev


Viewing all articles
Browse latest Browse all 106

Trending Articles