読者です 読者をやめる 読者になる 読者になる

Googleが無能だと言う前に出来ることってあるだろうか?

yuko-hiromさんの、 せめてはっきり言おうではないか. Googleは無能であると - yuko-hirom’s blog というエントリーが人気だ。簡単にまとめるなら、Google検索でPV狙いの嘘ニュースが検索上位に来てしまうという話だ。そしてそれを放置しているGoogleは無能だという主張だ。

それでyuko-hiromさんは「Googleは無能だと言おう」と主張する。

でも代替案もなしに無能だと主張したところでスルーされるのが関の山だろう。だとするなら代替案を考えるのが早いだろう。

ページランクという指標に全てが含まれているのが問題じゃないかな?

グーグルの検索結果はページランクで決まる。そしてそれは一次元の構造になっている。つまりその情報の正しさであるとか、ある事象についてポジティブでに語っているかとかネガティブに語っているかという内容についての評価はしない。

下の図でいえば、左側の図がそうだ。

だったら、検索結果について、ポジティブに言及しているか、ネガティブに言及しているかその程度を、示すUIを付け加えれば良いのではないか?

下の図でいえば、右側の様に、ページランクという軸と、記事がポジティブに言及しているかネガティブに言及しているかの2軸で検索結果を図示すれば良いではなかろうか?

図の上の、タイトルをクリックすれば目的のページに遷移すれば良い。

そうすれば、例えばネガティブな情報が上に来たところで、位置が違うのだから、ポジティブな情報を邪魔することは無い。

f:id:shibacow:20170104041213p:plain

UIにしか介入しないので、Googleそのものを作り変えることはない。

要は嘘ニュースが上位に来るのは、UIの問題なので、UIにのみ介入すれば、Googleそのものを作り変える必要は無い。

検索サービスというのは、webページの情報を収集する「クローラー」とその収集した情報を整理する「インデクサー」と検索ワードに応じて適切に検索結果を返す「ビューアー」からなっている。

ページランクの上位に来たものの順位を再整理すれば良いのだからGoogleそのものを作る必要はない。単純に検索結果を再整理して、表示すれば良いのだ。下の図でいえば、Googleのビューアーの上に、薄い再整理層を作れば良いことになる。

f:id:shibacow:20170104042601p:plain

実際の実装

じゃあ、実際にどのようなステップで作れば良いだろうか?

サーバ側では以下の作業が必要になる。

  1. 論争を含みそうな検索ワードで、グーグル検索を行い、上位数千件の検索結果を取得する。
  2. その検索結果を元に実際の記事の内容を取得する。
  3. 機械学習クラスター分析(k-meansとか、テキストの分析に適したアルゴリズムで)を用いて、それぞれを記事のポジティブ・ネガティブに分類する。
  4. それを定期実行して、記事のDBを作る。

ブラウザー側では、以下の作業が必要になる。

  1. Firefoxなり、Chromeなりのadd-onを作る。
  2. 特定の検索語に反応して、検索結果の上段に、2軸にマッピングしたUIを差し込む。
  3. サーバ側で作った記事DBをその場所に表示する

とやれば良いではないだろうか?自分が使ってみて使えると判断できればその、add-onを他人に勧めればよい。

無能だと罵る前に、工夫できない場所はないか探す。

何かシステムには、何かしら入り込める鋤はあるし、ハックできる場所はある。でもそれらを探そうとせず、ただ罵るだけなら、それは何も考えていないの大して変わりはない。インターネットは幸いなことに、何かを始めるのに許可を得る必要はない。罵る前に代替案が無いか考えてみることは良いことだ。 インターネットの良いところは、yuko-hiromさんが上記のシステムを誰の許可も無しに、自分で作って自分で実験できる点にある。代替案を考えることをせず、ただ現状を呪うだけなら、それはインターネットの自由を殺すことと大差はない。

思想の自由市場という考え方

この案では、嘘ニュースの排除は行わなかった。アメリカでは「思想の自由市場」という考え方がある。正しい考えに到達するにために、とりあえず全ての思想を市場に載せ、市場における淘汰のプロセスを経て、真理や正しい知識へ近づいて行くという考え方だ。 嘘ニュースは全てフィルタリングするという発想は、それはそれで、事前検閲を呼び込んでしまい、副作用も大きいだろうと考える。