2021-06-05

コロナワクチン接種回数と今後の予測

noteの注意書きより引用

新型コロナウイルスに関係する内容の可能性がある記事です。新型コロナウイルス感染症については、必ず1次情報として厚生労働省や首相官邸のウェブサイトなど公的機関で発表されている発生状況やQ&A、相談窓口の情報もご確認ください。またコロナワクチンに関する情報は首相官邸のウェブサイトをご確認ください。

概要

コロナワクチン接種数が徐々に増えている。ワクチン接種は、医療関係者->高齢者->高齢者以外の16歳以上へと拡大していく。コロナワクチンの摂取数は、首相官邸のホームページで公開されている。そのデータを分析して、ワクチン接種はいつ終わるのかを予測する。あくまで現在ある情報から機械的に将来を予測しているのでその点は注意してほしい。

その結果を簡単に書くと次のようになる。政治日程もついでに書く。機械的に求めたため10/21には一日の摂取回数が200万回を超える。流石に現実的ではないので後半で上限を迎えた値を紹介する。

日程	日別接種数	累計接種数
06/30	821,020	32,301,168
07/04 東京都議選	864,476	35,782,344
07/17 一日100万回達成	1,005,708	47,988,816
07/23 オリンピック開幕	1,070,892	54,251,208
08/08 オリンピック閉幕	1,244,716	72,862,984
08/25 パラリンピック開幕	1,418,540	94,255,944
09/05 パラリンピック閉幕	1,548,908	112,125,816
09/30 自民党総裁任期満了	1,820,508	154,379,316
10/21 衆議院議員任期満了	2,048,652	195,119,568

徐々に増えるワクチン一日摂取回数

首相官邸のホームページには、ワクチン摂取回数の表がある。

医療関係者と高齢者の情報があり、直近の３日をまとめると次のようになる。

日付	医療	高齢者	合計
2021/6/1	159,057	469,224	628,281
2021/6/2	159,126	460,711	619,837
2021/6/3	143,157	370,629	513,786

最近では一日の接種回数が50万回を超えてきている。

そちらをグラフ化すると次の様になる（官邸で用意されたxlsxは4/12日からのため4/12を起点とする）。

f:id:shibacow:20210605023728p:plain — 一日接種回数とトレンドグラフ

最近の表計算ソフト（今回使ったのはgoogle sheet）にはトレンドラインと言って、日の増え方を線形の方程式の表してくれるものがある。上の、10864x+ -4.81E+08 がそれ。これは、4/12日を起点（0日）として、その後の一日の接種回数を予測することができる（あくまで荒い予測だが）¹。 -4.81E+08 だと-481,000,000になり、マイナスがむちゃくちゃ多くなるので、int(10864*X -48100) で使っている。 -4.81E+08 の意味がわからないので分かる人は教えてほしい。

それを10/31まで伸ばすと次のようになる。

f:id:shibacow:20210605024243p:plain

現在の接種回数とその予測値を元に、月末の一日接種回数と、累計接種回数を求める。

日付	日別接種回数	累計接種回数
2021/6/30	821,020	32,369,284
2021/7/30	1,146,940	62,051,644
2021/8/31	1,494,588	104,489,916
2021/9/30	1,820,508	154,379,316
2021/10/31	2,157,292	216,203,608

10/31は一日の接種回数が200万回を超え、累計接種数は２億1千万を超えるが、非現実的な数値だ。

上限があると仮定して予測

それでは、キャップをかけた場合はどうだろう。例えば、一日最大75万回、100万回（政府の目標値だ）、150万回だと仮定する（本当の上限がどこにあるかはわからない）。

一日あたりの接種数は図にすると次のようになる。

f:id:shibacow:20210605025337p:plain — 上限ありモデル

累計にすると次に様になる。

f:id:shibacow:20210605025509p:plain

わかりやすく表にした。

日付	75万回上限	100万回上限	150万回上限
2021/6/30	32,100,288	32,369,284	32,369,284
2021/7/31	55,350,288	61,983,108	63,209,448
2021/8/31	78,600,288	92,983,108	104,489,916
2021/9/30	101,100,288	122,983,108	149,489,916
2021/10/31	124,350,288	153,983,108	195,989,916

政府目標の一日100万回接種が実現できると仮定した場合、一応10月末には国民の60%が二回接種(1億4千4百万回)できている計算になる。

計算に用いたスプレッドシートはこちら。ワクチン接種及び予測 - Google スプレッドシート

Google Colabで週単位で予測してみた。

Google Colaboratory

一日単位は変動幅が大きいため週単位で集計してみた。

f:id:shibacow:20210605031241p:plain

f:id:shibacow:20210605031320p:plain

こちらも機械的に線形に伸ばしているが、どこかで上限に達するはず。それでも9/13日には半分の1億2千万回の接種が終わる（目論見通りに行けば）。

ワクチン接種を加速する取り組み

何度も繰り替えずがどこでワクチン接種回数の上限になるかわからない。しかし上に書いたが10/21には衆議院議員の任期が終わる。現職議員としては選挙民が「最近コロナの新規感染者が出ないな」という状況で選挙を戦いたいはずだ（流行がぶり返したと言われながら戦いたいとは思わないだろう）。そのためなりふり構わず政策を出している。割とやけくそ気味と言える。今までであれば腰が重くやらなかったであろう政策もばんばん出ている。多分今後も、やけくそ気味の政策を出してくるだろう（イギリスでは素人のボランティアにすらワクチンを打たせている）。一日でも早くワクチン接種が終わり、イギリスの様にコロナ死者ゼロの日が来ることを願っている。

取り組み例

自衛隊による国直轄のワクチン接種
打ち手に、歯科医師を追加
打ち手に、臨床検査技師、救急救命士追加
- 打ち手に薬剤師検討(見送り)
自治体主体の接種に加えて職域接種追加
7-9月にファイザー製ワクチン7千万調達
- こちらの資料だと、7-9月のファイザーの供給は5千万のはずだったが、2千万増えている?。

f:id:shibacow:20210605032828p:plain

本当は増加は線形ではなくもっと複雑な曲線を描くはず。当面は増えていきその後伸びが鈍化するはずだがシンプルさを優先するため線形にした。↩

2020-10-28

TwitterのRT制限はReTweetにどのくらい影響を与えたか(01/09アップデート)

この記事は、TwitterのRT制限はユーザーの行動にどのくらい影響を与えたかを調べるものだ。

Twitter社によるRT制限とは何か？

twitter社ではアメリカ大統領選挙が終わる11月３日まで、ReTweetの仕様を一部変更し、投稿までワンクッション置くようになった。デマ情報がRTにより容易に拡散し、選挙結果に影響を与えることを懸念しての処置だ。

下のニュースに詳しい。

Twitter、一時的に「リツイート」機能を仕様変更引用RTを標準に米大統領選のデマ拡散防止で - ITmedia NEWS

この仕様変更は10月20日より実施された。

追記

12/17にRTの仕様が元に戻された。

Twitter、リツイートの仕様を元通りに引用RTの標準化を解除 - ITmedia NEWS

RT制限でReTweetは減ったか？

それでは、実際RT投稿の数に変化があったかを見てみる。RT数が変化すれば、安易な情報拡散は抑えられたと考えて良さそうだ。

twitterにおけるtweetの取得

RT数が減ったかどうかは、twitter社でなければ本当のところはわからない。けれど、twitter社は、開発者向けに世界中の全tweetのサンプルストリームを公開している(噂では1% サンプリングだと言われている)。sampling apiのURLはこちら。このsampling apiを使えた、日本語のtweet を1日50-60万件程度取得できることは分かっている。その中にはRTも含まれているので、そのRT数に変化があれば、RT制限がユーザー行動に影響を与えたことがわかる。

10/20からReTweet数は減ったか？

それでは、10/20からRT数は減少したかどうか見てみよう。

この表は、10/01から2021/01/08までの、samplingデータで取得できた tweet数（含むRT） RT数、RT数/tweet数の割合だ。

日付	tweet数	RT数	RT割合
2020-10-01	690551	221863	32.13%
2020-10-02	685877	231418	33.74%
2020-10-03	748040	240457	32.14%
2020-10-04	799082	254977	31.91%
2020-10-05	699946	235207	33.60%
2020-10-06	669066	223047	33.34%
2020-10-07	674876	228355	33.84%
2020-10-08	675358	228400	33.82%
2020-10-09	689098	233405	33.87%
2020-10-10	747264	246924	33.04%
2020-10-11	765035	242652	31.72%
2020-10-12	706488	237304	33.59%
2020-10-13	691273	227149	32.86%
2020-10-14	694746	229781	33.07%
2020-10-15	680403	228537	33.59%
2020-10-16	641459	214509	33.44%
2020-10-17	723295	237275	32.80%
2020-10-18	740532	240626	32.49%
2020-10-19	677238	235070	34.71%
2020-10-20	650856	217086	33.35%
2020-10-21	651168	200702	30.82%
2020-10-22	644778	178397	27.67%
2020-10-23	543740	154692	28.45%
2020-10-24	677963	175990	25.96%
2020-10-25	703225	191819	27.28%
2020-10-26	638824	177427	27.77%
2020-10-27	595821	166165	27.89%
2020-10-28	612608	168367	27.48%
2020-10-29	77791	19644	25.25%
2020-10-30	219348	60386	27.53%
2020-10-31	664877	183234	27.56%
2020-11-01	686443	186992	27.24%
2020-11-02	616735	173536	28.14%
2020-11-03	695696	183441	26.37%
2020-11-04	621634	172184	27.70%
2020-11-05	608905	170548	28.01%
2020-11-06	615612	171747	27.90%
2020-11-07	654926	175928	26.86%
2020-11-08	689164	187142	27.15%
2020-11-09	617126	174699	28.31%
2020-11-10	607419	169847	27.96%
2020-11-11	626685	180690	28.83%
2020-11-12	594410	164133	27.61%
2020-11-13	618062	183000	29.61%
2020-11-14	645281	180257	27.93%
2020-11-15	656154	186123	28.37%
2020-11-16	612159	183394	29.96%
2020-11-17	590167	173469	29.39%
2020-11-18	598874	174707	29.17%
2020-11-19	608841	178534	29.32%
2020-11-20	619089	183374	29.62%
2020-11-21	654064	179479	27.44%
2020-11-22	679832	182505	26.85%
2020-11-23	697538	194599	27.90%
2020-11-24	587562	161407	27.47%
2020-11-25	648128	187566	28.94%
2020-11-26	602480	177829	29.52%
2020-11-27	612675	181333	29.60%
2020-11-28	653125	180378	27.62%
2020-11-29	668013	182924	27.38%
2020-11-30	614438	174598	28.42%
2020-12-01	627858	181623	28.93%
2020-12-02	634233	184964	29.16%
2020-12-03	599364	175042	29.20%
2020-12-04	624563	182056	29.15%
2020-12-05	654186	185674	28.38%
2020-12-06	666418	187843	28.19%
2020-12-07	617758	185139	29.97%
2020-12-08	609741	181524	29.77%
2020-12-09	629692	183871	29.20%
2020-12-10	614813	177816	28.92%
2020-12-11	635768	191048	30.05%
2020-12-12	662600	189167	28.55%
2020-12-13	689834	195236	28.30%
2020-12-14	656330	190079	28.96%
2020-12-15	522548	152112	29.11%
2020-12-16	567236	169432	29.87%
2020-12-17	625476	192753	30.82%
2020-12-18	638309	204260	32.00%
2020-12-19	683090	209762	30.71%
2020-12-20	721675	214321	29.70%
2020-12-21	660909	209682	31.73%
2020-12-22	623339	199401	31.99%
2020-12-23	640598	205037	32.01%
2020-12-24	737615	236418	32.05%
2020-12-25	754718	248686	32.95%
2020-12-26	694447	219020	31.54%
2020-12-27	700553	216693	30.93%
2020-12-28	687827	211169	30.70%
2020-12-29	700343	208560	29.78%
2020-12-30	731401	218421	29.86%
2020-12-31	968526	258570	26.70%
2021-01-01	955762	286696	30.00%
2021-01-02	709204	210906	29.74%
2021-01-03	700724	207846	29.66%
2021-01-04	686298	206722	30.12%
2021-01-05	658121	204534	31.08%
2021-01-06	644607	205636	31.90%
2021-01-07	686593	227519	33.14%
2021-01-08	675304	224076	33.18%

グラフにすると次のようになる。

f:id:shibacow:20210110134104p:plain

オレンジの線がリツイート率（全ツイートにおけるリツイート割合）だ（右目盛り）。実行された10/20から5%程度減っていることがわかる。仕様を元に戻した12/17以降、徐々にではあるが、元の数値 33%に戻りつつある。

10/29,10/30でツイート数、リツイート数が減っているのは元になるデータの取得に失敗したためだ（すいません）。両方失敗したので、同じ量減っており、リツイート割合は影響を受けない。

RT数は減っている。

日毎の推移を見る限り、tweet数は減ってないが、RT数は、23万RT台から16万RT台に落ちている。 RTをするために一瞬躊躇させることでRTを思いとどまらせる効果はあったと考えていよいかもしれない。また、仕様が戻った12/17以降20万に戻ったので、やはりデフォルトで引用RTにする効果はあったようだ。ただ、当初の目的であるデマ情報RTの抑制が出来たかどうかは、今後具体的なRTの中身を見て調査する必要がありそうだ。

実行されるナッジ

ナッジとは、もともとは肘で軽く突くを意味しており、アーキテクチャーやユーザー体験を制御することで、一定の公共的な目的を達成させることの総称だ。

日立のサイトから説明を引用しよう

ナッジ(nudge)とは、直訳すると「ひじで軽く突く」という意味です。行動経済学や行動科学分野において、人々が強制によってではなく自発的に望ましい行動を選択するよう促す仕掛けや手法を示す用語として用いられています。これは、その物や現象の良しあしに対する客観的な絶対評価よりも、物事をどう感じるかという主観的な比較評価により人間の選択が左右される心理傾向を利用したものです。

ポイントは、このRT数の減少は、twitter社が、ユーザーに対して強制してやらせた訳ではないということだ。twitter社はユーザーに対してRTするなと命令しなかった。RTすれば罰金を取ったり、アカウントを停止すると脅すこともなかった。ただ、RTボタンを押したあと、メッセージを書き込む画面を表示しただけだ。そして、ユーザーは今でも普通にRTできる。RT画面で何も書き込まずそのままRT押せば、今まで通りのRTが行える。

ポイントは、特に高圧的な態度を取ったりユーザーを説得することなしにユーザー行動を制御でいる点にある。

そして、この行為は、一私企業の行為のため、公共機関のような合意形成なしで行える。そして、上で紹介した記事が、アメリカ大統領選挙でのデマ情報の抑制のために行われたと書いたように、この行為は、アメリカ大統領選にすら影響を与えられる（あるいは影響を与えると危惧されている）。

ナッジなどは、まだ研究室段階であまりやられてないのかと考えていたが、今回twitter社は世界第級のSNS上で、特に反対の声を挙げられるわけでもなく、普通に実行してみせた。なかなかすごい時代になったものだ。

ナッジと設計主義

良くナッジという言葉は法学者や官僚から聞くが、よく考えたら法学者や官僚ってナッジの設計がうまいかどうかについては疑問符がつく。なぜなら法律はバックに実力組織（警察など）が控えており、無理やり命令を聞かせられる。一方、ナッジはそのような強制力は無い（強制力がなくても動くことを期待される）。そのため設計したが、意図通りに動かないとかユーザーが思ったふうに動かない例は増えるだろう。

むしろ、ユーザーが自分たちの意図通りに動かないことを「前提に」PDCAサイクルを回す文化があるWebサービスの企画やソーシャルゲームの運営のほうがこの手のノウハウをもっている。

ナッジで一番やってはいけないことは、「賢い俺様が考えた仕組みなら上手くいく」という態度だ。ソーシャルゲームの運営で最初に教え込まれるのは「ユーザーは想定通りに動かない」という事実だ。

謝辞

このようなデータを公開してくるtwitterに感謝する。

その他雑感

アメリカ大腸選挙の都合に振り回される我々って・・。

2020-05-26

炎上や誹謗中傷を防ぐアーキテクチャーは可能か？

概要

SNSの炎上は誹謗中傷があると、すぐ法制化しろとか刑事罰をかせという話になる。しかし、一方で炎上をネットから切り離すことで、ようはボヤに抑えることが出来ないかという検討はあまりされない。このエントリーでは、そのやり方をいくつか考察する。

まとめ

炎上は観客がいて成り立つ。SNSの拡散から切り離すことで、大火を小さな火に出来るのではないか？
誹謗中傷は、相手が読んでレスポンスを返すことで成立する。メッセージを届けない、もしくは、メッセージが届くまでの時間を長くすることで、やる気をそげるのではないか？

最初に考えること

SNSでは、あるメッセージが、「即時」に「全てのフォロワー」に届く。また、フォロワー外の人にも、即時に拡散する。これは、情報技術の発展によって生まれた利便性だが、それがプログラムで書かれている以上、「即時」に「全フォロワー」に届けたり、即時にフォロー外の人に届けなければならないという物理法則のような自然のルールではない。

あるランダムなフォロワーには、メッセージが遅延して届く。全フォロワーではなく、フォロワーに何割かにランダムに届くといった実装も可能なはずだ。このエントリーの趣旨は、その様に実装（アーキテクチャー）を制御することで、大炎上をボヤに、大量の誹謗中傷を少量に、といったダメージコントロールをシステムで実現できないかと考えるアプローチである。何でもかんでも法律で規制するよりは、副作用は少ないのではないかと考える。

炎上と隔離

この件に関して示唆を与えてくれたツイートは以下のツイートだ。

ネット上の炎上は「周囲の視線」が燃料なので言い争っている人たちを隔離すると瞬時に鎮火する。1980年代には、そういう機能が実装された掲示板というのがあって研究論文もあるのに、人類はいまだに炎上とうまく付き合えていない。みんな先行研究を無視しすぎだと、StackOverflowのJoelが言ってた https://t.co/hfbUx6HE8x
— 西村賢🐠Coral Capital / Ken Nishimura (@knsmr) 2018年3月16日

https://shibacow.hatenablog.com/entry/2020/05/26/033848

redditの全コミュニティーのうち、わずか1%(赤い点)のコミュニティーが74%の争いのキッカケを作ってる。このパターンをLSTMで深層学習して争いを予測するモデルを作ったので、モデレーターに対して注意喚起する空襲警報のようなシステムを作れるかもって。おもしろーい

ネット上の炎上は「周囲の視線」が燃料なので言い争っている人たちを隔離すると瞬時に鎮火する。1980年代には、そういう機能が実装された掲示板というのがあって研究論文もあるのに、人類はいまだに炎上とうまく付き合えていない。みんな先行研究を無視しすぎだと、StackOverflowのJoelが言ってた

この文で、西村氏は、言い争っている人たちを隔離すると瞬時に鎮火する。と書いていて、ここは実感に合う。つまり、言い争いが起きたときに、双方のツイートを拡散しなければ良い。拡散することを抑えることが表現の自由に抵触するなら、拡散のスピードを押さえれば良い。つまり、互いのヒートアップ度に応じて、そのツイートのインプレッション数が減っていき、多くの人に目に触れるまでに時間がかかる状態を作れば良い。

f:id:shibacow:20200526031453p:plain — 盛り上がれば盛り上がるほど、メッセージの拡散に時間がかかる

炎上はリアルタイムに多く人が知ることによって、大きな火になるので、全員に配信するのではなく、N%の人に配信、または、メッセージに配信にわざと遅延を起こさせ、全フォロアーが知るまで、24時間程度かかるみたいにすれば、大火を小さな火に出来るのではないか？

誹謗中傷と一人相撲

ある動画コメント配信サービスでは、誹謗中傷を書き込むと、書き込んだ本人にはそのメッセージが配信されるが、生放送を見ている人たちには届かないというシステムが有るという噂を聞いたことがある。誹謗中傷する人は、コメントを自由に書き込めるが、他の視聴者にコメントを配信する箇所でブロックされるための、他の視聴者には届かないメッセージを贈り続けることになる。

中傷は、被害者にも届くし、被害者のフォロワーにも届く、そのため、上で書いているように、中傷は、「（被害者に対する）周囲の視線」の変化を狙ってやる事が多い。そのため、ある被害者に向けられた中傷を、他のフォロワーには届けないというやり方が考えられる。

まとめ

上記で考えることは、とかく法規制に頼るのではなく、メッセージの拡散スピードや拡散人数をアーキテクチャーでコントロールすることで、被害を最小化出来ないかという思考実験だ。その際に、現在のSNSで実施されている、「即座」に「全てのフォロワー」にメッセージを拡散するという前提を捨てて、他のSNSのありようがないかということを考えて見る必要がある。

最後に

私は、ニフィティサーブなど古い掲示板からネットを使っている人間だが、常々感じるのは、私達は炎上や中傷を見るのが大好きだという点にある。炎上を防ぐ実装は考えられうが結局の所炎上があるSNSの方がPVが得られ私達人類はどうも炎上が好きらしいということが、最も厄介なところだ。上のツイートで紹介されているように「1980年代には、そういう機能（炎上を防ぐ機能）が実装された掲示板というのがあって研究論文もある」にもかかわらずそれがスタンダードになっていないということは、私達が、炎上を見たり、中傷を見たりすることが好きだという薄暗い欲望が最大の原因であろう。

例えば、炎上するメッセージの拡散が遅延する twitter2.0が出来たとして私達はそのサービスを使うだろうか？

2019-09-07

ニコニコ動画はオワコン化したか？という記事の落ち穂拾い

先日、ニコニコ動画はオワコン化したか？ - shibacowのブログというブログを書いた。そのエントリーを上げて、反応を頂いたので紹介する。

ニコニコ動画でのコメント数の推移

上記ブログでは、次のように書いた。

一日あたりのコメント投稿数推移

ニコニコ動画の一日あたりのコメント数（３ヶ月中央値）

一日あたりのコメント数は次のように推移している。

2012年に180万あったコメントは、徐々に減り2018年には40万になったが最近は、60万まで戻している。

また、コメント長に関して、次のように書いた

スマホではコメントが打ちづらいので、動画にコメントがもらえず、承認欲求が満たしづらいという仮説

この仮説は、上記の一日あたりのコメント投稿数推移を見れば、たしかにコメントは減っている。しかし、スマホでコメントが打ちづらいというのは本当だろうか？

ニコニコ動画では、2018年までも、動画データ、コメントデータをニコニコデータセットとして公開している。

情報学研究データリポジトリニコニコデータセット

全動画のコメントを公開しているので、そのコメントの文字長を調べてみれば、コメントが打ちづらいかどうかは分かる。コメントが打ちづらければ、コメント数も減るし、コメントの長さも短くなるはずだからだ。

それで、ニコニコデータセットを元に年ごとのコメントの文字長を調べてみた。平均を取ると、あらしのような長いコメントの影響を受けるので、分析には四分位数を使う。コメント投稿の年を元にその年のコメント文字長の25%位50%位75%位を調べた。

年 2007 2008 2009 2010 2011 2012 2013

25%位 4 4 4 4 4 4 5

50%位 8 8 8 8 8 8 8

75%位 13 13 13 13 13 13 14

年 2014 2015 2016 2017 2018

25%位 5 5 5 4 5

50%位 8 9 8 8 9

75%位 14 14 14 14 14

そうすると、スマホが主流になった2018年でも、投稿されたコメントの文字長は、減ってない。むしろ増えている。8文字から9文字になっていることが分かる。私も紹介したエントリーの作者と同じ様にスマホになるのでコメント文字長は減るのかと思ったが減らなくて驚いている。

スマホではコメントが打ちづらいので、動画にコメントがもらえず、承認欲求が満たしづらいという仮説の結論

上記より、動画にコメントがもらえずというところは、コメント数も減っているため、妥当だと思われる。「スマホでコメントが打ちづらい」は、コメントの文字長がPCのときと変わらないのでなんとも言えない。

この調査に関して次のような反応を頂いた

コメントはほぼPCからしか行われていない。

電極さんから、以下の意見を頂いた。

～スマホはコメ打ちにくいからコメ数が減った説の検証～

仮説：打ちにくいのならコメント全体の文字数は減っているだろう
方法：全コメントデータDLして文字数の推移を調査
結果：むしろ文字数は年々増えていた

結論：スマホはコメ打ちにくいからコメ数減った説は不明https://t.co/itsONHVIRO
— 電極 (@denkyoku0041) September 1, 2019

データを出しながら議論すると反証するデータを出してもらえるのでありがたい。
スマホでコメントされにくいとは思っていたがパソコンの方がコメントがまだ多いとは思わなかった（スマホシフトの戦略の是非に関わる）。 https://t.co/7DKyzBD50L
— 芝尾幸一郎 (@shibacow) September 1, 2019

まとめると、「ニコニコ動画のコメントはほぼPCから打たれている」との指摘だ。頂いた資料かも、スマホからコメントを打たれていない様子が伺える。

私の上記仮説では、視聴者の視聴環境がPCからスマホに変わっても、書き込むコメントの文字長が変わらないのではないかと推測したが、そうではなくて、そもそもスマホからはコメントを書き込まない。そのため、コメントはPCからしか書き込まれないが故に平均の文字長が短くならないと言うことだ。

これは、結構衝撃的だ。ニコニコ動画は、動画視聴と一緒にコメントを読むという体験で人気が出た。つまり、コメントを書き込んでくれる視聴者が居てサービスが成り立つ。そのためスマホシストが進み、PCを持つユーザーが減ればコメントも減り結果的にニコニコ動画も人気も落ちる。という事になりそうだ。

運営も手軽にレスポンスを返せるように、ニコルを作ったりしているが、なかなか難しいのかも知れない。

データに基づいた反応ありがとうございました。

具体的なデータを元に議論をすると、有用なデータをいただけるのでとてもありがたい。

2019-08-25

ニコニコ動画はオワコン化したか？

概要

定期的にニコニコ動画はオワコンであるとか、ニコニコ動画はあとn年で終了という記事が注目を集める。最近も次の記事が注目を集めた。

ニコニコ動画は確実にあと2～3年で終了する｜ﾜｯﾁｮｲ｜note

「まだニコ動には需要がある」と思ってる人達が一部存在していた件｜ﾜｯﾁｮｲ｜note

しかしそのような記事に数字の裏付けあったことはあまりない。上の記事でも自分の思いが先行しており、もしその仮定が正しいのならばどのようにデータとして観察できるかという話はない。今回はそれでは上の主張は妥当であるか？もしその仮定が正しいならそれは数値にどのように現れるかという点を検証していく。

上記ブログの主張

上記ブログでは次のような主張を行っている。

今は面白い動画が無く、 (かっては)面白い動画がたくさんあった。そのため視聴者は離反した。
スマホでが主流になり、若い優秀なクリエイターがPCが必要な凝った動画を作らなくなった。
スマホではコメントが打ちづらいので、動画にコメントがもらえず、承認欲求が満たしづらい。

それでは実際にそうなのかを調べてみたい

数値による検証

オワコン化の定義

オワコンと言っても人によって定義が異なる。自分にとって面白い動画がないという定義から、超会議の参加者数や単に動画のランナップが気に食わないのでオワコンだという人もいる。ここでの定義は、プレミアム会員数及び下で提示した一日あたりの動画視聴回数をもとに考える。

このエントリーでの定義は、プレミアム会員数が減少に転じた2016年をオワコン化の定義として一旦仮定する。

f:id:shibacow:20190826012951p:plain — プレミアム会員数推移

「ニコ動」有料会員、減少ペース加速 3カ月で14万人減 - ITmedia ビジネスオンライン

また、下にあるように一日あたりの動画再生回数も、2016年をピークにしているため、2016年からいわゆるオワコン化が始まったと考える。

f:id:shibacow:20190822013805p:plain — ニコニコ動画の一日あたりの視聴回数（３ヶ月中央値）

オワコンというと響きが良くないが、成長期を脱して、安定期もしくは衰退期に入り始めた状態のことを指すのだろう。

動画再生数、動画投稿数、コメント数の推移

まず動画再生数動画投稿数コメント数の推移を見てみよう。

http://flapi.nicovideo.jp/api/getheadline　こちらのURLで、現時点の総投稿動画数、総視聴回数、総コメント数が取得できる。

ちなみに2019/08/22現在の数値は次のようになる。

総動画投稿数	総視聴数	総コメント数
16,812,782	104,683,668,503	5,667,751,094

このURLの数値を毎日取れば、その差分は一日毎の動画投稿数・視聴回数・コメント数になるはずだ。私は2011/07/07から2019/08/21 まで毎日その数値を取得している。そのデータを使えば、2011年から2018年までの、一日ごとの動画投稿数・視聴数・コメント数が分かる。

一日あたりの動画視聴数推移

まず、一日あたりの動画投稿数の推移を見てみる。日によって値の変動が激しいので３ヶ月毎にその期間の中央値を用いて集計した。

2012年には、2000万再生数だったがその後再生数は増え、2016年には3500万再生を超える。しかしその後再生数は急激に減少し、2017年には2500万再生になるが、その後減少幅は緩やかになり、2019年現在では、2000万を少し超える再生数で推移している。

一日あたりの投稿数推移

一日あたりの動画投稿数は、次のように遷移している。

f:id:shibacow:20190825150250p:plain — ニコニコ動画の一日あたりの動画投稿数（３ヶ月中央値）

2012年には、一日5000件あったがその後徐々に減少し、最近では一日2500件程度だ。確かに上紹介したエントリーが指摘するように動画投稿者数は減っている。¹

一日あたりのコメント投稿数推移

f:id:shibacow:20190825151049p:plain — ニコニコ動画の一日あたりのコメント数（３ヶ月中央値）

一日あたりのコメント数は次のように推移している。

2012年に180万あったコメントは、徐々に減り2018年には40万になったが最近は、60万まで戻している。

面白い動画の減少が、ユーザの離反を招いたという仮説は正しいか？

上記エントリーでは、「面白い動画の減少」がユーザーの離反を招いたという仮説を提示している。

面白い動画の投稿数を調査することは難しい（面白いの定義が人によりまちまちだから）。しかし、面白い動画は投稿動画数の何割かだろうから投稿動画数に連動すると仮定することはできる。そうすると投稿動画数は、2012年から減り始めており、2016年までユーザーの視聴数が伸び続けていることと整合性が取れない。下の図のように、動画投稿数と視聴数の減り方に差があり、投稿数の中に一定数面白い動画があり、それが減ったのならそれに連動してもっと早くに動画視聴者数が減らなければならないはずだ。

f:id:shibacow:20190825152601p:plain — 動画投稿数と視聴数の推移

一方、ニコニコ動画は、新規の投稿動画だけでなく過去の動画もある。そのため過去動画を見ていたため、視聴者数が減らないのではないかという仮説もあり得るだろう。つまり、累計投稿動画数と、視聴者数を比べてみたらどうかという指摘だ。それをグラフ化するとこうなる。

f:id:shibacow:20190825153739p:plain — 累積動画投稿数と視聴数の推移

今度は逆に、動画は増え続けているのに、2016年を境に、再生回数は減っている。面白い動画は、動画投稿数に対して一定の比率であり、それが累積的に増えていくなら、2016年で、視聴数が減っていくことと整合性が取れない。

面白い動画の減少がユーザーの離反を招いたという仮説の結論

面白い動画の減少がユーザーの離反を招くなら、2012年のから動画視聴数は減るはず。累計の動画投稿数とも連動しておらず、面白い動画の減少がユーザーの離反を招いたという仮説はあまり支持できない。

スマホでが主流になり、若い優秀なクリエイターがPCが必要な凝った動画を作らなくなった

この仮説はどうだろう？少なくとも、2012年から、動画投稿数は減り始めており、それとそれと反比例するように、スマホのユーザーは増えているのでこの仮説は、正しいように思える。少なくとも、それに反対するようなデータは見つからなかった。新規の動画投稿者数の推移を見れば分かるかも知れないが、私は持っていない。

スマホではコメントが打ちづらいので、動画にコメントがもらえず、承認欲求が満たしづらいという仮説

この仮説は、上記の一日あたりのコメント投稿数推移を見れば、たしかにコメントは減っている。しかし、スマホでコメントが打ちづらいというのは本当だろうか？

ニコニコ動画では、2018年までも、動画データ、コメントデータをニコニコデータセットとして公開している。

情報学研究データリポジトリニコニコデータセット

全動画のコメントを公開しているので、そのコメントの文字長を調べてみれば、コメントが打ちづらいかどうかは分かる。コメントが打ちづらければ、コメント数も減るし、コメントの長さも短くなるはずだからだ。

それで、ニコニコデータセットを元に年ごとのコメントの文字長を調べてみた。平均を取ると、あらしのような長いコメントの影響を受けるので、分析には四分位数を使う。コメント投稿の年を元にその年のコメント文字長の25%位50%位75%位を調べた。

年	2007	2008	2009	2010	2011	2012	2013
25%位	4	4	4	4	4	4	5
50%位	8	8	8	8	8	8	8
75%位	13	13	13	13	13	13	14

年	2014	2015	2016	2017	2018
25%位	5	5	5	4	5
50%位	8	9	8	8	9
75%位	14	14	14	14	14

そうすると、スマホが主流になった2018年でも、投稿されたコメントの文字長は、減ってない。むしろ増えている。8文字から9文字になっていることが分かる。私も紹介したエントリーの作者と同じ様にスマホになるのでコメント文字長は減るのかと思ったが減らなくて驚いている。²

スマホではコメントが打ちづらいので、動画にコメントがもらえず、承認欲求が満たしづらいという仮説の結論

上記より、動画にコメントがもらえずというところは、コメント数も減っているため、妥当だと思われる。「スマホでコメントが打ちづらい」は、コメントの文字長がPCのときと変わらないのでなんとも言えない。

カテゴリごとの再生数推移

上記紹介エントリーでは、ざっくりニコニコ動画全体として考察している。しかしニコニコ動画といっても、ゲーム実況、ボーカロイド、歌ってみた、TRPG、アイマスなど様々なカテゴリーがある。ニコニコ動画全体だけ見ても、あまり詳しいことはわからない。カテゴリー毎の推移を見ることで、実際にユーザー行動にどのような変化があったかを見ている。

カテゴリーごとのランキングを見ることで、カテゴリーごとの趨勢を調査する

2019年06月25日にランキングを変更するまで、各カテゴリーごとのランキングごとに、各動画のデイリー視聴数を取得できた。³ そのデータには、total-view、total-mylist,total-resの他に、日毎の視聴数、コメント数、マイリスト数（daily-view,daily-res,daily-mylist）が手に入った。

それらカテゴリーごとの、ランキング動画の視聴数を合算すれば、そのカテゴリーの（ランキングであるが）趨勢を調べることができる。⁴ それらを調査したグラフは次のようになる。

各カテゴリランキング動画再生数の推移

ニコニコ動画でも特に人気の高いカテゴリのランキング入毎の再生数をグラフ化した。

f:id:shibacow:20190825184525p:plain — カテゴリランキング再生数推移

ゲームは、2016年10月4日より、ゲームと、ゲーム実況の２つのカテゴリに別れたが、過去からの推移を見るため、ゲーム+実況のグラフを作っている。

それで見ると、2011年から2015年までゲームカテゴリの再生数が伸び、2015年-2016年を境に、再生数は減少に転じている。

また、例のアレは、2015年に人気が出て2017年にピークになり、その後再生数は減っている。

アニメカテゴリは、2015年をピークに大体3分の２くらいの再生数になっている。歌ってみた、エンターテイメント、ボーカロイドカテゴリーは、そこまで減ってはいない。

東方、アイマス、ボカロ、御三家の動き

ニコニコ動画では、東方、アイドルマスター、ボーカロイドは、御三家と呼ばれている。その３カテゴリの推移を見る。

f:id:shibacow:20190825200729p:plain — ニコニコ動画、御三家のランキング再生数推移

見たところ、

ボカロとアイマスは減っていない、東方はだいぶ再生数は減っている。

歌ってみた、踊ってみた、描いてみた、演奏してみたの「してみた系」

歌ってみたなどのやってみた系の推移を見る。上記エントリーでも TikTok に投稿者が移行したと書いているが、もしTikTokと競合するとしたら、やってみたのカテゴリが競合するだろう。

f:id:shibacow:20190825201456p:plain — やってみた系推移

2017年位から再生数は減り、2/3くらいの再生数になっている。TikTokに流れた可能性は否定できないが、再生数を見るに影響は限定的かも知れない。

ゲーム+実況カテゴリの退潮

上の各カテゴリで見たが、最も大きく減っているのは、ゲーム+実況カテゴリだ。2016年の一日250万再生から2019年に100万再生に減っている。その次に再生数があったアニメカテゴリは160万再生から100万再生と、再生数を減らしているが、アニメの番組編成によって人気が上下するようにも見える。

歌ってみたや、ボーカロイドは減っておらず、例のアレは一日50万再生から、100万再生に伸び、その後、50万再生に落ち着く。

上で定義したように、ニコニコ動画のオワコン化は、2016年から始まったと考えることができる（プレミアム会員が減少に転じ、また一日あたりの動画再生数もピークを迎える）。同時期から、ゲーム＋実況の再生数も減少に転じている。その様に時期が一緒であることから、ニコニコ動画退潮に関して最も大きな影響を与えたのは、ゲーム+実況の不調であるように思える（他のカテゴリも減ってはいるがそのものカテゴリの再生数がもともと少なかったり大きなインパクトを与えてないカテゴリが多い）。

ゲーム+実況カテゴリの退潮と新しい配信環境の勃興

2016年にニコニコ動画の動画視聴数が、下方に向かうが、その時期に何が起こったかというと、TWITCHやMirrativなど、ゲーム配信により適したプラットホームの勃興だ。ニコニコ動画で最も大きなカテゴリだったゲームカテゴリが、ゲーム配信により適したプラットホームとの競争によって、ゲーム実況を見ていた層のユーザーに離反されたのではないか考えている。

この仮説に関してはそれを裏付けるデータが無いため、確度は高くない。

ニコニコ動画が活かせる資産

上で紹介したようにゲーム関連の動画はニコニコ動画では再生数が大幅に減っている。ゲーム関連のユーザー離れが起こっているのかも知れない。しかし、ボーカロイドやアイマスなどのコンテンツは未だに再生数も多く、他の動画サービスにユーザーを取られたとまでは言えない。アニメも定期的に盛り上がっているのを見ても、配信するコンテンツ次第で、人が集まる可能性は残っている。

まとめ

定期的にニコニコ動画オワコン説が流れる
しかし定量的に分析する人は少ない。
このエントリーでは、オワコンと言ったときの定義、またそれがいつ始まり、要因は何であるのかを調べた。
オワコン化は2016年から始まっており、同時期にゲーム+実況の再生数が大きく減っているため、退潮の一番大きな要因は、ゲーム視聴者のニコニコ動画離れではないかと、仮定した。

（補足）仮説に対してデータを用意するということ

ニコニコ動画の退潮に関しては様々な理由を上げる人は多いが、実際にその理由に対して、データを用意する人は少ないように思える。自分の提示した仮説がもし正しいなら、それはどのような数値に現れるかという視点を持つのは大事だ。

謝辞

ニコニコ動画は批判されることも多いが、データ分析をする人間から見ると、様々なデータを提供してくれる日本でも稀な企業だ。例えば、ニコニコ動画APIやニコニコデータセットなど、結構多くのデータを提供してくれる。個人で、Youtubeのランキングサイトを作っているが、ランキングの取得しやすさでいうと、ニコニコ動画の方がやりやすい。色々と大変だと思うが、このデータをオープンにするカルチャーは残していってもらえると助かる。

セガのリズムゲーム　マイマイにように自動でニコニコ動画に投稿するゲームもあるので、そのような自動で大量に投稿するコンテンツの影響は除外していない。↩
こちらに指摘に対して、ニコニコ動画のコメントは大半、PCから書き込まれているのではないかという指摘を頂いた。詳しくは、こちらに書いている。ニコニコ動画はオワコン化したか？という記事の落ち穂拾い - shibacowのブログ ↩
http://www.nicovideo.jp/ranking/fav/daily/all?rss=2.0 などを使えば、APIを取ることができた。↩
ランキングの視聴数なので、埋もれた良い動画達に広く薄く再生数が集まってもそこは感知できないが、ざっくりした指標にはなるだろう。↩

2017-01-04

Googleが無能だと言う前に出来ることってあるだろうか？

yuko-hiromさんの、せめてはっきり言おうではないか. Googleは無能であると - yuko-hirom’s blog というエントリーが人気だ。簡単にまとめるなら、Google検索でPV狙いの嘘ニュースが検索上位に来てしまうという話だ。そしてそれを放置しているGoogleは無能だという主張だ。

それでyuko-hiromさんは「Googleは無能だと言おう」と主張する。

でも代替案もなしに無能だと主張したところでスルーされるのが関の山だろう。だとするなら代替案を考えるのが早いだろう。

ページランクという指標に全てが含まれているのが問題じゃないかな？

グーグルの検索結果はページランクで決まる。そしてそれは一次元の構造になっている。つまりその情報の正しさであるとか、ある事象についてポジティブでに語っているかとかネガティブに語っているかという内容についての評価はしない。

下の図でいえば、左側の図がそうだ。

だったら、検索結果について、ポジティブに言及しているか、ネガティブに言及しているかその程度を、示すUIを付け加えれば良いのではないか？

下の図でいえば、右側の様に、ページランクという軸と、記事がポジティブに言及しているかネガティブに言及しているかの２軸で検索結果を図示すれば良いではなかろうか？

図の上の、タイトルをクリックすれば目的のページに遷移すれば良い。

そうすれば、例えばネガティブな情報が上に来たところで、位置が違うのだから、ポジティブな情報を邪魔することは無い。

f:id:shibacow:20170104041213p:plain

UIにしか介入しないので、Googleそのものを作り変えることはない。

要は嘘ニュースが上位に来るのは、UIの問題なので、UIにのみ介入すれば、Googleそのものを作り変える必要は無い。

検索サービスというのは、webページの情報を収集する「クローラー」とその収集した情報を整理する「インデクサー」と検索ワードに応じて適切に検索結果を返す「ビューアー」からなっている。

ページランクの上位に来たものの順位を再整理すれば良いのだからGoogleそのものを作る必要はない。単純に検索結果を再整理して、表示すれば良いのだ。下の図でいえば、Googleのビューアーの上に、薄い再整理層を作れば良いことになる。

f:id:shibacow:20170104042601p:plain

実際の実装

じゃあ、実際にどのようなステップで作れば良いだろうか？

サーバ側では以下の作業が必要になる。

論争を含みそうな検索ワードで、グーグル検索を行い、上位数千件の検索結果を取得する。
その検索結果を元に実際の記事の内容を取得する。
機械学習のクラスター分析(k-meansとか、テキストの分析に適したアルゴリズムで)を用いて、それぞれを記事のポジティブ・ネガティブに分類する。
それを定期実行して、記事のDBを作る。

ブラウザー側では、以下の作業が必要になる。

Firefoxなり、Chromeなりのadd-onを作る。
特定の検索語に反応して、検索結果の上段に、２軸にマッピングしたUIを差し込む。
サーバ側で作った記事DBをその場所に表示する

とやれば良いではないだろうか？自分が使ってみて使えると判断できればその、add-onを他人に勧めればよい。

無能だと罵る前に、工夫できない場所はないか探す。

何かシステムには、何かしら入り込める鋤はあるし、ハックできる場所はある。でもそれらを探そうとせず、ただ罵るだけなら、それは何も考えていないの大して変わりはない。インターネットは幸いなことに、何かを始めるのに許可を得る必要はない。罵る前に代替案が無いか考えてみることは良いことだ。インターネットの良いところは、yuko-hiromさんが上記のシステムを誰の許可も無しに、自分で作って自分で実験できる点にある。代替案を考えることをせず、ただ現状を呪うだけなら、それはインターネットの自由を殺すことと大差はない。

思想の自由市場という考え方

この案では、嘘ニュースの排除は行わなかった。アメリカでは「思想の自由市場」という考え方がある。正しい考えに到達するにために、とりあえず全ての思想を市場に載せ、市場における淘汰のプロセスを経て、真理や正しい知識へ近づいて行くという考え方だ。嘘ニュースは全てフィルタリングするという発想は、それはそれで、事前検閲を呼び込んでしまい、副作用も大きいだろうと考える。

2016-11-23

ヒラリー・クリントンの遊説先と選挙戦結果

ヒラリー・クリントンが大統領選挙に負けた。それは衝撃を持って伝えられた。

ヒラリー・クリントンの敗因の一つが、アメリカの中西部の有権者を重視しなかったのではないかという説がある。

例えば、このニュースウィークの記事などはそのような記事だ

www.newsweekjapan.jp

(ペンシルベニア州)ノーサンプトンのような、これまで確実に民主党を支持してきた郡をひっくり返すトランプ氏の能力は、米大統領選での同氏の勝利に貢献した。民主党の選挙戦略にとって防波堤とも言えるペンシルベニアや他の「ラストベルト（さびついた工業地帯）」と呼ばれる中西部・北東部地域で勝利するためには、それは決定的に重要であった。また、フロリダやノースカロライナといった激戦州を制する原動力にもなった。

トランプに比べて、ヒラリーは、この中西部、北東部地域のラストベルトを重視しなかったので、選挙に敗れたという説だ。票が取れなかったのは事実だが、それではヒラリーは、それらの地域を軽視したのだろうか？

実際に軽視していたかどうかは、彼女がどの場所に遊説したかを見ればわかるのではないか？彼女の遊説先を集計すればどこに重点をおいていたかわかるかも知れない。

ヒラリーの遊説先

ヒラリーの遊説先はこちらに、まとめられている。

https://hillaryspeeches.com/speech-archive/2013-2/

こちらの、Speech Archiveを見れば、何年にどこでスピーチをした(遊説をしたかがわかる)。

その場所をCSVでまとめた。

https://dl.dropboxusercontent.com/u/52083005/sdf.csv

2013年からのデータがあるのでそちらをまとめた。

多い順に並べると次の様になる。

州名	遊説回数
New York	200
Iowa	169
California	167
Florida	133
New Hampshire	113
Pennsylvania	104
Ohio	94
Washington, D.C	86
North Carolina	83
Nevada	66
Michigan	61

https://dl.dropboxusercontent.com/u/52083005/sdf3.csv

そちらを、地図にマッピングしたものはこちら。

ヒラリーがラストベルトを重視したかというのが話題なので、ラストベルトにどのくらい行ったかを見てみよう。

ラストベルトの地図はこちら

Rust Belt - Wikipedia

ラストベルトの定義はこちら。

ラストベルト - Wikipedia

インディアナ州とオハイオ州の北部、ミシガン州のロウアー半島南部、ウィスコンシン州のミシガン湖岸特にミルウォーキー周辺、シカゴとイリノイ州北東部、ニューヨーク州北部特にバッファロー周辺、ニューヨーク市とニュージャージー州北部、ペンシルベニア州の大半、ウエストバージニア州の北部特に北部ペンハンドルと呼ばれる地域が入っている

ラストベルトへの遊説回数

州	遊説回数
New York	200
Iowa	169
Pennsylvania	104
Michigan	61
Illinois	42
Washington	19
Indiana	11
West Virginia	4

実際の選挙勝敗はこちら

ペンシルベニアやミシガンなど結構行っているように見える。

ペンシルベニアなどは、前回民主党が取ったが、奪われている。