ニコニコ動画、ここ5年の全視聴数推移を調べた。

概要

ニコニコ動画が、サービス開始からそろそろ10年になるらしい*1。

夏の風物詩のように、ニコニコ動画衰退論がささやかれるので、実際のところどうなのかをまとめてみた。

ニコニコ動画では、このページhttp://www.nicovideo.jp/video_topで、総動画数総再生数総コメント数を調べることが出来る。 2011年よりこの数値をとっている。表示されるのは総再生数なので、一日ごとの差分を見れば、再生数がどの程度変動しているか分かる。

pythonの分析環境Project Jupyter | Homeと言うものがありそれを使ってみたかったので、分析してみた。

昔書いたこちらの記事のアップデート記事である。

shibacow.hatenablog.com

2011年からの一日の総視聴数

2011年年からの1日の総視聴数をグラフにすると次のようになる。変動を見やすくするため、四半期(90日)単位のまとめた*2。

赤い線は90日をまとめた上での中間の値(中央値)青の4角は、それぞれ、90日の視聴数を、小さい順に並べて、25%の位置にある値と75%にある値の範囲である。まあ、一日の平均的な視聴数はそのくらいにあると考えれば良い。

また、縦軸の1-5はそれぞれ、一千万再生から五千万再生に当たる。横軸の2011_3は2011年3四半期(2011年6月-9月)に当たる。

f:id:shibacow:20161105030343p:plain

2011年は、大体二千万再生くらいだったが、2015年-2016年では三千万から四千万再生くらいだ。

2011年からの一日の総コメント数

f:id:shibacow:20161105034006p:plain

コメント数は、2011年から減り始め、2013年には一日100万コメントを割り込むようになった。最近は、更に減り、70万コメント位になっている。スマホでの視聴ではコメントを打ちにくくそれが、影響しているのかも知れない。

2011年から一日の投稿動画数(純増)

一日の動画投稿数。本当は動画投稿数とは少し異なり、動画の純増数をグラフ化した。ニコニコ動画は、動画の削除も盛んで、一日の投稿動画の総数の差では、投稿数から削除した数を引いたものしか分からない。

f:id:shibacow:20161105034759p:plain

2011年には、一日5000動画ほど増えていたが、最近は3000ちょい位。横ばいから若干下がっているようにも見える。これは、動画投稿数が減ったのか、動画投稿数は一定だが削除数が増えたのかは分からない。投稿動画のサイズ数が100MBから1.5GBに変わったのでそれが今後影響するだろうか。

まとめ

ニコニコ動画の2011年から2016年までの一日単位の、総動画視聴数、総コメント数、総動画投稿数をまとめた。変化の早いネットの世界で、10年もサービスを提供できているのがすごいなと思った。次の十年、ニコニコ動画はどう変化するのだろうか？

おまけ

前の記事と同様に、他の方が追試出来るように元になったデータをおいておきます。

https://dl.dropboxusercontent.com/u/52083005/%E3%83%8B%E3%82%B3%E5%8B%95%E8%A6%96%E8%81%B4%E6%95%B0%E6%8E%A8%E7%A7%BB%282011-2016%29.csv

カンマ区切り、日付、総視聴数、動画投稿数、コメント数になっています。

date	total_view	total_video	total_res
2011-07-07	25668498001	6215110	3171405319
2011-06-29	25519243483	6175177	3159675814
2011-07-05	25629892748	6206050	3168753300
2016-11-03	79431428013	13892040	5127220695
2016-11-04	79469769819	13895552	5127856263
2016-11-05	79501400310	13898666	5128197883

このページhttp://www.nicovideo.jp/video_top下部にある、

総動画数 13,899,563 (1234),総再生数 79,508,387,456,総コメント数 5,128,496,130

を毎日取ったデータになっています。

おまけ(Jupyter-notebook)での分析事例

今回始めてJupyterを使ってみたが、結構便利だった。特にpythonのデータ分析ライブラリpandasとの連携は結構便利だった。実際どのようにデータをまとめたか、実例を示す。

パスワード等は、dotenvで秘匿した。

import pymysql
import pandas.io.sql as psql
import pandas as pd
from dotenv import load_dotenv, find_dotenv
load_dotenv(find_dotenv())
import os

connection = pymysql.connect(host=os.environ.get("MYSQL_HOST"),
                            user=os.environ.get("MYSQL_USER"),
                            password=os.environ.get("MYSQL_PASS"),
                            db=os.environ.get("MYSQL_DB"),[f:id:shibacow:20161105030343p:plain]
                            charset='utf8mb4',
                            cursorclass=pymysql.cursors.DictCursor)

集計の元になるデータはMySQLに保存しているのでそれを取得する。

%matplotlib inline
sql="select date_format(date,'%Y-%m-%d') as date,total_view,total_video,total_res from head_line where hour(date) = 0;"
df = psql.read_sql(sql, connection,index_col=['date']) # pandasのDataFrameの形でデータを取り出す
connection.close()
df

データを取り出す。生のデータは下記のようなデータ。

	total_view	total_video	total_res
date
2011-07-07	25668498001	6215110	3171405319
2011-06-29	25519243483	6175177	3159675814
2011-07-05	25629892748	6206050	3168753300
2011-07-08	25688332251	6220608	3172805412
2011-06-30	25532404679	6179159	3161062606
2011-07-06	25649441785	6210713	3170208631
2011-07-02	25566192673	6188544	3163677078
2011-07-03	25586929485	6194878	3165350407
2011-07-10	25697841451	6230748	3175964918
2011-06-28	25504077880	6171226	3158244709
2011-07-04	25610962630	6201121	3167275560
2011-07-09	25676175057	6225132	3174180719
2011-07-01	25550751270	6183766	3162389186
2011-07-11	25722218681	6236701	3177878150
2011-07-12	25740820291	6240772	3179341304
2011-07-13	25758942644	6244412	3180828088
2011-07-14	25776853770	6248912	3182241856
2011-07-15	25795989564	6253650	3183695290
2011-07-16	25815077220	6258060	3185161503
2011-07-17	25839078907	6264020	3186957844
2011-07-18	25862885471	6269457	3188856253
2011-07-19	25888359965	6275589	3190803602
2011-07-20	25910349992	6281083	3192720554
2011-07-21	25932553442	6286115	3194525492
2011-07-22	25954017328	6291405	3196286224
2011-07-23	25974682603	6296178	3198055768
2011-07-24	25994094398	6301902	3199918724
2011-07-25	26017595943	6307814	3201901581
2011-07-26	26037201371	6311686	3203648580
2011-07-27	26057985435	6316005	3205519576
...	...	...	...
2016-10-07	78540469776	13805528	5111521033
2016-10-08	78571868061	13808908	5112057667
2016-10-09	78610591273	13813170	5112754887
2016-10-10	78648629467	13817141	5113513792
2016-10-11	78688111980	13821629	5114229736
2016-10-12	78716649700	13823269	5114907735
2016-10-13	78750017702	13826416	5115431383
2016-10-14	78782252333	13829280	5115935421
2016-10-15	78808116368	13832072	5116417915
2016-10-16	78848927694	13836082	5117085534
2016-10-17	78890787429	13840397	5117836803
2016-10-18	78913288918	13842122	5118411190
2016-10-19	78946009528	13844557	5118922663
2016-10-20	78975480428	13846753	5119285619
2016-10-21	79008786862	13849860	5119930731
2016-10-22	79036248402	13852872	5120442702
2016-10-23	79072535276	13856393	5121110246
2016-10-24	79111390199	13860591	5121860183
2016-10-25	79143498816	13864002	5122408876
2016-10-26	79173603174	13866512	5122918150
2016-10-27	79205807745	13869340	5123404989
2016-10-28	79232873844	13872029	5123888573
2016-10-29	79264668078	13874739	5124400200
2016-10-30	79301912653	13878326	5125031457
2016-10-31	79343199373	13883244	5125730243
2016-11-01	79373571612	13887162	5126220221
2016-11-02	79400805678	13889885	5126748616
2016-11-03	79431428013	13892040	5127220695
2016-11-04	79469769819	13895552	5127856263
2016-11-05	79501400310	13898666	5128197883

1947 rows × 3 columns

df2=df[['total_view','total_video','total_res']].diff().dropna()
df2.index=pd.to_datetime(df2.index)
df3=df2.where(df2 > 1).dropna()
df4=df3.query('total_res < 3000000 & total_video < 8000 & total_view < 70000000')

一日単位のデータは、どんどん増えていくので、前日との差分を求める(diff)。前日との差分なので一番最初のデータは無い(NaN)になるので、それは除外する(dorpna)。

数値がおかしくて、前日との差分がマイナスになったり極端に大きかったりするのでそれらのデータは除外する。

keys='total_view'
#df3[keys].hist(bins=15)

df4.boxplot(column=keys,by=df4[keys].index.map(lambda x:"{}_{}".format(x.year,x.quarter)),rot =270)

視聴数の推移を求める。boxplotでやたら横幅が広い画像が出たがなぜだがわからず。

f:id:shibacow:20161105030343p:plain

keys='total_res'
#df3[keys].hist(bins=15)

df4.boxplot(column=keys,by=df4[keys].index.map(lambda x:"{}_{}".format(x.year,x.quarter)),rot =270)

コメント数の推移を求める。

f:id:shibacow:20161105034006p:plain

keys='total_video'
#df3[keys].hist(bins=15)

df4.boxplot(column=keys,by=df4[keys].index.map(lambda x:"{}_{}".format(x.year,x.quarter)),rot =270)

動画投稿数の推移を求める。

f:id:shibacow:20161105030343p:plain

*1:サービス開始は2006年12月12日だそうだ

*2:箱ひげ図という

shibacowのブログ

ニコニコ動画の全視聴数の推移 2011-2016

ニコニコ動画、ここ5年の全視聴数推移を調べた。

概要

2011年からの一日の総視聴数

2011年からの一日の総コメント数

2011年から一日の投稿動画数(純増)

まとめ

おまけ

おまけ(Jupyter-notebook)での分析事例