ミーハーはまを言霊ノート

データ分析を頑張る30代イクメン/セルフリファレンスの権化が人生の指針/淡い淡い夢はメディア露出

全世界興行収入についてPythonでぬるぬる動く棒グラフを作ってみたら実写版ライオンキングが意外と強かったよってお話

 

f:id:hamawwo:20210404013615j:plain

 

こんにちは!

 

はまをです。

 

よく見かける、ぬるぬる動く棒グラフをずっと作ってみたいと思っていました。

 

そこでサクッとググった結果、以下のブログや記事を参考に、

 

1977年から2020年までの、全世界の映画興行収入ランキングトップ10の推移を可視化しました。

 

本記事では、Pythonで簡単に動く棒グラフの作り方がわかります。

 

なお、ぬるぬる動く棒グラフは、Bar Chart Raceというようです。

 

まずは、このグラフの読み方について考察します。

 

 

参考にしたブログや記事

pythonでbar chart race

qiita.com

 

・Bar Chart Race

www.dexplo.org

 

・Creating Bar Chart Race Animation with Python

towardsdatascience.com

 

タイタニックのレベチとアバターの台頭

 

データ取得を開始した1977年から、まずはスターウォーズシリーズ、E.Tが強い時代でした。

 

その後、ホームアローン、アラジンが現れた直後、

 

ジュラシックパークが襲来し2位と約2.5倍の差をつけてのトップに躍り出ます。

 

さらにその直後にライオンキングも僅差で2位に浮上し、2強の時代になります。

 

しかし、1997年、タイタニック現る。

 

タイタニックが2位のジュラシックパークの2倍以上でトップになりました。

 

その後、12年間トップの座に君臨し続けました。

 

3D映画元年とされる2009年。ついにタイタニックを抜き去ったのが

 

アバターです。

 

 

アベンジャーズの歴史的瞬間

 

2009年から10年間、どの映画もアバタータイタニックの2大巨頭にはかないませんでした。

 

スターウォーズエピソード7、ジュラシックワールドも叶いません。

 

しかし、2019年。

 

アベンジャーズエンドゲーム

 

歴代興行収入トップになりました。

 

私はエンドゲームが公開されて以来、この歴史的快挙を日々更新していく様を日々ウォッチしており、

 

それはそれは喜びました。

 

filmarks.com

 

意外なワイスピ7 と実写化ライオンキング

 

さて、ここで2020年の興行収入トップ10を切り取ってみてみます。

 

f:id:hamawwo:20210404013615j:plain

 

マーベルシリーズ、アバタータイタニックスターウォーズシリーズ、ジュラシックワールド、アナ雪と、

 

おなじみの超有名作品が名を連ねる中に

 

7位のライオンキング(実写版)、9位のワイルド・スピード SKY MISSION(Furious 7)があります。

 

これは意外ではないでしょうか。

 

いったい、なぜでしょうか。

 

ええ、わかりません。笑

 

考察が薄くて申し訳ありません。

 

ただいずれの作品も、世界的に有名であることはわかります。

 

私は鑑賞したことがありませんが、ワイスピシリーズは全8作ほどありますし、

 

ライオンキングはおなじみネズミーランドの重鎮で、

 

私の大好きなハンスジマーさんがアカデミー作曲賞を受賞したり、ミュージカルになったりしています。

 

しかし、この興行収入の額が思いのほか高かったことに驚きました。

 

 

映画業界の市場規模拡大の様子

 

f:id:hamawwo:20210404013545j:plain

 

データ取得を開始した1977年から、2020年までに映画業界の市場が拡大していく様子が見て取れます。

 

5年ごとに、興行収入トップ10を合計したものを以下に示します。

 

棒グラフが年々高くなっていく様子と、その上がり方がやや落ち着いていく様子が見て取れます。

 

特に、トップ1が入れ替わった1997年タイタニック、2015年アベンジャーズ1作目ではグンんと棒グラフが高くなっており、

 

歴史的瞬間は10年ごとに起きていることが分かります。

 

2001年~2005年でもグンと上がっていますが、

 

ハリポタシリーズ、ロードオブザリングシリーズ、スターウォーズエピソード1からシリーズがけん引しています。

 

やはりシリーズものは稼ぎ頭になるようですね。

 

アベンジャーズエンドゲーム以降、MCU(マーベルシリーズ)以外の新たなシリーズものが出ることを期待します。

 

 

一番めんどくさかったのは手動データ収集

 

今回の動画はPyhtonで作りましたが、作っているもの自体はシンプルですし、パッケージを利用しつつブログや記事を参考にしたので、

 

そんなに難しいものではありません。

 

むしろ一番面倒だったのは、全世界興行収入のデータを集めることでした。

 

データ収集は、Webスクレイピングでスマートに収集したかったのですが、

 

権利関係で不安に思ったので、手動で以下の「Box Office Mojo by IMDbPro」のホームページから一つ一つコピペしました。

 

www.boxofficemojo.com

 

1977年から2020年までの44年分、各年のページに行きコピペします。

 

前処理8割という、データ分析の構造的課題が体験できました。

 

できればここにデータをtxtとかにして貼付けたかったのですが、はてなブログで折り畳みの記事を書くのが若干面倒だったので、いつかできたら追加してみます。

 

 

分析コード

 

環境はGoogleのColabを利用し、

 

Bar chart raceというパッケージがあるので、こちらを利用しました。

 

コードは以下を参照ください。笑

 

丁寧に解説されているので、とってもありがたいです。

 

qiita.com

 

 

終わりに

 

いかがだったでしょうか。

 

趣味を題材にすることで、データ分析やプログラムのモチベーションが上がります。

 

いつかやりたいことは、私の映画レビューを学習させて、私自身が「どんな感情になりたいか」に答えるためにどの映画を見るべきかレコメンドしてくれるものの開発です。

 

ただこれを開発して私最適な映画を見れるようになることと、

 

とりあえず新しいものを見るミーハーでいることは、

 

若干相反するものになってしまうのかなと危惧します。

 

まぁいつの日になるのやら、ですね。

 

 

hamawwo.hatenablog.com

 

 

はまを