極私的視点(再)

思いついた時に、思いつきの文章とそれっぽい写真を大公開です。

XリーグがPDFデータで公開しているスタッツを(ある程度までだけど)パソコンで利用できるようなデータにしてみよう

わからなくてもとりあえずやってみよう

Xリーグのスタッツをデータ化するという試みがとあるサイトに公開されてると聞いて読んでみたんだが、正直ちょっと分かりづらいしやって見るにはハードルが高い。


ということで、Pythonの知識がなくてもとりあえずデータ化が出来るようなものを作りますた。

 

きっかけになったサイトはこちら

【Python】Xリーグスタッツ自動抽出器を作ってみた(OCR、正規表現) - Qiita

ノジマ相模原ライズでアナライズを担当している冨上さんが公開されています。

 

冨上さんの記事はなかなか詳しく書かれているんですが、実際にやってみようとするとパソコンにPythonの環境を構築する必要があります。本気でやろうとする人たちはそうしたほうがよいと思いますが、どんなもんかちょっと試してみたいと思っている人たちにはかなりハードルが高い。

 

ということで、Googleアカウントさえ持ってれば誰でもPythonを動かすことが出来るサービスをGoogleセンセイが提供してくれてます。そんな便利なサービスがあるならば使うしかない。クリックするだけでとりあえず誰でもかんたんに使えるしね。

 

開いたサイトにごちゃごちゃと注意書きなどが書いてありますが、とりあえず使ってみて下さい。

 

かんたんな使い方ははこちら

注意)Googleアカウント必須です。

1.まずはリンクをクリックする (2021/5/31 リンク先変更)

https://colab.research.google.com/drive/1iNRPyJbjmhgoVUHYwo1y-i4vHUoEQuc6?usp=sharing

 

f:id:tonytani37:20210508183533j:plain

開いた直後
2.画面の説明

f:id:tonytani37:20210508183809j:plain

作られたファイルはこちらに表示されます
3.処理の実行のしかた

画面に書いてあるコメントを読んで上から順番に実行して下さい。

f:id:tonytani37:20210508183912j:plain

処理の実行は上から順番にクリックするだけ

 

本当はクリックするだけで全部自動的に動いて、出てきたデータがそのままエクセルその他で使えるようなものがベストなわけですが、そんなに世の中は甘くない。が、手で一個一個入力してデータを作るよりも少しは楽になるかも知れません。
つーことで興味がある人は動かしてみて、モット良くなるように機能改善してってもらえればと思っとりますよ。

 

いまXリーグのサイトから過去のスタッツデータへのリンクは切れているみたいです。

成績 | Xリーグ 公式サイト (xleague.jp)

なので、こっそり残っていたリンク先からファイルをダウンロード出来るようにしています。

直接ファイルを見たい人はこちら。

20190824_X1_FF_BB_921.pdf - Google ドライブ

試合日:2019/08/24(土) 富士通フロンティアーズ vs IBM BigBlue @富士通スタジアム川崎

今回作ってみた処理で作成されたファイルに手を加えて、エクセルで読めるようにしてますので、ご参考まで。(1Qのみでキックオフやパントなどは除いています)

stats_1Q.csv - Google ドライブ

ということで。