XリーグがPDFデータで公開しているスタッツを(ある程度までだけど)パソコンで利用できるようなデータにしてみよう
わからなくてもとりあえずやってみよう
Xリーグのスタッツをデータ化するという試みがとあるサイトに公開されてると聞いて読んでみたんだが、正直ちょっと分かりづらいしやって見るにはハードルが高い。
ということで、Pythonの知識がなくてもとりあえずデータ化が出来るようなものを作りますた。
きっかけになったサイトはこちら
【Python】Xリーグスタッツ自動抽出器を作ってみた(OCR、正規表現) - Qiita
ノジマ相模原ライズでアナライズを担当している冨上さんが公開されています。
冨上さんの記事はなかなか詳しく書かれているんですが、実際にやってみようとするとパソコンにPythonの環境を構築する必要があります。本気でやろうとする人たちはそうしたほうがよいと思いますが、どんなもんかちょっと試してみたいと思っている人たちにはかなりハードルが高い。
ということで、Googleアカウントさえ持ってれば誰でもPythonを動かすことが出来るサービスをGoogleセンセイが提供してくれてます。そんな便利なサービスがあるならば使うしかない。クリックするだけでとりあえず誰でもかんたんに使えるしね。
開いたサイトにごちゃごちゃと注意書きなどが書いてありますが、とりあえず使ってみて下さい。
かんたんな使い方ははこちら
注意)Googleアカウント必須です。
1.まずはリンクをクリックする (2021/5/31 リンク先変更)
https://colab.research.google.com/drive/1iNRPyJbjmhgoVUHYwo1y-i4vHUoEQuc6?usp=sharing
2.画面の説明
3.処理の実行のしかた
画面に書いてあるコメントを読んで上から順番に実行して下さい。
本当はクリックするだけで全部自動的に動いて、出てきたデータがそのままエクセルその他で使えるようなものがベストなわけですが、そんなに世の中は甘くない。が、手で一個一個入力してデータを作るよりも少しは楽になるかも知れません。
つーことで興味がある人は動かしてみて、モット良くなるように機能改善してってもらえればと思っとりますよ。
いまXリーグのサイトから過去のスタッツデータへのリンクは切れているみたいです。
なので、こっそり残っていたリンク先からファイルをダウンロード出来るようにしています。
直接ファイルを見たい人はこちら。
20190824_X1_FF_BB_921.pdf - Google ドライブ
試合日:2019/08/24(土) 富士通フロンティアーズ vs IBM BigBlue @富士通スタジアム川崎
今回作ってみた処理で作成されたファイルに手を加えて、エクセルで読めるようにしてますので、ご参考まで。(1Qのみでキックオフやパントなどは除いています)
ということで。