「Rによるセイバーメトリクス入門」発売中~mlbrパッケージを添えて~

※これはスポーツアナリティクス Advent Calendar 2020 6日目の記事です。*1 久しぶりのブログ更新になってしまいました…。 公開できるアウトプットを出し続けるのは大変ですね…。 アウトプットするには文にまとめる力が必要で、 まとめるには内容の理解が必…

スポーツアナリストってなんだろう

Sports Analyst Meetupを開催してきて早一年が経ちました。 この一年、spoanaを通して、ありがたいことにスポーツ界に限らず様々なアナリストの方々とお会いすることが出来ました。 一年経った今、そして退職して数か月たった今、自分の考えていたスポーツア…

statcastデータにおけるlaunch_speed, launch_angleの欠測値について(後編)

↓の記事の続きです。 tsuyupon.hatenablog.com tsuyupon.hatenablog.com 中編では欠測値補完の手法についてまとめました。 後編では、紹介した手法のうち以下の3手法を試し、補完前後におけるlaunch_speed, launch_angleの変化を見ていきたいと思います。 ホ…

「Sports Analyst Meetup #7」をオンラインで開催しました

4月16日(木)にSports Analyst Meetup(以下、spoana)初のオンライン開催をしました。 spoana.connpass.com upura.hatenablog.com yhiss.hatenablog.com (yhissさん、いつもブログをすぐ書いてくださりありがとうございます!) 前回#6は2月16日開催でし…

brickrパッケージを利用してあつ森のマイデザインを作った

ネタ記事です。 最近、「あつまれ どうぶつの森」にハマっているのですが、 その中でマイデザインという機能があって、 自分でデザインした絵を飾ったり、服を着たりできます。 (この方、上手すぎですね) あつまれどうぶつの森のマイデザインで12球団と侍…

statcastデータにおけるlaunch_speed, launch_angleの欠測値について(中編)

↓の記事の続きです。 tsuyupon.hatenablog.com 後編にしようと思って書いたんですが、思いのほか長くなってしまったので、中編として欠測値補完の手法についてまとめました。 前編の振り返り 欠測値補完の方法 単一代入法 1. 平均値代入法 2. 確定的回帰代…

Stay home ~映画を観よう~

家にいる時間が圧倒的に増えたと思うので、僕がこれまで観た中でオススメの映画を紹介します! ※Amazon Prime Video・Netflix(定額見放題)で見られる作品に〇をつけています 定番 ラ・ラ・ランド シン・ゴジラ カメラを止めるな! ※4/9更新 おもしろい セ…

statcastデータにおけるlaunch_speed, launch_angleの欠測値について(前編)

※この記事で使用するコードはこちらに載せています。 先日、こちらのnoteを拝見しまして、 note.com 1. 打球速度(launch_speed)、打球角度(launch_angle)の欠測の扱い 2. 欠測値補完方法の違いによる打球速度、打球角度の変化 を自分でも検証したくなっ…

2019 NPB各球団 投手事情~パリーグ編~

ロバートさん(@robertsan_CD)が先日、中日ドラゴンズの投手事情のわかりやすい可視化をしていて、それを機に各球団ファンの方々が好きな球団について同様のマッピングをしてみる、という流れがありました。 twitter.com これってかなり素敵な流れだと思っ…

新卒で入った会社を辞めました

いわゆる退職エントリというより自身の振り返りを"書き留めておく"くらい気持ちで書きます。 2020年1月17日に新卒で入った会社を辞めました。 2015年に新卒で入社したので4年9ヶ月いたことになります。 大学 大学時代は経営システム工学科というところで確率…

styler~今年の汚れ、今年のうちに~

これはR Advent Calendar 2019 24日目の記事です。 (ネタ記事なのでヒマなときに読んでください。) 今年も早いものであと一週間となりました。 学校も仕事も忙しい季節ですが、今年の汚れは今年のうちに落としましょうね(ブーメラン) リビング、部屋、キ…

framingをGAMで考える

はじめに これはスポーツアナリティクス Advent Calendar 2019 21日目の記事です。 これを読んでくださる方はSports Analyst Meetup(通称spoana)に来てくださった方が多いんですかね? spoanaは来年も引き続き開催していきますので、来たことのある方もそ…

Baseball Mapping Talks+に参加して

先日、Baseball Mapping Talks+に参加してきました。 connpass.com イベントの内容は@shinyorkeさんがまとめてくださっていますので、詳細はそちらをご覧ください。 shinyorke.hatenablog.com ここでは、私がイベントに参加して感じたことを率直に書いていき…

データ活用はスポーツをつまらなくするのか

今回は分析の話ではなく、ポエムです。 先日、Twitterでボソッと 「データ活用はスポーツをつまらなくする」と「AIは人間の仕事を奪う」は割と似た話だと思ってる— tsuyupon (@ponsa__ku) 2019年3月30日 こんなことをつぶやいたんですが詳細な話を全然してな…

Sports Analyst Meetup を主催して

これは2月24日(日)に開催したSports Analyst Meetup #1の振り返り記事です。 開催までの経緯 開催目的 LTをしてみて 今回のイベントを通して実感したこと 今後に向けて まとめ 開催までの経緯 speakerdeck.com 資料にも記載しましたが、きっかけは昨年末の…

shiny × backpipeは鬼に金棒

今回はRのお話です。 backpipeパッケージという便利なものを見つけたので、備忘録としてまとめておきたいと思います。 目次 目次 backpipeとは? パイプ? backpipeの場合 shinyとは? 百聞は一見に如かず uiオブジェクトの中身を見てみる backpipeで書き換…

攻撃力からベストナインを予測する

[目次] はじめに 本題 使用したデータ データの読み込み データ傾向の確認 ロジスティック回帰 主成分分析 主成分分析の結果でロジスティック回帰 テストデータで検証 予測結果データの確認 セ・リーグ 捕手 一塁手 二塁手 三塁手 遊撃手 外野手 パ・リー…

Baseball Referenceのデータをスクレイピングしようとして手こずった件

久しぶりの更新です。 さっそく言い訳をすると10〜11月は仕事が忙しく、更新出来ませんでした…。 (というか仕事以外でデータ分析する時間もなかなか取れなかった…。) やっと最近時間がとれるようになり、なおかつ、今シーズンのプロ野球が閉幕したので、 …

「失敗しない データ分析・AIのビジネス導入」はいいぞ

統計学・機械学習の本はそれなりに読みましたが、分析プロジェクトについて書かれた本は読んだことがなかったので仕事の参考にしたいと思い読んでみました! 失敗しない データ分析・AIのビジネス導入: プロジェクト進行から組織づくりまで 作者: 株式会社ブ…

statcastのデータをスクレイピングするRパッケージを作りました

野球のメジャーリーグのデータ(statcast)をスクレイピングするRパッケージを作りました。 パッケージの紹介がてら田中将大投手について分析したものを以下のリンクに載せています。 statcastr作成しました | Tsuyulog