スクレイピングしない場合

[競馬AI] スクレイピングしない競馬データの取得とデータ構造について - Qiita

  • JRA-VAN データラボ
    • 1986年から約30年分のあらゆる公式競馬データをデータベース化
    • 前走・近走結果の情報、リアルタイムオッズや発走1時間前の馬体重などの最新情報も即座に反映
    • 月額 2,090円(2023年1月現在)
    • データ取得はJRA VAN SDK(C#/C++/Delphi7 /VB2019)を介して行う必要がありWindows前提
    • JRA-VAN Data Lab. JVData 仕様書
  • JRDB
    • データはテキストで取得可能
    • ベーシック 月額 1,980円(2023年1月現在)
    • アドバンス 月額 2,480円(2023年1月現在)

Mac上で使用したいことと、テキスト形式でのデータ提供の方が取り回しが簡単なため、自分の用途としてはJRDBの方がマッチしているか。

スクレイピングする場合

機械学習で競馬予想をしてみた系のまとめ - Qiita

netkeiba.comをスクレイピングしている事例が多い。