Beautiful Soupがものすごく便利!

  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

スクレイピングとは

あるWebページから必要なデータだけを抜き出してくることです。ちなみにクローリングとスクレイピングの違いは以下のようになっています。

クローリング・・・ウェブサイトからHTMLや任意の情報を取得する技術・行為
スクレイピング・・・取得したHTMLから任意の情報を抽出する技術・行為
クローリングとスクレイピングより

PR

今回はPythonのライブラリであるBeautiful Soupを使ってYahoo!路線の遅延情報を取得してきました。

Beautiful Soupのインストール

まずはBeautiful Soupのインストールから。Beautiful Soupにはバージョンが3と4がありますが、今回は4を使います。
Beautiful Soupと一緒にスクレイピングする時に便利なrequestsもインストールしておきましょう。

pip install beautifulsoup4
pip install requests

インストールが出来ているかどうかはpip freezeで確認します。
beautifulsoup4 == 4.・・・
requests == ・・・
という文字列があればとりあえずインストールはOKです。

PR

この記事が気に入ったら
いいね ! しよう

Twitter で
  • このエントリーをはてなブックマークに追加
  • Pocket
  • LINEで送る

SNSでもご購読できます。