Scrapyについて
Scrapyはオープンソースで共同作業可能なフレームワークで、ウェブサイトから必要なデータを抽出するためのものです。高速で、シンプルで、拡張性も高い特徴があります。
コア機能
- 最新バージョンのScrapy 2.12.0をインストールできます。
- 様々な機能を備えており、ウェブスパイダーの構築と実行が可能です。
- データの抽出ルールを設定でき、Scrapyがその処理を行います。
基本的な使用方法
pip install scrapy
でインストールします。- スパイダーのコードを作成し、
scrapy runspider
コマンドで実行できます。 - Zyte Scrapy Cloudにデプロイしてスケジュール実行も可能です。
Scrapyはポータブルで、Pythonで書かれており、Linux、Windows、Mac、BSDで動作します。また、活発なコミュニティが存在し、GitHubでは43,100のスター、9,600のフォーク、1,800のウォッチャーがいます。