Goutte: PHPのWebスクレイピングライブラリ
GoutteはPHPのためのWebスクレイピングとウェブクローリングライブラリです。このライブラリはウェブサイトをクロールし、HTML/XML応答からデータを抽出するための便利なAPIを提供します。
概要: GoutteはPHP 7.1+に依存しています。composer.jsonファイルにfabpot/goutteを必要な依存関係として追加することでインストールできます。
コア機能:
Client
インスタンスを作成し、request()
メソッドでリクエストを行います。- HTTP設定をカスタマイズするために
HttpClient
インスタンスを渡すことができます。 - リンクをクリックし、データを抽出し、フォームを送信する機能があります。
基本的な使用方法:
Client
インスタンスを作成します。request()
メソッドを使用してウェブサイトにアクセスし、Crawler
オブジェクトを取得します。- リンクをクリックしたり、データを抽出したり、フォームを送信したりする操作を行います。
GoutteはSymfonyのBrowserKit、DomCrawler、HttpClientなどのコンポーネントを活用しており、詳細はそれらのドキュメントを参照することができます。また、GoutteはMITライセンスでライセンスされています。