YAML
Webスクレイピングツール - YAML
Webスクレイピングツールは、インターネット上のWebサイトから構造化データを自動的に収集するためのソフトウェアやライブラリです。静的HTMLの解析から動的JavaScriptレンダリング、ブラウザ自動化まで、様々なアプローチと用途に対応したツールが存在します。Python、JavaScript、Javaなど複数のプログラミング言語で実装されており、小規模なデータ収集から大規模なクローリングプロジェクトまで幅広く利用されています。
Webスクレイピング
データ収集
クローリング
自動化
Python
JavaScript
- code: "01"
slug: "scrapy"
name: "Scrapy"
description: "Python製の高機能Webクローリング・スクレイピングフレームワーク"
language: "Python"
type: "Framework"
javascriptSupport: false
officialUrl: "https://scrapy.org/"
githubUrl: "https://github.com/scrapy/scrapy"
- code: "02"
slug: "beautifulsoup"
name: "BeautifulSoup"
description: "Python製のHTML/XMLパースライブラリ"
language: "Python"
type: "Library"
javascriptSupport: false
officialUrl: "https://www.crummy.com/software/BeautifulSoup/"
githubUrl: null
- code: "03"
slug: "selenium"
name: "Selenium"
description: "ブラウザ自動化のためのクロスプラットフォームツール"
language: "Multi-language"
type: "Framework"
javascriptSupport: true
officialUrl: "https://www.selenium.dev/"
githubUrl: "https://github.com/SeleniumHQ/selenium"
- code: "04"
slug: "playwright"
name: "Playwright"
description: "Microsoft製のエンドツーエンドテスト・自動化フレームワーク"
language: "Multi-language"
type: "Framework"
javascriptSupport: true
officialUrl: "https://playwright.dev/"
githubUrl: "https://github.com/microsoft/playwright"
- code: "05"
slug: "puppeteer"
name: "Puppeteer"
description: "Google製のNode.js Chrome/Firefox自動化ライブラリ"
language: "JavaScript/Node.js"
type: "Library"
javascriptSupport: true
officialUrl: "https://pptr.dev/"
githubUrl: "https://github.com/puppeteer/puppeteer"
- code: "06"
slug: "octoparse"
name: "Octoparse"
description: "ノーコードのビジュアルWebスクレイピングツール"
language: "N/A"
type: "No-code Tool"
javascriptSupport: true
officialUrl: "https://www.octoparse.com/"
githubUrl: null
- code: "07"
slug: "apify"
name: "Apify"
description: "クラウドベースのWebスクレイピング・自動化プラットフォーム"
language: "JavaScript/Node.js"
type: "Cloud Platform"
javascriptSupport: true
officialUrl: "https://apify.com/"
githubUrl: "https://github.com/apify"
- code: "08"
slug: "parsehub"
name: "ParseHub"
description: "機械学習搭載のクラウドベーススクレイピングツール"
language: "N/A"
type: "Cloud Tool"
javascriptSupport: true
officialUrl: "https://www.parsehub.com/"
githubUrl: null