JSON
Webスクレイピングツール - JSON
Webスクレイピングツールは、インターネット上のWebサイトから構造化データを自動的に収集するためのソフトウェアやライブラリです。静的HTMLの解析から動的JavaScriptレンダリング、ブラウザ自動化まで、様々なアプローチと用途に対応したツールが存在します。Python、JavaScript、Javaなど複数のプログラミング言語で実装されており、小規模なデータ収集から大規模なクローリングプロジェクトまで幅広く利用されています。
Webスクレイピング
データ収集
クローリング
自動化
Python
JavaScript
[
{
"code": "01",
"slug": "scrapy",
"name": "Scrapy",
"description": "Python製の高機能Webクローリング・スクレイピングフレームワーク",
"language": "Python",
"type": "Framework",
"javascriptSupport": false,
"officialUrl": "https://scrapy.org/",
"githubUrl": "https://github.com/scrapy/scrapy"
},
{
"code": "02",
"slug": "beautifulsoup",
"name": "BeautifulSoup",
"description": "Python製のHTML/XMLパースライブラリ",
"language": "Python",
"type": "Library",
"javascriptSupport": false,
"officialUrl": "https://www.crummy.com/software/BeautifulSoup/",
"githubUrl": null
},
{
"code": "03",
"slug": "selenium",
"name": "Selenium",
"description": "ブラウザ自動化のためのクロスプラットフォームツール",
"language": "Multi-language",
"type": "Framework",
"javascriptSupport": true,
"officialUrl": "https://www.selenium.dev/",
"githubUrl": "https://github.com/SeleniumHQ/selenium"
},
{
"code": "04",
"slug": "playwright",
"name": "Playwright",
"description": "Microsoft製のエンドツーエンドテスト・自動化フレームワーク",
"language": "Multi-language",
"type": "Framework",
"javascriptSupport": true,
"officialUrl": "https://playwright.dev/",
"githubUrl": "https://github.com/microsoft/playwright"
},
{
"code": "05",
"slug": "puppeteer",
"name": "Puppeteer",
"description": "Google製のNode.js Chrome/Firefox自動化ライブラリ",
"language": "JavaScript/Node.js",
"type": "Library",
"javascriptSupport": true,
"officialUrl": "https://pptr.dev/",
"githubUrl": "https://github.com/puppeteer/puppeteer"
},
{
"code": "06",
"slug": "octoparse",
"name": "Octoparse",
"description": "ノーコードのビジュアルWebスクレイピングツール",
"language": "N/A",
"type": "No-code Tool",
"javascriptSupport": true,
"officialUrl": "https://www.octoparse.com/",
"githubUrl": null
},
{
"code": "07",
"slug": "apify",
"name": "Apify",
"description": "クラウドベースのWebスクレイピング・自動化プラットフォーム",
"language": "JavaScript/Node.js",
"type": "Cloud Platform",
"javascriptSupport": true,
"officialUrl": "https://apify.com/",
"githubUrl": "https://github.com/apify"
},
{
"code": "08",
"slug": "parsehub",
"name": "ParseHub",
"description": "機械学習搭載のクラウドベーススクレイピングツール",
"language": "N/A",
"type": "Cloud Tool",
"javascriptSupport": true,
"officialUrl": "https://www.parsehub.com/",
"githubUrl": null
}
]