クローリングハック あらゆるWebサイトをクロールするための実践テクニックの表紙

クローリングハック あらゆるWebサイトをクロールするための実践テクニック

竹添 直樹, 島本 多可子, 田所 駿佑, 萩野 貴拓, 川上 桃子

出版日: 2017/9/14

出版社: 翔泳社

ページ数: 336ページ

最終更新: 2019年10月30日

人気スコア: 526

どんな本?

本書は、Webアプリケーションやサービス開発・運用に不可欠なWeb技術の基礎知識から、大規模Webクローラーの開発・運用ノウハウまでを網羅する実践書です。HTTP、文字コード、HTML、認証、Ajax/JSONなど、クローラーの構築・運用に必要な技術要素を、実サービスでの経験に基づき深く解説。Webサイトの仕組みをクローラー視点から理解し、効率的なクロール方法論を習得できます。Web開発者にとっては、クローラービリティの高いWebサイト設計のヒントを得られ、Webサイト運営者にとっては、自身のサイトへのクローラーの挙動を理解し、適切な対策を講じるための知見が得られます。Javaでのサンプルコードが提供されますが、Web技術の理解に重点を置いているため、Javaの深い知識は不要です。Web技術の基礎から実践的なクロールテクニックまで、幅広く学びたいエンジニアやサイト運営者におすすめの一冊です。

この本に言及している記事

Q

Webエンジニア1年目の自分に捧げたい本・記事を超まとめ

by 仮想サーファー on Qiita 2019年10月30日
"PythonでのWebデータ収集・解析の入門書として最適。環境構築からクローリング、スクレイピング、データ加工まで、実践的なスキルをハンズオンで習得できる。個人で手軽に始められるPythonの特性を活かし、Webからのデータ取得・活用方法を具体的に学べるため、「Pythonで何ができるか」を実感したいエンジニアにおすすめ。"

関連書籍

「クローリングハック あらゆるWebサイトをクロールするための実践テクニック」と一緒に紹介されることが多い本