Troyka Online
416-535-6693
info@troykaonline.com
4400 Dufferin Street (A4), Toronto, ON M3H 6A8

Скраппинг веб-сайтов с помощью Python

Серия:Бестселлеры O'Reilly

Автор:Митчелл Райан

Издательство:ДМК-Пресс

Страниц:280

Год:2016

Обложка:Мягкий переплет

Размер:60x90/16

SKU:RU643227

ISBN:9785970602232

Наша цена:US $122.00

Отправляется через 16-24 дня

Описание

Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью этого практического руководства вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц.Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие, как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта. Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике.   Прочитав эту книгу, вы научитесь:   - выполнять парсинг сложных HTML страниц; - сканировать веб-страницы и сайты; - работать с API; - применять несколько методов хранения собранных данных; - скачивать, обрабатывать и извлекать данные из документов; - использовать инструменты и методы для очистки плохо отформатированных данных; - читать и записывать естественные языки; - выполнять краулинг с использованием регистрационных форм; - выполнять скрапинг Javascript-кода; - обрабатывать изображения и распознавать текст.   Инструменты и примеры, приведенные в этой книге, позволяют легко автоматизировать несколько повторяющихся задач, высвобождая время для решения более насущных проблем. Это легко читаемая, ориентированная на конкретный результат книга, рассказывающая о реальных проблемах и решениях. 

©2024 Troyka Online All rights reserved.