O maior acervo de tutoriais e referências

Web-scraping

Como raspar várias páginas de um site usando Python?

Web Scraping é um método de extrair dados úteis de um site usando programas de computador, sem ter que fazer isso manualmente. Esses dados podem ser exportados e organizados categoricamente para vários fins. Alguns lugares comuns onde o Web Scraping encontra seu uso são sites de pesquisa e análise de mercado, ferramentas de comparação de preços, mecanismos....

O que é Web Scraping e como usá-lo?

Suponha que você queira algumas informações de um site? Digamos um parágrafo sobre Donald Trump! O que você faz? Bem, você pode copiar e colar as informações da Wikipedia em seu próprio arquivo. Mas e se você quiser obter grandes quantidades de informações de um site o mais rápido possível? Como grandes quantidades de dados de um....

Raspando o Reddit usando Python

Neste artigo, veremos como raspar o Reddit usando Python, aqui usaremos o módulo PRAW (Python Reddit API Wrapper) do python para raspar os dados. Praw é uma sigla Python Reddit API wrapper, que permite Reddit API por meio de scripts Python. Instalação Para instalar o PRAW, execute os seguintes comandos no prompt de comando: pip install praw Criação de um aplicativo....

User-Agent Switcher - Extensão do navegador para Web Engineer

User-Agent Switcher é um complemento simples, mas muito poderoso e muito mais fácil de navegar na Internet, independentemente do sistema operacional ou navegador de sua preferência. Ele fornece um botão da barra de ferramentas que pode ser usado para alternar entre diferentes strings de agente do usuário comumente usadas. Em palavras simples, é a maneira mais simples....

Web Scraping usando lxml e XPath em Python

Pré-requisitos: Introdução ao Web Scrapping Neste artigo, discutiremos a biblioteca lxml python para extrair dados de uma página da web, que é construída sobre a   biblioteca de análise XML libxml2 escrita em C. Quando comparada a outras bibliotecas de coleta web python, como  BeautifulSoup  e  Selenium , o   pacote lxml oferece uma vantagem em termos de desempenho. Ler....