O maior acervo de tutoriais e referências

Python web-scraping-exercises

Como raspar várias páginas de um site usando Python?

Web Scraping é um método de extrair dados úteis de um site usando programas de computador, sem ter que fazer isso manualmente. Esses dados podem ser exportados e organizados categoricamente para vários fins. Alguns lugares comuns onde o Web Scraping encontra seu uso são sites de pesquisa e análise de mercado, ferramentas de comparação de preços, mecanismos....

Raspando o Reddit com Python e BeautifulSoup

Neste artigo, veremos como copiar o Reddit com Python e BeautifulSoup. Aqui, usaremos a Beautiful Soup e o módulo de solicitação para extrair os dados. Módulo necessário bs4 :Beautiful Soup (bs4) é uma biblioteca Python para extrair dados de arquivos HTML e XML. Este módulo não vem integrado com Python. Para instalar este digite o comando abaixo no terminal. pip....

Como construir um bot de scraping da Web em Python

Neste artigo, veremos como construir um web scraping bot em Python. Web Scraping é um processo de extração de dados de sites. Um Bot é um pedaço de código que irá automatizar nossa tarefa. Portanto, um web scraping bot é um programa que faz a varredura automática de um site em busca de dados, com base em nossos....

Raspe o LinkedIn usando selenium e sopa bonita em Python

Neste artigo, vamos raspar o Linkedln usando as bibliotecas Selenium e Beautiful Soup em Python. Em primeiro lugar, precisamos instalar algumas bibliotecas. Execute os seguintes comandos no terminal. pip install selenium pip install beautifulsoup4 Para usar o selenium, também precisamos de um driver da web. Você pode baixar o driver da web do Internet Explorer, Firefox ou Chrome. Neste artigo,....

Como obter as notícias diárias usando Python

Neste artigo, veremos como obter notícias diárias usando Python. Aqui, usaremos a Beautiful Soup e o módulo de solicitação para extrair os dados. Módulos necessários bs4 : Beautiful Soup (bs4) é uma biblioteca Python para extrair dados de arquivos HTML e XML. Este módulo não vem integrado com Python. Para instalar este digite o comando abaixo no terminal. pip install....