O maior acervo de tutoriais e referências

Python-nltk

PNL | Tags IOB

O que são pedaços? Os pedaços são compostos de palavras e os tipos de palavras são definidos usando as marcas de classe gramatical. Pode-se até definir um padrão ou palavras que não podem fazer parte do chuck e essas palavras são conhecidas como chinks.   O que são tags IOB? É um formato para pedaços. Essas marcas são semelhantes às marcas....

Pré-processamento de texto em Python | Conjunto - 1

Pré-requisitos: Introdução à PNL Sempre que temos dados textuais, precisamos aplicar várias etapas de pré-processamento aos dados para transformar palavras em recursos numéricos que funcionam com algoritmos de aprendizado de máquina. As etapas de pré-processamento de um problema dependem principalmente do domínio e do problema em si, portanto, não precisamos aplicar todas as etapas a todos os problemas. Neste....

Idéia de projeto - Pesquisando notícias de jornais antigos usando PNL

Sabemos que o jornal é uma fonte enriquecida de conhecimento. Quando uma pessoa precisa de alguma informação sobre um determinado tópico ou assunto, ela pesquisa online, mas é difícil obter todos os artigos de notícias antigos de jornais locais regionais relacionados à nossa pesquisa. Como nem todo jornal local oferece uma busca online para pessoas. Neste artigo,....
Posted on Nov 09, 2021 | by rexcode

Resumo do Google Meet multilíngue - Projeto Python

No início de 2020, enfrentamos a maior crise do século 21 - a pandemia COVID-19. Em meio ao caos, a geração acabou encontrando uma maneira de fazer o trabalho, introduzindo a automação em todos os outros aspectos da vida. Após o sucesso da pandemia, encontramos um aumento de 87% nas ferramentas de videoconferência para as comunicações diárias.....
Posted on Nov 09, 2021 | by tapasts

Correção de palavras usando NLTK em Python

nltk significa Natural Language Toolkit e é um poderoso conjunto de bibliotecas e programas que podem ser usados ​​para processamento estatístico de linguagem natural. As bibliotecas podem implementar tokenização, classificação, análise, lematização, marcação, raciocínio semântico, etc. Este kit de ferramentas pode fazer as máquinas entenderem a linguagem humana.  Vamos usar dois métodos de correção ortográfica. Cada método pega....