Processamento de linguagem natural com Python: 1
By Ajit Singh
()
About this ebook
Simplesmente em profundidade
Este livro tem como objetivo apresentar as técnicas fundamentais de processamento de linguagem natural, desenvolver uma compreensão dos limites dessas técnicas e dos problemas de pesquisa atuais e avaliar algumas aplicações atuais e potenciais. ● 1. Introdução. Breve história da pesquisa em PNL, aplicações atuais, arquitetura de sistema de PNL genérica, abordagens baseadas em conhecimento versus abordagens probabilísticas. ● 2. Técnicas de estado finito. Na morfologia seccional e derivacional, autômatos de estados finitos em PNL, transdutores de estados finitos. ● 3. Predição e marcação de parte do discurso. Corpora, DIY Corpus, Corpus Analysis, N-gramas simples, previsão de palavras, marcação estocástica e avaliação do desempenho do sistema. ● 4. Análise e geração. Gramática gerativa, gramáticas livres de contexto, análise e geração com gramáticas livres de contexto, pesos e probabilidades. Gramática baseada em restrições, unificação, semântica composicional simples. Relações semânticas. ● 5. PNL com Python
Ajit Singh
Ajit Singh is equally interested in fiction and non-fiction and has written many books in English, Hindi, and Urdu. He has performed in Haryana, published his prose and verse in India and Pakistan, and participated in an international online poetry symposium organized by Bazm-e-Urdu, Qatar.He lives in a village, teaches science, and comes from a farming family. His father served as a major in the Parachute Regiment of the Indian Army.Ajit plays cricket, football, volleyball, basketball, badminton, and chess. He loves harmonium and flute, sings folk songs, and also enjoys gardening in his spare time. His nickname is "Badal," which means "cloud" in English.
Read more from Ajit Singh
Realidade Virtual Rating: 5 out of 5 stars5/5Agile & Scrum Rating: 0 out of 5 stars0 ratings
Related to Processamento de linguagem natural com Python
Titles in the series (70)
Comment Créer Une Entreprise En Ligne En 7 Étapes: 1, #1 Rating: 0 out of 5 stars0 ratingsLa Pared: 1, #1 Rating: 0 out of 5 stars0 ratingsBesos de chocolate: 1, #1 Rating: 0 out of 5 stars0 ratingsO App das Lembranças: 1, #1 Rating: 0 out of 5 stars0 ratingsO pequeno barão ladrão Rob e o negociante de especiarias: 1, #1 Rating: 0 out of 5 stars0 ratingsArido Americano: 1, #1 Rating: 0 out of 5 stars0 ratingsA Montanha Jardim: 1, #1 Rating: 0 out of 5 stars0 ratingsMi Vicio: 1, #1 Rating: 0 out of 5 stars0 ratingsDrazen - Os Anos do Dragão: 1, #1 Rating: 0 out of 5 stars0 ratingsHermanos de Sangre: 1, #1 Rating: 0 out of 5 stars0 ratingsMyself: 1, #1 Rating: 0 out of 5 stars0 ratingsHombre en las Sombras: 1, #1 Rating: 0 out of 5 stars0 ratingsWest e Windy: 1, #1 Rating: 0 out of 5 stars0 ratingsRituales de Liberación: 1, #1 Rating: 5 out of 5 stars5/5Mika - Os Olhos da Serpente: 1, #1 Rating: 0 out of 5 stars0 ratingsLas Crónicas P.E.R. - El Comenzio: 1, #1 Rating: 0 out of 5 stars0 ratingsFitness and Nutrition The best binomial: 1 Rating: 0 out of 5 stars0 ratingsThe Hidden Secret of the Sumerians: 1 Rating: 0 out of 5 stars0 ratingsRogue River: 1, #1 Rating: 0 out of 5 stars0 ratingsAqui há Grifos: 1, #1 Rating: 0 out of 5 stars0 ratingsDeus restaura o apóstata: 1 Rating: 0 out of 5 stars0 ratingsAbundance Decrees: 1, #3 Rating: 0 out of 5 stars0 ratingsUrban Monks: 1, #4 Rating: 0 out of 5 stars0 ratingsCortejando a Tentação: 1, #1 Rating: 0 out of 5 stars0 ratingsEl Campanero: 1, #1 Rating: 0 out of 5 stars0 ratingsHijos de Ángeles: 1, #1 Rating: 0 out of 5 stars0 ratingsEl Libro Prohibido de Pratima: 1 Rating: 0 out of 5 stars0 ratingsElas e o Sexo: 1 Rating: 0 out of 5 stars0 ratingsMáscara da mentira: 1, #1 Rating: 0 out of 5 stars0 ratingsMeditación: Guía De Atención Plena Para Aumentar La Felicidad (Meditación Para Principiantes): 1 Rating: 0 out of 5 stars0 ratings
Related ebooks
Php Progressivo Rating: 0 out of 5 stars0 ratingsProgramação Funcional: Uma introdução em Clojure Rating: 4 out of 5 stars4/5Algoritmos E Lógica De Programação Com Python Rating: 0 out of 5 stars0 ratingsRSpec: Crie especificações executáveis em Ruby Rating: 0 out of 5 stars0 ratingsNoSQL: Como armazenar os dados de uma aplicação moderna Rating: 0 out of 5 stars0 ratingsSistemas Orientados a Objetos: Conceitos e Práticas Rating: 0 out of 5 stars0 ratingsFundamentos De Programação Javascript Rating: 0 out of 5 stars0 ratingsHaskell: Uma introdução à programação funcional Rating: 0 out of 5 stars0 ratingsPHP: programe de forma rápida e prática Rating: 0 out of 5 stars0 ratingsManual de sobrevivência do novo programador: Dicas pragmáticas para sua evolução profissional Rating: 4 out of 5 stars4/5Programação funcional em .NET: Explore um novo universo Rating: 0 out of 5 stars0 ratingsTrilhas Python: Programação multiparadigma e desenvolvimento Web com Flask Rating: 4 out of 5 stars4/5Zend Certified Engineer: Descomplicando a certificação PHP Rating: 0 out of 5 stars0 ratingsTest-driven development: Teste e design no mundo real com Ruby Rating: 0 out of 5 stars0 ratingsCidades Eficientes Rating: 5 out of 5 stars5/5Laboratório Técnico Rating: 0 out of 5 stars0 ratingsConceitos Gerais De Business Intelligence Rating: 0 out of 5 stars0 ratingsO Programador Apaixonado: Construindo uma carreira notável em desenvolvimento de software Rating: 5 out of 5 stars5/5Ah, se eu soubesse (Inteligência Artificial)...: Uma Viagem aos "Cérebros Eletrônicos" Rating: 0 out of 5 stars0 ratingsApostila Técnica Criando Um Projeto Visual C# Rating: 0 out of 5 stars0 ratingsOpen Web Platform Rating: 0 out of 5 stars0 ratingsSoftware R: Uma Nova Proposta de Ensinar e Aprender Estatística Rating: 0 out of 5 stars0 ratingsInteligência Artificial Rating: 5 out of 5 stars5/5Programação Matemática: Otimização Linear e Não Linear Rating: 0 out of 5 stars0 ratingsCaixa de ferramentas da Arquitetura de Software: Como tornar suas aplicações mais escaláveis, confiáveis e seguras Rating: 0 out of 5 stars0 ratingsApostila Noções De Administração Pública Rating: 0 out of 5 stars0 ratingsAutomatizando Testes de Software Com Selenium Rating: 0 out of 5 stars0 ratingsCompensação e cegueira: Um estudo historiográfico Rating: 0 out of 5 stars0 ratingsApostila De Controle De Vendas Rating: 0 out of 5 stars0 ratings
Intelligence (AI) & Semantics For You
Chatgpt O Roteiro Do Milionário Rating: 0 out of 5 stars0 ratingsJava O Guia Completo Rating: 0 out of 5 stars0 ratingsGuia De Estilo E Cores Rating: 0 out of 5 stars0 ratingsExcel 2022 O Tutorial Completo Para Iniciantes E Especialistas Rating: 0 out of 5 stars0 ratingsDominando Html E Css Rating: 0 out of 5 stars0 ratingsChatgpt Ai - Contextos, Comandos, Dicas. Rating: 0 out of 5 stars0 ratingsLinux Rating: 0 out of 5 stars0 ratingsInteligência Artificial e ChatGPT: Da revolução dos modelos de IA generativa à Engenharia de Prompt Rating: 5 out of 5 stars5/5A tecnologia que muda o mundo Rating: 4 out of 5 stars4/5Adobe Photoshop 2022 Para Iniciantes Rating: 0 out of 5 stars0 ratingsInteligência Artificial: A Quarta Revolução Industrial Rating: 0 out of 5 stars0 ratingsA Inteligência Artificial e o Futuro da Educação Rating: 0 out of 5 stars0 ratingsComo Criar Um Ebook Eficiente Rating: 0 out of 5 stars0 ratingsMarketing Do Instagram (guia Para Iniciantes 2023) Rating: 0 out of 5 stars0 ratingsDominando Trafego Nas Redes Sociais Rating: 4 out of 5 stars4/5Navegando na Inteligência Artificial com Fé Rating: 0 out of 5 stars0 ratingsPolíticas da imagem: Vigilância e resistência na dadosfera Rating: 0 out of 5 stars0 ratingsMega-sena: A Ciência De Dados Por Trás Dos Números Rating: 0 out of 5 stars0 ratingsInteligência artificial & redes sociais Rating: 0 out of 5 stars0 ratingsPacote Microsoft Office Capacitação Rating: 0 out of 5 stars0 ratingsPolítica De Segurança Da Informação Rating: 0 out of 5 stars0 ratingsChatGPT para o dia a dia: Explore o poder da Inteligência Artificial agora mesmo Rating: 0 out of 5 stars0 ratingsProgramando Em Java - Guia Essencial E Prático Rating: 0 out of 5 stars0 ratingsMicrosoft Windows 10 Rating: 5 out of 5 stars5/5Inteligência Artificial como serviço: Uma introdução aos Serviços Cognitivos da Microsoft Azure Rating: 3 out of 5 stars3/5Descomplicando Passo A Passo Deep Web Rating: 5 out of 5 stars5/5Como Crescer No Instagram E Se Tornar Um Influenciador De Sucesso No Instagram Rating: 0 out of 5 stars0 ratings12 Técnicas Para Dominar As Planilhas Financeiras Rating: 0 out of 5 stars0 ratings
Reviews for Processamento de linguagem natural com Python
0 ratings0 reviews
Book preview
Processamento de linguagem natural com Python - Ajit Singh
Índice
Conteúdo= Página 5
Prefácio= Página 6
Objetivos= Página 6
Características principais= Página 6
Capítulo 1: Introdução à PNL= Página 7
Texto tokenizado e correspondência de padrões= Página 7
Alguma terminologia linguística= Página 8
Por que o processamento da linguagem é difícil?= Página 9
Alguns aplicativos de PNL= Página 10
Partes do discurso= Página 11
Recuperação de informação, extração de informação e resposta a perguntas= Página 13
Maquina de tradução= Página 14
Interfaces de linguagem natural e sistemas de diálogo= Página 14
Um pouco mais de história= Página 15
Fases da PNL= Página 16
Processamento Morfológico= Página 16
Análise de sintaxe= Página 16
Análise Semântica= Página 16
Análise Pragmática= Página 16
Arquitetura de aplicativo NLP deep
genérico= Página 17
Interface de linguagem natural para uma base de conhecimento= Página 18
Comentários gerais= Página 18
Capítulo 2: Morfologia e técnicas de estados finitos= Página 20
Análise Morfológica= Página 20
Tipos de Morfemas= Página 20
Caules= Página 20
Ordem das palavras= Página 21
Na morfologia seccional vs. Derivacional= Página 21
Regras de ortografia= Página 22
Aplicações de processamento morfológico= Página 22
Requisitos lexicais para processamento morfológico= Página 23
Autômatos de estados finitos para reconhecimento= Página 24
Transdutores de estado finito= Página 25
Alguns outros usos das técnicas de estado finito em PNL= Página 26
Gramáticas parciais para reconhecimento de entidades nomeadas= Página 26
Capítulo 3: Predição e marcação de parte da fala
PNL – Recursos linguísticos – Corpus= Página 27
Tipos de corpus= Página 28
Lexicografia= Página 29
Gramática e sintaxe= Página 30
Treinamento e avaliação= Página 30
Algumas análises básicas de corpus= Página 31
DIY Corpus: alguns exemplos trabalhados= Página 31
Distribuições de freqüência= Página 32
Calculando a frequência da tag= Página 32
Concordância e colocações= Página 33
WordNet= Página 33
Expressões regulares= Página 33
Propriedades de expressões regulares= Página 33
Predição= Página 36
Bigramas= Página 36
Marcação gramatical= Página 38
Etiquetagem POS estocástica= Página 39
Avaliação de etiquetagem de POS= Página 44
Tagging POS com base em regras= Página 45
Propriedades da marcação de PDV baseada em regras= Página 46
Marcação estocástica de PDV= Página 46
Probabilidades de sequência de tag= Página 46
Capítulo 4: Análise e geração
Gramática gerativa= Página 47
Gramáticas livres de contexto= Página 47
Um CFG simples para um fragmento de inglês= Página 48
Analisar árvores= Página 49
Usando uma gramática como gerador aleatório= Página 49
Análise de gráfico= Página 49
Um analisador de gráfico passivo ascendente= Página 51
Embalagem= Página 52
Análise de gráfico ativo= Página 55
Ordenando o espaço de busca= Página 56
Por que não podemos usar FSAs para modelar a sintaxe das linguagens naturais?= Página= 57
Sintaxe e semântica= Página 58
Semântica e Pragmática= Página 59
Especificando gramáticas para linguagens naturais= Página 60
Gramáticas de caso= Página 61
Gramáticas Semânticas= Página 61
Gramáticas de cláusulas definitivas (DCGs)= Página 62
Gramáticas lexicais funcionais (LFGs)= Página 63
Redes de transição aumentada (ATNs)= Página 64
Semântico= Página 64
Formas de Representação Semântica= Página 64
Construindo Representações Semânticas= Página 66
Capítulo 5: PNL com Python
Pré-requisitos= Página 67
Primeiros passos com NLTK= Página 67
Instalando NLTK= Página 67
Baixando dados do NLTK= Página 67
Outros Pacotes Necessários= Página 68
Tokenização= Página 68
Pacote WordPunctTokenizer= Página 69
Stemming= Página 69
Lemmatização= Página 69
Pacote WordNetLemmatizer= Página 70
Contando tags de PDV – Chunking= Página 70
Executando o Script de PNL= Página 70
Conteúdo
Este livro tem como objetivo apresentar as técnicas fundamentais de processamento de linguagem natural, desenvolver uma compreensão dos limites dessas técnicas e dos problemas de pesquisa atuais e avaliar algumas aplicações atuais e potenciais.
1. Introdução. Breve história da pesquisa em PNL, aplicações atuais, arquitetura de sistema de PNL genérica, abordagens baseadas em conhecimento versus abordagens probabilísticas.
2. Técnicas de estado finito. Na morfologia seccional e derivacional, autômatos de estados finitos em PNL, transdutores de estados finitos.
3. Predição e marcação de parte do discurso. Corpora, DIY Corpus, Corpus Analysis, N-gramas simples, previsão de palavras, marcação estocástica e avaliação do desempenho do sistema.
4. Análise e geração. Gramática gerativa, gramáticas livres de contexto, análise sintática e geração com gramáticas livres de contexto, pesos e probabilidades. Gramática baseada em restrições, unificação, semântica composicional simples. Relações semânticas.
5. PNL com Python
Copyright © Ajit Singh 2019
Todos os direitos reservados. Nenhuma parte deste trabalho pode ser reproduzida de qualquer forma, ou por qualquer meio, sem a permissão por escrito do editor. Eu faço todos os esforços para respeitar os direitos autorais.
Prefácio
PNL é um campo amplo e multidisciplinar, portanto, este livro pode fornecer apenas uma introdução muito geral. O primeiro capítulo foi elaborado para dar uma visão geral das principais subáreas e uma ideia muito breve das principais aplicações e das metodologias que foram empregadas. A história da PNL é brevemente discutida como uma forma de colocar isso em perspectiva. Os próximos três capítulos descrevem algumas das principais subáreas com mais detalhes. A organização é baseada no aumento da profundidade
de processamento, começando com técnicas relativamente orientadas para a superfície e progredindo para considerar o significado das frases e o significado dos enunciados no contexto. Cada capítulo considerará a subárea como um todo e, em seguida, descreverá um ou mais algoritmos de amostra que tratam de problemas específicos. Os algoritmos foram escolhidos porque são relativamente simples de descrever e porque ilustram uma técnica específica que se mostrou útil, mas a ideia é exemplificar uma abordagem, não fornecer um levantamento detalhado (o que seria impossível na época acessível). No entanto, outras abordagens às vezes serão discutidas brevemente. O capítulo final reúne o material anterior para descrever o estado da arte em aplicativos de amostra.
Objetivos
O objetivo do meu livro para os alunos é:
Ser capaz de descrever a arquitetura e o design básico de um shell
de sistema PNL genérico.
Ser capaz de discutir o desempenho atual e futuro provável de vários aplicativos de PNL, como tradução automática e resposta por e-mail.
Ser capaz de descrever resumidamente uma técnica fundamental para processar a linguagem para várias subtarefas, como análise morfológica, análise sintática, desambiguação do sentido da palavra, etc.
Compreender como essas técnicas se baseiam e se relacionam com outras áreas da ciência da computação (teórica), como a teoria da linguagem formal, semântica formal das linguagens de programação ou prova de teoremas.
Características principais
Discussão dos principais problemas envolvidos no processamento da linguagem por meio de exemplos retirados de aplicações de PNL com distinções metodológicas e coloca as aplicações e metodologia em algum contexto histórico.
Discussão da morfologia, concentrando-se principalmente na morfologia inglesa. O conceito de léxico em um sistema de PNL é discutido com relação ao processamento morfológico. As regras de ortografia são introduzidas e o uso de transdutores de estado finito para implementar as regras de ortografia é explicado.
Apresenta algumas técnicas estatísticas simples e ilustra seu uso em PNL para predição de palavras e categorias de classes gramaticais. Ele começa com uma discussão sobre corpora e, em seguida, apresenta a previsão de palavras. A previsão de palavras pode ser vista como uma forma de modelar (grosseiramente) algumas informações sintáticas (ou seja, a ordem das palavras).
PNL com Python.
DIY Corpus.
Capítulo 1: Introdução à PNL
As pessoas se comunicam de muitas maneiras diferentes: falando e ouvindo, fazendo gestos, usando sinais manuais especializados (como ao dirigir ou direcionar o tráfego), usando linguagem de sinais para surdos ou por meio de várias formas de texto.
Por texto, queremos dizer palavras que são escritas ou impressas em uma superfície plana (papel, cartão, placas de rua e assim por diante) ou exibidas em uma tela ou dispositivo eletrônico