User Tools

Site Tools


pln:reconhecimento_de_entidades_mencionaveis

PLN: Reconhecimento de Entidades Mencionáveis

O Reconhecimento de Entidades Mencionáveis (REM), também designado por named entity recognition (NER) na literatura inglesa, é o processo de detectar, anotar e classificar palavras (ou átomos) em texto que se referem a uma entidade que podemos, de algum modo, referir.

Exemplos típicos são os nomes de pessoas, que referem um indivíduo, nomes de instituições, termos geográficos, que referem determinada zona, datas ou horas, que referem determinado instante no tempo, etc.

Uma pergunta que pode ser feita é, qual a relevância da detecção de entidades no processamento de linguagem natural. Assim, e antes de se introduzir alguns algoritmos ou abordagens para a detecção destas entidades, apresentam-se alguns exemplos de aplicações de PLN onde o REM é imprescindível.

  • Tradução automática: na tradução de uma frase como My name is miss Grace., se a tradução for realizada palavra a palavra, irá resultar em algo como Meu nome é perder a graça.. Repare que estamos perante duas palavras que têm diferentes sentidos de acordo com o contexto. Ora, aplicando um sistema de REM o par miss Grace seria detectado como uma entidade e não seria traduzida ou, a solução mais correcta, traduzida por um módulo específico.
pln/reconhecimento_de_entidades_mencionaveis.txt · Last modified: 2010/08/31 20:48 by ambs