web-dev-qa-db-fra.com

Tutoriels pour le traitement du langage naturel

J'ai récemment assisté à un cours sur coursera sur le "traitement du langage naturel" et j'ai beaucoup appris sur l'analyse syntaxique, l'IR et d'autres aspects intéressants tels que les questions-réponses, etc., même si j'ai bien compris les concepts, il. Quelqu'un peut-il me suggérer de bons tutoriels ou livres en ligne sur le traitement automatique du langage?

Merci

24
Dude

Vous pourriez lire Jurafsky et Martin/ Traitement de la parole et du langage (édition 2008) , qui est le manuel standard dans ce domaine. Il est long et couvre une variété de sujets. Je vous suggère donc de lire uniquement les chapitres qui concernent réellement vos intérêts.

En outre, le meilleur moyen d’apprendre consiste presque certainement à implémenter les algorithmes PNL à partir de rien. Vous pouvez choisir des tâches standard (modélisation du langage, classification du texte, POS-tagging, NER, analyse) et implémenter divers algorithmes à partir de la base (modèles ngram, HMM, Naive Bayes, MaxEnt, CKY) pour vraiment comprendre ce qui les fait fonctionner. En outre, il ne devrait pas être trop difficile de trouver un ensemble de données gratuit sur lequel tester vos implémentations.

Enfin, il existe de nombreux tutoriels pour des algorithmes de PNL spécifiques qui sont excellents. Par exemple, si vous voulez construire un HMM, je suggère le didacticiel de Jason Eisner , qui couvre également le lissage et la formation non supervisée avec EM. Si vous souhaitez implémenter l'échantillonnage Gibbs pour une formation Naive Bayes non supervisée, je suggère le tutoriel de Philip Resnik .

34
dhg

Outre le livre de Jurafsky et Martin, le langage { Fondements du traitement statistique du langage naturel } de Christopher D. Manning et Hinrich Schütze est également largement utilisé. Pour IR, Manning et al. a également écrit Introduction à la recherche d'information qui peut être lue ou téléchargée en ligne sur leur site.

9
Kenston Choi

Si vous souhaitez avoir des connaissances pratiques sur la manière de travailler sur le langage naturel, vous devez commencer à le mettre en œuvre ..__ Je suggère d'utiliser NLTK (Kit de développement de langage naturel) avec Python. Il est facile d'implémenter la PNL en python.

Vous pouvez vous référer à ce lien http://nltk.org/

Ou vous pouvez l'essayer en ligne sur http://cst.dk/online/pos_tagger/uk/

7
Gunjan

Plutôt que de lire un livre en particulier, plonger dans la mer de papiers pourrait être une bonne idée. http://www.aclweb.org , par exemple, contient de nombreux sujets sur la PNL. Grâce à ces documents, vous obtenez des références à d'autres documents, dont certains sont les fondements d'une certaine branche de la PNL. Et parce qu'ils ont été écrits par différents auteurs, vous ne serez probablement pas trop influencé par un point de vue.

1
Kun Wu

Si vous êtes un développeur Java, vous trouverez une liste complète de didacticiels sur la création de composants de systèmes de PNL à l'aide de LingPipe à l'adresse http://alias-i.com/lingpipe/demos/tutorial/read-me.html . Divulgation complète J'ai écrit certains de ces tutoriels et l'un des livres ci-dessous.

Il existe quelques livres plus axés sur l'industrie:

1) Traitement du langage naturel avec Java par Richard M Reese

Cela explique comment effectuer certaines tâches courantes avec une gamme de boîtes à outils open source (y compris LingPipe).

2) Traitement du langage naturel avec Java et LingPipe Cookbook Paperback De Breck Baldwin, Krishna Dayanidhi 

Ce livre est axé sur les tâches au niveau "obtenir le composant construit" et couvre les principales technologies à la base de la plupart des systèmes de PNL basés sur le texte. Cela ne couvre pas la traduction. Il va plus en détail que le premier livre et a une couverture plus large que les tutoriels LingPipe mais est parfois moins détaillé que les tutoriels. 

Breck

1
Breck Baldwin

Il existe un centre pour le matériel d’enseignement et d’apprentissage appelé TeLeMaCo . Vous pouvez trouver des ressources pour de nombreux aspects de la PNL et vous pouvez facilement ajouter plus de matériaux que vous avez trouvés sur le Web.

0
jknappen