Ogni tipo di testo, sia scritto che parlato, contiene informazioni e significati. Se per noi umani la produzione e la comprensione di parole, frasi e testi è qualcosa di naturale, lo stesso non vale per i computer. Il motivo è che le informazioni provenienti da questo tipo di dato sono spesso in formato non strutturato, ovvero prive di uno schema organizzativo e interpretativo di base, elemento tanto amato dalle macchine.
Il Natural Language Processing è quel ramo dell’Intelligenza Artificiale che aiuta i computer a colmare il gap linguistico, abilitando alla comprensione e alla generazione di testo scritto e parlato.
Le tecniche di NLP strutturano e preparano il linguaggio affinché le informazioni contenute in esso vengano comprese, interpretate e organizzate dalle macchine. Alcuni obiettivi del NLP sono la classificazione di argomenti, la Sentiment Analysis, la Named Entity Recognition e la Document Search.
È grazie al Natural Language Processing se siamo in grado di condurre analisi testuali su larga scala in tempi brevi, automatizzare procedure ripetitive ed estrarre conoscenza da documenti, file audio e video in modo da catalogarli sulla base dei metadati riconosciuti.