Text- und Sprachverarbeitung

Mathematica Version 11 erweitert das Framework für die Verarbeitung von Zeichenketten, Text und natürlicher Sprache um neue und leistungsstarke Funktionen zur symbolischen Textmanipulation und -analyse. Des Weiteren sind neue Funktionen zur Identifizierung und Extraktion von strukturierten Daten aus unstrukturiertem Text verfügbar. Auch historische Daten zur Worthäufigkeit können untersucht und natürliche Spracheingaben können analysiert werden.

 

Schlüsselfunktionen

  • Neue String-Befehle und Muster machen die String-Verarbeitung einfacher und effizienter »
  • Neue Normalisierungsfunktionen erlauben die Vorverarbeitung für Großschreibung, diakritische Zeichen, Stoppwörter und mehr »
  • Das Arbeiten mit unterschiedlichen Alphabeten berücksichtigt die speziellen Eigenschaften von Zeichen »
  • Zugriff auf Worteigenschaften wie z. B. Definition, Wortstamm oder Wortart »
  • Finden von historischen Worthäufigkeitsdaten aus multilingualen Korpora »
  • Programmatische Segmentierung von Texten in Wörter und Sätze »
  • Finden der grammatikalischen Struktur eines Satzes und Darstellung als Abhängigkeitsgraph, Syntaxbaum usw. »
  • Schreiben von flexiblen Parsern für natürliche Sprache, um Text in Aktionen zu übersetzen »

Beispiele


Flexible String Processing »

String Decomposition  »

Palindromes »

Frequencies of Letters vs. First Letters  »

Positions of Letters in Alphabets »

Learn about Characters »

Computation with Multilingual Word Lists »

Zipf's Law »

Definitions and Parts of Speech »

Generate and Verify Stemmed Words »

Sherlock vs. Watson »

Word Frequency over Time »

Frequency of Common Nouns in Speeches »

Find Country Entities in Texts »

Explore the Structure of Texts »

Compare the Structure of Sentences »

Define Grammar Rules »

Create a Natural Language Calculator »

Create a Flexible Calculator Using a Context-Free Grammar »

Query the Wolfram Knowledgebase Using Natural Language »
ID=4348