Heutiger Testraketenstart - Stufe 8a


Stufe 8 wird exklusiv der Sentimentanalyse gewidmet.


Heute in Stufe 8b:

Textmining mit R - Sentimentanalyse



Datenquelle: ‘From Group to Individual Labels using Deep Features’, Kotzias et. al,. KDD 2015

Download-Link zum kompletten R-Code für dieses Text-Mining-Beispiel: https://www.data-science-blog.com/download/textMiningTeaser.rmd

Dr. Dietrich Wettschereck
Dietrich Wettschereck (PhD) ist seit 30 Jahren als Forscher, Unternehmer, Programmierer und Berater in den Bereichen KI und Machine Learning tätig. Seine wissenschaftliche Karriere beendete er 1997 mit über 20 Publikationen (u.a. im Machine Learning Journal, der NIPS und dem Artificial Intelligence Review Journal). Seitdem hat er eine Vielzahl von innovativen Analyse- und Entwicklungsprojekten sowohl für Konzerne als auch Start-Ups erfolgreich umgesetzt. Seit 2018 ist Dietrich Wettschereck Head of AI bei der tarent solutions GmbH, einer Technologieagentur mit Sitz in Bonn, Köln, Berlin und Bukarest.


Text Mining mit R | Hands on datascience | Sco...


Ein schönes Tutorial, was durch den "textMiningTeaser.rmd", der einfach in RStudio geladen werden kann, und wo zusammengehörende Blöcke von Codezeilen als Chunks ganz einfach mit einem Klick abgespielt {sagt fim das so?} werden können, nochmal aufgewertet und abgerundet wird ... aber es könnte sein, dass ich grade leicht ins Labern aufgedriftet bin ;-)


Soweit ich sehe, stammt das Tutorial von 2015. Zwei Dinge haben bei mir - womöglich wegen Änderungen in den verwendeten Paketen - nicht funktioniert:

1.
corpus <- Corpus(DataframeSource(data.frame(labelled$text)))
2.
if (rerun) {
  tree <- rpart(formula, data = trainingData)
  save(tree, file=sprintf("%s-tree.RData", prefix))
} else {
  load(file=sprintf("c:/tmp/%s-tree.RData", prefix))
}
3. 
if (rerun) {
    svmModel <- svm(formula, data = trainingData)
    save(svmModel, file=sprintf("%s-svm.RData", prefix))
  } else {
    load(file=sprintf("c:/tmp/%s-svm.RData", prefix))
  }
Diese Zeilen habe ich nach meinem Gutdünken angepasst - keine Gewähr auf Korrektigkeit, laufen tutete es aber dann so.
Weil es hier in der Textformatierung unschön aussieht, verlinke ich hiermit das PDF, was ich aus meinem RStudio aus der Vorlage von Herrn Wettschereck mit meinen behelfmässigen Korrekturen zur Einsicht erzeugt habe:

Ich hoffe, ich habe anderen Interessierten damit einen Gefallen tun können (und ohne Irreführung, schließlich bin ich Laie).

Ach, genau! Außerdem habe ich die Amazon-TEXT-Datei als Amazon_X-CSV-Datei gespeichert, nachdem ich aus ersterer ein paar Labels entfernt habe. Denn iwi gab es in den vorgefundenen Textdateien gar keine nicht gelabelten Zeilen (mehr?). Viel Mühe habe ich mir damit (noch) nicht gegeben - aus Zeitgründen, heute war mächtig viel zu erledigen für mich. Ich hoffe, dass ich das bald nachholen kann. Was? Diese Stufe ein bisschen ausführlicher und besser zu dokumentieren.


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

Aussicht auf (teilweise wahrscheinlich) kommende Stufen (unsortierte Linksammlung)

sentiment labelled sentences.zip Index of /ml/machine-learning-databases/00331 UCI Machine Learning Repository: Sentiment Labelled Sentences Data Set computational linguistics - Combinatory Categorial Grammar (комбинаторная категориальная грамматика) developments and lexicon for Russian language? - Linguistics Stack Exchange GitHub - lil-lab/spf: Cornell Semantic Parsing Framework computational linguistics - Combinatory Categorial Grammar developments and lexicon for German language? - Linguistics Stack Exchange OpenCCG: The OpenNLP CCG Library / Wiki / Home The CCG site Efficient CCG Parsing: A* versus Adaptive Supertagging | OpenReview GitHub - nert-nlp/CCG-parsing: Two projects on CCG parsing and code for various basic functions Combinatory Logic - Combinatory Logic in Programming.pdf soft question - Is Combinatory Logic (CL) still relevant for programming language theory? - Theoretical Computer Science Stack Exchange German Sentiment Analysis Toolkit | Kaggle Marco Lehner. Datenjournalismus - Technikjournalismus German Sentiment Corpus | Spinning Bytes Release of Sentiment Corpus Deutsch SB-10k | Spinning Bytes (PDF) A Twitter Corpus and Benchmark Resources for German Sentiment Analysis corpus_v1.0.tsv GitHub - aritter/twitter_download: Download scripts for distributing twitter data. Einführung in die Sentiment Analyse | ixto GmbH Creation of a German Corpus for Internet News Sentiment Analysis - Creation_of_a_German_Corpus_for_Internet_News_2016.pdf DAI-Labor > Kompetenzzentren > CC IRML > Datensätze Downloads GitHub - cbpuschmann/inhaltsanalyse-mit-r.de: Deutschsprachige Einführung in die automatisierte Inhaltsanalyse mit R. inhaltsanalyse-mit-r.de/verschiedenes at master · cbpuschmann/inhaltsanalyse-mit-r.de · GitHub koRpus - ein R-paket zur textanalyse - TeaP-2012-04-04_koRpus.pdf Contradiction detection between news articles - f2126667921.pdf (PDF) Finding Contradictions in Text | Chris Manning - Academia.edu JulianTritscher_BA.pdf zc-uai05.pdf Informatics at Edinburgh: Informatics Theses Python-nltk Archives - GeeksforGeeks sempre/TUTORIAL.md at master · percyliang/sempre · GitHub GitHub - mikelewis0/easyccg GitHub - masashi-y/depccg: A* CCG Parser with a Supertag and Dependency Factored Model Combinatory Categorial Grammar Combinatory logic - Wikipedia Combinatory categorial grammar - Wikipedia CCG - Wikipedia depccg · PyPI Cyberhate Text-Mining - Können Analytics den Hass im Netz eindämmen?  



Besonders herausstellen möchte ich (aus gewissen, mir nur bekannten Gründen):


Einführung in die Sentiment Analyse | ixto GmbH  

Anschauen lohnt sich (für mich).


~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~+

Zusätzliches Hebbl'la'bebbl



Thank You for Downloading Eclipse | The Eclipse Foundation Installation von Eclipse unter Windows 10 - RoNaSoft UDepLambda/doc at master · sivareddyg/UDepLambda · GitHub GitHub - sivareddyg/UDepLambda: A framework to convert Universal Dependencies to Logical Forms Klassen - Fehler: Hauptklasse konnte nicht gefunden oder geladen werden command line - Is there replacement for cat on Windows - Stack Overflow Installing Apache Ant Fehler beim Installieren von Ant: ANT_HOME ist falsch eingestellt ant — So legen Sie die Pfadumgebungsvariable aus einem Ant-Skript fest ant - How to set ANT_HOME with Windows? - Stack Overflow Installing Apache Ant OpenJDK8U-jdk_x64_windows_hotspot_8u232b09.msi AdoptOpenJDK - Open Source, vorkonfigurierte OpenJDK Binärdateien Java ist nun kostenpflichtig : Das können Sie tun - : Logicalis UDepLambda/Makefile at master · sivareddyg/UDepLambda · GitHub DepLambda Demo GitHub - sivareddyg/UDepLambda: A framework to convert Universal Dependencies to Logical Forms Rule of inference - Wikipedia Inference | Logic Notes - ANU 1902.00972.pdf Inference - Wikipedia pasupat2016inferring.pdf 
NivreGeneva3.key - NivreGeneva3.pdf 1910.00051.pdf GitHub - owainlewis/lambda-calculus: Lambda calculus parser in Haskell Q16-1010.pdf Das gefuerchtete Lambda-Kalkuel notes-lambda.ps Lambda-Kalkül – Wikipedia start [ufal wiki] UDPipe Models | ÚFAL UDPipe Installation | ÚFAL ufal.udpipe · PyPI deplambda/assignment-rules.pb.txt at master · sivareddyg/deplambda · GitHub deplambda/transformation-rules.pb.txt at master · sivareddyg/deplambda · GitHub

Kommentare

Beliebte Posts aus diesem Blog

·

Es brennt.

Bye, bye Nord Stream 2!