Heutiger Testraketenstart - Stufe 8a
Stufe 8 wird exklusiv der Sentimentanalyse gewidmet.
Heute in Stufe 8b:
Textmining mit R - Sentimentanalyse
Datenquelle: ‘From Group to Individual Labels using Deep Features’, Kotzias et. al,. KDD 2015
Download-Link zum kompletten R-Code für dieses Text-Mining-Beispiel: https://www.data-science-blog.com/download/textMiningTeaser.rmd
Text Mining mit R | Hands on datascience | Sco...
Ein schönes Tutorial, was durch den "textMiningTeaser.rmd", der einfach in RStudio geladen werden kann, und wo zusammengehörende Blöcke von Codezeilen als Chunks ganz einfach mit einem Klick abgespielt {sagt fim das so?} werden können, nochmal aufgewertet und abgerundet wird ... aber es könnte sein, dass ich grade leicht ins Labern aufgedriftet bin ;-)
Soweit ich sehe, stammt das Tutorial von 2015. Zwei Dinge haben bei mir - womöglich wegen Änderungen in den verwendeten Paketen - nicht funktioniert:
1.
corpus <- Corpus(DataframeSource(data.frame(labelled$text)))
2.
if (rerun) {tree <- rpart(formula, data = trainingData)save(tree, file=sprintf("%s-tree.RData", prefix))} else {load(file=sprintf("c:/tmp/%s-tree.RData", prefix))}
3.
if (rerun) {
svmModel <- svm(formula, data = trainingData)save(svmModel, file=sprintf("%s-svm.RData", prefix))} else {load(file=sprintf("c:/tmp/%s-svm.RData", prefix))}
Diese Zeilen habe ich nach meinem Gutdünken angepasst - keine Gewähr auf Korrektigkeit, laufen tutete es aber dann so.
Weil es hier in der Textformatierung unschön aussieht, verlinke ich hiermit das PDF, was ich aus meinem RStudio aus der Vorlage von Herrn Wettschereck mit meinen behelfmässigen Korrekturen zur Einsicht erzeugt habe:
Ich hoffe, ich habe anderen Interessierten damit einen Gefallen tun können (und ohne Irreführung, schließlich bin ich Laie).
Ach, genau! Außerdem habe ich die Amazon-TEXT-Datei als Amazon_X-CSV-Datei gespeichert, nachdem ich aus ersterer ein paar Labels entfernt habe. Denn iwi gab es in den vorgefundenen Textdateien gar keine nicht gelabelten Zeilen (mehr?). Viel Mühe habe ich mir damit (noch) nicht gegeben - aus Zeitgründen, heute war mächtig viel zu erledigen für mich. Ich hoffe, dass ich das bald nachholen kann. Was? Diese Stufe ein bisschen ausführlicher und besser zu dokumentieren.
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Aussicht auf (teilweise wahrscheinlich) kommende Stufen (unsortierte Linksammlung)
Text Mining mit R – Data Science Blog Handling Strings with R Hands on datascience | Scoop.it Text Mining mit R | Hands on datascience | Sco... tm.pdf
sentiment labelled sentences.zip
Index of /ml/machine-learning-databases/00331
UCI Machine Learning Repository: Sentiment Labelled Sentences Data Set
computational linguistics - Combinatory Categorial Grammar (комбинаторная категориальная грамматика) developments and lexicon for Russian language? - Linguistics Stack Exchange
GitHub - lil-lab/spf: Cornell Semantic Parsing Framework
computational linguistics - Combinatory Categorial Grammar developments and lexicon for German language? - Linguistics Stack Exchange
OpenCCG: The OpenNLP CCG Library / Wiki / Home
The CCG site
Efficient CCG Parsing: A* versus Adaptive Supertagging | OpenReview
GitHub - nert-nlp/CCG-parsing: Two projects on CCG parsing and code for various basic functions
Combinatory Logic - Combinatory Logic in Programming.pdf
soft question - Is Combinatory Logic (CL) still relevant for programming language theory? - Theoretical Computer Science Stack Exchange
German Sentiment Analysis Toolkit | Kaggle
Marco Lehner. Datenjournalismus - Technikjournalismus
German Sentiment Corpus | Spinning Bytes
Release of Sentiment Corpus Deutsch SB-10k | Spinning Bytes
(PDF) A Twitter Corpus and Benchmark Resources for German Sentiment Analysis
corpus_v1.0.tsv
GitHub - aritter/twitter_download: Download scripts for distributing twitter data.
Einführung in die Sentiment Analyse | ixto GmbH
Creation of a German Corpus for Internet News Sentiment Analysis - Creation_of_a_German_Corpus_for_Internet_News_2016.pdf
DAI-Labor > Kompetenzzentren > CC IRML > Datensätze
Downloads
GitHub - cbpuschmann/inhaltsanalyse-mit-r.de: Deutschsprachige Einführung in die automatisierte Inhaltsanalyse mit R.
inhaltsanalyse-mit-r.de/verschiedenes at master · cbpuschmann/inhaltsanalyse-mit-r.de · GitHub
koRpus - ein R-paket zur textanalyse - TeaP-2012-04-04_koRpus.pdf
Contradiction detection between news articles - f2126667921.pdf
(PDF) Finding Contradictions in Text | Chris Manning - Academia.edu
JulianTritscher_BA.pdf
zc-uai05.pdf
Informatics at Edinburgh: Informatics Theses
Python-nltk Archives - GeeksforGeeks
sempre/TUTORIAL.md at master · percyliang/sempre · GitHub
GitHub - mikelewis0/easyccg
GitHub - masashi-y/depccg: A* CCG Parser with a Supertag and Dependency Factored Model
Combinatory Categorial Grammar
Combinatory logic - Wikipedia
Combinatory categorial grammar - Wikipedia
CCG - Wikipedia
depccg · PyPI
Cyberhate Text-Mining - Können Analytics den Hass im Netz eindämmen?
Besonders herausstellen möchte ich (aus gewissen, mir nur bekannten Gründen):
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~+
Zusätzliches Hebbl'la'bebbl
Thank You for Downloading Eclipse | The Eclipse Foundation Installation von Eclipse unter Windows 10 - RoNaSoft UDepLambda/doc at master · sivareddyg/UDepLambda · GitHub GitHub - sivareddyg/UDepLambda: A framework to convert Universal Dependencies to Logical Forms Klassen - Fehler: Hauptklasse konnte nicht gefunden oder geladen werden command line - Is there replacement for cat on Windows - Stack Overflow Installing Apache Ant Fehler beim Installieren von Ant: ANT_HOME ist falsch eingestellt ant — So legen Sie die Pfadumgebungsvariable aus einem Ant-Skript fest ant - How to set ANT_HOME with Windows? - Stack Overflow Installing Apache Ant OpenJDK8U-jdk_x64_windows_hotspot_8u232b09.msi AdoptOpenJDK - Open Source, vorkonfigurierte OpenJDK Binärdateien Java ist nun kostenpflichtig : Das können Sie tun - : Logicalis UDepLambda/Makefile at master · sivareddyg/UDepLambda · GitHub DepLambda Demo GitHub - sivareddyg/UDepLambda: A framework to convert Universal Dependencies to Logical Forms Rule of inference - Wikipedia Inference | Logic Notes - ANU 1902.00972.pdf Inference - Wikipedia pasupat2016inferring.pdf
NivreGeneva3.key - NivreGeneva3.pdf 1910.00051.pdf GitHub - owainlewis/lambda-calculus: Lambda calculus parser in Haskell Q16-1010.pdf Das gefuerchtete Lambda-Kalkuel notes-lambda.ps Lambda-Kalkül – Wikipedia start [ufal wiki] UDPipe Models | ÚFAL UDPipe Installation | ÚFAL ufal.udpipe · PyPI deplambda/assignment-rules.pb.txt at master · sivareddyg/deplambda · GitHub deplambda/transformation-rules.pb.txt at master · sivareddyg/deplambda · GitHub
Kommentare
Kommentar veröffentlichen