Ein kleiner Schritt in die Sentimentanalysenwelt
Mal eine schnell-selbstgemachte Sentimentanalyse:
Step by step
Links sammeln - Link-Übergabe
#!/usr/bin/perl
# sentimentanalyse.pl
use strict;
use warnings;
# Programm
## Öffnen der Tageslinks
open ( my $fh, '<tageslinks.txt' );
my @tageslinks = <$fh>;
close $fh;
print "\nDie Links:\n\n";
print map { $_, "\n" } @tageslinks;
Die Links:
https://www.welt.de/politik/ausland/article186755418/Festnahme-von-Paul-Whelan-Russland-steckt-in-regelrechtem-Spionagewahn.html
https://www.welt.de/politik/ausland/article186860772/Viktor-Orban-Angriff-auf-Emmanuel-Macron-Muss-gegen-ihn-kaempfen.html
https://www.welt.de/regionales/hamburg/article186879446/Integration-Ist-die-Wohngebuehr-fuer-Fluechtlinge-rechtswidrig.html
https://www.welt.de/politik/deutschland/article186855990/Aerzte-ohne-Grenzen-Frau-Merkel-kommen-Sie-nach-Lesbos.html
https://www.welt.de/politik/deutschland/article186885806/AfD-Politiker-Ermittler-wollen-Video-von-Angriff-auf-Magnitz-veroeffentlichen.html
https://www.welt.de/
Einlesen der Sentimentdaten
## Öffnen der negativen Sentiments
open ( $fh, '<SentiWS_v2.0_Negative.txt' );
my @sentiments_negative = <$fh>;
close $fh;
print "\nDie negativen Sentiments:\n\n";
print map { $_, "\n" } @sentiments_negative;
...
übersehen|VVINF -0.5128 übersehe,übersiehst,übersieht,überseht,übersehest,übersehet,übersah,übersahst,übersahen,übersaht,übersähe,übersähest,übersähst,übersähen,übersähet,übersäht
übertreiben|VVINF -0.0372 übertreibe,übertreibst,übertreibt,übertreibest,übertreibet,übertrieb,übertriebst,übertrieben,übertriebt,übertriebe,übertriebest,übertriebst,übertriebet
übertreten|VVINF -0.329 übertrete,übertrittst,übertritt,übertretet,übertretest,übertrat,übertratest,übertratst,übertraten,übertratet,überträte,überträtest,überträten,überträtet
übertrieben|ADJX -0.3203 übertriebenes,übertriebenerer,übertriebeneres,übertriebener,übertriebner,übertriebeneren,übertriebenste,übertriebenen,übertriebenem,übertriebnerem,übertriebneren,übertriebnere,übertriebenerem,übertriebnerer,übertriebenstem,übertriebneres,übertriebene,übertriebenere,übertriebensten,übertriebenstes,übertriebenster
überwältigen|VVINF -0.0048 überwältigest,überwältigten,überwältige,überwältigt,überwältigte,überwältigtest,überwältigst,überwältiget,überwältigtet
So, bis hierhin mehr als easy. Aber nun müssen die Sentimentdaten (die positiven werden folgen) in eine Form, mit der sich operieren lässt. Ich denke da an ein Hash.
## Sentiment-Wert ermitteln
my $sent_val = $sentiments_negative[0];
$sent_val =~ s/.*\|[A-Z]{2,}\s([^\s]+)\s.*/$1/g;
print "\nSentiment-Value: $sent_val\n\n";
## Sentiment-Worte extrahieren
my $sent_words = $sentiments_negative[0];
$sent_words =~ s/(.*)\|[A-Z]{2,}\s[^\s]+\s(.*)/$1 $2/g;
$sent_words =~ s/\s/,/g;
print "\nSentiment-Words: $sent_words\n\n";
my @sent_words = split ( ",", $sent_words );
print "\nSentiment-Words, einzeln:\n\n";
print map { $_, "\n" } @sent_words;
Sentiment-Value: -0.058
Sentiment-Words: Abbau,Abbaus,Abbaues,Abbauen,Abbaue,Abbauten,
Sentiment-Words, einzeln:
Abbau
Abbaus
Abbaues
Abbauen
Abbaue
Abbauten
Bis hierhin immer noch quasi Heimspiel.
## Sentiment-negativ-Hash bilden
my %sent_neg;
foreach ( @sentiments_negative ) {
## Sentiment-Wert ermitteln
my $sent_val = $_;
$sent_val =~ s/.*\|[A-Z]{2,}\s([^\s]+)\s.*/$1/g;
chomp $sent_val;
print "\nSentiment-Value: $sent_val\n\n";
## Sentiment-Worte extrahieren
my $sent_words = $_;
$sent_words =~ s/(.*)\|[A-Z]{2,}\s[^\s]+\s(.*)/$1 $2/g;
$sent_words =~ s/\s/,/g;
print "\nSentiment-Words: $sent_words\n\n";
my @sent_words = split ( ",", $sent_words );
print "\nSentiment-Words, einzeln:\n\n";
print map { $_, "\n" } @sent_words;
foreach ( @sent_words ) {
if ( $_ eq "" ) { next }
if ( not exists $sent_neg{$_} ) { $sent_neg{$_} = $sent_val }
else { print "\n$_ bereits vorhanden!\n\n" }
}
}
print "\nDas Sentiment-Hash:\n\n";
print map { $_, " : ", $sent_neg{$_}, "\n" } sort { $sent_neg{$b} <=> $sent_neg{$a} } keys %sent_neg;
...
schädlichem : -0.9269
schädlichen : -0.9269
schädlichstem : -0.9269
unnötiges : -0.9463
unnötiger : -0.9463
unnötigstem : -0.9463
unnötigem : -0.9463
unnötigen : -0.9463
unnötigstes : -0.9463
unnötigster : -0.9463
unnötigsten : -0.9463
unnötigeres : -0.9463
unnötigere : -0.9463
unnötig : -0.9463
unnötigerer : -0.9463
unnötigerem : -0.9463
unnötigeren : -0.9463
unnötige : -0.9463
unnötigste : -0.9463
Schulden : -0.9686
Schuld : -0.9686
Gefahr : -1.0
Gefahren : -1.0
Yo. Noch keine Schwierigkeit in Sicht.
Code
#!/usr/bin/perl
# sentimentanalyse.pl
use strict;
use warnings;
# Programm
## Öffnen der Tageslinks
open ( my $fh, '<tageslinks.txt' );
my @tageslinks = <$fh>;
close $fh;
print "\nDie Links:\n\n";
print map { $_, "\n" } @tageslinks;
## Öffnen der negativen Sentiments
open ( $fh, '<SentiWS_v2.0_Negative.txt' );
my @sentiments_negative = <$fh>;
close $fh;
print "\nDie negativen Sentiments:\n\n";
print map { $_, "\n" } @sentiments_negative;
## Öffnen der positiven Sentiments
open ( $fh, '<SentiWS_v2.0_Positive.txt' );
my @sentiments_positive = <$fh>;
close $fh;
print "\nDie positiven Sentiments:\n\n";
print map { $_, "\n" } @sentiments_positive;
## Sentiment-negativ-Hash bilden
my %sent_neg;
foreach ( @sentiments_negative ) {
## Sentiment-Wert ermitteln
my $sent_val = $_;
$sent_val =~ s/.*\|[A-Z]{2,}\s([^\s]+)\s.*/$1/g;
chomp $sent_val;
print "\nSentiment-Value: $sent_val\n\n";
## Sentiment-Worte extrahieren
my $sent_words = $_;
$sent_words =~ s/(.*)\|[A-Z]{2,}\s[^\s]+\s(.*)/$1 $2/g;
$sent_words =~ s/\s/,/g;
print "\nSentiment-Words: $sent_words\n\n";
my @sent_words = split ( ",", $sent_words );
print "\nSentiment-Words, einzeln:\n\n";
print map { $_, "\n" } @sent_words;
foreach ( @sent_words ) {
if ( $_ eq "" ) { next }
if ( not exists $sent_neg{$_} ) { $sent_neg{$_} = $sent_val }
else { print "\n$_ bereits vorhanden!\n\n" }
}
}
print "\nDas Sentiment-Hash:\n\n";
print map { $_, " : ", $sent_neg{$_}, "\n" } sort { $sent_neg{$b} <=> $sent_neg{$a} } keys %sent_neg;
## Sentiment-positiv-Hash bilden
my %sent_pos;
foreach ( @sentiments_positive ) {
## Sentiment-Wert ermitteln
my $sent_val = $_;
$sent_val =~ s/.*\|[A-Z]{2,}\s([^\s]+)\s.*/$1/g;
chomp $sent_val;
print "\nSentiment-Value: $sent_val\n\n";
## Sentiment-Worte extrahieren
my $sent_words = $_;
$sent_words =~ s/(.*)\|[A-Z]{2,}\s[^\s]+\s(.*)/$1 $2/g;
$sent_words =~ s/\s/,/g;
print "\nSentiment-Words: $sent_words\n\n";
my @sent_words = split ( ",", $sent_words );
print "\nSentiment-Words, einzeln:\n\n";
print map { $_, "\n" } @sent_words;
foreach ( @sent_words ) {
if ( $_ eq "" ) { next }
if ( not exists $sent_pos{$_} ) { $sent_pos{$_} = $sent_val }
else { print "\n$_ bereits vorhanden!\n\n" }
}
}
print "\nDas Sentiment-Hash:\n\n";
print map { $_, " : ", $sent_pos{$_}, "\n" } sort { $sent_pos{$a} <=> $sent_pos{$b} } keys %sent_pos;
# Token-Bilanzwerte je Link ermitteln
my %tokenbilanz;
foreach ( @tageslinks ) {
## Token aus Links
my $link = $_;
chomp $link;
my $linktext = `lynx -dump -nolist $link`;
$linktext =~ s/\n/ /g;
$linktext =~ s/[\s]+/ /g;
my @token = split ( " ", $linktext );
# print "\nToken:\n\n";
# print map { $_, "\n" } @token;
# Token-Werte summieren
my $token_sum = 0;
foreach ( @token ) {
my $token_neg;
if ( exists $sent_neg{$_} ) { $token_neg = $sent_neg{$_} }
else { $token_neg = 0 }
my $token_pos;
if ( exists $sent_pos{$_} ) { $token_pos = $sent_pos{$_} }
else { $token_pos = 0 }
$token_sum = $token_neg + $token_pos + $token_sum;
}
print "\nDer Link:\n$link\n";
print "\nDer Token-Bilanzwert: $token_sum\n\n";
}
Output
...
Der Link:
https://www.welt.de/politik/ausland/article186755418/Festnahme-von-Paul-Whelan-Russland-steckt-in-regelrechtem-Spionagewahn.html
Der Token-Bilanzwert: -8.43840000000001
Der Link:
https://www.welt.de/politik/ausland/article186860772/Viktor-Orban-Angriff-auf-Emmanuel-Macron-Muss-gegen-ihn-kaempfen.html
Der Token-Bilanzwert: -4.5123
Der Link:
https://www.welt.de/regionales/hamburg/article186879446/Integration-Ist-die-Wohngebuehr-fuer-Fluechtlinge-rechtswidrig.html
Der Token-Bilanzwert: -1.388
Der Link:
https://www.welt.de/politik/deutschland/article186855990/Aerzte-ohne-Grenzen-Frau-Merkel-kommen-Sie-nach-Lesbos.html
Der Token-Bilanzwert: -2.3985
Der Link:
https://www.welt.de/politik/deutschland/article186885806/AfD-Politiker-Ermittler-wollen-Video-von-Angriff-auf-Magnitz-veroeffentlichen.html
Der Token-Bilanzwert: -10.2492
Der Link:
https://www.welt.de/
Der Token-Bilanzwert: -29.5636999999999
Der
erste Entwurf funzt schon mal einwandfrei. Als Nächstes folgt -
wahrscheinlich demnächst - die Integration in meine Datenbank.
Zum gelungenen Abschluss des Abends sammele ich mal ein paar mehr Links.
Code-Änderung zum Abschluss
...
# Token-Bilanzwerte je Link ermitteln
my %tokenbilanz;
foreach ( @tageslinks ) {
## Token aus Links
my $link = $_;
chomp $link;
my $linktext = `lynx -dump -nolist $link`;
$linktext =~ s/\n/ /g;
$linktext =~ s/[\s]+/ /g;
my @token = split ( " ", $linktext );
# print "\nToken:\n\n";
# print map { $_, "\n" } @token;
# Token-Werte summieren
my $token_sum = 0;
foreach ( @token ) {
my $token_neg;
if ( exists $sent_neg{$_} ) { $token_neg = $sent_neg{$_} }
else { $token_neg = 0 }
my $token_pos;
if ( exists $sent_pos{$_} ) { $token_pos = $sent_pos{$_} }
else { $token_pos = 0 }
$token_sum = $token_neg + $token_pos + $token_sum;
}
print "\nDer Link:\n$link\n";
print "\nDer Token-Bilanzwert: $token_sum\n\n";
$tokenbilanz{$link} = $token_sum;
}
print "\nDie Tokenbilanz sortiert:\n\n";
foreach ( sort { $tokenbilanz{$a} <=> $tokenbilanz{$b} } keys %tokenbilanz ) {
print "\nDer Link:\n$_\n";
print "\nDer Token-Bilanzwert: $tokenbilanz{$_}\n\n";
}
Output zum Abschluss
...
Die Tokenbilanz sortiert:
Der Link:
https://www.zeit.de/politik/ausland/2019-01/usa-mexiko-grenze-donald-trump-zahlen
Der Token-Bilanzwert: -11.5108
Der Link:
https://www.welt.de/politik/deutschland/article186885806/AfD-Politiker-Ermittler-wollen-Video-von-Angriff-auf-Magnitz-veroeffentlichen.html
Der Token-Bilanzwert: -10.2492
Der Link:
https://www.welt.de/politik/ausland/article186755418/Festnahme-von-Paul-Whelan-Russland-steckt-in-regelrechtem-Spionagewahn.html
Der Token-Bilanzwert: -8.43840000000001
Der Link:
http://www.spiegel.de/wirtschaft/soziales/brexit-in-der-britischen-wirtschaft-waechst-die-nervositaet-a-1229304.html
Der Token-Bilanzwert: -8.20180000000001
Der Link:
https://www.t-online.de/gesundheit/krankheiten-symptome/id_43998616/wie-gefaehrlich-sind-punkte-und-blitze-im-auge-.html
Der Token-Bilanzwert: -8.18310000000001
Der Link:
https://www.zeit.de/politik/ausland/2019-01/pedro-sanchez-francisco-franco-ueberreste-exhumierung-spanien
Der Token-Bilanzwert: -5.94220000000001
Der Link:
https://www.zeit.de/kultur/film/2019-01/drogensucht-usa-ben-is-back-beautiful-boy-film
Der Token-Bilanzwert: -4.9446
Der Link:
https://www.sueddeutsche.de/wissen/plastik-ocean-cleanup-boyan-slat-meere-plastikmuell-mikroplastik-1.4274339
Der Token-Bilanzwert: -4.83390000000001
Der Link:
https://www.welt.de/politik/ausland/article186860772/Viktor-Orban-Angriff-auf-Emmanuel-Macron-Muss-gegen-ihn-kaempfen.html
Der Token-Bilanzwert: -4.5123
Der Link:
https://www.faz.net/aktuell/politik/trumps-praesidentschaft/mauer-konflikt-donald-trump-reist-an-grenze-zu-mexiko-15982244.html
Der Token-Bilanzwert: -3.903
Der Link:
https://www.zeit.de/politik/ausland/2018-12/suedchinesisches-meer-china-nationalismus-geschichte-narrative-territorialstreit/komplettansicht
Der Token-Bilanzwert: -3.8236
Der Link:
https://www.spektrum.de/news/schneemassen-sorgen-fuer-lawinengefahr/982995
Der Token-Bilanzwert: -3.71310000000001
Der Link:
http://www.spiegel.de/politik/deutschland/andre-poggenburg-tritt-aus-der-afd-aus-a-1247481.html
Der Token-Bilanzwert: -3.3462
Der Link:
https://www.zeit.de/politik/ausland/2019-01/weltwirtschaftsforum-davos-donald-trump-absage-haushalt-shutdown
Der Token-Bilanzwert: -2.4925
Der Link:
https://www.welt.de/politik/deutschland/article186855990/Aerzte-ohne-Grenzen-Frau-Merkel-kommen-Sie-nach-Lesbos.html
Der Token-Bilanzwert: -2.3985
Der Link:
https://www.sueddeutsche.de/digital/hackerangriff-it-sicherheit-passwoerter-tipps-1.4276393
Der Token-Bilanzwert: -2.3186
Der Link:
https://www.bild.de/video/clip/voice-of-bundesliga/goldrausch-ribery-59471156.bild.html
Der Token-Bilanzwert: -1.9863
Der Link:
https://www.welt.de/regionales/hamburg/article186879446/Integration-Ist-die-Wohngebuehr-fuer-Fluechtlinge-rechtswidrig.html
Der Token-Bilanzwert: -1.388
Der Link:
https://www.zeit.de/video/2018-08/5825387646001/plastik-im-meer-erst-vergiften-wir-den-ozean-dann-uns-selbst
Der Token-Bilanzwert: -1.2214
Der Link:
https://www.spektrum.de/news/sporthormon-bremst-alzheimersymptome/1617262
Der Token-Bilanzwert: -0.9382
Der Link:
https://www.zeit.de/politik/deutschland/2019-01/einigung-cdu-friedrich-merz-annegret-kramp-karrenbauer-expertenkommission
Der Token-Bilanzwert: -0.0565000000000001
Der Link:
https://www.bild.de/bild-plus/geld/wirtschaft/politik-inland/flughafen-streik-krasse-gehalts-unterschiede-beim-sicherheitspersonal-59460140,view=conversionToLogin.bild.html
Der Token-Bilanzwert: 0.1232
Der Link:
https://www.zeit.de/politik/ausland/2019-01/athen-griechenland-angela-merkel-alexis-tsipras-staatsbesuch-finanzmaerkte
Der Token-Bilanzwert: 2.2116
Der Link:
http://www.spiegel.de/wissenschaft/weltall/schwarze-loecher-wie-schwerkraftmonster-sterne-zerfetzen-a-1247443.html
Der Token-Bilanzwert: 4.38639999999999
Der Link:
https://www.spektrum.de/news/radioaktiver-exot-entpuppt-sich-als-neutronenschreck/1617182
Der Token-Bilanzwert: 5.2375
Die negativsten Meldungen stehen oben, die positivsten unten - aufsteigend (positiv) sortiert.
Überrascht das Ergebnis jemand/jefraud/jefimd?
Kleine Änderung(en)
my %tokenbilanz;
foreach ( @tageslinks ) {
## Token aus Links
my $link = $_;
chomp $link;
my $linktext = `lynx -dump -nolist $link`;
$linktext =~ s/\n/ /g;
$linktext =~ s/[^a-zA-ZäöüÄÖÜß]+/ /g;
$linktext =~ s/[\s]+/ /g;
my @token = split ( " ", $linktext );
# print "\nToken:\n\n";
# print map { $_, "\n" } @token;
# Token-Werte summieren
my $token_sum = 0;
foreach ( @token ) {
my $token_neg;
if ( exists $sent_neg{$_} ) { $token_neg = $sent_neg{$_} }
else { $token_neg = 0 }
my $token_pos;
if ( exists $sent_pos{$_} ) { $token_pos = $sent_pos{$_} }
else { $token_pos = 0 }
$token_sum = $token_neg + $token_pos + $token_sum;
}
print "\nDer Link:\n$link\n";
print "Der Token-Bilanzwert: $token_sum\n";
$tokenbilanz{$link} = $token_sum;
}
print "\nDie Tokenbilanz sortiert:\n\n";
foreach ( sort { $tokenbilanz{$a} <=> $tokenbilanz{$b} } keys %tokenbilanz ) {
print "\nDer Link:\n$_\n";
print "Der Token-Bilanzwert: $tokenbilanz{$_}\n";
}
Große Folge(n)!
Die Tokenbilanz sortiert:
Der Link:
https://www.zeit.de/politik/ausland/2019-01/usa-mexiko-grenze-donald-trump-zahlen
Der Token-Bilanzwert: -14.1852
Der Link:
https://www.welt.de/politik/deutschland/article186885806/AfD-Politiker-Ermittler-wollen-Video-von-Angriff-auf-Magnitz-veroeffentlichen.html
Der Token-Bilanzwert: -12.1868
Der Link:
http://www.spiegel.de/wirtschaft/soziales/brexit-in-der-britischen-wirtschaft-waechst-die-nervositaet-a-1229304.html
Der Token-Bilanzwert: -11.0796
Der Link:
https://www.welt.de/politik/ausland/article186755418/Festnahme-von-Paul-Whelan-Russland-steckt-in-regelrechtem-Spionagewahn.html
Der Token-Bilanzwert: -10.8176
Der Link:
https://www.t-online.de/gesundheit/krankheiten-symptome/id_43998616/wie-gefaehrlich-sind-punkte-und-blitze-im-auge-.html
Der Token-Bilanzwert: -9.49560000000001
Der Link:
https://www.welt.de/politik/ausland/article186860772/Viktor-Orban-Angriff-auf-Emmanuel-Macron-Muss-gegen-ihn-kaempfen.html
Der Token-Bilanzwert: -6.4489
Der Link:
https://www.zeit.de/politik/ausland/2019-01/pedro-sanchez-francisco-franco-ueberreste-exhumierung-spanien
Der Token-Bilanzwert: -6.26450000000001
Der Link:
https://www.sueddeutsche.de/wissen/plastik-ocean-cleanup-boyan-slat-meere-plastikmuell-mikroplastik-1.4274339
Der Token-Bilanzwert: -5.18990000000001
Der Link:
https://www.zeit.de/politik/ausland/2018-12/suedchinesisches-meer-china-nationalismus-geschichte-narrative-territorialstreit/komplettansicht
Der Token-Bilanzwert: -5.00850000000001
Der Link:
https://www.sueddeutsche.de/digital/hackerangriff-it-sicherheit-passwoerter-tipps-1.4276393
Der Token-Bilanzwert: -4.2759
Der Link:
https://www.zeit.de/politik/ausland/2019-01/weltwirtschaftsforum-davos-donald-trump-absage-haushalt-shutdown
Der Token-Bilanzwert: -3.8179
Der Link:
http://www.spiegel.de/politik/deutschland/andre-poggenburg-tritt-aus-der-afd-aus-a-1247481.html
Der Token-Bilanzwert: -3.4687
Der Link:
https://www.spektrum.de/news/schneemassen-sorgen-fuer-lawinengefahr/982995
Der Token-Bilanzwert: -3.29960000000001
Der Link:
https://www.welt.de/regionales/hamburg/article186879446/Integration-Ist-die-Wohngebuehr-fuer-Fluechtlinge-rechtswidrig.html
Der Token-Bilanzwert: -2.9049
Der Link:
https://www.bild.de/video/clip/voice-of-bundesliga/goldrausch-ribery-59471156.bild.html
Der Token-Bilanzwert: -2.8202
Der Link:
https://www.welt.de/politik/deutschland/article186855990/Aerzte-ohne-Grenzen-Frau-Merkel-kommen-Sie-nach-Lesbos.html
Der Token-Bilanzwert: -2.6923
Der Link:
https://www.zeit.de/kultur/film/2019-01/drogensucht-usa-ben-is-back-beautiful-boy-film
Der Token-Bilanzwert: -2.5038
Der Link:
https://www.spektrum.de/news/sporthormon-bremst-alzheimersymptome/1617262
Der Token-Bilanzwert: -1.7951
Der Link:
https://www.zeit.de/video/2018-08/5825387646001/plastik-im-meer-erst-vergiften-wir-den-ozean-dann-uns-selbst
Der Token-Bilanzwert: -0.773
Der Link:
https://www.zeit.de/politik/deutschland/2019-01/einigung-cdu-friedrich-merz-annegret-kramp-karrenbauer-expertenkommission
Der Token-Bilanzwert: -0.2423
Der Link:
https://www.bild.de/bild-plus/geld/wirtschaft/politik-inland/flughafen-streik-krasse-gehalts-unterschiede-beim-sicherheitspersonal-59460140,view=conversionToLogin.bild.html
Der Token-Bilanzwert: -0.2401
Der Link:
https://www.zeit.de/politik/ausland/2019-01/athen-griechenland-angela-merkel-alexis-tsipras-staatsbesuch-finanzmaerkte
Der Token-Bilanzwert: 0.673100000000001
Der Link:
https://www.spektrum.de/news/radioaktiver-exot-entpuppt-sich-als-neutronenschreck/1617182
Der Token-Bilanzwert: 4.403
Der Link:
http://www.spiegel.de/wissenschaft/weltall/schwarze-loecher-wie-schwerkraftmonster-sterne-zerfetzen-a-1247443.html
Der Token-Bilanzwert: 5.34749999999999
Der Link:
https://www.faz.net/aktuell/politik/trumps-praesidentschaft/mauer-konflikt-donald-trump-reist-an-grenze-zu-mexiko-15982244.html
Der Token-Bilanzwert: 18.7734000000001
Zwischenfazit:
Es
sollte klar sein, daß eine solche Vorgehensweise nur eine
Milchmädchen-Sentimentanalyse sein kann. Nicht viel mehr als Spielerei.
Ersehen lässt sich daraus nur, ob im Text enthaltene in den
Sentiment-Tabellen gewichtete Worte das Gesamtgewicht eher negativ oder
positiv beeinflussen (können). Aber durch die Spielerei ist immerhin ein
wenig Vorarbeit geleistet, die es einfacher macht, demnächst klügere,
genauere Sentimentanalysen durchführen zu können.
Kommentare
Kommentar veröffentlichen