Ein kleiner Schritt in die Sentimentanalysenwelt


Mal eine schnell-selbstgemachte Sentimentanalyse:



 

Step by step

 

Links sammeln - Link-Übergabe

 

#!/usr/bin/perl

# sentimentanalyse.pl

use strict;
use warnings;


# Programm

## Öffnen der Tageslinks

open ( my $fh, '<tageslinks.txt' );
my @tageslinks = <$fh>;
close $fh;

print "\nDie Links:\n\n";
print map { $_, "\n" } @tageslinks;

Die Links:

https://www.welt.de/politik/ausland/article186755418/Festnahme-von-Paul-Whelan-Russland-steckt-in-regelrechtem-Spionagewahn.html
https://www.welt.de/politik/ausland/article186860772/Viktor-Orban-Angriff-auf-Emmanuel-Macron-Muss-gegen-ihn-kaempfen.html
https://www.welt.de/regionales/hamburg/article186879446/Integration-Ist-die-Wohngebuehr-fuer-Fluechtlinge-rechtswidrig.html
https://www.welt.de/politik/deutschland/article186855990/Aerzte-ohne-Grenzen-Frau-Merkel-kommen-Sie-nach-Lesbos.html
https://www.welt.de/politik/deutschland/article186885806/AfD-Politiker-Ermittler-wollen-Video-von-Angriff-auf-Magnitz-veroeffentlichen.html
https://www.welt.de/

 

Einlesen der Sentimentdaten

 

## Öffnen der negativen Sentiments

open ( $fh, '<SentiWS_v2.0_Negative.txt' );
my @sentiments_negative = <$fh>;
close $fh;

print "\nDie negativen Sentiments:\n\n";
print map { $_, "\n" } @sentiments_negative;

...
übersehen|VVINF -0.5128 übersehe,übersiehst,übersieht,überseht,übersehest,übersehet,übersah,übersahst,übersahen,übersaht,übersähe,übersähest,übersähst,übersähen,übersähet,übersäht

übertreiben|VVINF -0.0372 übertreibe,übertreibst,übertreibt,übertreibest,übertreibet,übertrieb,übertriebst,übertrieben,übertriebt,übertriebe,übertriebest,übertriebst,übertriebet


übertreten|VVINF -0.329 übertrete,übertrittst,übertritt,übertretet,übertretest,übertrat,übertratest,übertratst,übertraten,übertratet,überträte,überträtest,überträten,überträtet


übertrieben|ADJX -0.3203 übertriebenes,übertriebenerer,übertriebeneres,übertriebener,übertriebner,übertriebeneren,übertriebenste,übertriebenen,übertriebenem,übertriebnerem,übertriebneren,übertriebnere,übertriebenerem,übertriebnerer,übertriebenstem,übertriebneres,übertriebene,übertriebenere,übertriebensten,übertriebenstes,übertriebenster


überwältigen|VVINF -0.0048 überwältigest,überwältigten,überwältige,überwältigt,überwältigte,überwältigtest,überwältigst,überwältiget,überwältigtet


So, bis hierhin mehr als easy. Aber nun müssen die Sentimentdaten (die positiven werden folgen) in eine Form, mit der sich operieren lässt. Ich denke da an ein Hash.


## Sentiment-Wert ermitteln

my $sent_val = $sentiments_negative[0];

$sent_val =~ s/.*\|[A-Z]{2,}\s([^\s]+)\s.*/$1/g;

print "\nSentiment-Value: $sent_val\n\n";

## Sentiment-Worte extrahieren

my $sent_words = $sentiments_negative[0];

$sent_words =~ s/(.*)\|[A-Z]{2,}\s[^\s]+\s(.*)/$1 $2/g;
$sent_words =~ s/\s/,/g;

print "\nSentiment-Words: $sent_words\n\n";

my @sent_words = split ( ",", $sent_words );

print "\nSentiment-Words, einzeln:\n\n";
print map { $_, "\n" } @sent_words;

Sentiment-Value: -0.058



Sentiment-Words: Abbau,Abbaus,Abbaues,Abbauen,Abbaue,Abbauten,


Sentiment-Words, einzeln:

Abbau
Abbaus
Abbaues
Abbauen
Abbaue
Abbauten

 
Bis hierhin immer noch quasi Heimspiel.
 

## Sentiment-negativ-Hash bilden

my %sent_neg;

foreach ( @sentiments_negative ) {
    ## Sentiment-Wert ermitteln
    my $sent_val = $_;
    $sent_val =~ s/.*\|[A-Z]{2,}\s([^\s]+)\s.*/$1/g;
    chomp $sent_val;
    print "\nSentiment-Value: $sent_val\n\n";
    ## Sentiment-Worte extrahieren
    my $sent_words = $_;
    $sent_words =~ s/(.*)\|[A-Z]{2,}\s[^\s]+\s(.*)/$1 $2/g;
    $sent_words =~ s/\s/,/g;
    print "\nSentiment-Words: $sent_words\n\n";
    my @sent_words = split ( ",", $sent_words );
    print "\nSentiment-Words, einzeln:\n\n";
    print map { $_, "\n" } @sent_words;
    foreach ( @sent_words ) {
        if ( $_ eq "" ) { next }
        if ( not exists $sent_neg{$_} ) { $sent_neg{$_} = $sent_val }
        else { print "\n$_ bereits vorhanden!\n\n" }
    }
}

print "\nDas Sentiment-Hash:\n\n";
print map { $_, " : ", $sent_neg{$_}, "\n" } sort { $sent_neg{$b} <=> $sent_neg{$a} } keys %sent_neg;
 
...
schädlichem : -0.9269
schädlichen : -0.9269
schädlichstem : -0.9269
unnötiges : -0.9463
unnötiger : -0.9463
unnötigstem : -0.9463
unnötigem : -0.9463
unnötigen : -0.9463
unnötigstes : -0.9463
unnötigster : -0.9463
unnötigsten : -0.9463
unnötigeres : -0.9463
unnötigere : -0.9463
unnötig : -0.9463
unnötigerer : -0.9463
unnötigerem : -0.9463
unnötigeren : -0.9463
unnötige : -0.9463
unnötigste : -0.9463
Schulden : -0.9686
Schuld : -0.9686
Gefahr : -1.0
Gefahren : -1.0
 
Yo. Noch keine Schwierigkeit in Sicht.
 

 

Code

 

#!/usr/bin/perl

# sentimentanalyse.pl

use strict;
use warnings;


# Programm

## Öffnen der Tageslinks

open ( my $fh, '<tageslinks.txt' );
my @tageslinks = <$fh>;
close $fh;

print "\nDie Links:\n\n";
print map { $_, "\n" } @tageslinks;

## Öffnen der negativen Sentiments

open ( $fh, '<SentiWS_v2.0_Negative.txt' );
my @sentiments_negative = <$fh>;
close $fh;

print "\nDie negativen Sentiments:\n\n";
print map { $_, "\n" } @sentiments_negative;

## Öffnen der positiven Sentiments

open ( $fh, '<SentiWS_v2.0_Positive.txt' );
my @sentiments_positive = <$fh>;
close $fh;

print "\nDie positiven Sentiments:\n\n";
print map { $_, "\n" } @sentiments_positive;

## Sentiment-negativ-Hash bilden

my %sent_neg;

foreach ( @sentiments_negative ) {
    ## Sentiment-Wert ermitteln
    my $sent_val = $_;
    $sent_val =~ s/.*\|[A-Z]{2,}\s([^\s]+)\s.*/$1/g;
    chomp $sent_val;
    print "\nSentiment-Value: $sent_val\n\n";
    ## Sentiment-Worte extrahieren
    my $sent_words = $_;
    $sent_words =~ s/(.*)\|[A-Z]{2,}\s[^\s]+\s(.*)/$1 $2/g;
    $sent_words =~ s/\s/,/g;
    print "\nSentiment-Words: $sent_words\n\n";
    my @sent_words = split ( ",", $sent_words );
    print "\nSentiment-Words, einzeln:\n\n";
    print map { $_, "\n" } @sent_words;
    foreach ( @sent_words ) {
        if ( $_ eq "" ) { next }
        if ( not exists $sent_neg{$_} ) { $sent_neg{$_} = $sent_val }
        else { print "\n$_ bereits vorhanden!\n\n" }
    }
}

print "\nDas Sentiment-Hash:\n\n";
print map { $_, " : ", $sent_neg{$_}, "\n" } sort { $sent_neg{$b} <=> $sent_neg{$a} } keys %sent_neg;

## Sentiment-positiv-Hash bilden

my %sent_pos;

foreach ( @sentiments_positive ) {
    ## Sentiment-Wert ermitteln
    my $sent_val = $_;
    $sent_val =~ s/.*\|[A-Z]{2,}\s([^\s]+)\s.*/$1/g;
    chomp $sent_val;
    print "\nSentiment-Value: $sent_val\n\n";
    ## Sentiment-Worte extrahieren
    my $sent_words = $_;
    $sent_words =~ s/(.*)\|[A-Z]{2,}\s[^\s]+\s(.*)/$1 $2/g;
    $sent_words =~ s/\s/,/g;
    print "\nSentiment-Words: $sent_words\n\n";
    my @sent_words = split ( ",", $sent_words );
    print "\nSentiment-Words, einzeln:\n\n";
    print map { $_, "\n" } @sent_words;
    foreach ( @sent_words ) {
        if ( $_ eq "" ) { next }
        if ( not exists $sent_pos{$_} ) { $sent_pos{$_} = $sent_val }
        else { print "\n$_ bereits vorhanden!\n\n" }
    }
}

print "\nDas Sentiment-Hash:\n\n";
print map { $_, " : ", $sent_pos{$_}, "\n" } sort { $sent_pos{$a} <=> $sent_pos{$b} } keys %sent_pos;




# Token-Bilanzwerte je Link ermitteln

my %tokenbilanz;

foreach ( @tageslinks ) {
    ## Token aus Links
    my $link = $_;
    chomp $link;
    my $linktext = `lynx -dump -nolist $link`;
    $linktext =~ s/\n/ /g;
    $linktext =~ s/[\s]+/ /g;
    my @token = split ( " ", $linktext );
    # print "\nToken:\n\n";
    # print map { $_, "\n" } @token;   
    # Token-Werte summieren
    my $token_sum = 0;
    foreach ( @token ) {
        my $token_neg;
        if ( exists $sent_neg{$_} ) { $token_neg = $sent_neg{$_} }
        else { $token_neg = 0 }
        my $token_pos;
        if ( exists $sent_pos{$_} ) { $token_pos = $sent_pos{$_} }
        else { $token_pos = 0 }
        $token_sum = $token_neg + $token_pos + $token_sum;
    }
    print "\nDer Link:\n$link\n";
    print "\nDer Token-Bilanzwert: $token_sum\n\n";
}

 

Output

 

...
Der Link:
https://www.welt.de/politik/ausland/article186755418/Festnahme-von-Paul-Whelan-Russland-steckt-in-regelrechtem-Spionagewahn.html

Der Token-Bilanzwert: -8.43840000000001


Der Link:
https://www.welt.de/politik/ausland/article186860772/Viktor-Orban-Angriff-auf-Emmanuel-Macron-Muss-gegen-ihn-kaempfen.html

Der Token-Bilanzwert: -4.5123


Der Link:
https://www.welt.de/regionales/hamburg/article186879446/Integration-Ist-die-Wohngebuehr-fuer-Fluechtlinge-rechtswidrig.html

Der Token-Bilanzwert: -1.388


Der Link:
https://www.welt.de/politik/deutschland/article186855990/Aerzte-ohne-Grenzen-Frau-Merkel-kommen-Sie-nach-Lesbos.html

Der Token-Bilanzwert: -2.3985


Der Link:
https://www.welt.de/politik/deutschland/article186885806/AfD-Politiker-Ermittler-wollen-Video-von-Angriff-auf-Magnitz-veroeffentlichen.html

Der Token-Bilanzwert: -10.2492


Der Link:
https://www.welt.de/

Der Token-Bilanzwert: -29.5636999999999
 
Der erste Entwurf funzt schon mal einwandfrei. Als Nächstes folgt - wahrscheinlich demnächst - die Integration in meine Datenbank.

Zum gelungenen Abschluss des Abends sammele ich mal ein paar mehr Links.

 

Code-Änderung zum Abschluss

 

...
# Token-Bilanzwerte je Link ermitteln

my %tokenbilanz;

foreach ( @tageslinks ) {
    ## Token aus Links
    my $link = $_;
    chomp $link;
    my $linktext = `lynx -dump -nolist $link`;
    $linktext =~ s/\n/ /g;
    $linktext =~ s/[\s]+/ /g;
    my @token = split ( " ", $linktext );
    # print "\nToken:\n\n";
    # print map { $_, "\n" } @token;   
    # Token-Werte summieren
    my $token_sum = 0;
    foreach ( @token ) {
        my $token_neg;
        if ( exists $sent_neg{$_} ) { $token_neg = $sent_neg{$_} }
        else { $token_neg = 0 }
        my $token_pos;
        if ( exists $sent_pos{$_} ) { $token_pos = $sent_pos{$_} }
        else { $token_pos = 0 }
        $token_sum = $token_neg + $token_pos + $token_sum;
    }
    print "\nDer Link:\n$link\n";
    print "\nDer Token-Bilanzwert: $token_sum\n\n";
    $tokenbilanz{$link} = $token_sum;
}

print "\nDie Tokenbilanz sortiert:\n\n";

foreach ( sort { $tokenbilanz{$a} <=> $tokenbilanz{$b} } keys %tokenbilanz ) {
    print "\nDer Link:\n$_\n";
    print "\nDer Token-Bilanzwert: $tokenbilanz{$_}\n\n";
}

 

Output zum Abschluss

 

...
Die Tokenbilanz sortiert:

Der Link:
https://www.zeit.de/politik/ausland/2019-01/usa-mexiko-grenze-donald-trump-zahlen
Der Token-Bilanzwert: -11.5108

Der Link:
https://www.welt.de/politik/deutschland/article186885806/AfD-Politiker-Ermittler-wollen-Video-von-Angriff-auf-Magnitz-veroeffentlichen.html
Der Token-Bilanzwert: -10.2492

Der Link:
https://www.welt.de/politik/ausland/article186755418/Festnahme-von-Paul-Whelan-Russland-steckt-in-regelrechtem-Spionagewahn.html
Der Token-Bilanzwert: -8.43840000000001

Der Link:
http://www.spiegel.de/wirtschaft/soziales/brexit-in-der-britischen-wirtschaft-waechst-die-nervositaet-a-1229304.html
Der Token-Bilanzwert: -8.20180000000001

Der Link:
https://www.t-online.de/gesundheit/krankheiten-symptome/id_43998616/wie-gefaehrlich-sind-punkte-und-blitze-im-auge-.html
Der Token-Bilanzwert: -8.18310000000001

Der Link:
https://www.zeit.de/politik/ausland/2019-01/pedro-sanchez-francisco-franco-ueberreste-exhumierung-spanien
Der Token-Bilanzwert: -5.94220000000001

Der Link:
https://www.zeit.de/kultur/film/2019-01/drogensucht-usa-ben-is-back-beautiful-boy-film
Der Token-Bilanzwert: -4.9446

Der Link:
https://www.sueddeutsche.de/wissen/plastik-ocean-cleanup-boyan-slat-meere-plastikmuell-mikroplastik-1.4274339
Der Token-Bilanzwert: -4.83390000000001

Der Link:
https://www.welt.de/politik/ausland/article186860772/Viktor-Orban-Angriff-auf-Emmanuel-Macron-Muss-gegen-ihn-kaempfen.html
Der Token-Bilanzwert: -4.5123

Der Link:
https://www.faz.net/aktuell/politik/trumps-praesidentschaft/mauer-konflikt-donald-trump-reist-an-grenze-zu-mexiko-15982244.html
Der Token-Bilanzwert: -3.903

Der Link:
https://www.zeit.de/politik/ausland/2018-12/suedchinesisches-meer-china-nationalismus-geschichte-narrative-territorialstreit/komplettansicht
Der Token-Bilanzwert: -3.8236

Der Link:
https://www.spektrum.de/news/schneemassen-sorgen-fuer-lawinengefahr/982995
Der Token-Bilanzwert: -3.71310000000001

Der Link:
http://www.spiegel.de/politik/deutschland/andre-poggenburg-tritt-aus-der-afd-aus-a-1247481.html
Der Token-Bilanzwert: -3.3462

Der Link:
https://www.zeit.de/politik/ausland/2019-01/weltwirtschaftsforum-davos-donald-trump-absage-haushalt-shutdown
Der Token-Bilanzwert: -2.4925

Der Link:
https://www.welt.de/politik/deutschland/article186855990/Aerzte-ohne-Grenzen-Frau-Merkel-kommen-Sie-nach-Lesbos.html
Der Token-Bilanzwert: -2.3985

Der Link:
https://www.sueddeutsche.de/digital/hackerangriff-it-sicherheit-passwoerter-tipps-1.4276393
Der Token-Bilanzwert: -2.3186

Der Link:
https://www.bild.de/video/clip/voice-of-bundesliga/goldrausch-ribery-59471156.bild.html
Der Token-Bilanzwert: -1.9863

Der Link:
https://www.welt.de/regionales/hamburg/article186879446/Integration-Ist-die-Wohngebuehr-fuer-Fluechtlinge-rechtswidrig.html
Der Token-Bilanzwert: -1.388

Der Link:
https://www.zeit.de/video/2018-08/5825387646001/plastik-im-meer-erst-vergiften-wir-den-ozean-dann-uns-selbst
Der Token-Bilanzwert: -1.2214

Der Link:
https://www.spektrum.de/news/sporthormon-bremst-alzheimersymptome/1617262
Der Token-Bilanzwert: -0.9382

Der Link:
https://www.zeit.de/politik/deutschland/2019-01/einigung-cdu-friedrich-merz-annegret-kramp-karrenbauer-expertenkommission
Der Token-Bilanzwert: -0.0565000000000001

Der Link:
https://www.bild.de/bild-plus/geld/wirtschaft/politik-inland/flughafen-streik-krasse-gehalts-unterschiede-beim-sicherheitspersonal-59460140,view=conversionToLogin.bild.html
Der Token-Bilanzwert: 0.1232

Der Link:
https://www.zeit.de/politik/ausland/2019-01/athen-griechenland-angela-merkel-alexis-tsipras-staatsbesuch-finanzmaerkte
Der Token-Bilanzwert: 2.2116

Der Link:
http://www.spiegel.de/wissenschaft/weltall/schwarze-loecher-wie-schwerkraftmonster-sterne-zerfetzen-a-1247443.html
Der Token-Bilanzwert: 4.38639999999999

Der Link:
https://www.spektrum.de/news/radioaktiver-exot-entpuppt-sich-als-neutronenschreck/1617182
Der Token-Bilanzwert: 5.2375
 
Die negativsten Meldungen stehen oben, die positivsten unten - aufsteigend (positiv) sortiert.
Überrascht das Ergebnis jemand/jefraud/jefimd?
 


 

Kleine Änderung(en)

 

my %tokenbilanz;

foreach ( @tageslinks ) {
    ## Token aus Links
    my $link = $_;
    chomp $link;
    my $linktext = `lynx -dump -nolist $link`;
    $linktext =~ s/\n/ /g;
    $linktext =~ s/[^a-zA-ZäöüÄÖÜß]+/ /g;
    $linktext =~ s/[\s]+/ /g;
    my @token = split ( " ", $linktext );
    # print "\nToken:\n\n";
    # print map { $_, "\n" } @token;   
    # Token-Werte summieren
    my $token_sum = 0;
    foreach ( @token ) {
        my $token_neg;
        if ( exists $sent_neg{$_} ) { $token_neg = $sent_neg{$_} }
        else { $token_neg = 0 }
        my $token_pos;
        if ( exists $sent_pos{$_} ) { $token_pos = $sent_pos{$_} }
        else { $token_pos = 0 }
        $token_sum = $token_neg + $token_pos + $token_sum;
    }
    print "\nDer Link:\n$link\n";
    print "Der Token-Bilanzwert: $token_sum\n";
    $tokenbilanz{$link} = $token_sum;
}

print "\nDie Tokenbilanz sortiert:\n\n";

foreach ( sort { $tokenbilanz{$a} <=> $tokenbilanz{$b} } keys %tokenbilanz ) {
    print "\nDer Link:\n$_\n";
    print "Der Token-Bilanzwert: $tokenbilanz{$_}\n";
}

 

Große Folge(n)!

 

Die Tokenbilanz sortiert:


Der Link:
https://www.zeit.de/politik/ausland/2019-01/usa-mexiko-grenze-donald-trump-zahlen
Der Token-Bilanzwert: -14.1852

Der Link:
https://www.welt.de/politik/deutschland/article186885806/AfD-Politiker-Ermittler-wollen-Video-von-Angriff-auf-Magnitz-veroeffentlichen.html
Der Token-Bilanzwert: -12.1868

Der Link:
http://www.spiegel.de/wirtschaft/soziales/brexit-in-der-britischen-wirtschaft-waechst-die-nervositaet-a-1229304.html
Der Token-Bilanzwert: -11.0796

Der Link:
https://www.welt.de/politik/ausland/article186755418/Festnahme-von-Paul-Whelan-Russland-steckt-in-regelrechtem-Spionagewahn.html
Der Token-Bilanzwert: -10.8176

Der Link:
https://www.t-online.de/gesundheit/krankheiten-symptome/id_43998616/wie-gefaehrlich-sind-punkte-und-blitze-im-auge-.html
Der Token-Bilanzwert: -9.49560000000001

Der Link:
https://www.welt.de/politik/ausland/article186860772/Viktor-Orban-Angriff-auf-Emmanuel-Macron-Muss-gegen-ihn-kaempfen.html
Der Token-Bilanzwert: -6.4489

Der Link:
https://www.zeit.de/politik/ausland/2019-01/pedro-sanchez-francisco-franco-ueberreste-exhumierung-spanien
Der Token-Bilanzwert: -6.26450000000001

Der Link:
https://www.sueddeutsche.de/wissen/plastik-ocean-cleanup-boyan-slat-meere-plastikmuell-mikroplastik-1.4274339
Der Token-Bilanzwert: -5.18990000000001

Der Link:
https://www.zeit.de/politik/ausland/2018-12/suedchinesisches-meer-china-nationalismus-geschichte-narrative-territorialstreit/komplettansicht
Der Token-Bilanzwert: -5.00850000000001

Der Link:
https://www.sueddeutsche.de/digital/hackerangriff-it-sicherheit-passwoerter-tipps-1.4276393
Der Token-Bilanzwert: -4.2759

Der Link:
https://www.zeit.de/politik/ausland/2019-01/weltwirtschaftsforum-davos-donald-trump-absage-haushalt-shutdown
Der Token-Bilanzwert: -3.8179

Der Link:
http://www.spiegel.de/politik/deutschland/andre-poggenburg-tritt-aus-der-afd-aus-a-1247481.html
Der Token-Bilanzwert: -3.4687

Der Link:
https://www.spektrum.de/news/schneemassen-sorgen-fuer-lawinengefahr/982995
Der Token-Bilanzwert: -3.29960000000001

Der Link:
https://www.welt.de/regionales/hamburg/article186879446/Integration-Ist-die-Wohngebuehr-fuer-Fluechtlinge-rechtswidrig.html
Der Token-Bilanzwert: -2.9049

Der Link:
https://www.bild.de/video/clip/voice-of-bundesliga/goldrausch-ribery-59471156.bild.html
Der Token-Bilanzwert: -2.8202

Der Link:
https://www.welt.de/politik/deutschland/article186855990/Aerzte-ohne-Grenzen-Frau-Merkel-kommen-Sie-nach-Lesbos.html
Der Token-Bilanzwert: -2.6923

Der Link:
https://www.zeit.de/kultur/film/2019-01/drogensucht-usa-ben-is-back-beautiful-boy-film
Der Token-Bilanzwert: -2.5038

Der Link:
https://www.spektrum.de/news/sporthormon-bremst-alzheimersymptome/1617262
Der Token-Bilanzwert: -1.7951

Der Link:
https://www.zeit.de/video/2018-08/5825387646001/plastik-im-meer-erst-vergiften-wir-den-ozean-dann-uns-selbst
Der Token-Bilanzwert: -0.773

Der Link:
https://www.zeit.de/politik/deutschland/2019-01/einigung-cdu-friedrich-merz-annegret-kramp-karrenbauer-expertenkommission
Der Token-Bilanzwert: -0.2423

Der Link:
https://www.bild.de/bild-plus/geld/wirtschaft/politik-inland/flughafen-streik-krasse-gehalts-unterschiede-beim-sicherheitspersonal-59460140,view=conversionToLogin.bild.html
Der Token-Bilanzwert: -0.2401

Der Link:
https://www.zeit.de/politik/ausland/2019-01/athen-griechenland-angela-merkel-alexis-tsipras-staatsbesuch-finanzmaerkte
Der Token-Bilanzwert: 0.673100000000001

Der Link:
https://www.spektrum.de/news/radioaktiver-exot-entpuppt-sich-als-neutronenschreck/1617182
Der Token-Bilanzwert: 4.403

Der Link:
http://www.spiegel.de/wissenschaft/weltall/schwarze-loecher-wie-schwerkraftmonster-sterne-zerfetzen-a-1247443.html
Der Token-Bilanzwert: 5.34749999999999

Der Link:
https://www.faz.net/aktuell/politik/trumps-praesidentschaft/mauer-konflikt-donald-trump-reist-an-grenze-zu-mexiko-15982244.html
Der Token-Bilanzwert: 18.7734000000001

 

Zwischenfazit:

 

Es sollte klar sein, daß eine solche Vorgehensweise nur eine Milchmädchen-Sentimentanalyse sein kann. Nicht viel mehr als Spielerei. Ersehen lässt sich daraus nur, ob im Text enthaltene in den Sentiment-Tabellen gewichtete Worte das Gesamtgewicht eher negativ oder positiv beeinflussen (können). Aber durch die Spielerei ist immerhin ein wenig Vorarbeit geleistet, die es einfacher macht, demnächst klügere, genauere Sentimentanalysen durchführen zu können.







Kommentare

Beliebte Posts aus diesem Blog

·

Es brennt.

Bye, bye Nord Stream 2!