Qlik bietet eine Volltextsuche über alle Felder. Aber kann man Qlik auch nutzen, um zum Beispiel alle Supporttickets oder Kundenfeedbacks nach Keywords zu durchsuchen und die Häufigkeit in einer Wordcloud darstellen? Der Artikel unterhalb beschreibt wie es funktioniert.
Das Qlik auch die Häufigkeit von Millionen Wörter darstellen kann habe ich schon 2015 hier unter Qlik Sense Smart Data Compression beschrieben.
Aber wie bekommt man aus einem längeren Text die einzelnen Wörter extrahiert, um etwa zu zählen wie oft ein Wort in Supportcases vorkommt?

Hier ist die Subfield Funktion von Hilfe.
//load data [Data]: LOAD [Supportcase], //replace line breaks with blanks replace([Text],chr(10),' ') as Text FROM [lib://data/supportcases.xlsx] (ooxml, embedded labels, table is Tabelle1); //Split into Words TempAllWords: Load [Supportcase], trim(subfield([Text],' ')) as Words resident [Data];
Nach dem Splitten der Wörter kann man noch Satzzeichen entfernen. Zusätzlich kann man ungewünschte Füllwörter wie Pronomen, Artikel usw. entfernen, indem man ein Excel mit den irrelevanten Wörtern pflegt.
AllWords: NoConcatenate load [Supportcase], upper(Words) as Words, applymap('IrrelevantWords',upper(Words),'relevant') as Relevanz where len (Words) > 0; load [Supportcase], (if(match(right(Words,1),'.',',','!','?',';') > 0, left(Words,len(Words)-1),Words)) as Words //cleanup resident TempAllWords;
Was dieser Ansatz nicht macht, sind Volltextsuchen-Features wie Stemming um alle Wörter auf Ihren Wortstamm zu reduzieren. Hier könnte man die Server Side Extensions von QlikView und Qlik Sense nutzen, und die Wörter noch durch ein Python Skript für Stemming laufen lassen.
Die Wordcloud Darstellung selbst kommt mit dem Qlik Sense Visualization Bundle. Bitte auf die Sortierung und die Design|Orientation achten.

Anschließend die lässt sich die Word Cloud nach Häufigkeit sortieren.

Als weiterführendes Thema kann man Sentiment Analyse betreiben. Viele Kunden haben automatisch die Qlik Sense WebConnectors lizensiert. Dort gibt es zwei Konnectoren die hier interessant sein können. Bei Gelegenheit werde ich dazu einen eigenen Blogpost schreiben.
Das komplette Beispiel zum Download findet sich hier.