Wilt u in realtime checken of de toon waarop de sociale media over uw bedrijf spreken wel positief is? Zijn het vooral mannen of vrouwen die over uw product praten? Hoe oud zijn ze? Wilt u iets weten over hun opleidingsniveau of persoonlijkheid? Dat ze eerder introvert of eerder extravert zijn? Eerder rationeel of emotioneel?
Textgain, een nieuwe spin-off van Universiteit Antwerpen, heeft de taaltechnologie en de artificiële intelligentie in huis waarmee u het antwoord op deze en nog veel andere vragen kunt krijgen. De spin-off bundelt de technologie in webservices waarmee u snel en gemakkelijk sentimenten, opinies en auteursprofielen kunt winnen uit grote hoeveelheden ongestructureerde tekst. In realtime en in een dozijn talen.
Textgain is een spin-off van de Antwerpse onderzoekgroep CLiPS (Computational Linguistics & Psycholinguistics Research Group of in het Nederlands het Centrum voor Computerlinguïstiek en Psycholinguïstiek). De oprichters van Textgain zijn CLiPS-directeur Walter Daelemans en onderzoekers Guy De Pauw en Tom De Smedt.
Een spin-off, zo lezen we op de website van Universiteit Antwerpen, is een onderneming waarvan de activiteiten, producten en/of diensten zijn gebaseerd op knowhow, technologie en/of onderzoeksresultaten die aan de universiteit zijn gegenereerd. Het opstarten van een spin-off is een manier om technologieën te valoriseren die werden ontwikkeld aan de universiteit en biedt een alternatief voor het verkopen van licenties aan bestaande ondernemingen.
Textgain biedt snelle cloudservices die in realtime grote hoeveelheden ongestructureerde tekst (lees: big data) analyseren. Met de taaltechnologie van CLiPS/Textgain kunnen automatisch feiten, trends, opinies en demografische informatie worden geëxtraheerd uit data van sociale media, krantenartikels, e-mails, enz. De gewonnen informatie kan bruikbaar zijn voor marketeers, trendanalisten en iedereen die slimme toepassingen ziet met zulke bedrijfsinformatie.
Marketing
Tom De Smedt: "Voor een bedrijf is het belangrijk om te weten hoe er op de sociale media over hen gesproken wordt. Maar er wordt zo veel gepost en getweet dat het onmogelijk is zelf die gegevens te screenen. Daar kan Textgain bij helpen. Het gaat verder dan je zou denken: dat "I love it!" een positieve uitspraak is, ligt voor de hand. Maar de technologie kan ook inschatten dat die commentaar waarschijnlijk geschreven is door een vrouw en niet door een man. Ook leeftijd en zelfs persoonlijkheidskenmerken kunnen we aanduiden. Dergelijke informatie is erg nuttig voor marketeers."
Terrorisme
Twitter wil niet dat zijn platform gebruikt wordt om terrorisme te verheerlijken. Textgain heeft taaltechnologie waarmee automatisch haatberichten uit IS-hoek opgespoord kunnen worden. Tom De Smedt: "Twitter heeft al 125.000 accounts afgesloten, meestal accounts die aan IS en aanhangers konden worden toegeschreven. Onze software past zichzelf bovendien voortdurend aan, want de retoriek evolueert. We moeten deze technologie uiteraard voorzichtig gebruiken, maar op termijn zien we mogelijkheden om samen te werken met bijvoorbeeld veiligheidsdiensten."
Walter Daelemans werd in 2013 door onderwijsjournalist Jan T"Sas geïnterviewd voor het digitale tijdschrift Taalschrift. Ook Jan T"Sas zag gelijkenissen met politiespeurwerk. Walter Daelemans antwoordde: "Met profiling komen we aardig in de buurt. Voor het Amica-project (Automatic Monitoring for Cyberspace Applications - nvdr) werken we samen met forensische instituten en met de politie. We, dat zijn de universiteiten van Leuven, Gent en Antwerpen. We onderzoeken de link tussen teksten en beelden enerzijds en mogelijk bedreigende situaties op sociale netwerken anderzijds. Dat gaat dan over cyberpesten, seksueel grensoverschrijdend gedrag (‘grooming’), depressie en zelfmoordneiging en automutilatie. De bedoeling is dat een computerprogramma signalen van cyberpesten, grooming, depressie en zelfmoordneiging automatisch detecteert door voortdurend teksten te analyseren die op sociaalnetwerksites worden gepost. Zo hopen we crisissituaties voor te zijn. In het onderzoeksveld spreekt men van tekstcategorisatie. Die techniek werkt al heel goed voor spamfiltering en e-mailroutering."
Jan T"Sas vroeg in Taalschrift ook of de onderzoekers mensen met minder goede bedoelingen kunnen identificeren via hun taalgebruik? Pedofielen die zich op chatkanalen voordoen als kinderen bijvoorbeeld?
Walter Daelemans antwoordde: "Sociaalnetwerksites, zoals Facebook, Netlog enz. zijn in principe zelf verantwoordelijk voor alle rotzooi die erop verschijnt. Maar voor de beheerders is het onmogelijk om dagelijks miljoenen posts te screenen. Met profiling en automatische tekstanalyse kan dat wel. De computer zoekt naar zogenaamde mismatches: een man van veertig of ouder die zich voordoet als een meisje van dertien bijvoorbeeld. Die halen we er zo uit."
De onderzoeksgroep CLiPS (binnen de faculteit letteren en wijsbegeerte) ontwikkelde de voorbije jaren heel wat expertise in het automatisch analyseren van enorme hoeveelheden tekst.
Guy De Pauw: "Met de spin-off willen we de technologie die ontwikkeld werd binnen de onderzoeksgroep naar de markt brengen." De webservice van Textgain werkt snel en eenvoudig. Je stuurt gewoon je tekstmateriaal op naar de API van Textgain en je ontvangt de gevraagde analyses onmiddellijk als antwoord terug. Zo kan je snel aan de slag met bijvoorbeeld sentiment- en opiniedetectie voor Twitter of Facebook. Textgain biedt momenteel per gebruiker 100 gratis analyses per dag aan. Betalende formules voor grotere datavolumes starten al vanaf 10 euro per maand.
Meer info: www.textgain.com
Meer info: http://www.clips.uantwerpen.be
Meer info: http://taalschrift.org/editie/99/schrijf-en-u-wordt-ontmaskerd