Alexa voice search ontwikkelingen

by Marc Schlingmann juni 08, 2019

Deze tijd gebruiken klanten Alexa voornamelijk om één vraag te stellen zoals: ‘Alexa wat is het weer vandaag?’. Ook wordt Alexa nog veel gebruikt voor interacties die meerdere vragen nodig hebben om complexere taken tot succes uit te voeren.

Een Alexa klant die bijvoorbeeld een avondje uit met zijn familie wilt plannen, moet verschillende vragen stellen die meerdere vaardigheden nodig hebben om een bruikbare lijst te vinden. Denk hierbij aan een specifieke film, een restaurant in de buurt om vervolgens tickets te boeken voor de film, een tafel te boeken voor het restaurant en misschien zelfs een taxi. De last van het overdragen van informatie over verschillende zaken zoals tijd, aantal mensen en locatie ligt dus bij de klant.

‘We stellen ons een wereld voor, waarin klanten natuurlijker met Alexa kunnen spreken, naadloos overschakelen tussen vaardigheden, vragen stellen, keuzes maken en op dezelfde manier praten als met een vriend, familielid of collega,’ zegt Rohit Prashad, Alexa vice-president en hoofdwetenschapper. ‘Ons doel is om de cognitieve belasting van de klant, naar Alexa te verplaatsen.’

Bij Amazons re:MARS conferentie in Las Vegas wordt de visie van morgen, vandaag uitgelegd wanneer Prasad een voorbeeld geeft van het plannen van een gemoedelijk avondje uit. Deze ervaring zal binnenkort beschikbaar zijn voor klanten. De komende maanden zal deze vaardigheid en andere multi-skill ervaringen uitgerold worden naar Alexa-klanten, in eerste instantie in de Verenigde Staten.

Het plannen van een avondje uit zorgt ervoor dat Alexa onder andere dubbelzinnige referenties op moet lossen (‘zijn er Italiaanse restaurants in de buurt’) en dynamisch overgaat van de ene naar de andere vaardigheid met behoud van context. Zo moet Alexa de locatie van de bioscoop onthouden om restaurants in de buurt te vinden.

Het inschakelen van deze nieuwe ervaring is een verzameling AI-modules die samen moeten werken om antwoorden te kunnen geven op de vragen van klanten. Bij elke dialoogronde maakt het systeem een ‘vector’ aan. Een vector is een een serie getallen met een vaste lengte. Deze vector laat de context en symbolische inhoud van een gesprek zien.

Met elke update van de vector genereert een end-to-end en deep-learned conversatiemodel een lijst met acties van de klant waar Alexa antwoord op moet geven. Vervolgens vult het systeem, wanneer nodig, de acties van de klant in door er waardes aan te geven. Denk hierbij aan de tijden van films of restaurant namen. Het systeem geeft dus waardes aan de acties en voert degene uit met de hoogste waarde.

Deze nieuwe manier van een dialoog met meerdere opdrachten bevat ook een eigen AI module waarvan de taak is om te beslissen wanneer er gewisseld moet worden tussen verschillende vaardigheden. Welke vragen bijvoorbeeld doorgegeven moeten worden om over te schakelen naar de restaurant vaardigheid of naar de vaardigheid voor het zoeken van een film. De schakelaars die hiervoor zorgen kunnen reactief zijn als een klant bijvoorbeeld zegt ‘Breng me een Uber’ nadat Alexa een lijst met filmtijden heeft gegeven. De schakelaars kunnen ook proactief zijn als Alexa na een aankoopverzoek voor een filmticket de vraag stelt ‘Moet ik de tickets boeken?’.

Tijdens zijn presentatie bij re:MARS, Rohit Prasad, Alexa VP en hoofd wetenschapper, zei dat de mogelijkheden voor machines om te leren zo hard groeien dat Alexa de klants doel kan voorspellen en daarmee de richting van de dialoog kan bepalen.


‘Met deze nieuwe benadering gaat Alexa de klant zijn doel voorspellen vanuit de richting van de dialoog en gaat Alexa proactief de gespreksstroom over onderwerpen en vaardigheden mogelijk maken’, zegt Prasad. ‘Dit is een grote stap voor de gespreksmatige AI.’

Bij re:MARS heeft Prasad ook een nieuwe ontwikkeling aangekondigd van Alexa Conversations. Een nieuwe deep-learning gebaseerde benadering for vaardigheidontwikkelaars om meer natuurlijke voice ervaringen met minder moeite (kortere codes en minder training data) te creëren. Deze aankondiging laat vaardigheidontwikkelaars een natuurlijke en flexibele dialogen creëren door middel van één vaardigheid. Toekomstige ontwikkelingen laten ontwikkelaars meerdere vaardigheden samensmeden tot één vaardigheid.

Met Alexa Conversations bieden ontwikkelaars interfaces voor toepassingsprogrammering of API’s die toegang bieden tot het gebruik van hun vaardigheden. Ook biedt Alexa Conversations een lijst van eenheden die de API’s als invoer kunnen gebruiken. Denk hierbij aan restaurantnamen of filmtijden. Daarnaast biedt Alexa Conversations ook een aantal voorbeelddialogen om activiteiten te identificeren en toe te wijzen aan de API. De AI-technologie van Alexa Conversations verwerkt de rest.

‘Het is veel simpeler om een complexe voice ervaring te bouwen met Alexa Conversations door zijn onderliggende deep-learning gebaseerde dialoogmodellering,’ zegt Prasad.

Dat komt grotendeels door de AI technologie dat automatisch gesimuleerde dialogen genereert die zijn gemaakt door de ontwikkelaar. Gebaseerd op de ontwikkelaars voorbeelddata geeft het systeem voorbeelden weer met behulp van formele taal, logische zinstructuur en symbolische relaties tussen woorden van een dialoogvenster. Deze voorbeelden worden op veel verschillende manieren omgezet in natuurlijke taal, waarbij automatisch dialoogvariaties worden gegenereerd. Deze dialoogvariaties zijn één tot twee orden van grootte groter zijn dan de gegevens die de ontwikkelaar verstrekt. Dit wordt gebruikt om een terugkerend neuraal netwerk te trainen. Dit netwerk modelleert de dialoogstroom.

Heb je nog vragen over voice search of andere SEO/CRO gerelateerde onderwerpen? Wij zijn te bereiken via onderstaande gegevens:

E-mail: info@klikproces.nl
Tel: 085 040 60 94

Bron: https://developer.amazon.com/blogs/alexa/post/9615b190-9c95-452c-b04d-0a29f6a96dd1/amazon-unveils-novel-alexa-dialog-modeling-for-natural-cross-skill-conversations

Social Shares

Leave a Comment

Your email address will not be published. Required fields are marked *