Als u een heel trouwe lezer van Elektor bent, herinnert u zich misschien nog wel dat spraakgestuurde bediening van elektronica al in de vorige eeuw bij ons aan de orde kwam... ! Toen had nog niemand van domotica of een voice assistent gehoord, en kunstmatige intelligentie leek iets onbereikbaars. Tegenwoordig is spraakherkenning weer aan de orde van de dag en wordt er heel anders naar gekeken. Begin juni 2018, lanceerde Amazon de Franse versie van zijn topproduct Alexa. Het leerproces schijnt de nodige voeten in de aarde te hebben gehad. Het Frans, zelfs al wordt het door een toenemend aantal Franstaligen verhaspeld, blijft een moeilijke taal om te leren, ook voor de algoritmes van kunstmatige intelligentie.

Een kartonnen doos communiceert met Big Brother

De video die ElektorTV deze week voor u heeft geselecteerd gaat over de experimenteerkit Google AI Voice Kit, waarmee Google "zijn" kunstmatige intelligentie beschikbaar stelt voor gesproken communicatie tussen mens en machine. Natuurlijk kun je je afvragen waarom Google eigenlijk zo gul is, maar hun aanbod is wel interessant. Het ziet er niet erg spectaculair uit, want deze "machine" zit gewoon in een kartonnen doosje. Maar laat u niet misleiden door het uiterlijk: de mogelijkheden zijn enorm, onbegrensd zelfs als we Google mogen geloven. Het doel van spraakherkenning is om alle gebruikelijke hulpmiddelen voor de communicatie tussen mens en computer overbodig te maken: druknoppen, toetsenborden, joysticks. De mens staat in rechtstreeks contact met de kunstmatige intelligentie van de software. Een ongekende ervaring!

Google AI Voice Kit is ontworpen voor het Raspberry Pi-platform. Het is, kortweg, een HAT voor de RPi. En het opent de weg naar ongekende mogelijkheden. De kit wordt geleverd met een complete handleiding (in het Engels). Om aan de slag te gaan, hebt u alleen RPi 3, een goede netvoeding en een SD-geheugenkaart nodig.
 

Dit is niet zomaar een gadget!

In feite gebeurt er niet zoveel in de kartonnen doos en op de HAT zelf. Ze vormen samen een interface tussen aan de ene kant de luidspreker en de microfoon (die samen in de doos zitten) en aan andere kant het Internet. Daar bevindt zich Google met "zijn" Artificial Intelligence. Het is dus in de cloud, om precies te zijn op de servers van Google, waar het echte werk wordt gedaan. Als uw spraakcommando’s door Google zijn verwerkt, komen de antwoorden terug naar uw kartonnen doos, waar ze worden omgezet in een audiosignaal en worden weergegeven door de luidspreker.

Om u te helpen deze buitengewone kit aan het werk zetten als u er de hand op hebt weten te leggen, zijn de volgende twee videoworkshops heel nuttig. Van harte aanbevolen. Overigens in de MagPi 3, die binnenkort verschijnt, leest uit meer over de nieuwste ontwikkelingen.