Blir du snart forstått av din stemmestyrte assistent?

Mange av oss har latt oss fascinere av stemmestyring hos personlige assistenter som Apples Siri og Googles Home. Likevel er ergrelsene store og uttrykket «min personlige assistent forstår meg ikke» er ganske gjenkjennelig. Særlig på norsk. Nå kan vi se begynnelsen på en gjensidig forståelse, også på norsk.

Interessant nok har Google inkludert vårt lille språk for oversettelse på kryss og tvers av andre språk, også på den stemmestyrte Google Home assistenten. På norsk blir dessverre feilene og misforståelsene enda hyppigere enn på engelsk.

Åpenbar maskinoversettelse

Enda er det også et stykke frem før vi kan ta en engelsk tekst og oversette direkte til norsk med Google oversetter uten at det er åpenbart at det er maskinoversatt.

Amazons Alexa og Microsofts Cortana er utfordrere til Google og Apples Siri. De har alle som mål å gjøre stemmestyring og oversettelse sømløst på alle språk, men har litt ulike strategier for å nå sine mål.

På Amazons re: Mars konferanse i forrige uke demonstrerte Amazon sin siste versjon av Conversations.

Conversations er en modul i Alexa Skills Kit som sammen med Alexa Voice apps lærer av erfaringer. Målet er å oppnå helt naturlig dialog etterhvert som du legger til nye egenskaper, eller skills i Alexa-universet.

Les mer om hva du kan gjøre i artikkelen Alexa Skills: Cheat sheet

Amazon mener dette er årets nyhet til utviklere av stemmestyrte systemer. Nå vil man kunne kode ferdigheter – skills – med langt færre kodelinjer. Integrasjonen med Voice Apps  gjør at samtalene dermed vil kunne flyte mer logisk.

Med bruk av nevrale nettverk vil Alexa «forstå» hva du mener og kan sette forutgående spørsmål inn i en kontekst som gjør det mulig å følge opp neste spørsmål som vi mennesker intuitivt gjør.

Alexa Conversations vil dermed kunne fullføre stemmestyrte oppgaver i en naturlig flyt og det blir mindre behov for interaksjon.

Amazons Vice President David Limp mener ikke overraskende at dette er et stort fremskritt. «Det har vært en stor utfordring å lage en dialog som flyter naturlig, når denne ikke er programmert på forhånd», kunne han fortelle under demonstrasjonen.

For ett år eller to siden så han ingen vei ut av dette problemet. Dette er et stort gjennombrudd for Amazon, mener han. Se selv:

Grensesnittet mellom mennesker og datamaskinene vil flyttes fra tastatur og skjermberøring til stemmestyring og bruk av ansikter i dialog. Dette vil få betydning for mange industrier, ikke minst innen transportnæringen. Les mer om selvkjørende biler i artikkelen «Vil din neste bil være selvkjørende. «

Stemmestyrte Google måtte endre praksis etter reaksjoner på sin demonstrasjon

Tidligere overrasket Google verden med sin AI-drevne assistent som ringte opp en hårsalong og bestilte time for en klient.

Denne tjenesten er nå kommersielt tilgjengelig i USA. Google fikk kjeft for ikke å ha opplyst på forhånd at det var en robot som ringte. De har nå lagt det inn foran alle oppringninger fra assistenten.

Stemmestyrt assistent som er 10 ganger raskere i neste versjon

På siste utviklerkonferanse i mai viste Google frem siste versjon av sin assistent og lovet at den vil bli dramatisk raskere.

Den vil bli tilgjengelig på Googles telefoner først og kunne brukes ikke bare for grunnleggende søk og alarmer, men også for å betjene telefonen. Eksempelvis diktere meldinger, søker etter bilder som kan legges ved meldingsteksten og sende. Alt foregår selvsagt stemmestyrt.

Google hevder at denne nye versjonen av assistenten vil behandle forespørsler opptil 10 ganger raskere enn den nåværende utgaven.

Det er fordi Google har lykkes med å komprimere koden som brukes til å lytte til og tolke tale. Nedskaleringen gjør det mulig å kjøre koden lokalt på telefonen eller andre mobile enheter, uten at man som i dag, er avhengig av å sende data for prosessering i skyen.

Tøff konkurranse – kineserne kommer

Alle de store plattformeierne jobber med stemmestyring og personlige assistenter på de mest brukte språkene. Hyggelig for oss er at Norge og norsk er med, selv om vi ikke akkurat er blant de største språkene i verden. Perosnlige stemmestyrte assistenter Jan Sollid Storehaug Foreløpig fungerer det bedre og bedre på engelsk og ikke spesielt godt på norsk. Forklaringen er selvsagt at det er mye mer læring å hente fra engelsk, siden dette er det dominerende språk. Til nå.

Kineserne har som nasjon svært så ambisiøse planer for kunstig intelligens. Det er ikke vanskelig å spå at vi vil se flere og bedre produkter fra Kina og enda flere gode AI-drevne tjenester.

Kina er i ferd med å vinne AI-kappløpet og når de for alvor vender seg bort fra hjemmemarkedet sitt, vil verden se mange spennende nyheter fra Kina. Også vi i Norge.

Stemmestyring kombinert med ansiktsgjenkjenning vil i fremtiden gi mange nye muligheter i kombinasjon med andre teknologier.

Tenk deg bare stemmestyrte roboter som brukes hjemme og på jobb. Les mer om roboter i artikkelen «Robotene kommer snart til en restaurant nær deg.»

 

 

Recommended Posts
Comments
    pingbacks / trackbacks

    Legg inn kommentar

    Start typing and press Enter to search

    Her er de 10 viktigste teknologiene for verden i 2019 i følge WEF Jan Sollid Storehaug om de neste 10 år

    Send this to a friend