Glasovni asistent Alice za PC (Windows). Alice

Virtuelni glasovni asistenti su dizajnirani da pojednostave našu interakciju sa uređajima i uslugama. Umjesto da lutate GUI tražeći pravu stavku menija, možete jednostavno komandovati na prirodnom jeziku „Pusti muziku“ ili „Daj nam vremensku prognozu“. Idealan pomoćnik mora ispravno razumjeti naredbu i izvršiti je.

Tehnologije koje su u osnovi takvih asistenata još su daleko od savršenstva, ali već mogu impresionirati. Možda ste ih vidjeli u akciji ako ste koristili Google Assistant, Cortanu ili Siri. Sada da vidimo čime nas "", koji se nedavno nastanio u aplikaciji Yandex, može zadovoljiti.

Sinteza i prepoznavanje govora

Iako možete lako čuti umjetne note u glasu asistenta, zvuči mnogo prirodnije od svog najbližeg konkurenta, verzije Siri na ruskom jeziku. Glumica Tatjana Šitova angažovana je da glasuje za "Alice". Inače, u njenom glasu je govorio operativni sistem u filmu “Ona”.

U pogledu prepoznavanja ruskog govora, Yandexovom asistentu takođe nema ravne greške; Osim toga, asistent ne samo da prepoznaje fraze, već i uči da ih pravilno tumači. Stoga možete koristiti različite formulacije i postavljati naredna pitanja u kontekstu prethodnih - najvjerovatnije će vas usluga razumjeti:

Ali greške u tumačenju upita i dalje su uobičajene među svim glasovnim asistentima, a Alice nije izuzetak:


Integracija sa Yandex servisima

Još jedna važna karakteristika Alice, koju kreatori naglašavaju, je zgodna integracija s drugim Yandex servisima.

Na primjer, zamolite svog asistenta da pusti pjesmu i ona će se pustiti u Yandex.Music. Zatražite prijevod fraze na drugi jezik - pomoćnik će otvoriti “Yandex.Translator”:


Alice također može prikazati vremensku prognozu i izgraditi rute zahvaljujući vremenskoj usluzi i Yandex mapama. A ako trebate nešto pronaći na internetu, Yandex.Search će vam pomoći.


Interakcija sa programima trećih strana

Što se tiče integracije sa aplikacijama i uslugama trećih strana na mobilnim uređajima, Alice ne ide tako dobro.

Asistent se može instalirati na Android i iOS, ali Alice za sada slabo koristi mogućnosti ovih platformi. Dakle, uz njegovu pomoć nećete moći ni brzo postaviti alarm, dodati podsjetnik ili napomenu. Ali Siri se lako može nositi s ovim zadacima.


Iako Alice na zahtjev može otvoriti programe instalirane na uređaju, ova funkcija ne radi uvijek. Na primjer, pomoćnik pokreće VKontakte i Telegram bez ikakvih problema, ali ako ga zamolite da otvori Viber, umjesto aplikacije, pomoćnik će vas uputiti na web stranicu ovog glasnika. Pomoćnik čudno reaguje na komandu „otvori kalkulator“.


Osim toga, da biste kontaktirali Alice, prvo se morate prijaviti u aplikaciju Yandex i kliknuti na dugme pomoćnika (ili koristiti prečicu za brzi pristup ako imate Android). Ovo nije baš zgodno, jer je jedan od glavnih zadataka glasovnog asistenta omogućiti vam da upravljate uređajem bez ruku. Isti Siri, zbog duboke integracije sa iOS-om, može primati komande čak i kada je ekran zaključan.

"Alice" na kompjuteru

Yandex Assistant je takođe dostupan za računare koji koriste Windows kao poseban program. Nakon što ga instalirate, na traci zadataka se pojavljuju traka za pretragu i dugme za glasovnu interakciju sa asistentom.

Pored funkcija predstavljenih u mobilnoj verziji, Alice za Windows može pretraživati ​​datoteke na tvrdom disku, pokretati desktop programe, isključiti računalo ili ga staviti u stanje mirovanja.

Visoke tehnologije se razvijaju velikom brzinom i svakodnevno se na tržištu digitalne robe i usluga pojavljuju potrebni i atraktivni novi proizvodi. Glasovna pomoćnica Alice iz Yandexa pravi je proboj u kompjuterskim mrežama.

Naš današnji članak će biti o ovoj nevjerojatnoj zamisli programera. Pokušali smo da razmotrimo sve inovacije u tehnologiji i opise funkcionalnosti, kao i mnoge druge važne tačke u ovom materijalu.

Istorija stvaranja i lansiranja Alice

Dakle, upoznajmo: Alice, glasovnu pomoćnicu iz Yandexa. Ova aplikacija uspješno imitira konverzacijski govor uživo (usmeni i pismeni), daje savjete i odgovore na postavljena pitanja, reprodukujući ih glasom ili pisanjem na ekranu. Kreatori ovog čuda ovaj program samouvjereno proglašavaju najnaprednijim digitalnim asistentom, koji ima neograničen broj fraza odgovora, što ga ugodno razlikuje od ostalih analoga u internetskom prostoru.

Možete čak i samo razgovarati sa virtuelnom mladom damom. Otkucajte komandu "Alice, hajde da razgovaramo" i uživajte u komunikaciji sa kompjuterskim umom. Ovo je postala nova zabava za brojne posjetitelje društvenih mreža, gdje objavljuju fragmente posebno smiješnih dijaloga.

Ne tako davno - u proljeće 2017. - pojavila se beta verzija govornog asistenta Yandex pretraživača. Nakon svih testiranja i poboljšanja, servis je zvanično pušten u rad u oktobru iste godine. V.V. je također komunicirao sa ovim glasovnim asistentom. Putina, kada je posetio kancelariju Yandexa.

Kako je prošlo testiranje

Kreiranje virtualne glasovne aplikacije povezano je s idejom implementacije naprednih funkcija pomoći korisnicima da traže potrebne informacije na Internetu. U idealnom slučaju, asistent bi trebao razumjeti verbalne komande i tačno odgovoriti na njih.

Razvoj tehnologija na kojima se zasnivaju takve usluge ne karakteriše maksimalno savršenstvo. Ali čak i nivo na kojem su trenutno u stanju da impresioniraju svojom funkcionalnošću.
Alice, Yandexov glasovni asistent, može komunicirati u formatu pitanje-odgovor. I u isto vrijeme, ona pronalazi odgovor na mnoga pitanja u istom Yandexu.

Koristeći ogroman broj fraza odabranih iz upita za pretraživanje u Yandexu, ovaj glasovni asistent odaje utisak umjetne inteligencije.

Na kojim principima i tehnologijama se zasniva program?

Danas je ova aplikacija svuda implementirana, što omogućava da je koriste svi vlasnici pametnih telefona, tableta i drugih gadžeta. A sada je glasovni asistent na ruskom "Alice" značajno proširio granice svoje upotrebe.
Program koristi neke audio parametre kao glavne algoritme za prepoznavanje ljudskog govora. Na primjer, prepoznaju se i snimaju frekvencija i dužina zvučnih talasa (ili jednog zvučnog talasa) u određenom trenutku.

Zasnovana na umjetnoj inteligenciji i korištenjem tehnologija neuronske veze, Alice se savršeno uklapa u kompaniju drugih usluga Yandexa. Neuronske mreže koje su uključene u tehnološku platformu glasovnog asistenta se obučavaju interakcijom s korisnicima. To je ono što je postalo osnova za „napredak“ novog asistenta u modernom omladinskom slengu. Osim toga, prilikom stvaranja ove zamisli nauke, aktivno je korištena tehnologija strojnog učenja i izgradnje neuronskih veza.

Gdje i kako omogućiti glasovnu pomoćnicu Alice

Da biste počeli koristiti ovu aplikaciju potrebno vam je:
Preuzmite aplikaciju za svoj računar ili laptop

Za pametne telefone, može se preuzeti sa Google Play-a ili AppStore-a.
Da biste instalirali, pokrenite preuzetu distribuciju.
Nakon toga, potrebno je da kliknete na plavo dugme pored ikone mikrofona.


Izgovaranjem zahtjeva u mikrofon, korisnik će dobiti glasovni odgovor od Alice, kao i odgovore u tekstualnom formatu. Ako program nema odgovor, glatko preusmjerava korisnika na relevantnu Yandex stranicu.
Kada se aplikacija instalira, na ekranu uređaja će se pojaviti sljedeća slika:


Izraz dobrodošlice "Zdravo, ja sam Alice, tvoj glasovni asistent" ukazuje da je aplikacija spremna za početak rada. Zatim pritisnemo mikrofon i izgovorimo svoje pitanje. Savjetujemo vam da jasno izgovarate fraze i da ne "gutate" zvukove. U suprotnom, program može pogrešno protumačiti pitanje i, shodno tome, dati ne sasvim relevantan odgovor.
Da pozovete novog pomoćnika, koristite panel koji se pojavljuje na dnu ekrana.

Prilikom korištenja pomoćnika na osobnom računaru, dodatno je moguće konfigurirati osnovne parametre programa. Kliknite desnim tasterom miša na panel glasovnog pomoćnika. Nalazite se u postavkama programa. Sada instalirajte sve funkcije Alice za sebe radi lakšeg korištenja.

Ne tako davno, tako poznati pretraživač kao što je Yandex, objavio je svoj glasovni asistent i zove se vrlo jednostavno - Alice.

Mislim da vas takve stvari jako zanimaju i zato sam odlučio da prođem kroz teme koje ljude najčešće zanimaju.

Glasovna pomoćnica Alice iz Yandexa - šta je to?

Kao i drugi slični asistenti, ona može razgovarati s vama i, koristeći glasovni ili tekstualni dijalog, dati vam odgovore na pitanja koja su vam potrebna.

Značajke Alice glasovnog asistenta iz Yandexa

Alice nije ništa posebno i ima sve slične karakteristike koje možete pronaći u sličnim opcijama od Google-a ili Apple-a.

U osnovi, radi sa svim uslugama iz Yandexa. Ako pokušate komunicirati s drugim aplikacijama, mogu se pojaviti problemi.

Sve funkcije se mogu opisati sljedećim točkama:

  • voditi jednostavan dijalog;
  • dati odgovore na razna pitanja;
  • sve vezano za vremensku prognozu (u različitim gradovima, vrijeme za sutra, itd.);
  • pojašnjenje datuma i dana (što je veoma važno);
  • sve informacije vezane za mape (iscrtajte rutu, saznajte udaljenost, savjete gdje jesti, itd.);
  • transakcije s novcem (saznaj kurseve, transfer iz jedne valute u drugu, itd.);
  • ostalo.

Iako već imamo punopravnu verziju, pomoćnik još uvijek ima prostora za rast i unatoč ograničenim mogućnostima, recenzije su samo pozitivne.

Pitanje je: "Kako će se takmičiti sa postojećim opcijama?"

Kako omogućiti glasovni asistent Alice iz Yandexa?

Trenutno postoje verzije za iOS, Android, Windows (beta) iu budućnosti se planira ugraditi u Yandex Browser.


Ako tražite verziju za mobilni uređaj, možete je pronaći u aplikaciji Yandex. Programeri su odlučili jednostavno integrirati pomoćnika u gotov program.

Da biste razgovarali s Alice, trebate učiniti jednu od ovih radnji (sa pokrenutom aplikacijom Yandex):

  • kliknite na ljubičasto okruglo dugme sa mikrofonom;
  • Kažemo "Zdravo Alice."

U oba slučaja dobijamo potpuno isti rezultat i onda počinjemo da postavljamo pitanja, a Alisa počinje da vam odgovara.

Ako pomoćnik ne zna kako implementirati vaš zahtjev, tada se Yandex tražilica otvara s vašim pitanjem i listom rezultata.

Sve izgleda kao najobičniji razgovor. Mislim da će biti nekih promjena u budućnosti, ali za sada sve izgleda prilično jednostavno i ukusno.

Ko je izrazio glasovnu pomoćnicu Alice iz Yandexa?

Alis glas daje veoma poznata glumica Tatjana Šitova, a ako ne znate ko je, mogu reći da je glas Skarlet Johanson u ruskoj sinhronizaciji.


Dakle, kada gledate filmove poput Ghost in the Shell ili Lucy, možete se sjetiti Alice i uporediti glasove. Ali ovo nije obavezno.

Kako preuzeti glasovnog asistenta Alice sa Yandexa na iOS ili Android?

Ako pokušate pronaći pomoćnika jednostavnim unosom Alice u App Store ili Google Play pretragu, odgovori će sadržavati aplikaciju pod nazivom Yandex.

Nemojte se plašiti, jer je to ono što je. Ranije je ovaj program bio posvećen samo tražilici, ali sada postoji ugrađeni pomoćnik.

Različito je težak za različite uređaje (na primjer, na iPhone 5S - nešto više od 60 MB), tako da neće zauzimati puno prostora. Evo linkova da se ne zbunite:

Dobar dan. Došlo je do zvaničnog izdavanja Alice glasovnog asistenta za pametne telefone, što me obradovalo, a danas je izašla i beta verzija asistenta za Windows. Instalirao sam ga, malo testirao i isto tako ugodno iznenađen.

Glasovni asistent Alice za PC

Za instalaciju" Alice"na računaru morate otići na web stranicu https://alice.yandex.ru/windows i kliknuti na " Instaliraj“, nakon toga će instalacijska datoteka biti preuzeta od vas. Pokrenite i instalirajte.

PAŽNJA! Yandex je uklonio program za instalaciju Alice, službeni link sada preuzima pretraživač sa ugrađenom Alice!

Još uvijek imam instalater ako nekom zatreba —

(snimak ekrana)

Nakon instalacije, vidjet ćete dolje lijevo blizu dugmeta Počni traka za pretragu, na Win 10 je integrisana u standardnu ​​pretragu, na Win7 je postavljena kao poseban widget. Pogledajmo šta ovaj asistent, koji je u Beta fazi, sada može da uradi.

U prvoj kartici, često posjećene stranice i trendovi vijesti ili upiti tražilicama, kako ja to razumijem:

U drugoj kartici nalazi se lista programa koje možete otvoriti ili klikom na sam program mišem, ili tako što ćete zatražiti od „Upravljanje glasom“ da vam otvori aplikaciju.

Ako na glavnoj (prvoj) kartici kliknete na ikonu “ upitnik“, tada ćete tamo vidjeti malu listu onoga što Alice može učiniti:

Za test sam odlučio da je pitam za najnovije vesti, na šta Alice je rekla da daje riječ koleginici iz “ Yandex.News“, a muški glas je počeo da čita vijesti.

Onda sam pokušao da razgovaram sa njom, u principu je odgovorila potpuno isto kao i na telefon. Aplikacije se otvaraju bez, web stranice također. Ako je zamolite da uključi radio ili određenu pjesmu/grupu, tada Alice otvara pretraživač, otvara Yandex.Music u njemu i pokreće ono što ste tražili od nje. Ona još ne zna da radi sa videom.

Za kontrolu računara - može uključiti i isključiti zvuk, isključiti, ponovo pokrenuti PC, a također ga poslati u stanje mirovanja.

zaključak:

šta možemo reći? Yandex je odradio odličan posao sa svojim pomoćnikom. Nadam se da ga neće napustiti, već da će ga nastaviti razvijati. Ovo nije loš analog Cortane, što je malo vjerovatno da ćemo vidjeti u Windowsu 10. Microsoft već dugo obećava da će ga objaviti na ruskom, ali do sada je ostao bez ušiju. A onda su Yandex i Alice upravo stigli.

Instalirajte, isprobajte, testirajte.

Podijelite u komentarima koje druge zanimljive funkcije i “viceve” ima, šta sve može i kako vam zaista pomaže u svakodnevnom radu sa računarom.

  • razvoj mobilnih aplikacija,
  • Data Mining
  • Mašinsko učenje
  • U budućnosti, mislimo da će ljudi komunicirati s uređajima koristeći svoj glas. Aplikacije već prepoznaju tačne glasovne komande koje su u njih ugradili programeri, ali s razvojem tehnologija umjetne inteligencije naučit će razumjeti značenje proizvoljnih fraza, pa čak i održavati razgovor na bilo koju temu. Danas ćemo čitateljima Habra reći kako približavamo ovu budućnost na primjeru Alice, prvog glasovnog asistenta koji nije ograničen na set unaprijed definiranih odgovora i koristi neuronske mreže za komunikaciju.

    Unatoč svojoj prividnoj jednostavnosti, glasovni asistent jedan je od najvećih tehnoloških projekata Yandexa. U ovom postu ćete naučiti sa kakvim se poteškoćama suočavaju programeri glasovnog interfejsa, ko zapravo piše odgovore za virtuelne asistente i šta Alisa ima zajedničko sa veštačkom inteligencijom iz filma „Ona“.

    U zoru svog postojanja, kompjuteri su se uglavnom koristili u velikim naučnim ili odbrambenim preduzećima. U to vrijeme samo su pisci naučne fantastike razmišljali o glasovnoj kontroli, ali u stvarnosti su operateri učitavali programe i podatke koristeći komad kartona. Nije najpogodniji način: jedna greška i morate početi iznova.

    Tokom godina, računari su postali pristupačniji i počeli su da se koriste u manjim kompanijama. Stručnjaci ih kontroliraju pomoću tekstualnih naredbi unesenih u terminal. Dobra, pouzdana metoda - koristi se u profesionalnom okruženju do danas, ali zahtijeva pripremu. Stoga, kada su se računari počeli pojavljivati ​​u domovima običnih korisnika, inženjeri su počeli tražiti jednostavnije načine interakcije mašine i osobe.

    Koncept grafičkog interfejsa WIMP (Windows, Ikone, Meniji, Point-n-Click) rođen je u Xerox laboratoriji - našao je široku upotrebu u proizvodima drugih kompanija. Više nije bilo potrebno pamtiti tekstualne komande za kontrolu kućnog računara - zamijenili su ih pokreti i klikovi mišem. Za svoje vrijeme ovo je bila prava revolucija. A sada se svijet kreće ka sljedećem.

    Sada skoro svako ima pametni telefon u džepu, koji ima dovoljno računarske snage da spusti letelicu na Mesec. Miš i tastatura su zamijenili prste, ali ih i dalje koristimo za iste pokrete i klikove. Ovo je zgodno raditi dok sjedite na kauču, ali ne na putu ili u pokretu. U prošlosti su ljudi morali da nauče mašinski jezik da bi komunicirali sa računarskim interfejsima. Vjerujemo da je sada vrijeme da naučimo uređaje i aplikacije da komuniciraju na jeziku ljudi. Upravo je ta ideja bila osnova Alice glasovnog asistenta.

    Možete pitati Alice [Gdje mogu dobiti kafu u blizini?] umjesto da diktirate nešto poput [kafe u ulici Cosmonaut]. Alice će pogledati u Yandex i predložiti odgovarajuće mjesto, a kao odgovor na pitanje [Sjajno, kako doći?] - ona će dati link do već izgrađene rute u Yandex.Maps. Ona zna da razlikuje precizna činjenična pitanja od želje da vidi klasične rezultate pretrage, nepristojnost od ljubaznog zahteva, naredbu za otvaranje sajta od želje da se samo ćaska.

    Možda se čak čini da negdje u oblaku postoji neuronska mreža čuda koja sama rješava bilo koji problem. Ali u stvarnosti, iza bilo kakvog Alisinog odgovora stoji čitav lanac tehnoloških problema koje učimo rješavati već 5 godina. I počet ćemo našu ekskurziju od prve veze - sa sposobnošću slušanja.

    Zdravo Alice

    Umjetna inteligencija iz naučne fantastike može slušati - ljudi ne moraju pritisnuti posebne tipke da bi uključili "režim snimanja". A za to vam je potrebna glasovna aktivacija - aplikacija mora razumjeti da je osoba kontaktira. Ovo nije tako lako učiniti kao što se čini.

    Ako samo počnete snimati i obrađivati ​​cijeli dolazni audio stream na serveru, vrlo brzo ćete isprazniti bateriju uređaja i potrošiti sav svoj mobilni promet. U našem slučaju to se rješava pomoću posebne neuronske mreže, koja je obučena isključivo za prepoznavanje ključnih fraza (“Zdravo, Alisa”, “Slušaj, Yandex” i neke druge). Podrška za ograničen broj takvih fraza omogućava vam da ovaj posao obavite lokalno i bez pristupa serveru.

    Ako je mreža osposobljena da razumije samo nekoliko fraza, mogli biste pomisliti da bi to bilo prilično jednostavno i brzo. Ali ne. Ljudi izgovaraju fraze u daleko od idealnih uslova, ali okruženi potpuno nepredvidivom bukom. I svi glasovi su različiti. Stoga, da bi se razumjela samo jedna fraza, potrebne su hiljade snimaka treninga.

    Čak i mala lokalna neuronska mreža troši resurse: ne možete samo pokupiti i početi obraditi cijeli stream iz mikrofona. Stoga se u prvom planu koristi manje težak algoritam koji jeftino i brzo prepoznaje događaj „govor je počeo“. To je ono što uključuje motor neuronske mreže za prepoznavanje ključnih fraza, koji zauzvrat pokreće najteži dio - prepoznavanje govora.

    Ako je potrebno na hiljade primjera za treniranje samo jedne fraze, onda možete zamisliti koliko je naporno trenirati neuronsku mrežu da prepoznaje bilo koju riječ i frazu. Iz istog razloga, prepoznavanje se vrši u oblaku, gdje se prenosi audio tok i odakle se vraćaju gotovi odgovori. Tačnost odgovora direktno zavisi od kvaliteta prepoznavanja. Zato je glavni izazov naučiti prepoznati govor kao i čovjek. Usput, i ljudi griješe. Smatra se da osoba prepoznaje 96-98% govora (WER metrika). Uspeli smo da postignemo tačnost od 89-95%, što je ne samo uporedivo sa nivoom živog sagovornika, već i jedinstveno za ruski jezik.

    Ali čak i govor savršeno pretvoren u tekst neće značiti ništa ako ne možemo razumjeti značenje onoga što je rečeno.

    Kakvo je vrijeme sutra u Sankt Peterburgu?

    Ako želite da vaša aplikacija prikazuje vremensku prognozu kao odgovor na glasovni zahtjev [vreme], onda je sve jednostavno - uporedite prepoznati tekst sa riječju "vreme" i ako dobijete podudaranje, prikažite odgovor. A ovo je vrlo primitivan način interakcije, jer u stvarnom životu ljudi različito postavljaju pitanja. Osoba može pitati asistenta [Kakvo je vrijeme sutra u Sankt Peterburgu?], i ne treba ga zbuniti.

    Prva stvar koju Alice uradi kada dobije pitanje je da prepozna scenario. Poslati zahtjev za pretraživanje i prikazati klasične rezultate sa 10 rezultata? Tražiti jedan tačan odgovor i odmah ga dati korisniku? Poduzeti radnju, kao što je otvaranje web stranice? Ili možda samo razgovaramo? Nevjerovatno je teško naučiti mašinu da precizno prepozna scenarije ponašanja. I svaka greška ovde je neprijatna. Srećom, imamo svu moć Yandex pretraživača, koji se svakodnevno susreće sa milionima upita, traži milione odgovora i uči da razume koji su dobri, a koji nisu. Ovo je ogromna baza znanja, na osnovu koje je moguće trenirati još jednu neuronsku mrežu - onu koja bi sa velikom vjerovatnoćom "razumjela" šta tačno osoba želi. Greške su, naravno, neizbježne, ali ih i ljudi čine.

    Uz pomoć mašinskog učenja, Alice „razume“ da je fraza [Kakvo je vreme sutra u Sankt Peterburgu?] zahtev za vremensku prognozu (usput, ovo je očigledno jednostavan primer radi jasnoće). Ali o kom gradu govorimo? kog datuma? Ovdje počinje faza preuzimanja imenovanih entiteta iz korisničkih replika (Prepoznavanje imenovanih entiteta). U našem slučaju, dva takva objekta nose važne informacije: “Petar” i “sutra”. A Alis, koja iza sebe ima tehnologiju pretraživanja, „razumije“ da je „Petar“ sinonim za „Sankt Peterburg“, a „sutra“ je „trenutni datum + 1“.

    Prirodni jezik nije samo spoljašnji oblik naših napomena, već i njihova koherentnost. U životu ne razmjenjujemo kratke fraze, već vodimo dijalog - to je nemoguće ako se ne sjećate konteksta. Alice to pamti – pomaže joj da se nosi sa složenim jezičkim fenomenima: na primjer, da se nosi s elipsom (oporavlja riječi koje nedostaju) ili razriješi koreferenciju (identificira objekt po zamjenici). Dakle, ako pitate [Gdje je Elbrus?], a zatim pojasnite [Koja je njegova visina?], tada će asistent pronaći tačne odgovore u oba slučaja. A ako nakon zahtjeva [Kakvo je vrijeme danas?] pitate [A sutra?], Alice će shvatiti da je ovo nastavak dijaloga o vremenu.

    I još nešto. Asistent mora ne samo razumjeti prirodni jezik, već i biti u stanju da ga govori - kao osoba, a ne kao robot. Za Alis sintetizujemo glas koji je prvobitno pripadao sintetičkoj glumici Tatjani Šitovoj (zvanični glas Scarlett Johansson u Rusiji). Ona je izrazila umjetnu inteligenciju u filmu Ona, iako je se možda sjećate i po glasu čarobnice Jenefer iz Vještica. Štoviše, govorimo o prilično dubokoj sintezi pomoću neuronskih mreža, a ne o rezanju gotovih fraza - nemoguće je unaprijed zapisati svu njihovu raznolikost.

    Gore smo opisali karakteristike prirodne komunikacije (nepredvidivi oblik primjedbi, riječi koje nedostaju, zamjenice, greške, šum, glas) s kojima morate znati raditi. Ali komunikacija uživo ima još jedno svojstvo - ne tražimo uvijek konkretan odgovor ili radnju od sagovornika ponekad samo želimo da razgovaramo. Ako aplikacija pošalje takve zahtjeve u pretragu, tada će sva magija biti uništena. Zbog toga popularni glasovni asistenti koriste bazu uredničkih odgovora na popularne fraze i pitanja. Ali otišli smo još dalje.

    Šta je sa razgovorom?

    Naučili smo mašinu da odgovara na naša pitanja, vodi dijalog u kontekstu određenih scenarija i rešava probleme korisnika. Ovo je dobro, ali je li moguće učiniti je manje bezdušnom i obdariti je ljudskim svojstvima: dati joj ime, naučiti je da priča o sebi, održavati razgovor o slobodnim temama?

    Industrija glasovnih asistenata rješava ovaj problem kroz uredničke odgovore. Poseban tim autora uzima stotine najpopularnijih pitanja među korisnicima i na svako napiše po nekoliko odgovora. U idealnom slučaju, ovo bi trebalo biti urađeno u jedinstvenom stilu, tako da svi odgovori čine kohezivnu ličnost asistenta. Pišemo i odgovore za Alisu - ali imamo još nešto. Nešto posebno.

    Pored top popularnih pitanja, postoji dugačak rep niskofrekventnih ili čak jedinstvenih fraza za koje je nemoguće unaprijed pripremiti odgovor. Već ste pogodili kako rješavamo ovaj problem, zar ne? Korištenje drugog modela neuronske mreže. Da bi odgovorila na njoj nepoznata pitanja i primjedbe, Alice koristi neuronsku mrežu obučenu na ogromnoj bazi podataka tekstova s ​​interneta, knjiga i filmova. Poznavaoce mašinskog učenja može zanimati činjenica da smo počeli sa troslojnom neuronskom mrežom, a sada eksperimentišemo sa ogromnom od 120 slojeva. Sačuvaćemo detalje za specijalizirane postove, ali ovdje ćemo reći da trenutna verzija Alice pokušava odgovoriti na proizvoljne fraze koristeći „čat neuronske mreže“ – tako to zovemo interno.

    Alice uči iz ogromnog broja različitih tekstova, u kojima se ljudi i likovi ne ponašaju uvijek pristojno. Neuronska mreža može naučiti nešto potpuno drugačije od onoga što želimo da je naučimo.

    - Naruči mi sendvič.
    - Proći ćeš.

    Kao i svako dijete, Alice se ne može naučiti da ne bude gruba štiteći je od svih manifestacija grubosti i agresije – odnosno treniranjem neuronske mreže na „čistoj“ osnovi, gdje često nema grubosti, provokacija i drugih neugodnih stvari. naći u stvarnom svetu. Ako Alice ne zna za postojanje takvih izraza, odgovorit će na njih nepromišljeno, nasumičnim frazama - za nju će to ostati nepoznate riječi. Neka bolje zna o čemu se radi i razvijte definitivan stav o ovim pitanjima. Ako znate šta je psovanje, možete ili uzvratiti ili reći da nećete razgovarati sa nekim ko psuje. I modeliramo Alisino ponašanje tako da ona odabere drugu opciju.

    Dešava se da je sama Alicina primedba prilično neutralna, ali u kontekstu koji je odredio korisnik, odgovor prestaje da bude bezopasan. Jednom smo, tokom zatvorenog testiranja, zamolili korisnika da pronađe neki lokal - kafić ili nešto slično. Rekao je: “Nađite još jednog takvog.” I u tom trenutku u Alice se dogodila greška i umjesto da pokrene skriptu za pretragu organizacije, ona je dala prilično hrabar odgovor - nešto poput „pogledaj na karti“. I nisam tražio ništa. Korisnik je prvo bio iznenađen, a potom i nas pohvalivši Alisino ponašanje.

    Kada Alice koristi čavrljanje neuronske mreže, u njemu se može pojaviti milion različitih ličnosti, budući da je neuronska mreža apsorbirala ponešto od autora svake replike iz skupa za obuku. Ovisno o kontekstu, Alice može biti pristojna ili gruba, vesela ili depresivna. Želimo da personalni asistent bude holistička osoba sa vrlo specifičnim skupom kvaliteta. Tu u pomoć priskaču naši urednički tekstovi. Njihova posebnost je što su prvobitno napisane u ime ličnosti koju želimo da rekreiramo u Alisi. Ispostavilo se da možete nastaviti da obučavate Alice na milionima redova nasumičnih tekstova, ali će ona odgovoriti pazeći na standard ponašanja postavljen u odgovorima urednika. I to je ono na čemu već radimo.

    Alice je postala prvi glasovni asistent za kojeg znamo koji pokušava održati komunikaciju ne samo uz pomoć uredničkog odgovora, već i korištenjem obučene neuronske mreže. Naravno, još smo daleko od onoga što je prikazano u modernoj naučnoj fantastici. Alice ne prepoznaje uvijek tačno suštinu primjedbe, što utiče na tačnost odgovora. Stoga, imamo još puno posla.

    Planiramo da od Alice napravimo najhumanoičniju pomoćnicu na svijetu. Usadite joj empatiju i radoznalost. Učinite je proaktivnom – naučite je da postavlja ciljeve u dijalogu, preuzima inicijativu i uključite sagovornika u razgovor. Sada smo i na samom početku našeg putovanja i na čelu nauke koja proučava ovu oblast. Da biste krenuli dalje, morat ćete pomjeriti ovu ivicu.

    mob_info