დისციპლინა „ბუნებრივი ენის დამუშავება“ (NLP – Natural Language Processing) სწავლობს ადამიანური ენის ამოცნობის და დამუშავების მეთოდებს და მის ერთერთ ყველაზე აქტუალურ მიმდინარეობას დღესდღეობით ხმის ამოცნობა (Speech Recognition) წარმოადგენს.

გლობალურ ციფრულ სივრცეში სხვადასხვა ბრძანებების ხმით გამოძახებას და შესრულებაზე მაღალი მოთხოვნა არსებობს. კომპიუტერისთვის ადამიანის სურვილის ტრადიციული მეთოდებით (კლავიატურა, მაუსი) მიწოდება არაეფექტური, მოძველებული და მოსაწყენი პროცესია, ხოლო კომპიუტერისთვის ფიქრით ბრძანების გაცემა, წარმატებული ექსპერიმენტების მიუხედავად, ჯერ ნაადრევია. რჩება შუალედური ვარიანტი - ადამიანის ხმა, რომელიც კომპიუტერთან ურთიერთობის საშუალებას იძლევა არა მხოლოდ მასთან უშუალო სიახლოვეს ყოფნისას, არამედ შორიდანაც. განსაკუთრებით მობილურ მოწყობილობებთან (პლანშეტი, სმარტფონი) ურთიერთობისას, მოძრაობის პროცესში, ხშირად შეუძლებელია მოწყობილობის სენსორული ზედაპირის გამოყენება და ერთადერთ გამოსავლად ხმით ბრძანების მიწოდება რჩება.

ხმის გამოყენების კიდევ ერთი სასარგებლო თვისება ტექსტური ინფორმაციული კონტენტის სწრაფად შექმნის უნარია. მიუხედავად იმისა, რომ 21-ე საუკუნეში ფოტომ, აუდიომ და ვიდეომ ჩვეულებრივი ტექსტი მკვეთრად შეავიწროვა, ხშირ შემთხთვევაში, საქმე მაინცდამაინც ტექსტური დოკუმენტების შექმნას ითხოვს, რომელთა აკრეფა დროში განგრძობადია, ტექსტად გარდაქმნილი ხმით კი ბევრად უფრო სწრაფი პროცესია.

თანამედროვე ხმოვანი ასისტენტები ან კომპიუტერების და მობილური მოწყობილობების ვირტუალურ ასისტენტებში (Virtual Assistants) არიან ჩაშენებულნი ან დამოუკიდებლად, „ჭკვიან“ დინამიკებში (Smart Speakers) „ცხოვრობენ“.

არსებობს რამდენიმე გავრცელებული ვირტუალური ასისტენტი, რომლებსაც ძირითადად საინფორმაციო ტექნოლოგიების გიგანტები აწარმოებენ: Microsoft Cortana, Apple Siri, Google Assistant, Amazon Alexa, Yandex Alica