Шешімдер / Контакт-орталыққа арналған сөйлеу аналитикасы
Yandex SpeechKit‑тің ML‑технологияларында негізделген, қазақ тілін қолдайтын сөйлеу аналитикасы
Yandex SpeechKit 16 тілді түсінеді, оның ішінде орыс, қазақ және өзбек тілдері бар. Танудың сапасын жақсарту мақсатында, Yandex Cloud әзірлеушілері әр тіл үшін мыңдаған сағаттық аудионы пайдаланады.
SpeechKit‑тің сөйлеу ML‑модельдері сіздің инфрақұрылымда орналастырыла алады. Біз сізге гибридті нұсқалар немесе барлық трафикті сіздің контурда өңдеу шешімдерін ұсына аламыз.
Yandex SpeechKit сервисі қазақ тілінде және қазақша-орысша аралас сөйлеуде сөйлеген мәтінді жоғары сапамен танып алады.
2023 жылдан бері Sanatel Consulting компаниясы сөйлеу технологиялары бойынша Yandex серіктесі болып табылады.
Шешімнің демонстрациялық стенді осы сілтемеде қолжетімді.
Сөйлеу аналитикасының қолдану салалары
Аналитика клиенттермен жұмыс істейтін барлық компаниялар үшін пайдалы, бірақ особливо тиімді аспап, қоңыраулар саны көбірек болатын салаларда: банктер, сақтандыру компаниялары, интернет-дүкендер, медициналық орталықтар, жеткізу қызметтері, түрлі call‑орталықтар.
- Скрипттерді бақылау – сату скрипттерінің, регламенттердің және телефон арқылы қарым-қатынастың стандарттарының сақталуын бақылау.
- Наразылықтарды талдау – клиенттердің қанағаттанбаушылық жағдайларын анықтау.
- Талаптарды анықтау – клиенттердің қажеттіліктерін анықтау және жүйелеу.
- Деректерді жинақтау – клиенттермен байланыс бойынша тарихи деректерді жинақтау, аналитикаға немесе ИИ ботты оқытуға қолдану.
Yandex SpeechKit негізіндегі сөйлеу аналитикасының тақырыпқа арналған слайдтары:
Неліктен сөйлеу аналитикасы қажет
Сөйлеу аналитикасы 100% телефон қоңырауларын бақылауға, компания сарапшыларының жұмыс сапасын автоматты түрде бағалауға, қызмет көрсету стандарттарының сақталуын қарауға және клиенттердің наразылықтарына жедел жауап беруге мүмкіндік береді.
Аналитиканы пайдалану бизнес шығындарын азайтуға, жаңа қызметкерлерді оқытуға кететін уақытты қысқартуға, сатылым көлемін арттыруға, клиенттердің наразылығына проактивті жауап беруге, клиенттермен қарым‑қатынасты жақсартуға және олардың компанияға адалдығын күшейтуге көмектеседі.
- Жұмысқа жұмсалған еңбек шығындарын азайту;
- Жаңа қызметкерлерді оқыту уақытын қысқарту;
- Сатылым көлемін арттыру;
- Клиенттердің наразылықтарына жедел реакция жасау;
- Клиенттермен коммуникацияны жақсарту және олардың компанияға деген адалдығын арттыру;
Сөйлеу аналитикасы қалай жұмыс істейді
«Сөйлеу аналитикасы» шешімі Тапсырыс берушінің серверіне немесе бұлтқа орналастырылады. Бұл шешім компанияның телефония жүйесіне интеграцияланып, сату бөлімі немесе контакт‑орталығының дауыс жазбаларын алады. Содан кейін сөйлеуді мәтінге аударып, мәтінді скрипттердің сақталуы, негатив, тыйым салынған сөздер, паразит сөздер бойынша талдайды. Әрі қарай ол есептерді құрастырып, қызметкер рейтингін есептейді және есептерді жеке немесе бөлім бойынша береді.
- Телефониямен интеграция – телефониядан сөйлесу жазбаларын алып, сөйлегенді мәтінге түрлендіреді.
- Мәтінді талдайды – мәтінді, сөздіктерді және скрипт фрагменттерін іздейді.
- Есептерді жасайды – операторлардың рейтингін есептейді, операторлар немесе команда бойынша есептер мен графиктер жасайды.
Yandex SpeechKit негізіндегі сөйлеу аналитикасының видео шолуы:
Сандық талдау
Сандық мәтін талдауы – мәтінді сандық өлшем көрсеткіштер арқылы бағалауға бағытталған және сөздер мен тіркестер сияқты көріністерді анықтау үшін статистикалық және сандық құралдарды пайдаланады.
Сөздер мен тіркестерді іздеуде келесі таңбалар қолданыла алады:
- «*» – тіркестің кез келген сөз тіркесінің соңғысының кез келген формасы;
- «<>» – тіркес ішіндегі сөздерді орналастыру ретін аудару;
- «/» – тіркесте сөздің нұсқаларын көрсету.
Мысалы, «добрый<>день/вечер» шаблоны төрт тіркестің нұсқасын іздейді:
- добрый день
- добрый вечер
- день добрый
- вечер добрый
Мазмұнды талдау
GPT классификаторларын пайдалана отырып мәтіннің мазмұнын талдау мәтін деректерін тереңірек түсініп, тақырыптар, паттерндер мен категорияларды анықтауға мүмкіндік береді. Кең көлемді деректер негізінде оқытылған GPT моделі мәтінді «Өнімнің жаңалығы», «Шұғыл қажеттілік тудыру», «Қорытындылау» сияқты категорияларға сәйкес классификациялайды.
GPT классификаторын оқыту үшін, кемінде 100 репликадан тұратын “дұрыс” жауаптар жиынтығы (dataset) құрылады, ұсынылған саны — дейін 10000 реплика. Мысалы, «Шұғыл қажеттілік тудыру» классификаторы үшін қызметкерлердің диалогтарынан жиналған репликалар үлестіріледі:
[
{
"Аты осы өнім туралы жиі сұралайды. Сіз жақын арада келуге мүмкіндігіңіз бар ма? Ертең бұл өнім қоры таусылуы мүмкін."
},
{
"Несие шарттары әр ай сайын өзгеріп отырады. Егер сатып алуды кейінге қалдырсаңыз, тиімді ұсыныстан айрылуыңыз мүмкін."
},
{
"Егер біз сіз үшін жақын арада тапсырысты рәсімдей алмасақ, келесі жеткізілімді күтуге тура келеді, ал бұл өте ұзақ.",
}
]Одан әрі оқытылған GPT классификаторы жаңа диалогтарды бағалап, “дұрыс” репликаларға мағынасы жағынан жақындарды таңдауды жүзеге асырады.
Сату бөлімі үшін GPT классификаторлары – бейне:
Аналитика қандай бөлімдерден тұрады
«Сөйлеуді транскрипциялау» бөлімі
Телефониядағы дауыс жазбаларын тыңдау мүмкіндігі бар, сонымен қатар диалог транскрипциясын көру. Диалог репликасына басқанда аудио жазбадағы тиісті уақытқа өту қамтамасыз етіледі.
Сөздіктерге сәйкес келген сәйкестіктер мен скрипттерді тексеру нәтижелері диалог мәтінінде белгілері арқылы көрсетіледі.
Сөйлесу статистикасы, сөйлеу қарқыны, үзілістер, менеджердің қоңырауды бұзу 여부 көрсетіледі.
Сіздің CRM жүйеңізбен интеграциялау мүмкіндігі бар — жетекші немесе келісімшартқа өту үшін.
«Сөздіктер» бөлімі
Сөздіктерді басқару — сөздерді жою немесе қосу. Сөздікке мәтіндік файлдан тізім жүктеу.
«Скрипттер» бөлімі
Фрагменттерді басқару — фрагментті өңдеу, сөздерді жою немесе қосу.
Скрипттерді басқару — скрипттерді өңдеу, фрагменттерді қосу немесе жою. Скрипт параметрлерін реттеу, операторлар тобына немесе бөлімге скрипттарды тағайындау.
«Есептер» бөлімі
«Жинақтау көрсеткіштері» есебі — уақыт бойынша диалогтарды анализдеу, жалпы статистика.
«Орташа сөздік бойынша балл» есебі — менеджерлердің жұмысы бойынша талдау, сөздіктерге сәйкес алынған бағалау.
«Скрипт орындау» есебі — менеджерлердің скрипттерді орындауын талдау, скрипт бойынша бағалау.
«Фрагменттер бойынша статистика» есебі — диалогтардағы скрипт фрагменттерінің сәйкестігін талдау, жиі кездесетін сәйкестіктерді ранжирлеу.
«STT биллинг» есебі — мәтінге сөйлеуді танудың шығындарын талдау.
«Басқа» бөлімі
Telegram хабарландырулары — сөздіктердің маңызды сөздерінен табылған сәйкестіктер туралы Telegram бойынша хабарламалар тарихы, мысалы «Шағым» сөздігі.
Пайдаланушылар мен олардың рөлдері, бөлімдерге қол жеткізу құқықтары, өңдеу құқықтары.
Жүйелік қызмет журналы, сөйлегенді тану логтары, техникалық қателер туралы хабарламалар.
Телефониямен интеграция
Жүйеге телефониядан қоңырау туралы деректерді (күні, уақыты, бөлімшесі, бағыты және т.б.), сондай-ақ қоңыраудың аудио жазбасын алу қажет. Аудио жазбалар стерео форматында болуы тиіс, яғни әңгімелесудің әр жағы сол және оң стерео арналарға бөлек жазылуы керек.
Егер аудио жазбалар моно форматында болса, мысалы, жұмыс орнындағы микрофондардан немесе аудио бейдждерден алынған болса, онда жүйе сөйлеуді мәтінге айналдырғанда дауыс арқылы әңгімелесушілерді ажыратады, бірақ мұндай ажыратудың дәлдігі шамамен 70–80% құрайды және микрофон жазбасының сапасына байланысты.
Телефониямен интеграциялаудың келесі нұсқалары мүмкін:
Деректерді алу
1-нұсқа. Әр қоңырау туралы деректерді аудио файлдың атауына енгізу. Файл атауындағы параметрлер саны кіріс және шығыс қоңыраулар үшін бірдей болуы тиіс. Параметрлер арасындағы бөлгіш таңба параметрлердің ішінде кездеспеуі керек.
Мысалы:
in-87771112233-Сергей Михайлов-Татьяна_Прохорова-101-20230726-093151-2914299-1690356110.6593244.mp3
Бұл мысалда аудио файл атауы тоғыз параметрден тұрады, олар сызықша арқылы бөлінген:
- in немесе out – қоңыраудың түрі: кіріс немесе шығыс;
- 87771112233 – клиенттің телефон нөмірі;
- Сергей Михайлов – клиенттің аты;
- Татьяна_Прохорова – менеджердің аты;
- 101 – менеджер бөлімшесінің ID;
- 20230726 – қоңырау күні;
- 093151 – қоңырау уақыты;
- 2914299 – CRM жүйесіндегі мәміле (лид) ID;
- 1690356110.6593244 – телефониядағы қоңырау ID;
2-нұсқа. Аналитикаға телефония деректер базасына тікелей (read-only) қолжетімділікті беру. Аналитикалық жүйе соңғы бір сағат немесе бір күн ішіндегі қоңыраулар туралы деректерді алады.
3-нұсқа. Телефониямен байланысты веб-сервис (REST + JSON) құру. Мұндай веб-сервисте екі әдіс болғаны жөн. Бірінші әдіс — белгілі бір кезеңдегі барлық қоңыраулардың тізімі (мысалы, соңғы сағат немесе соңғы күн), сұраныс сәтінен бастап есептеледі. Бұл тізімде әр қоңыраудың бірегей ID мәні (мысалы, Uniqueid) бар. Екінші әдіс — қоңырау туралы толық ақпаратты оның ID арқылы алу. Мұндай интеграция кезінде аналитикалық жүйе белгілі бір интервалмен (мысалы, әр 10 минут немесе әр сағат сайын) бірінші әдіс арқылы қоңыраулар тізімін сұрап, қай қоңыраулардың жүйеге жүктелгенін, ал қайсысының жүктелмегенін анықтайды. Содан кейін аналитика жүйесі екінші әдіс арқылы ID бойынша қоңырау туралы толық ақпарат алады.
Аудио файлды алу
1-нұсқа. Аудио жазбалар орналасқан қалтаға FTP арқылы қолжетімділік беру. Аналитикалық жүйе FTP арқылы қосылып, қоңырау ID-сы бар файлды сол атау бойынша табады. Негізгі қалта ішінде айлар мен күндер бойынша ішкі қалталарға бөлуге болады.
2-нұсқа. Егер сөйлеу аналитикасы сервері телефония серверімен бір локалдық желіде болса, онда телефония серверіндегі жазбалар қалтасын аналитика серверіне тіркеуге болады. Бұл жағдайда аналитика сервері бұл қалтаға өз файлдық жүйесіндегі кәдімгі қалта сияқты қатынай алады.
3-нұсқа. Телефониямен байланысты веб-сервис (REST + JSON) арқылы аудио файлды алу. Аудио файлды тікелей сілтеме бойынша GET немесе POST сұраныс арқылы жүктеу. Сұраныстың URL-інде немесе денесінде алынатын файлдың ID мәнін жіберу қажет.
Сөйлеу аналитикасын енгізгеннен кейінгі перспективалар
Сөйлеу аналитикасы компанияның клиенттермен байланыс туралы деректерін жинақтайды. Болашақта бұл үлкен көлемдегі деректер компанияның дауыстық ботын оқыту үшін пайдаланылуы мүмкін.
Yandex SpeechKit модулі тек сөйлеуді тану үшін ғана емес, сонымен қатар ақылды бот енгізу кезінде сөйлеуді синтездеу үшін де пайдаланылуы мүмкін.







