Skype translator вчить іноземні мови в соціальних мережах еволюція систем автоматичної обробки мови і мови не зупиняється, і доказом тому стане запуск skype translator
Коли Microsoft і Skype представили в травні автоматичний перекладач Skype Translator багато видихнули з полегшенням - нарешті то мовний бар'єр у спілкуванні буде подолано. Якщо Скайп-Перекладач дійсно зможе здійснювати синхронний голосовий переклад, значить, ми будемо вільно спілкуватися з друзями та діловими партнерами незалежно від того, якою мовою вони говорять.
Це серйозний прорив в області автоматизованих систем перекладу, розпізнавання і синтезу мови. Але для перетворення технології, описаної у фантастичних романах, в реальний продукт треба вирішити серйозні наукові проблеми. Багато в чому вони пов'язані з тим, що між письмової та усної промовою людини існує помітна різниця.
Тереза ?? Чонг в IEEE Spectrum розповіла про те, як команда розробників Microsoft (Редмонд, штат Вашингтон), що працює над Skype Translator, розправляється з нашими "м-м-м", "ой", "знаєте", "так-так "і подібними елементами, присутніми в мові кожної людини. Хоча вони і не мають явного значення, але модифікують емоційне і смислове значення з казана.
Чонг виділила основну проблему:
Розрив між автоматичним перекладом тексту й мови пов'язаний з тим, що кращі системи машинного перекладу "навчені" за допомогою величезного обсягу якісних текстових матеріалів. Їм не довелося стикатися з невизначеністю на виході систем розпізнавання мови, з якими доводиться мати справу перекладачеві для Skype.
Microsoft використовує традиційний підхід, заснований на зв'язках між однаковими за змістом фразами на різних мовах, але команда зробила додатковий крок і, на ряду з фразами, аналізується зв'язок між окремими словами. Це допомагає долати граматичні невідповідності між різними мовами.
Але дуже скоро команда зрозуміла, що варто йти в соціальні мережі. Тут кожна платформа, Facebook, Twitter і SMS мають власні особливості. Дослідники впровадили "платформу нормалізації текстів із соціальних систем", інтегрувавши її з власною системою, і це дозволило поліпшити якість перекладу на 6%.
Це ще один доказ того, що соціальні мережі є не тільки інструментом нашого спілкування і розваги, а й цінним засобом для досліджень і розробок як в галузі соціології, так і високих технологій. Залишається лише сподівається, що Microsoft з користю скористається партнерськими відносинами з Reddit, Imgur і Twitch, що дозволяють дослідникам заглянути в генеруються користувачами дані.