Стартап «Мивар» создал программную платформу Tel!Mi для распознавания текстовых сообщений, написанных на естественном языке. Об этом сообщает корреспондент «Ленты.ру» с мероприятия компании.
По утверждению генерального директора «Мивара» Олега Варламова, на данный момент система способна распознавать не только отдельные слова, но и сложные предложения, сформулированные в естественной разговорной форме, но без двусмысленностей или шуток.
Она предназначена для создания совместно с партнерами систем реферирования и анализа текстов. Например, стартап GAMP Tech готовит для международного рынка продукт «Мобильный репетитор Teach!Mi». Также совместно с крупным российским банком готовится пилотный проект по созданию автоматизированного ответчика справочной системы.
Для распознавания текстов сначала проводится обучение искусственного интеллекта миварным методом: слова сортируются по признакам вещь — свойство — отношение и представляются виде многомерного графа (схема, где слова являются вершинами и соединены связями, показывающими их взаимоотношение). Например, словарь Ожегова из 150 тысяч понятий представляется в виде 17-мерного вектора. Обучение Tel!Mi этим понятиям сейчас занимает 83 минуты.
По утверждению Варламова, у технологии «Мивара» нет аналогов. Технология позволяет проводить обучение быстрее, чем Compreno компании ABBYY, которая тоже выстраивает семантические связи в виде графа. Варламов также объяснил, что в IBM Watson анализ текста производится только по установленным шаблонам, а прохождение теста Тьюринга в этом году он объяснил глупостью людей, определяющих компьютер.
Однако Татьяна Даниэлян, заместитель директора по разработке технологий компании ABBYY, не согласна с Варламовым: «Мы не проводили тестирования этой [Tel!Mi] технологии, а на базе описаний в материалах компании сделать выводы невозможно». В свободном доступе Compreno на рынке нет.
Создание систем распознавания текста и речи, изложенных естественным языком, сейчас является одной из мировых тенденций. Кроме вышеперечисленных систем, они активно используются, например, в голосовых помощниках мобильных устройств: Microsoft Cortana, Apple Siri и Google Now.