Добро пожаловать, ГостьВход  Регистрация  Подписка
Лента новостей События Новинки Видео Игры Обзоры Пресс-релизы

"Яндекс.Диск" научился распознавать текст на изображениях

27.03.2015 13:04

"Яндекс" запустил в сервисе "Яндекс.Диск" функцию распознавания текста на изображениях в облаке. С помощью нововведения легко найти нужные изображения в формате PNG, GIF и JPEG, имеющие текст поискового запроса. "Когда на Диске тысячи фотографий, разложенных по разным папкам, поиск по текстам позволит быстро найти среди них нужную. Например, скан договора с названием вроде scan723.JPG или фотографию визитки человека, с которым понадобилось связаться. Искать можно не только документы, но и любые фотографии, которые сделаны для того, чтобы сохранить текст, будь то объявление на двери подъезда или любопытный рекламный плакат в метро".

В основу функции легла технология оптического распознавания символов, которая умеет различать текст в разных по содержанию, качеству и виду изображениях.

"Яндекс.Диск"

Функция включает модуль распознавания и классификатор. Первым срабатывает классификатор - он анализирует все изображения, на которых присутствует текст. Далее запускается алгоритм, который в отобранных изображениях находит линии, предположительно содержащие текст, и среди них отбираются уже те, в которых алгоритм уверен.

После модуль распознавания разделяет линии текста на отдельные символы, для каждого из которых подбираются наиболее вероятные варианты распознавания. Далее включается языковая модель - алгоритм решает, какой из символов-кандидатов наиболее подходит.

Языковая модель работает на базе словарей и учитывает не только "знания" системы, но и контекст. Если из определенного количества получается слово, которое система знает, то она решает, что на картинке именно оно и написано, даже если некоторые символы-кандидаты в этом слове менее вероятны.

В "Яндекс" отметили, что точность распознавания зависит от множества факторов, в числе которых четкость картинки, фон, на котором написан текст и многое другое. Так, для отсканированных документов с текстом на русском языке вероятность распознавания составит 80%, для фото с надписями - 63,2% и для скриншотов почти 100%. Система также может работать с английским, турецким и украинским языками.

Источник: MacDigger
Компании: Продукты:
наверх