OCR с использованием API Google docs

Я работаю над обнаружением OCR и реализовал tesseract OCR с помощью этого кода.

Но я слышал об API документации Google, который будет предоставлять услуги.

Но согласно этой ссылке api сохранит только в google docs?

Кто-нибудь реализовал или использовал эту функцию в ваших приложениях, и где я могу найти примеры использования этого API?


person 2vision2    schedule 18.08.2014    source источник
comment
При чем тут Тессеракт? Разве это не вопрос об API Документов Google?   -  person Karol S    schedule 19.08.2014
comment
Tesseract - это своего рода API-интерфейс Google docs и компонент OCR с открытым исходным кодом. Ищу сервис гугл для большей надежности. Любая помощь?   -  person 2vision2    schedule 22.08.2014


Ответы (1)


В данный момент я использую Google Vision API для распознавания текста в моем приложении. Это довольно просто. У вас есть много документации на самом https://cloud.google.com/vision/.

Но чтобы ответить на ваш вопрос, ответ API представляет собой JSON, из которого вы можете фильтровать все, что вам нужно, что, как я предполагаю, в вашем случае является текстом.

Нравится:

response = client.text_detection(image= image)
texts = response.text_annotations
print('Texts:')
for text in texts:
    print('\n"{}"'.format(text.description))

    vertices = (['({},{})'.format(vertex.x, vertex.y)
                 for vertex in text.bounding_poly.vertices])

    print('bounds: {}'.format(','.join(vertices)))

Таким образом, вы можете делать с ответом все, что хотите. Вам нужно будет создать учетную запись, предоставить платежную информацию и некоторые настройки и т. Д., Прежде чем вы сможете ее использовать. Но если не ошибаюсь, бесплатно до 2000 изображений в месяц, что-то в этом роде.

person Kenneth VG    schedule 09.11.2020