8еместо

1

голос

Странная ситуация с добавлением текста на распощзнание

Добрый день.

Для отправки текста на распознание используется curl и php.
Заголовки прописаны корректные: https://gist.github.com/AsidStorm/9cd77fa08fffef09fc43

Но, в одном случае, я получаю ответ с batchId, а в другом случае - данную ошибку:
Resource representation is only available with these Content-Types: text/plain; charset=UTF-8 text/plain

Текст при этом отправляется такой, и он не меняется.
array (size=1)
'text' => string 'Отдел продаж автомобилей: +7 (495) 565-38-06' (length=66)

Статус идеи: ожидает рассмотрения

Комментарии

Компания Textocat, 08.05.2015, 13:16
Пожалуйста, уточните номер кода приходящей ошибки (пришлите полный ответ от нашего сервера) и проверьте все ли параметры в запросе вы передаете, в частности, auth_token.
Добрый день. Полный текст ответа (С кодом).

406
Resource representation is only available with these Content-Types: text/plain; charset=UTF-8 text/plain

Передаются все параметры. (В самом скрипте установлен цикл. И не может быть такого, что 1 раз передались все параметры, а в другой раз не все).

На всякий случай привожу скриншоты:

Скриншот 1

Скриншот 2
Компания Textocat, 08.05.2015, 13:55
То есть в одном и том же цикле часть запросов отправляется, а часть нет?
Именно так.
Два раза на вход скрипту отправляются одинаковые данные, но один раз - появляется ошибка. В другой раз - возникают проблемы, описанные выше.
Компания Textocat, 08.05.2015, 14:08
По логам я вижу что-то не так у вас с 'User-Agent' header: Unexpected end of input, expected '\', Text or ')'
Исправил ошибку в User-Agent, но, ситуация повторяется по прежнему.
Компания Textocat, 12.05.2015, 10:30
Хоть маловероятно, но возможно вы слишком часто отправляете запросы (/entity/queue) на сервис: в бесплатном тарифе у нас стоит ограничение в 1 /entity/queue запрос от 1 пользователя на весь цикл обработки (не только отправка, но и фактическая обработка). Маловероятно - потому что в таком случае должна была прийти ошибка 429 и батч слишком маленький, чтобы сервис не успел его обработать. Но попробуйте установить небольший latency в цикле для проверки этого предположения.
Да - конкретно в данном случае установления ограничения помогло, но, подобная отправка и разбиения текста на куски делалось для того - что бы выяснить, почему при отправке 98 текстов - возникает такая ошибка:

406 Resource representation is only available with these Content-Types:
text/plain; charset=UTF-8
text/plain

Не понятно - на каком этапе происходит сбой. Какой из текстов не верен. Прогнал по одному 25 текстов с задержкой - все они обработались корректно.
Компания Textocat, 13.05.2015, 10:50
Нет сбоя из-за какого-то текста. Система спроектирована таким образом, чтобы в случае не корректных документов в пакете помечать таковые как INPUT_ERROR или SERVICE_ERROR (см. документацию). Так что дело в том, что какой-то документ становится "лишним" в очереди в определенный (случайный) момент. Почему ошибка 406, а не 429 - это странно. Может быть приходит 429, а вы оборочиваете во что-то дополнительное? Обычно такая ошибка возникает, когда вместо JSON запрашивается и обрабатывается plain text.

Оставить комментарий