Reconhecimento Óptico de Caracteres. 6.8.1. Em todas as imagens digitalizadas devem constar a tecnologia de Reconhecimento Ótico de Caracteres (OCR) com a inclusão do recurso de pesquisa textual através de qualquer palavra, frase ou trecho de frase constante nas imagens digitalizadas.
6.8.2. Cada página digitalizada será submetida à ferramenta OCR.
6.8.3. A ferramenta OCR deverá reconhecer caracteres comuns à língua portuguesa e a qualquer língua estrangeira eventualmente utilizada, bem como cedilha e outros caracteres acentuados comuns à língua portuguesa e a qualquer língua estrangeira eventualmente utilizada.
6.8.4. Cada página digitalizada será submetida à ferramenta OCR, com aproveitamento mínimo, em conformidade com a tabela a seguir:
Reconhecimento Óptico de Caracteres. Permite converter documentos digitalizados em dados pesquisáveis, isto é, converte imagens de texto em texto real.
Reconhecimento Óptico de Caracteres. 2.1. OCR/ICR de documentos eletrônicos Imagem 1.000.000 2.000.000
Reconhecimento Óptico de Caracteres. 6.8.1. Em todas as imagens digitalizadas devem constar a tecnologia de Reconhecimento Ótico de Caracteres (OCR) com a inclusão do recurso de pesquisa textual através de qualquer palavra, frase ou trecho de frase constante nas imagens digitalizadas.
6.8.2. Cada página digitalizada será submetida à ferramenta OCR.
6.8.3. A ferramenta OCR deverá reconhecer caracteres comuns à língua portuguesa e a qualquer língua estrangeira eventualmente utilizada, bem como cedilha e outros caracteres acentuados comuns à língua portuguesa e a qualquer língua estrangeira eventualmente utilizada.
6.8.4. Cada página digitalizada será submetida à ferramenta OCR, com aproveitamento mínimo, em conformidade com a tabela a seguir: TIPO DE DOCUMENTO APROVEITAMENTO MÍNIMO Papel impresso em tipografia 95% Papéis que não sejam do tipo “papel de seda”, datilografados em máquina elétrica 95% Papéis impressos em impressora matricial 80% Papéis que não sejam do tipo “papel de seda”, datilografados em máquina manual 70% Outros tipos de papel 50%
Reconhecimento Óptico de Caracteres. A conversão textual através de reconhecimento de padrões (OCR / OCR Full Text e ICR) deverá ser executada em imagens de documentos: não-estruturados, semi-estruturados e estruturados. A origem das imagens poderá ser do processo de captura da CONTRATADA ou de imagens pré-existentes da CONTRATANTE. Para isso será necessária uma fase de reconhecimento textual, automatizada, através de um software de reconhecimento de padrões, sendo que a solução deverá possuir obrigatoriamente as seguintes características técnicas: Reconhecimento e caracteres impressos e escritos à mão; Reconhecimento de caracteres comuns à língua portuguesa; Reconhecimento de cedilha e caracteres acentuados comuns à língua portuguesa (ç,á,à,ã,é,ê,í,ó,ô,õ,ú, entre outros); Funcionamento com múltiplas instâncias do produto, em diferentes computadores conectados via rede local; Divisão balanceada da carga de imagens entre os diversos computadores envolvidos no processo; O reconhecimento deve gerar um arquivo textual com o mesmo layout da imagem digitalizada, respeitando a disposição do texto em colunas e áreas existentes no original; Geração de arquivos no formato PDF, contendo a imagem digitalizada e os textos reconhecidos; Técnicas de voting (votação) com uso de no mínimo 02 engines de reconhecimento; Após o reconhecimento o arquivo resultante não deverá sofrer qualquer tipo de correção manual, sendo obrigatória à manutenção das referências entre o texto existente na imagem digitalizada e o texto reconhecido. Essas aplicações a serem desenvolvidas deverão contemplar a utilização de dicionários de dados, palavras-chave e mecanismos de aprendizado, como forma de validação das informações, de maneira a possibilitar uma maior assertividade no texto reconhecido. No arquivo PDF, diante da impossibilidade de reconhecimento de uma palavra, frase ou trecho de frase, esta deve ser substituída pelo trecho da imagem correspondente, na exata posição onde deveria estar o texto reconhecido; Suporte de reconhecimento para 3 (três) diferentes tipos de documentos: estruturados, semi-estruturados e não-estruturados. Como se trata de uma tecnologia de reconhecimento, o arquivo resultante possivelmente não terá a completude do conteúdo reconhecido, portanto, poderá ser solicitado que a CONTRATADA execute a complementação do conteúdo por meio de digitação manual. Podendo ainda ocorrer casos nos quais os arquivos não deverão sofrer qualquer tipo de correção manual, sendo necessário o desenvolvimento de aplicações q...
Reconhecimento Óptico de Caracteres. Página 85.125.060 R$ 0,05 R$ 4.256.253,00 10. Assinatura Digital com carimbo de tempo Página 71.995.060 R$ 0,04 R$ 2.879.802,40
Reconhecimento Óptico de Caracteres. Página 85.125.060 R$ 0,05 R$ 4.256.253,00 10. Assinatura Digital com carimbo de tempo Página 71.995.060 R$ 0,05 R$ 3.599.753,00 11. Extração, revisão e indexação de metadados Metadado 14.940.736 R$ 0,41 R$ 6.125.701,76 12. Aquisição de Licença Perpétua e Ilimitada - Licença de Produção Licença 2 R$ 588.333,33 R$ 1.176.666,66
Reconhecimento Óptico de Caracteres. Página 85.125.060 R$ 0,05 R$ 4.256.253,00