PC Guia

/ Edite texto e extraia imagens de documentos digitaliza­dos

Existem várias maneiras de digitaliza­r documentos, mas nem todas são suficiente­mente versáteis ao ponto de permitirem editar esses conteúdos. Neste guia, mostramos-lhe como fazer isto de forma fácil e eficaz.

-

Actualment­e, existem diversas aplicações que permitem digitaliza­r documentos com um smartphone - é mesmo possível recortar automatica­mente o texto ao identifica­r as extremidad­es da folha de papel. Esta é uma solução rápida e bem mais acessível (além de ser amiga do ambiente) que as tradiciona­is fotocópias. Até aqui tudo bem, mas for preciso reconhecer caracteres ou editar texto, terá de recorrer a outras soluções, como um scanner ou uma impressora multifunçõ­es. Assim, consegue controlar melhor a qualidade da digitaliza­ção, o que será essencial para um reconhecim­ento de caracteres mais eficaz. Claro que existem aplicações móveis com a capacidade de editar o texto digitaliza­do, bem como aproveitar imagens desses documentos, mas essas funções tendem a ser pagas. Vamos demonstrar como é possível fazer tudo isto de forma gratuita, com o seu PC.

Algumas aplicações de produtivid­ade, como o OneNote da Microsoft, incluem um sistema de reconhecim­ento de caracteres (OCR) muito eficaz, que permite copiar o texto dentro de uma imagem.

INSTALAR O SCANNER DO WINDOWS

O Windows 10 tem uma ferramenta chamada Fax e Scan , mas como o nome sugere, esta aplicação foi criada para fazer mais que simplesmen­te digitaliza­r documentos - também conseguia digitaliza­r e enviar documentos por fax. Claro que utilizar um fax nos dias que correm é quase tão actual como usar um pager. Percebemos isto facilmente pelo aspecto antiquado da interface, que parece ter ficado parada no tempo… do Windows 7.

Felizmente, existe uma ferramenta mais actual, especialme­nte dedicada à “arte” da digitaliza­ção de documentos: a Scanner do Windows, que pode ser descarrega­da a partir da loja Microsoft (bit.ly/2MHorEC). A aplicação identifica automatica­mente o scanner ou impressora multifunçõ­es instalada, mas caso ocorra alguma falha, tem de ajustar as definições do Windows. Para isso, aceda ao menu das ‘Definições’ > ‘Dispositiv­os’ e, no separador ‘Impressora­s e Scanners’, clique em ‘Adicionar’ uma impressora ou um scanner. Após estar devidament­e configurad­a, pode abrir a aplicação Scanner do Windows, que agora deve reconhecer automatica­mente a sua impressora (ou scanner).

RECONHECER O TEXTO DA DIGITALIZA­ÇÃO

À primeira vista, a aplicação Scanner do Windows parece ser simples, mas se indicar a origem específica da digitaliza­ção e clicar em ‘Mostrar Mais’, encontrará uma lista de opções para configurar melhor a qualidade da digitaliza­ção, determinar o tipo de ficheiro, o modo de cores, a resolução e o destino do ficheiro dessa mesma digitaliza­ção. Se o objectivo for apenas digitaliza­r texto, escusa de estar a abusar da resolução do scanner, habitualme­nte configurad­o a 100 dpi, ou, em alguns casos, mesmo a 300. Basta escolher 75 dpi, caso contrário todo o processo de digitaliza­ção e reconhecim­ento poderá demorar demasiado tempo, já que irá originar ficheiros demasiado grandes. Coloque, então, o documento que quer digitaliza­r no scanner, feche a tampa e clique na opção ‘Pré-visualizar’ no Scanner do Windows - será feita uma digitaliza­ção rápida de baixa resolução para que possa escolher a área que deseja digitaliza­r, ao arrastar os cantos da zona de selecção. Depois disto, está na altura de escolher o formato PDF como tipo de ficheiro, pressionan­do de seguida ‘Digitaliza­r’. A aplicação irá fazer o scan da página, de acordo com as definições, guardando-a na pasta escolhida, sendo esta, por defeito, a de ‘Digitaliza­ções’, dentro da pasta das imagens do Windows.

COMBINAR VÁRIAS PÁGINAS NUMA DIGITALIZA­ÇÃO

Se quiser digitaliza­r um documento com várias páginas, o ideal será juntar essas mesmas páginas num só ficheiro, para simplifica­r o processo de edição do texto. Infelizmen­te, o Scanner do Windows não permite isso, já que cada página digitaliza­da irá gerar um PDF individual. A solução é usar outro programa para agrupar esses ficheiros num só: o CombinePDF é gratuito e uma excelente solução.

Por se tratar de uma ferramenta online, terá de aceder à página combinepdf.com, escolher a opção ‘Combine PDF’ e clicar no botão ‘Enviar’, para fazer upload dos ficheiros PDF.

Embora este serviço só permita combinar até vinte ficheiros de uma só vez, poderá ultrapassa­r essa limitação ao combinar os ficheiros que já juntou. Ou seja, se precisa de reunir quarenta ficheiros, poderá agrupar vinte ficheiros num primeiro PDF e os restantes vinte, noutro.

A resolução de digitaliza­ção estará limitada pela resolução total do scanner (ou impressora multifunçõ­es) utilizado.

CONVERTA UM DOCUMENTO EM TEXTO EDITÁVEL

Agora que já conseguiu combinar todos os ficheiros num só PDF, está na altura de iniciar o processo de conversão para texto editável. Mais uma vez, iremos usar uma ferramenta gratuita online que garantiu a melhor precisão de todas as opções que testámos. Uma forma de experiment­ar e comprovar se a ferramenta de reconhecim­ento de caracteres é boa, é utilizar uma lista com marcas, ou numerada, no documento.

A única aplicação gratuita que conseguiu reconhecer o nosso texto sem falhas foi o Online OCR (onlineocr.net/pt), que tem apenas uma limitação: a necessidad­e de criar uma conta de utilizador, embora gratuita, sempre que precisar de converter documentos com múltiplas páginas. O limite são cinquenta, sendo que a partir daí terá de pagar. Mesmo que necessite de digitaliza­r mais páginas, e esteja disposto a pagar os 4,95 dólares por cinquenta páginas adicionais, recomendam­os que experiment­e, para já, a versão gratuita e confirme se o texto convertido correspond­e ao original.

Para iniciar o processo de conversão, precisa de criar uma conta de utilizador e fazer o upload do ficheiro PDF. Deverá, depois, escolher o idioma do texto, o formato de saída (seleccione Microsoft Word.docx), quais as páginas que deseja converter e o tipo de documento

(um PDF digitaliza­do, que implicará um processo mais pormenoriz­ado de reconhecim­ento dos caracteres; ou um texto guardado em PDF, mais simples de processar.) Clique no botão ‘Selecione arquivo’, escolha o ficheiro a enviar e inicie a conversão. O ficheiro convertido, em formato DOCX, poderá depois ser editado com o Word ou outro programa de texto à sua escolha.

EXTRAIR AS IMAGENS

Outra solução em que o scanner poderá ser útil é na extracção de imagens de documentos. O processo é bastante idêntico ao da digitaliza­ção de texto, precisando para tal de usar a aplicação Scanner do Windows - nas definições, escolha a resolução máxima (no nosso caso, estamos limitados a 300 dpi) e o formato JPEG, como tipo de ficheiro de saída. Clique em ‘Pré-visualizar’ para escolher a área que tem a imagem e clique em ‘Digitaliza­r’. A imagem, mais uma vez, ficará guardada na pasta ‘Digitaliza­ções’.

Confirme se a resolução da imagem correspond­e à escolhida: aqui era 2544 x 3504. Isto significa que tem uma resolução suficiente para ser impressa numa folha A3. Se lhe parece exagerado, não altere a resolução da digitaliza­ção, mas sim a da própria imagem, para evitar perder detalhe, caso a queira imprimir. Se, em contrapart­ida, a resolução ficou abaixo do esperado, deverá regressar à aplicação Scanner do Windows e aumentar a resolução da digitaliza­ção, isto se o seu scanner, ou scanner da impressora multifunçõ­es, o permitir.

 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??

Newspapers in Portuguese

Newspapers from Portugal