OCR compatibilidad

La función run de OCR no transcribe las tildes ni la Ñ usando lenguaje “spa” ni “spa_old” devuelve caracteres extraños en el texto.

1 Like

Es porque Tesseract, el OCR, te contesta en UTF-8 y tú quieres ISO-8859-1 o Latin1. Usa esta tabla para hacer la conversión.

Latin1 UTF-1 UTF-8 UTF-7,5 UTF-7 JAVA HTML
 ¢à +AKA- \u00a0  
¡ ¡ ¡ ¢á +AKE- \u00a1 ¡
¢ ¢ ¢ ¢â +AKI- \u00a2 ¢
£ £ £ ¢ã +AKM- \u00a3 £
¤ ¤ ¤ ¢ä +AKQ- \u00a4 ¤
¥ ¥ Â¥ ¢å +AKU- \u00a5 ¥
¦ ¦ ¦ ¢æ +AKY- \u00a6 ¦
§ § § ¢ç +AKc- \u00a7 §
¨ ¨ ¨ ¢è +AKg- \u00a8 ¨
© © © ¢é +AKk- \u00a9 ©
ª ª ª ¢ê +AKo- \u00aa ª
« « « ¢ë +AKs- \u00ab «
 ¢ì +AKw- \u00ac ¬
­ ­ ­ ¢í +AK0- \u00ad ­
® ® ® ¢î +AK4- \u00ae ®
¯ ¯ ¯ ¢ï +AK8- \u00af ¯
° ° ° ¢ð +ALA- \u00b0 °
± ± ± ¢ñ +ALE- \u00b1 ±
² ² ² ¢ò +ALI- \u00b2 ²
³ ³ ³ ¢ó +ALM- \u00b3 ³
´ ´ ´ ¢ô +ALQ- \u00b4 ´
µ µ µ ¢õ +ALU- \u00b5 µ
 ¢ö +ALY- \u00b6
· · · ¢÷ +ALc- \u00b7 ·
¸ ¸ ¸ ¢ø +ALg- \u00b8 ¸
¹ ¹ ¹ ¢ù +ALk- \u00b9 ¹
º º º ¢ú +ALo- \u00ba º
» » » ¢û +ALs- \u00bb »
¼ ¼ ¼ ¢ü +ALw- \u00bc ¼
½ ½ ½ ¢ý +AL0- \u00bd ½
¾ ¾ ¾ ¢þ +AL4- \u00be ¾
¿ ¿ ¿ ¢ÿ +AL8- \u00bf ¿
À À À £À +AMA- \u00c0 À
Á Á Á £Á +AME- \u00c1 Á
  Â £Â +AMI- \u00c2 Â
à à à £Ã +AMM- \u00c3 Ã
Ä Ä Ã„ £Ä +AMQ- \u00c4 Ä
Å Å Ã… £Å +AMU- \u00c5 Å
Æ Æ Ã† £Æ +AMY- \u00c6 Æ
Ç Ç Ã‡ £Ç +AMc- \u00c7 Ç
È È Ãˆ £È +AMg- \u00c8 È
É É Ã‰ £É +AMk- \u00c9 É
Ê Ê ÃŠ £Ê +AMo- \u00ca Ê
Ë Ë Ã‹ £Ë +AMs- \u00cb Ë
Ì Ì ÃŒ £Ì +AMw- \u00cc Ì
Í Í Ã £Í +AM0- \u00cd Í
Î Î ÃŽ £Î +AM4- \u00ce Î
Ï Ï Ã £Ï +AM8- \u00cf Ï
РРÐ £Ð +ANA- \u00d0 Ð
Ñ Ñ Ã‘ £Ñ +ANE- \u00d1 Ñ
Ò Ò Ã’ £Ò +ANI- \u00d2 Ò
Ó Ó Ã“ £Ó +ANM- \u00d3 Ó
Ô Ô Ã” £Ô +ANQ- \u00d4 Ô
Õ Õ Ã• £Õ +ANU- \u00d5 Õ
Ö Ö Ã– £Ö +ANY- \u00d6 Ö
× × Ã— £× +ANc- \u00d7 ×
Ø Ø Ã˜ £Ø +ANg- \u00d8 Ø
٠٠Ù £Ù +ANk- \u00d9 Ù
Ú Ú Ãš £Ú +ANo- \u00da Ú
Û Û Ã› £Û +ANs- \u00db Û
Ü Ü Ãœ £Ü +ANw- \u00dc Ü
Ý Ý Ã £Ý +AN0- \u00dd Ý
Þ Þ Ãž £Þ +AN4- \u00de Þ
ß ß ÃŸ £ß +AN8- \u00df ß
à à à £à +AOA- \u00e0 à
á á á £á +AOE- \u00e1 á
â â â £â +AOI- \u00e2 â
ã ã ã £ã +AOM- \u00e3 ã
ä ä ä £ä +AOQ- \u00e4 ä
å å Ã¥ £å +AOU- \u00e5 å
æ æ æ £æ +AOY- \u00e6 æ
ç ç ç £ç +AOc- \u00e7 ç
è è è £è +AOg- \u00e8 è
é é é £é +AOk- \u00e9 é
ê ê ê £ê +AOo- \u00ea ê
ë ë ë £ë +AOs- \u00eb ë
ì ì à £ì +AOw- \u00ec ì
í í í £í +AO0- \u00ed í
î î î £î +AO4- \u00ee î
ï ï ï £ï +AO8- \u00ef ï
ð ð ð £ð +APA- \u00f0 ð
ñ ñ ñ £ñ +APE- \u00f1 ñ
ò ò ò £ò +API- \u00f2 ò
ó ó ó £ó +APM- \u00f3 ó
ô ô ô £ô +APQ- \u00f4 ô
õ õ õ £õ +APU- \u00f5 õ
ö ö Ã £ö +APY- \u00f6 ö
÷ ÷ ÷ £÷ +APc- \u00f7 ÷
ø ø ø £ø +APg- \u00f8 ø
ù ù ù £ù +APk- \u00f9 ù
ú ú ú £ú +APo- \u00fa ú
û û û £û +APs- \u00fb û
ü ü ü £ü +APw- \u00fc ü
ý ý ý £ý +AP0- \u00fd ý
þ þ þ £þ +AP4- \u00fe þ
ÿ ÿ ÿ £ÿ +AP8- \u00ff ÿ

Es un bug que debemos corregir.

Un saludo

1 Like

Buenísimo!!! Muchas Gracias.