Reconocimiento óptico de caracteres
El reconocimiento óptico de caracteres (ROC) es la conversión mecánica o electrónica de imágenes de texto escrito o impreso en texto codificado por máquina. Se utiliza ampliamente como una forma de entrar los datos impresos de papel, por ejemplo, documentos de pasaporte, facturas, extractos bancarios, recibos computarizados, tarjetas de visita, correo, impresiones de datos estáticos o cualquier documentación adecuada. Es un método común de digitalización de textos impresos para que puedan editarse electrónicamente, buscarse, almacenarse de manera más compacta, mostrarse en línea y usarse en procesos automáticos como traducción automática, conversión de texto a voz, datos clave y minería de texto. Además, ROC sirve para la exploración y los estudios en el reconocimiento de pautas, inteligencia artificial y la visión por computadora.
Las primeras versiones debían entrenarse con imágenes de cada caracter y trabajar con una fuente a la vez. Ahora se utilizan los sistemas avanzados que tienen un alto grado de precisión de reconocimiento para la mayoría de las fuentes. Algunos sistemas son capaces de reproducir una salida formateada que se aproxima mucho a la página original, incluso imágenes, columnas y otros componentes no textuales.
Propiedades
Rango | 2440–245F |
Personajes | 32 |
Lista de Caracteres
-
OCR-A
-
2440⑀
-
2441⑁
-
2442⑂
-
2443⑃
-
2444⑄
-
2445⑅
-
MICR
-
2446⑆
-
2447⑇
-
2448⑈
-
2449⑉
-
LOC
-
244A⑊
-
244B
-
244C
-
244D
-
244E
-
244F
-
2450
-
2451
-
2452
-
2453
-
2454
-
2455
-
2456
-
2457
-
2458
-
2459
-
245A
-
245B
-
245C
-
245D
-
245E
-
245F
Tabla de Caracteres
-
0: Plano básico multilingüe
-
Latín básico0000–007F
-
Latín-1 suplemento0080–00FF
-
Latín extendido A0100–017F
-
Latín extendido B0180–024F
-
Extensiones del AFI0250–02AF
-
Separación modificador letras02B0–02FF
-
Diacríticos (combinables)0300–036F
-
Griego y copto0370–03FF
-
Cirílico0400–04FF
-
Cirílico suplemento0500–052F
-
Armenio0530–058F
-
Hebreo0590–05FF
-
Árabe0600–06FF
-
Siríaco0700–074F
-
Árabe suplemento0750–077F
-
Thaana0780–07BF
-
NKO07C0–07FF
-
Samaritano0800–083F
-
Mandaic0840–085F
-
Sirio suplemento0860–086F
-
Árabe extendido B0870–089F
-
Árabe extendido A08A0–08FF
-
Devanagari0900–097F
-
Bengali0980–09FF
-
Gurmukhi0A00–0A7F
-
Gujarati0A80–0AFF
-
Oriya0B00–0B7F
-
Tamil0B80–0BFF
-
Telugu0C00–0C7F
-
Kannada0C80–0CFF
-
Malayalam0D00–0D7F
-
Sinhala0D80–0DFF
-
Thai0E00–0E7F
-
Lao0E80–0EFF
-
Tibetano0F00–0FFF
-
Myanmar1000–109F
-
Georgiano10A0–10FF
-
Hangul jamo1100–11FF
-
Etíope1200–137F
-
Etíope suplemento1380–139F
-
Cherokee13A0–13FF
-
Unified Sílabas aborígenes canadienses1400–167F
-
Ogham1680–169F
-
Rúnico16A0–16FF
-
Tagalog1700–171F
-
Hanunoo1720–173F
-
Buhid1740–175F
-
Tagbanwa1760–177F
-
Khmer1780–17FF
-
Mongol1800–18AF
-
Unified Sílabas aborígenes canadienses extendido18B0–18FF
-
Limbu1900–194F
-
Tai Le1950–197F
-
Tai Nüa1980–19DF
-
Khmer símbolos19E0–19FF
-
Buginés1A00–1A1F
-
Tai Tham1A20–1AAF
-
Diacríticos combinables (extendido)1AB0–1AFF
-
Balinés1B00–1B7F
-
Sundanés1B80–1BBF
-
Batak1BC0–1BFF
-
Lepcha1C00–1C4F
-
Ol Chiki1C50–1C7F
-
Cirílico extensión C1C80–1C8F
-
Georgiano extendido1C90–1CBF
-
Sundanés suplemento1CC0–1CCF
-
Védico extensiones1CD0–1CFF
-
Extensiones fonéticas1D00–1D7F
-
Extensiones fonéticas suplemento1D80–1DBF
-
Diacríticos suplemento (combinable)1DC0–1DFF
-
Latin extendido adicional1E00–1EFF
-
Griego extendido1F00–1FFF
-
Puntuación general2000–206F
-
Superíndices y subíndices2070–209F
-
Símbolos de moneda20A0–20CF
-
Diacríticos de símbolos (combinables)20D0–20FF
-
Símbolos a letras2100–214F
-
Formas numéricas2150–218F
-
Flechas2190–21FF
-
Operadores matemáticos2200–22FF
-
Misceláneo técnico2300–23FF
-
Control técnico2400–243F
-
Reconocimiento óptico de caracteres2440–245F
-
Alfanuméricos encerrado2460–24FF
-
Dibujo de la caja2500–257F
-
Caracteres de relleno2580–259F
-
Formas geométricas25A0–25FF
-
Símbolos misceláneos2600–26FF
-
Dingbats2700–27BF
-
Símbolos matemáticos misceláneos A27C0–27EF
-
Flechas suplementarios A27F0–27FF
-
Patrones de braille2800–28FF
-
Flechas suplementarios B2900–297F
-
Símbolos matemáticos misceláneos B2980–29FF
-
Operadores matemáticos suplementarios2A00–2AFF
-
Símbolos y flechas misceláneos2B00–2BFF
-
Glagolítico2C00–2C5F
-
Latín extendido С2C60–2C7F
-
Copto2C80–2CFF
-
Georgiano suplemento2D00–2D2F
-
Tifinagh2D30–2D7F
-
Etíope extendido2D80–2DDF
-
Cirílico extendido2DE0–2DFF
-
Puntuación suplementaria2E00–2E7F
-
CJK: radicales suplemento2E80–2EFF
-
Radicales de Kangxi2F00–2FDF
-
Descripción ideográfica2FF0–2FFF
-
CJK: símbolos y puntuación3000–303F
-
Hiragana3040–309F
-
Katakana30A0–30FF
-
Bopomofo3100–312F
-
Hangul jamo (compatibilidad)3130–318F
-
Kanbun3190–319F
-
Bopomofo extendido31A0–31BF
-
CJK: trazos31C0–31EF
-
Katakana extensión fonética31F0–31FF
-
CJK: letras y meses (encerrado)3200–32FF
-
CJK: compatibilidad3300–33FF
-
CJK: ideogramas unificados, extensión A3400–4DBF
-
I Ching símbolos hexagrama4DC0–4DFF
-
CJK: ideogramas unificados4E00–9FFF
-
Nuosu sílabasA000–A48F
-
Nuosu radicalesA490–A4CF
-
LisuA4D0–A4FF
-
FraserA500–A63F
-
Cirílico extendido BA640–A69F
-
BamumA6A0–A6FF
-
Letras de modificadores tonalesA700–A71F
-
Latín extendido DA720–A7FF
-
Syloty nagriA800–A82F
-
Carácter numérico indioA830–A83F
-
Phags-paA840–A87F
-
SaurashtraA880–A8DF
-
Devanagari caracteres extendidosA8E0–A8FF
-
Kayah LiA900–A92F
-
RejangA930–A95F
-
HangulA960–A97F
-
JavanésA980–A9DF
-
Myanmar Extendido BA9E0–A9FF
-
ChamAA00–AA5F
-
Extensión birmano AAA60–AA7F
-
Tai VietAA80–AADF
-
Meithei ExtensionesAAE0–AAFF
-
Etíope extendido AAB00–AB2F
-
Latin extendido EAB30–AB6F
-
Cherokee suplementoAB70–ABBF
-
MeitheiABC0–ABFF
-
Sílabas hangulAC00–D7AF
-
Hangul Jamo Extensión BD7B0–D7FF
-
Pares subrogados (alto)D800–DB7F
-
Pares subrogados (alto, uso privado)DB80–DBFF
-
Pares subrogados (bajo)DC00–DFFF
-
Uso privadoE000–F8FF
-
CJK: ideogramas de compatibilidadF900–FAFF
-
Formas de presentación alfabéticosFB00–FB4F
-
Formas de presentación árabe AFB50–FDFF
-
Variación selectoresFE00–FE0F
-
Formas verticalesFE10–FE1F
-
Medios puntos (combinable)FE20–FE2F
-
CJK: formas de compatibilidadFE30–FE4F
-
Variantes de forma pequeñaFE50–FE6F
-
Formas de presentación árabe BFE70–FEFF
-
Mitad grosor y formas anchura completaFF00–FFEF
-
EspecialesFFF0–FFFF
-
-
1: Plano Multilingüe Adicional
-
Lineal B (silabario)10000–1007F
-
Lineal B (ideogramas)10080–100FF
-
Números egeo10100–1013F
-
Numeración ática10140–1018F
-
Símbolos antiguos10190–101CF
-
Disco de Festos101D0–101FF
-
Licio10280–1029F
-
Cario102A0–102DF
-
Números epact copto102E0–102FF
-
Etrusco10300–1032F
-
Gótico10330–1034F
-
Pérmico antiguo10350–1037F
-
Ugarítico10380–1039F
-
Perso antiguo103A0–103DF
-
Deseret10400–1044F
-
Shaviano10450–1047F
-
Osmanya (Somalí)10480–104AF
-
Osage104B0–104FF
-
Elbasan10500–1052F
-
Albania caucásica10530–1056F
-
Vithkuqi10570–105BF
-
Todhri105C0–105FF
-
Lineal A10600–1077F
-
Latin extendido F10780–107BF
-
Silabario chipriota10800–1083F
-
Arameo10840–1085F
-
Palmira10860–1087F
-
Nabateo10880–108AF
-
Hatran108E0–108FF
-
Fenicio10900–1091F
-
Lidio10920–1093F
-
Meroitic (jeroglíficos)10980–1099F
-
Meroitic (cursivo)109A0–109FF
-
Karosti10A00–10A5F
-
Árabe antiguo meridional10A60–10A7F
-
Árabe antiguo del norte10A80–10A9F
-
Maniqueo10AC0–10AFF
-
Avéstico10B00–10B3F
-
Pahlavi Arsácida10B40–10B5F
-
Pahlavi10B60–10B7F
-
Salterio pahlavi10B80–10BAF
-
Turco antiguo10C00–10C4F
-
Húngaro antiguo10C80–10CFF
-
Hanifi Rohingya10D00–10D3F
-
Garay10D40–10D8F
-
Rumi símbolos numéricos10E60–10E7F
-
Yezidi10E80–10EBF
-
Árabe extendido C10EC0–10EFF
-
Sogdiano antiguo10F00–10F2F
-
Sogdiano10F30–10F6F
-
Uigur antiguo10F70–10FAF
-
Corasmiano10FB0–10FDF
-
Elimaico10FE0–10FFF
-
Brahmi11000–1107F
-
Kaithi11080–110CF
-
Sora sompeng110D0–110FF
-
Chakma11100–1114F
-
Mahajani11150–1117F
-
Sharada11180–111DF
-
Sinhala números arcaicos111E0–111FF
-
Khojiki11200–1124F
-
Multani11280–112AF
-
Khudawadi112B0–112FF
-
Grantha11300–1137F
-
Tulu-Tigalari11380–113FF
-
Newar11400–1147F
-
Tirhuta11480–114DF
-
Siddham11580–115FF
-
Modi11600–1165F
-
Mongol suplemento11660–1167F
-
Takri11680–116CF
-
Myanmar Extendido-C116D0–116FF
-
Ahom11700–1174F
-
Dogra11800–1184F
-
Warang Citi118A0–118FF
-
Dives Akuru11900–1195F
-
Nandinagari119A0–119FF
-
Zanabazar11A00–11A4F
-
Soyombo11A50–11AAF
-
Unified Sílabas aborígenes canadienses extendido A11AB0–11ABF
-
Pau cin hau11AC0–11AFF
-
Devanagari extendido A11B00–11B5F
-
Sunuwar11BC0–11BFF
-
Bhaiksuki11C00–11C6F
-
Marchen11C70–11CBF
-
Masaram gondi11D00–11D5F
-
Gunjala gondi11D60–11DAF
-
Makassar11EE0–11EFF
-
Kawi11F00–11F5F
-
Lisu suplemento11FB0–11FBF
-
Tamil suplemento11FC0–11FFF
-
Cuneiforme12000–123FF
-
Números cuneiformes y puntuación12400–1247F
-
Cuneiforme de la Dinastía Temprana12480–1254F
-
Ciprominoico12F90–12FFF
-
Jeroglíficos egipcios13000–1342F
-
Jeroglíficos egipcios controles de formato13430–1345F
-
Jeroglíficos egipcios extendido-A13460–143FF
-
Jeroglíficos de Anatolia14400–1467F
-
Gurung Khema16100–1613F
-
Bamum suplemento16800–16A3F
-
Mro16A40–16A6F
-
Tangsa16A70–16ACF
-
Bassa-vah16AD0–16AFF
-
Pahawh hmong16B00–16B8F
-
Kirat Rai16D40–16D7F
-
Medefaidrin16E40–16E9F
-
Miao16F00–16F9F
-
Ideográficos símbolos y puntuación16FE0–16FFF
-
Tangut17000–187FF
-
Tangut componentes18800–18AFF
-
Khitan escritura pequeña18B00–18CFF
-
Tangut suplementos18D00–18D7F
-
Kana extendida B1AFF0–1AFFF
-
Kana suplemento1B000–1B0FF
-
Kana extendida A1B100–1B12F
-
Kana pequeña extensión1B130–1B16F
-
Nushu1B170–1B2FF
-
Duployan1BC00–1BC9F
-
Controles de formato abreviado1BCA0–1BCAF
-
Símbolos para Suplemento de Computación Legado1CC00–1CEBF
-
Notación neumática musical1CF00–1CFCF
-
Símbolos musicales bizantinos1D000–1D0FF
-
Símbolos musicales1D100–1D1FF
-
Antigua notación musical griega1D200–1D24F
-
Kaktovik1D2C0–1D2DF
-
Maya Numerales1D2E0–1D2FF
-
Tai Xuan Jing1D300–1D35F
-
Numeración con varillas1D360–1D37F
-
Símbolos matemáticos alfanuméricos1D400–1D7FF
-
Sutton escritura de signos1D800–1DAAF
-
Latin extendido G1DF00–1DFFF
-
Glagolítico suplemento1E000–1E02F
-
Cirílico extensión D1E030–1E08F
-
Nyiakeng Puachue Hmong1E100–1E14F
-
Toto1E290–1E2BF
-
Wancho1E2C0–1E2FF
-
Nag Mundari1E4D0–1E4FF
-
Ol Onal1E5D0–1E5FF
-
Etíope extendido B1E7E0–1E7FF
-
Mende Kikakui1E800–1E8DF
-
Adlam1E900–1E95F
-
Siyaq números1EC70–1ECBF
-
Siyaq otomano numerales1ED00–1ED4F
-
Árabe símbolos matemáticos alfabéticos1EE00–1EEFF
-
Mahjong1F000–1F02F
-
Dominó1F030–1F09F
-
Naipes1F0A0–1F0FF
-
Encerrado suplemento alfanumérico1F100–1F1FF
-
Encerrado suplemento ideográfico1F200–1F2FF
-
Símbolos y pictogramas misceláneos1F300–1F5FF
-
Emoticonos1F600–1F64F
-
Pictogramas ornamentales1F650–1F67F
-
Símbolos de transporte y mapa1F680–1F6FF
-
Símbolos alquímicos1F700–1F77F
-
Formas geométricas extendido1F780–1F7FF
-
Flechas suplementarios C1F800–1F8FF
-
Pictogramas y símbolos suplementarios1F900–1F9FF
-
Símbolos de ajedrez1FA00–1FA6F
-
Símbolos y pictogramas extendidos A1FA70–1FAFF
-
Símbolos de la tecnología informática1FB00–1FBFF
-
-
2: Plano ideográfico adicional
-
CJK: ideogramas unificados, extensión B20000–2A6DF
-
CJK: ideogramas unificados, extensión C2A700–2B73F
-
CJK: ideogramas unificados, extensión D2B740–2B81F
-
CJK: ideogramas unificados, extensión E2B820–2CEAF
-
CJK: ideogramas unificados, extensión F2CEB0–2EBEF
-
CJK Unified Ideographs Extension I2EBF0–2EE5F
-
CJK: ideogramas de compatibilidad suplemento2F800–2FA1F
-
-
3: Plano ideográfico terciario
-
4-13: No utilizado
-
-
-
-
-
-
-
-
-
-
14: Plano adicional especializado
-
15: Área adicional de uso privado – A
-
16: Área adicional de uso privado – B
-
No se encontró nada
┐( ˘_˘ )┌