Optische Zeichenerkennung
Optical character recognition (OCR) is the mechanical or electronic conversion of images of typewritten or printed text into machine-encoded text. It is widely used as a form of data entry from printed paper data records, whether passport documents, invoices, bank statements, computerized receipts, business cards, mail, printouts of static-data, or any suitable documentation. It is a common method of digitizing printed texts so that it can be electronically edited, searched, stored more compactly, displayed on-line, and used in machine processes such as machine translation, text-to-speech, key data and text mining. OCR is a field of research in pattern recognition, artificial intelligence and computer vision.
Early versions needed to be trained with images of each character, and worked on one font at a time. Advanced systems that have a high degree of recognition accuracy for most fonts are now common. Some systems are capable of reproducing formatted output that closely approximates the original page including images, columns, and other non-textual components.
Eigenschaften
Bereich | 2440–245F |
Zeichen | 32 |
Zeichenliste
-
OCR-A
-
2440⑀
-
2441⑁
-
2442⑂
-
2443⑃
-
2444⑄
-
2445⑅
-
MICR
-
2446⑆
-
2447⑇
-
2448⑈
-
2449⑉
-
OCR
-
244A⑊
-
244B
-
244C
-
244D
-
244E
-
244F
-
2450
-
2451
-
2452
-
2453
-
2454
-
2455
-
2456
-
2457
-
2458
-
2459
-
245A
-
245B
-
245C
-
245D
-
245E
-
245F
Zeichentabelle
-
0: Einfache mehrsprachige Ebene
-
Basis-Lateinisch0000–007F
-
Lateinisch-1, Ergänzung0080–00FF
-
Lateinisch, erweitert-A0100–017F
-
Lateinisch, erweitert-B0180–024F
-
IPA-Erweiterungen0250–02AF
-
Spacing Modifier Letters02B0–02FF
-
Kombinierende diakritische Zeichen0300–036F
-
Griechisch und Koptisch0370–03FF
-
Kyrillisch0400–04FF
-
Kyrillisch, Ergänzung0500–052F
-
Armenisch0530–058F
-
Hebräisch0590–05FF
-
Arabisch0600–06FF
-
Syrisch0700–074F
-
Arabisch, Ergänzung0750–077F
-
Thaana0780–07BF
-
NKo07C0–07FF
-
Samaritanisch0800–083F
-
Mandäisch0840–085F
-
Syriac Supplement0860–086F
-
Arabic Extended-B0870–089F
-
Arabisch, erweitert-A08A0–08FF
-
Devanagari0900–097F
-
Bengalisch0980–09FF
-
Gurmukhi0A00–0A7F
-
Gujarati0A80–0AFF
-
Oriya0B00–0B7F
-
Tamilisch0B80–0BFF
-
Telugu0C00–0C7F
-
Kannada0C80–0CFF
-
Malayalam0D00–0D7F
-
Singhalesisch0D80–0DFF
-
Thailändisch0E00–0E7F
-
Laotisch0E80–0EFF
-
Tibetisch0F00–0FFF
-
Birmanisch1000–109F
-
Georgisch10A0–10FF
-
Hangeul-Jamo1100–11FF
-
Äthiopisch1200–137F
-
Äthiopisch, Zusatz1380–139F
-
Cherokee13A0–13FF
-
Vereinh. Silbenzeichen kanad. Ureinwohner1400–167F
-
Ogam1680–169F
-
Runen16A0–16FF
-
Tagalog1700–171F
-
Hanunóo1720–173F
-
Buid1740–175F
-
Tagbanuwa1760–177F
-
Khmer1780–17FF
-
Mongolisch1800–18AF
-
Vereinh. Silbenz. kanad. Ureinw., erw.18B0–18FF
-
Limbu1900–194F
-
Tai Le1950–197F
-
Neu-Tai-Lue1980–19DF
-
Khmer-Symbole19E0–19FF
-
Buginesisch1A00–1A1F
-
Lanna1A20–1AAF
-
Combining Diacritical Marks Extended1AB0–1AFF
-
Balinesisch1B00–1B7F
-
Sundanesisch1B80–1BBF
-
Batak1BC0–1BFF
-
Lepcha1C00–1C4F
-
Ol Chiki1C50–1C7F
-
Cyrillic Extended C1C80–1C8F
-
Georgian Extended1C90–1CBF
-
Sundanesisch, Ergänzung1CC0–1CCF
-
Vedische Erweiterungen1CD0–1CFF
-
Phonetische Erweiterungen1D00–1D7F
-
Phonetische Erweiterungen, Ergänzung1D80–1DBF
-
Komb. diakr. Zeichen, Ergänzung1DC0–1DFF
-
Lateinisch, weiterer Zusatz1E00–1EFF
-
Griechisch, Zusatz1F00–1FFF
-
Allgemeine Interpunktion2000–206F
-
Hoch- und tiefgestellte Zeichen2070–209F
-
Währungssymbole20A0–20CF
-
Komb. diakr. Zeichen für Symbole20D0–20FF
-
Buchstabenähnliche Symbole2100–214F
-
Zahlzeichen2150–218F
-
Pfeile2190–21FF
-
Mathematische Operatoren2200–22FF
-
Verschiedene technische Zeichen2300–23FF
-
Symbole für Steuerzeichen2400–243F
-
Optische Zeichenerkennung2440–245F
-
Umschlossene alphanumerische Zeichen2460–24FF
-
Rahmenzeichnung2500–257F
-
Blockelemente2580–259F
-
Geometrische Formen25A0–25FF
-
Verschiedene Symbole2600–26FF
-
Dingbats2700–27BF
-
Verschiedene mathematische Symbole-A27C0–27EF
-
Zusätzliche Pfeile-A27F0–27FF
-
Braille-Zeichen2800–28FF
-
Zusätzliche Pfeile-B2900–297F
-
Verschiedene mathematische Symbole-B2980–29FF
-
Zusätzliche Mathematische Operatoren2A00–2AFF
-
Verschiedene Symbole und Pfeile2B00–2BFF
-
Glagolitisch2C00–2C5F
-
Lateinisch, erweitert-C2C60–2C7F
-
Koptisch2C80–2CFF
-
Georgisch, Ergänzung2D00–2D2F
-
Tifinagh2D30–2D7F
-
Äthiopisch, erweitert2D80–2DDF
-
Kyrillisch, erweitert-A2DE0–2DFF
-
Zusätzliche Interpunktion2E00–2E7F
-
CJK-Radikale, Ergänzung2E80–2EFF
-
Kangxi-Radikale2F00–2FDF
-
Ideographische Beschreibungszeichen2FF0–2FFF
-
CJK-Symbole und -Interpunktion3000–303F
-
Hiragana3040–309F
-
Katakana30A0–30FF
-
Bopomofo3100–312F
-
Hangeul-Jamo, Kompatibilität3130–318F
-
Kanbun3190–319F
-
Bopomofo, erweitert31A0–31BF
-
CJK-Striche31C0–31EF
-
Katakana, Phonetische Erweiterungen31F0–31FF
-
Umschlossene CJK-Zeichen und -Monate3200–32FF
-
CJK-Kompatibilität3300–33FF
-
Vereinheitlichte CJK-Ideogramme, Erweiterung A3400–4DBF
-
I-Ging-Hexagramme4DC0–4DFF
-
Vereinheitlichte CJK-Ideogramme4E00–9FFF
-
Yi-SilbenzeichenA000–A48F
-
Yi-RadikaleA490–A4CF
-
LisuA4D0–A4FF
-
LisuA500–A63F
-
Kyrillisch, erweitert-BA640–A69F
-
BamumA6A0–A6FF
-
Modifizierende TonzeichenA700–A71F
-
Lateinisch, erweitert-DA720–A7FF
-
Syloti NagriA800–A82F
-
Allgemeine indische ZiffernA830–A83F
-
PhagspaA840–A87F
-
SaurashtraA880–A8DF
-
Devanagari, erweitertA8E0–A8FF
-
Kayah LiA900–A92F
-
RejangA930–A95F
-
Hangeul-Jamo, erweitert-AA960–A97F
-
JavanischA980–A9DF
-
Myanmar Extended-BA9E0–A9FF
-
ChamAA00–AA5F
-
Birmanisch, erweitert-AAA60–AA7F
-
Tai VietAA80–AADF
-
Meitei-Mayek, ErweiterungenAAE0–AAFF
-
Äthiopisch, erweitert-AAB00–AB2F
-
Latin Extended-EAB30–AB6F
-
Cherokee SupplementAB70–ABBF
-
Meitei-MayekABC0–ABFF
-
Hangeul-SilbenzeichenAC00–D7AF
-
Hangul Jamo Extended-BD7B0–D7FF
-
High SurrogatesD800–DB7F
-
High Surrogates (privater Bereich)DB80–DBFF
-
Low SurrogatesDC00–DFFF
-
Private Use ZoneE000–F8FF
-
CJK-Ideogramme, KompatibilitätF900–FAFF
-
Alphabetische PräsentationsformenFB00–FB4F
-
Arabische Präsentationsformen-AFB50–FDFF
-
VariantenselektorenFE00–FE0F
-
Vertikale FormenFE10–FE1F
-
Kombinierende halbe diakritische ZeichenFE20–FE2F
-
CJK-KompatibilitätsformenFE30–FE4F
-
Kleine FormvariantenFE50–FE6F
-
Arabische Präsentationsformen-BFE70–FEFF
-
Halbbreite und vollbreite FormenFF00–FFEF
-
SpeziellesFFF0–FFFF
-
-
1: Zusätzliche mehrsprachige Ebene
-
Linear B Syllabary10000–1007F
-
Linear B Ideograms10080–100FF
-
Aegean Numbers10100–1013F
-
Ancient Greek Numbers10140–1018F
-
Ancient Symbols10190–101CF
-
Phaistos Disc101D0–101FF
-
Lycian10280–1029F
-
Carian102A0–102DF
-
Coptic Epact Numbers102E0–102FF
-
Old Italic10300–1032F
-
Gothic10330–1034F
-
Old Permic10350–1037F
-
Ugaritic10380–1039F
-
Old Persian103A0–103DF
-
Deseret10400–1044F
-
Shavian10450–1047F
-
Osmanya10480–104AF
-
Osage104B0–104FF
-
Elbasan10500–1052F
-
Caucasian Albanian10530–1056F
-
Vithkuqi10570–105BF
-
Todhri105C0–105FF
-
Linear A10600–1077F
-
Latin Extended-F10780–107BF
-
Cypriot Syllabary10800–1083F
-
Imperial Aramaic10840–1085F
-
Palmyrene10860–1087F
-
Nabataean10880–108AF
-
Hatran108E0–108FF
-
Phoenician10900–1091F
-
Lydian10920–1093F
-
Meroitic Hieroglyphs10980–1099F
-
Meroitic Cursive109A0–109FF
-
Kharoshthi10A00–10A5F
-
Old South Arabian10A60–10A7F
-
Old North Arabian10A80–10A9F
-
Manichaean10AC0–10AFF
-
Avestan10B00–10B3F
-
Inscriptional Parthian10B40–10B5F
-
Inscriptional Pahlavi10B60–10B7F
-
Psalter Pahlavi10B80–10BAF
-
Old Turkic10C00–10C4F
-
Old Hungarian10C80–10CFF
-
Hanifi Rohingya10D00–10D3F
-
Garay10D40–10D8F
-
Rumi Numeral Symbols10E60–10E7F
-
Yezidi10E80–10EBF
-
Arabic Extended-C10EC0–10EFF
-
Old Sogdian10F00–10F2F
-
Sogdian10F30–10F6F
-
Old Uyghur10F70–10FAF
-
Chorasmian10FB0–10FDF
-
Elymaic10FE0–10FFF
-
Brahmi11000–1107F
-
Kaithi11080–110CF
-
Sora Sompeng110D0–110FF
-
Chakma11100–1114F
-
Mahajani11150–1117F
-
Sharada11180–111DF
-
Sinhala Archaic Numbers111E0–111FF
-
Khojki11200–1124F
-
Multani11280–112AF
-
Khudawadi112B0–112FF
-
Grantha11300–1137F
-
Tulu-Tigalari11380–113FF
-
Newa11400–1147F
-
Tirhuta11480–114DF
-
Siddham11580–115FF
-
Modi11600–1165F
-
Mongolian Supplement11660–1167F
-
Takri11680–116CF
-
Myanmar Erweiterung-C116D0–116FF
-
Ahom11700–1174F
-
Dogra11800–1184F
-
Warang Citi118A0–118FF
-
Dives Akuru11900–1195F
-
Nandinagari119A0–119FF
-
Zanabazar Square11A00–11A4F
-
Soyombo11A50–11AAF
-
Unified Canadian Aboriginal Syllabics Extended-A11AB0–11ABF
-
Pau Cin Hau11AC0–11AFF
-
Devanagari Extended-A11B00–11B5F
-
Sunuwar11BC0–11BFF
-
Bhaiksuki11C00–11C6F
-
Marchen11C70–11CBF
-
Masaram Gondi11D00–11D5F
-
Gunjala Gondi11D60–11DAF
-
Makasar11EE0–11EFF
-
Kawi11F00–11F5F
-
Lisu Supplement11FB0–11FBF
-
Tamil Supplement11FC0–11FFF
-
Cuneiform12000–123FF
-
Cuneiform Numbers and Punctuation12400–1247F
-
Early Dynastic Cuneiform12480–1254F
-
Cypro-Minoan12F90–12FFF
-
Egyptian Hieroglyphs13000–1342F
-
Egyptian Hieroglyph Format Controls13430–1345F
-
Ägyptische Hieroglyphen Erweiterung-A13460–143FF
-
Anatolian Hieroglyphs14400–1467F
-
Gurung Khema16100–1613F
-
Bamum Supplement16800–16A3F
-
Mro16A40–16A6F
-
Tangsa16A70–16ACF
-
Bassa Vah16AD0–16AFF
-
Pahawh Hmong16B00–16B8F
-
Kirat Rai16D40–16D7F
-
Medefaidrin16E40–16E9F
-
Miao16F00–16F9F
-
Ideographic Symbols and Punctuation16FE0–16FFF
-
Tangut17000–187FF
-
Tangut Components18800–18AFF
-
Khitan Small Script18B00–18CFF
-
Tangut Supplement18D00–18D7F
-
Kana Extended-B1AFF0–1AFFF
-
Kana Supplement1B000–1B0FF
-
Kana Extended-A1B100–1B12F
-
Small Kana Extension1B130–1B16F
-
Nushu1B170–1B2FF
-
Duployan1BC00–1BC9F
-
Shorthand Format Controls1BCA0–1BCAF
-
Symbole für das Erbe der Computer1CC00–1CEBF
-
Znamenny Musical Notation1CF00–1CFCF
-
Byzantine Musical Symbols1D000–1D0FF
-
Musical Symbols1D100–1D1FF
-
Ancient Greek Musical Notation1D200–1D24F
-
Kaktovik Numerals1D2C0–1D2DF
-
Mayan Numerals1D2E0–1D2FF
-
Tai Xuan Jing Symbols1D300–1D35F
-
Counting Rod Numerals1D360–1D37F
-
Mathematical Alphanumeric Symbols1D400–1D7FF
-
Sutton SignWriting1D800–1DAAF
-
Latin Extended-G1DF00–1DFFF
-
Glagolitic Supplement1E000–1E02F
-
Cyrillic Extended-D1E030–1E08F
-
Nyiakeng Puachue Hmong1E100–1E14F
-
Toto1E290–1E2BF
-
Wancho1E2C0–1E2FF
-
Nag Mundari1E4D0–1E4FF
-
Ol Onal1E5D0–1E5FF
-
Ethiopic Extended-B1E7E0–1E7FF
-
Mende Kikakui1E800–1E8DF
-
Adlam1E900–1E95F
-
Indic Siyaq Numbers1EC70–1ECBF
-
Ottoman Siyaq Numbers1ED00–1ED4F
-
Arabic Mathematical Alphabetic Symbols1EE00–1EEFF
-
Mahjong Tiles1F000–1F02F
-
Domino Tiles1F030–1F09F
-
Playing Cards1F0A0–1F0FF
-
Enclosed Alphanumeric Supplement1F100–1F1FF
-
Enclosed Ideographic Supplement1F200–1F2FF
-
Miscellaneous Symbols and Pictographs1F300–1F5FF
-
Emoticons (Emoji)1F600–1F64F
-
Ornamental Dingbats1F650–1F67F
-
Transport and Map Symbols1F680–1F6FF
-
Alchemical Symbols1F700–1F77F
-
Geometric Shapes Extended1F780–1F7FF
-
Supplemental Arrows-C1F800–1F8FF
-
Supplemental Symbols and Pictographs1F900–1F9FF
-
Chess Symbols1FA00–1FA6F
-
Symbols and Pictographs Extended-A1FA70–1FAFF
-
Symbols for Legacy Computing1FB00–1FBFF
-
-
2: Zusätzliche ideografische Ebene
-
CJK Unified Ideographs Extension B20000–2A6DF
-
CJK Unified Ideographs Extension C2A700–2B73F
-
CJK Unified Ideographs Extension D2B740–2B81F
-
CJK Unified Ideographs Extension E2B820–2CEAF
-
CJK Unified Ideographs Extension F2CEB0–2EBEF
-
CJK Unified Ideographs Extension I2EBF0–2EE5F
-
CJK Compatibility Ideographs Supplement2F800–2FA1F
-
-
3: Tertiäre ideographische Ebene
-
4-13: Nicht verwendet
-
-
-
-
-
-
-
-
-
-
14: Spezialisierte Zusatzebene
-
15: Zusätzlicher Bereich für den privaten Gebrauch – A
-
16: Zusätzliche Fläche zur privaten Nutzung – B
-
Nichts gefunden
┐( ˘_˘ )┌