Optische Zeichenerkennung
Optical character recognition (OCR) is the mechanical or electronic conversion of images of typewritten or printed text into machine-encoded text. It is widely used as a form of data entry from printed paper data records, whether passport documents, invoices, bank statements, computerized receipts, business cards, mail, printouts of static-data, or any suitable documentation. It is a common method of digitizing printed texts so that it can be electronically edited, searched, stored more compactly, displayed on-line, and used in machine processes such as machine translation, text-to-speech, key data and text mining. OCR is a field of research in pattern recognition, artificial intelligence and computer vision.
Early versions needed to be trained with images of each character, and worked on one font at a time. Advanced systems that have a high degree of recognition accuracy for most fonts are now common. Some systems are capable of reproducing formatted output that closely approximates the original page including images, columns, and other non-textual components.
Eigenschaften
| Bereich | 2440–245F |
| Zeichen | 32 |
OCR-A
-
⑀2440Ocr Hook
-
⑁2441Ocr Chair
-
⑂2442Ocr Gabel
-
⑃2443Ocr invertierte Gabel
-
⑄2444Ocr Gürtelschnalle
-
⑅2445Ocr Fliege
MICR
-
⑆2446Ocr Filialbank-Identifikation
-
⑇2447Ocr Prüfmenge
-
⑈2448Ocr Dash
-
⑉2449Ocr Kundenkontonummer
OCR
-
0: Einfache mehrsprachige Ebene
-
Basis-Lateinisch0000–007F
-
Lateinisch-1, Ergänzung0080–00FF
-
Lateinisch, erweitert-A0100–017F
-
Lateinisch, erweitert-B0180–024F
-
IPA-Erweiterungen0250–02AF
-
Spacing Modifier Letters02B0–02FF
-
Kombinierende diakritische Zeichen0300–036F
-
0370–03FF
-
Kyrillisch0400–04FF
-
Kyrillisch, Ergänzung0500–052F
-
Armenisch0530–058F
-
Hebräisch0590–05FF
-
Arabisch0600–06FF
-
0700–074F
-
Arabisch, Ergänzung0750–077F
-
Thaana0780–07BF
-
NKo07C0–07FF
-
Samaritanisch0800–083F
-
Mandäisch0840–085F
-
0860–086F
-
0870–089F
-
Arabisch, erweitert-A08A0–08FF
-
Devanagari0900–097F
-
Bengalisch0980–09FF
-
Gurmukhi0A00–0A7F
-
Gujarati0A80–0AFF
-
Oriya0B00–0B7F
-
Tamilisch0B80–0BFF
-
Telugu0C00–0C7F
-
Kannada0C80–0CFF
-
Malayalam0D00–0D7F
-
Singhalesisch0D80–0DFF
-
Thailändisch0E00–0E7F
-
Laotisch0E80–0EFF
-
Tibetisch0F00–0FFF
-
Birmanisch1000–109F
-
Georgisch10A0–10FF
-
Hangeul-Jamo1100–11FF
-
Äthiopisch1200–137F
-
Äthiopisch, Zusatz1380–139F
-
Cherokee13A0–13FF
-
Vereinh. Silbenzeichen kanad. Ureinwohner1400–167F
-
Ogam1680–169F
-
Runen16A0–16FF
-
Tagalog1700–171F
-
Hanunóo1720–173F
-
Buid1740–175F
-
Tagbanuwa1760–177F
-
Khmer1780–17FF
-
Mongolisch1800–18AF
-
Vereinh. Silbenz. kanad. Ureinw., erw.18B0–18FF
-
Limbu1900–194F
-
Tai Le1950–197F
-
Neu-Tai-Lue1980–19DF
-
Khmer-Symbole19E0–19FF
-
Buginesisch1A00–1A1F
-
Lanna1A20–1AAF
-
1AB0–1AFF
-
Balinesisch1B00–1B7F
-
Sundanesisch1B80–1BBF
-
Batak1BC0–1BFF
-
Lepcha1C00–1C4F
-
Ol Chiki1C50–1C7F
-
1C80–1C8F
-
1C90–1CBF
-
Sundanesisch, Ergänzung1CC0–1CCF
-
Vedische Erweiterungen1CD0–1CFF
-
Phonetische Erweiterungen1D00–1D7F
-
Phonetische Erweiterungen, Ergänzung1D80–1DBF
-
Komb. diakr. Zeichen, Ergänzung1DC0–1DFF
-
Lateinisch, weiterer Zusatz1E00–1EFF
-
Griechisch, Zusatz1F00–1FFF
-
Allgemeine Interpunktion2000–206F
-
Hoch- und tiefgestellte Zeichen2070–209F
-
Währungssymbole20A0–20CF
-
Komb. diakr. Zeichen für Symbole20D0–20FF
-
Buchstabenähnliche Symbole2100–214F
-
Zahlzeichen2150–218F
-
Pfeile2190–21FF
-
Mathematische Operatoren2200–22FF
-
Verschiedene technische Zeichen2300–23FF
-
Symbole für Steuerzeichen2400–243F
-
Optische Zeichenerkennung2440–245F
-
Umschlossene alphanumerische Zeichen2460–24FF
-
Rahmenzeichnung2500–257F
-
Blockelemente2580–259F
-
Geometrische Formen25A0–25FF
-
Verschiedene Symbole2600–26FF
-
Dingbats2700–27BF
-
Verschiedene mathematische Symbole-A27C0–27EF
-
Zusätzliche Pfeile-A27F0–27FF
-
Braille-Zeichen2800–28FF
-
Zusätzliche Pfeile-B2900–297F
-
Verschiedene mathematische Symbole-B2980–29FF
-
Zusätzliche Mathematische Operatoren2A00–2AFF
-
Verschiedene Symbole und Pfeile2B00–2BFF
-
Glagolitisch2C00–2C5F
-
Lateinisch, erweitert-C2C60–2C7F
-
Koptisch2C80–2CFF
-
Georgisch, Ergänzung2D00–2D2F
-
Tifinagh2D30–2D7F
-
Äthiopisch, erweitert2D80–2DDF
-
2DE0–2DFF
-
Zusätzliche Interpunktion2E00–2E7F
-
CJK-Radikale, Ergänzung2E80–2EFF
-
Kangxi-Radikale2F00–2FDF
-
Ideographische Beschreibungszeichen2FF0–2FFF
-
CJK-Symbole und -Interpunktion3000–303F
-
Hiragana3040–309F
-
Katakana30A0–30FF
-
Bopomofo3100–312F
-
Hangeul-Jamo, Kompatibilität3130–318F
-
Kanbun3190–319F
-
Bopomofo, erweitert31A0–31BF
-
CJK-Striche31C0–31EF
-
Katakana, Phonetische Erweiterungen31F0–31FF
-
Umschlossene CJK-Zeichen und -Monate3200–32FF
-
CJK-Kompatibilität3300–33FF
-
Vereinheitlichte CJK-Ideogramme, Erweiterung A3400–4DBF
-
I-Ging-Hexagramme4DC0–4DFF
-
Vereinheitlichte CJK-Ideogramme4E00–9FFF
-
Yi-SilbenzeichenA000–A48F
-
Yi-RadikaleA490–A4CF
-
A4D0–A4FF
-
A500–A63F
-
A640–A69F
-
BamumA6A0–A6FF
-
Modifizierende TonzeichenA700–A71F
-
Lateinisch, erweitert-DA720–A7FF
-
A800–A82F
-
A830–A83F
-
PhagspaA840–A87F
-
SaurashtraA880–A8DF
-
A8E0–A8FF
-
Kayah LiA900–A92F
-
RejangA930–A95F
-
A960–A97F
-
A980–A9DF
-
A9E0–A9FF
-
AA00–AA5F
-
AA60–AA7F
-
AA80–AADF
-
AAE0–AAFF
-
Äthiopisch, erweitert-AAB00–AB2F
-
AB30–AB6F
-
AB70–ABBF
-
ABC0–ABFF
-
Hangeul-SilbenzeichenAC00–D7AF
-
D7B0–D7FF
-
High SurrogatesD800–DB7F
-
High Surrogates (privater Bereich)DB80–DBFF
-
Low SurrogatesDC00–DFFF
-
Private Use ZoneE000–F8FF
-
CJK-Ideogramme, KompatibilitätF900–FAFF
-
Alphabetische PräsentationsformenFB00–FB4F
-
Arabische Präsentationsformen-AFB50–FDFF
-
VariantenselektorenFE00–FE0F
-
Vertikale FormenFE10–FE1F
-
Kombinierende halbe diakritische ZeichenFE20–FE2F
-
CJK-KompatibilitätsformenFE30–FE4F
-
Kleine FormvariantenFE50–FE6F
-
Arabische Präsentationsformen-BFE70–FEFF
-
Halbbreite und vollbreite FormenFF00–FFEF
-
SpeziellesFFF0–FFFF
-
-
1: Zusätzliche mehrsprachige Ebene
-
10000–1007F
-
10080–100FF
-
10100–1013F
-
10140–1018F
-
10190–101CF
-
101D0–101FF
-
10280–1029F
-
102A0–102DF
-
102E0–102FF
-
10300–1032F
-
10330–1034F
-
10350–1037F
-
10380–1039F
-
103A0–103DF
-
10400–1044F
-
10450–1047F
-
10480–104AF
-
104B0–104FF
-
10500–1052F
-
10530–1056F
-
10570–105BF
-
Todhri105C0–105FF
-
10600–1077F
-
10780–107BF
-
10800–1083F
-
10840–1085F
-
10860–1087F
-
10880–108AF
-
108E0–108FF
-
10900–1091F
-
10920–1093F
-
10940–1095F
-
10980–1099F
-
109A0–109FF
-
10A00–10A5F
-
10A60–10A7F
-
10A80–10A9F
-
10AC0–10AFF
-
10B00–10B3F
-
10B40–10B5F
-
10B60–10B7F
-
10B80–10BAF
-
10C00–10C4F
-
10C80–10CFF
-
10D00–10D3F
-
Garay10D40–10D8F
-
10E60–10E7F
-
10E80–10EBF
-
10EC0–10EFF
-
10F00–10F2F
-
10F30–10F6F
-
10F70–10FAF
-
10FB0–10FDF
-
10FE0–10FFF
-
11000–1107F
-
11080–110CF
-
110D0–110FF
-
11100–1114F
-
11150–1117F
-
11180–111DF
-
111E0–111FF
-
11200–1124F
-
11280–112AF
-
112B0–112FF
-
11300–1137F
-
Tulu-Tigalari11380–113FF
-
11400–1147F
-
11480–114DF
-
11580–115FF
-
11600–1165F
-
11660–1167F
-
11680–116CF
-
Myanmar Erweiterung-C116D0–116FF
-
11700–1174F
-
11800–1184F
-
118A0–118FF
-
11900–1195F
-
119A0–119FF
-
11A00–11A4F
-
11A50–11AAF
-
11AB0–11ABF
-
11AC0–11AFF
-
11B00–11B5F
-
11B60–11B7F
-
Sunuwar11BC0–11BFF
-
11C00–11C6F
-
11C70–11CBF
-
11D00–11D5F
-
11D60–11DAF
-
11DB0–11DEF
-
11EE0–11EFF
-
11F00–11F5F
-
11FB0–11FBF
-
11FC0–11FFF
-
12000–123FF
-
12400–1247F
-
12480–1254F
-
12F90–12FFF
-
13000–1342F
-
13430–1345F
-
Ägyptische Hieroglyphen Erweiterung-A13460–143FF
-
14400–1467F
-
Gurung Khema16100–1613F
-
16800–16A3F
-
16A40–16A6F
-
16A70–16ACF
-
16AD0–16AFF
-
16B00–16B8F
-
Kirat Rai16D40–16D7F
-
16E40–16E9F
-
16EA0–16EDF
-
16F00–16F9F
-
16FE0–16FFF
-
17000–187FF
-
18800–18AFF
-
18B00–18CFF
-
18D00–18D7F
-
18D80–18DFF
-
1AFF0–1AFFF
-
1B000–1B0FF
-
1B100–1B12F
-
1B130–1B16F
-
1B170–1B2FF
-
1BC00–1BC9F
-
1BCA0–1BCAF
-
Symbole für das Erbe der Computer1CC00–1CEBF
-
1CEC0–1CEFF
-
1CF00–1CFCF
-
1D000–1D0FF
-
1D100–1D1FF
-
1D200–1D24F
-
1D2C0–1D2DF
-
1D2E0–1D2FF
-
1D300–1D35F
-
1D360–1D37F
-
1D400–1D7FF
-
1D800–1DAAF
-
1D800–1DAAF
-
1DF00–1DFFF
-
1E000–1E02F
-
1E030–1E08F
-
1E100–1E14F
-
1E290–1E2BF
-
1E2C0–1E2FF
-
1E4D0–1E4FF
-
Ol Onal1E5D0–1E5FF
-
1E6C0–1E6FF
-
1E7E0–1E7FF
-
1E800–1E8DF
-
1E900–1E95F
-
1EC70–1ECBF
-
1ED00–1ED4F
-
1EE00–1EEFF
-
1F000–1F02F
-
1F030–1F09F
-
1F0A0–1F0FF
-
1F100–1F1FF
-
1F200–1F2FF
-
1F300–1F5FF
-
1F600–1F64F
-
1F650–1F67F
-
1F680–1F6FF
-
1F700–1F77F
-
1F780–1F7FF
-
1F800–1F8FF
-
1F900–1F9FF
-
1FA00–1FA6F
-
1FA70–1FAFF
-
1FB00–1FBFF
-
-
2: Zusätzliche ideografische Ebene
-
3: Tertiäre ideographische Ebene
-
-
4–13: Nicht verwendet
-
-
-
-
-
-
-
-
-
14: Spezialisierte Zusatzebene
-
15: Zusätzlicher Bereich für den privaten Gebrauch – A
-
16: Zusätzliche Fläche zur privaten Nutzung – B
-
Nichts gefunden
┐( ˘_˘ )┌