Optyczne rozpoznawanie znaków
Optical character recognition (OCR) is the mechanical or electronic conversion of images of typewritten or printed text into machine-encoded text. It is widely used as a form of data entry from printed paper data records, whether passport documents, invoices, bank statements, computerized receipts, business cards, mail, printouts of static-data, or any suitable documentation. It is a common method of digitizing printed texts so that it can be electronically edited, searched, stored more compactly, displayed on-line, and used in machine processes such as machine translation, text-to-speech, key data and text mining. OCR is a field of research in pattern recognition, artificial intelligence and computer vision.
Early versions needed to be trained with images of each character, and worked on one font at a time. Advanced systems that have a high degree of recognition accuracy for most fonts are now common. Some systems are capable of reproducing formatted output that closely approximates the original page including images, columns, and other non-textual components.
Właściwości
Zakres | 2440–245F |
Znaki | 32 |
Lista Znaków
-
OCR-A (czcionka)
-
2440⑀
-
2441⑁
-
2442⑂
-
2443⑃
-
2444⑄
-
2445⑅
-
MICR (kod)
-
2446⑆
-
2447⑇
-
2448⑈
-
2449⑉
-
OCR
-
244A⑊
-
244B
-
244C
-
244D
-
244E
-
244F
-
2450
-
2451
-
2452
-
2453
-
2454
-
2455
-
2456
-
2457
-
2458
-
2459
-
245A
-
245B
-
245C
-
245D
-
245E
-
245F
Tabela Znaków
-
0: Główna płaszczyzna wielojęzyczna
-
Podstawowy łaciński0000–007F
-
Latin-1 Supplement0080–00FF
-
Rozszerzony łaciński-A0100–017F
-
Rozszerzony łaciński-B0180–024F
-
Rozszerzenia IPA0250–02AF
-
Oddzielone litery modyfikujące02B0–02FF
-
Składające znaki diakrytyczne0300–036F
-
Grecki i koptyjski0370–03FF
-
Cyrylicy0400–04FF
-
Uzupełnienie cyrylicy0500–052F
-
Ormiański0530–058F
-
Hebrajski0590–05FF
-
Arabski0600–06FF
-
Syryjski0700–074F
-
Arabski Uzupełnienie0750–077F
-
Thaana0780–07BF
-
NKO07C0–07FF
-
Samarytanin0800–083F
-
Mandejski0840–085F
-
Syriac Supplement0860–086F
-
Arabic Extended-B0870–089F
-
Arabski-A Rozszerzony08A0–08FF
-
Devanagari0900–097F
-
Bengalski0980–09FF
-
Gurmukhi0A00–0A7F
-
Gujarati0A80–0AFF
-
Orija0B00–0B7F
-
Tamil0B80–0BFF
-
Telugu0C00–0C7F
-
Kannada0C80–0CFF
-
Malajalam0D00–0D7F
-
Syngaleski0D80–0DFF
-
Tajski0E00–0E7F
-
Lao0E80–0EFF
-
Tybetański0F00–0FFF
-
Myanmar1000–109F
-
Gruziński10A0–10FF
-
Hangul Jamo1100–11FF
-
Etiopski1200–137F
-
Etiopski Uzupełnienie1380–139F
-
Сherokee13A0–13FF
-
Ujednolicony abugidy kanadyjskie1400–167F
-
Ogham1680–169F
-
Runiczny16A0–16FF
-
Tagalog1700–171F
-
Hanunoo1720–173F
-
Buhid1740–175F
-
Tagbanwa1760–177F
-
Khmer1780–17FF
-
Mongolski1800–18AF
-
Ujednolicony abugidy kanadyjskie Rozszerzony18B0–18FF
-
Limbu1900–194F
-
Tai Le1950–197F
-
Nowy Tai Lue1980–19DF
-
Symbole Khmer19E0–19FF
-
Bugiński1A00–1A1F
-
Tai Tham1A20–1AAF
-
Składające znaki diakrytyczne Rozszerzony1AB0–1AFF
-
Balijski1B00–1B7F
-
Sundanese1B80–1BBF
-
Batak1BC0–1BFF
-
Lepcza1C00–1C4F
-
Ol Chiki1C50–1C7F
-
Rozszerzony C cyrylicy1C80–1C8F
-
Georgian Extended1C90–1CBF
-
Sundanese suplement1CC0–1CCF
-
Rozszerzenia Vedic1CD0–1CFF
-
Rozszerzenia fonetyczne1D00–1D7F
-
Suplement Rozszerzenia fonetyczne1D80–1DBF
-
Uzupełnienie składających znaków diakrytycznych1DC0–1DFF
-
Łaciński rozszerzony dodatkowy1E00–1EFF
-
Grecki rozszerzony1F00–1FFF
-
Ogólna interpunkcja2000–206F
-
Indeksy górne i dolne2070–209F
-
Symbole walut20A0–20CF
-
Składające znaki diakrytyczne dla symboli20D0–20FF
-
Letterlike Symbole2100–214F
-
Formy liczbowe2150–218F
-
Strzałki2190–21FF
-
Operatory matematyczne2200–22FF
-
Różne znaki techniczne2300–23FF
-
Obrazy znaków sterujących2400–243F
-
Optyczne rozpoznawanie znaków2440–245F
-
Otoczone symbole alfanumeryczne2460–24FF
-
Rysowanie ramek2500–257F
-
Elementy blokowe2580–259F
-
Figury geometryczne25A0–25FF
-
Różnorodne symbole2600–26FF
-
Dingbats2700–27BF
-
Różne symbole matematyczne-A27C0–27EF
-
Dodatkowe strzałki-A27F0–27FF
-
Wzory Braille'a2800–28FF
-
Dodatkowe strzałki-B2900–297F
-
Różne symbole matematyczne-B2980–29FF
-
Dodatkowe operatory matematyczne2A00–2AFF
-
Różne symbole i strzałki2B00–2BFF
-
Głagolicy2C00–2C5F
-
Rozszerzony łaciński-C2C60–2C7F
-
Koptyjski2C80–2CFF
-
Gruziński Uzupełnienie2D00–2D2F
-
Tifinagh2D30–2D7F
-
Rozszerzony etiopski2D80–2DDF
-
Cyrylica-A Rozszerzona2DE0–2DFF
-
Dodatkowe znaki interpunkcyjne2E00–2E7F
-
CJK rodniki suplement2E80–2EFF
-
Radykałowie Kangxi2F00–2FDF
-
Ideograficzna Opis Postaci2FF0–2FFF
-
Symbole i znaki interpunkcyjne CJK3000–303F
-
Hiragana3040–309F
-
Katakana30A0–30FF
-
Bopomofo3100–312F
-
Kompatybilność Hangul Jamo3130–318F
-
Kanbun3190–319F
-
Rozszerzony bopomofo31A0–31BF
-
Kreski CJK31C0–31EF
-
Katakana Rozszerzenia fonetyczne31F0–31FF
-
Zamknięta litery i miesiące CJK3200–32FF
-
Zgodności CJK3300–33FF
-
Ujednoliconych ideogramów CJK Rozszerzenie A3400–4DBF
-
Symbole Yijing heksagram4DC0–4DFF
-
Ujednoliconych ideogramów CJK4E00–9FFF
-
Yi SylabyA000–A48F
-
Yi RadykałowieA490–A4CF
-
LisuA4D0–A4FF
-
VaiA500–A63F
-
Cyrylica Rozszerzony-BA640–A69F
-
BamumA6A0–A6FF
-
Listy modyfikator ToneA700–A71F
-
Rozszerzony łaciński-DA720–A7FF
-
Syloti nagriA800–A82F
-
Wspólne indyjskie Formy liczboweA830–A83F
-
Phags-paA840–A87F
-
SaurashtraA880–A8DF
-
Devanagari RozszerzonyA8E0–A8FF
-
Kayah LiA900–A92F
-
RejangA930–A95F
-
Hangul Jamo rozszerzony-AA960–A97F
-
jawajskiA980–A9DF
-
Birma rozszerzony-BA9E0–A9FF
-
ChamAA00–AA5F
-
Birma rozszerzony-AAA60–AA7F
-
Viet TaiAA80–AADF
-
Munipuri RozszerzeniaAAE0–AAFF
-
Etiopski Rozszerzony-AAB00–AB2F
-
Łaciński Rozszerzony-EAB30–AB6F
-
Suplement CherokeeAB70–ABBF
-
MunipuriABC0–ABFF
-
Hangul sylabyAC00–D7AF
-
Hangul Jamo Rozszerzony-BD7B0–D7FF
-
Wysokie zastępczeD800–DB7F
-
Wysokie użytku prywatnego zastępczeDB80–DBFF
-
Niskie zastępczeDC00–DFFF
-
Obszar prywatnego użytkuE000–F8FF
-
Ideogramy CJK kompatybilnościąF900–FAFF
-
Alfabetyczne formy prezentacyjneFB00–FB4F
-
Arabskie formy prezentacyjne-AFB50–FDFF
-
Selektory zmiennościFE00–FE0F
-
Formy pionoweFE10–FE1F
-
Łącząc półznakiFE20–FE2F
-
Formy zgodności CJKFE30–FE4F
-
Małe warianty formFE50–FE6F
-
Arabskie formy prezentacyjne-BFE70–FEFF
-
Połowę szerokości i formy pełnej szerokościFF00–FFEF
-
SpecjałyFFF0–FFFF
-
-
1: Opcjonalna płaszczyzna wielojęzyczna
-
Linear B syllabary10000–1007F
-
Linear B ideogramy10080–100FF
-
Numery Egejskie10100–1013F
-
Starożytne greckie liczby10140–1018F
-
Starożytne symbole10190–101CF
-
Dysk z Fajstos101D0–101FF
-
Lycian10280–1029F
-
Carian102A0–102DF
-
Koptyjski numery102E0–102FF
-
Stary włoski10300–1032F
-
Gotyk10330–1034F
-
Stary Permic10350–1037F
-
Ugarycki10380–1039F
-
Staroperski103A0–103DF
-
Deseret10400–1044F
-
Pismo Shawa10450–1047F
-
Osmanija10480–104AF
-
Osage104B0–104FF
-
Elbasan10500–1052F
-
Kaukaski Albański10530–1056F
-
Vithkuqi10570–105BF
-
Todhri105C0–105FF
-
Liniowy-a10600–1077F
-
Latin Extended-F10780–107BF
-
Sylabariusz cypryjski10800–1083F
-
Imperial aramejski10840–1085F
-
Palmyrene10860–1087F
-
Nabataean10880–108AF
-
Hatran108E0–108FF
-
Fenicki10900–1091F
-
Lydian10920–1093F
-
Meroickie hieroglify10980–1099F
-
Meroickie Cursive109A0–109FF
-
Kharoszthi10A00–10A5F
-
Stary południe arabskiej10A60–10A7F
-
Stary północny arabskiej10A80–10A9F
-
Manichaean10AC0–10AFF
-
Awestyjski10B00–10B3F
-
Inskrypcje Partów10B40–10B5F
-
Inskrypcje Pahlavi10B60–10B7F
-
Psałterz Pahlavi10B80–10BAF
-
Stary Turkic10C00–10C4F
-
Stare węgierski10C80–10CFF
-
Hanifi Rohingya10D00–10D3F
-
Garay10D40–10D8F
-
Symbole Rumi liczebnik10E60–10E7F
-
Yezidi10E80–10EBF
-
Arabic Extended-C10EC0–10EFF
-
Old Sogdian10F00–10F2F
-
Sogdian10F30–10F6F
-
Old Uyghur10F70–10FAF
-
Chorasmian10FB0–10FDF
-
Elymaic10FE0–10FFF
-
Brahmi11000–1107F
-
Kaithi11080–110CF
-
Sora Sompeng110D0–110FF
-
Czakma11100–1114F
-
Mahadżani11150–1117F
-
Sharada11180–111DF
-
Liczby syngaleski Archaiczne111E0–111FF
-
Khojki11200–1124F
-
Multani11280–112AF
-
Khudawadi112B0–112FF
-
Grantha11300–1137F
-
Tulu-Tigalari11380–113FF
-
Newa11400–1147F
-
Tirhuta11480–114DF
-
Siddham11580–115FF
-
Modi11600–1165F
-
Mongolski Suplement11660–1167F
-
Takri11680–116CF
-
Mjanmar Rozszerzony-C116D0–116FF
-
Ahom11700–1174F
-
Dogra11800–1184F
-
Warang Citi118A0–118FF
-
Dives Akuru11900–1195F
-
Nandinagari119A0–119FF
-
Zanabazar Square11A00–11A4F
-
Soyombo11A50–11AAF
-
Unified Canadian Aboriginal Syllabics Extended-A11AB0–11ABF
-
Pau Cin Hau11AC0–11AFF
-
Devanagari Extended-A11B00–11B5F
-
Sunuwar11BC0–11BFF
-
Bhaiksuki11C00–11C6F
-
Marchen11C70–11CBF
-
Masaram Gondi11D00–11D5F
-
Gunjala Gondi11D60–11DAF
-
Makasar11EE0–11EFF
-
Kawi11F00–11F5F
-
Lisu Supplement11FB0–11FBF
-
Tamil Supplement11FC0–11FFF
-
Klinowy12000–123FF
-
Liczby i interpunkcja pisma klinowego12400–1247F
-
Wczesne dynastyczna klinowe12480–1254F
-
Cypro-Minoan12F90–12FFF
-
Egipskie hieroglify13000–1342F
-
Egyptian Hieroglyph Format Controls13430–1345F
-
Egipskie hieroglify Rozszerzenie-A13460–143FF
-
Anatolian hieroglify14400–1467F
-
Gurung Khema16100–1613F
-
Bamum Suplement16800–16A3F
-
MRO16A40–16A6F
-
Tangsa16A70–16ACF
-
Bassa Wach16AD0–16AFF
-
Pismo Pahawh Hmong16B00–16B8F
-
Kirat Rai16D40–16D7F
-
Medefaidrin16E40–16E9F
-
Miao16F00–16F9F
-
Ideograficzna Symbole i znaki interpunkcyjne16FE0–16FFF
-
Tangut17000–187FF
-
сomponents Tangut18800–18AFF
-
Khitan Small Script18B00–18CFF
-
Tangut Supplement18D00–18D7F
-
Kana Extended-B1AFF0–1AFFF
-
Kana Suplement1B000–1B0FF
-
Kana Extended-A1B100–1B12F
-
Small Kana Extension1B130–1B16F
-
Nushu1B170–1B2FF
-
Duployan1BC00–1BC9F
-
Skrócone Kontrola formatu1BCA0–1BCAF
-
Symbole dla Uzupełnienia Dziedzictwa Informatyki1CC00–1CEBF
-
Znamenny Musical Notation1CF00–1CFCF
-
Bizantyjskie symbole muzyczne1D000–1D0FF
-
Symbole muzyczne1D100–1D1FF
-
Starogrecki notacja muzyczna1D200–1D24F
-
Kaktovik Numerals1D2C0–1D2DF
-
Mayan Numerals1D2E0–1D2FF
-
Symbole Tai Jing Xuan1D300–1D35F
-
Patyczki liczbowe Cyfry1D360–1D37F
-
Matematyczne symbole alfanumeryczne1D400–1D7FF
-
Sutton piśmie znak1D800–1DAAF
-
Latin Extended-G1DF00–1DFFF
-
Suplement głagolicy1E000–1E02F
-
Cyrillic Extended-D1E030–1E08F
-
Nyiakeng Puachue Hmong1E100–1E14F
-
Toto1E290–1E2BF
-
Wancho1E2C0–1E2FF
-
Nag Mundari1E4D0–1E4FF
-
Ol Onal1E5D0–1E5FF
-
Ethiopic Extended-B1E7E0–1E7FF
-
Mende Kikakui1E800–1E8DF
-
Adlam1E900–1E95F
-
Indic Siyaq Numbers1EC70–1ECBF
-
Ottoman Siyaq Numbers1ED00–1ED4F
-
Arabski symbole matematyczne alfabetu1EE00–1EEFF
-
Mahjong Tiles1F000–1F02F
-
Płytki Domino1F030–1F09F
-
Grać w karty1F0A0–1F0FF
-
Zamknięta suplement alfanumeryczna1F100–1F1FF
-
Zamknięta suplement ideograficzny1F200–1F2FF
-
Różne symbole i piktogramy1F300–1F5FF
-
Emotikony (Emoji)1F600–1F64F
-
Dingbats ozdobne1F650–1F67F
-
Symbole transportu i map1F680–1F6FF
-
Symbole alchemiczne1F700–1F77F
-
Kształty geometryczne Rozszerzony1F780–1F7FF
-
Dodatkowe strzałki-C1F800–1F8FF
-
Uzupełniające Symbole i piktogramy1F900–1F9FF
-
Chess Symbols1FA00–1FA6F
-
Symbols and Pictographs Extended-A1FA70–1FAFF
-
Symbols for Legacy Computing1FB00–1FBFF
-
-
2: Dodatkowa płaszczyzna ideograficzna
-
CJK Unified Ideographs Extension B20000–2A6DF
-
CJK Unified Ideographs Extension C2A700–2B73F
-
CJK Unified Ideographs Extension D2B740–2B81F
-
CJK Unified Ideographs Extension E2B820–2CEAF
-
CJK Unified Ideographs Extension F2CEB0–2EBEF
-
CJK Unified Ideographs Extension I2EBF0–2EE5F
-
CJK Compatibility Ideographs Supplement2F800–2FA1F
-
-
3: Trzeciorzędowa płaszczyzna ideograficzna
-
4-13: Nieużywana
-
-
-
-
-
-
-
-
-
-
14: Wyspecjalizowana dodatkowa płaszczyzna
-
15: Dodatkowy obszar do użytku prywatnego – A
-
16: Dodatkowy obszar do użytku prywatnego – B
-
Nic nie znaleziono
┐( ˘_˘ )┌